Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn cơ sở dữ liệu âm thanh hiện đang được quan tâm đặc biệt bởi các đặc thù của dữ liệu âm thanh như: đa dạng, t
Trang 1Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS ĐỖ TRUNG TUẤN
Thái Nguyên, năm 2011
Trang 2Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CẢM ƠN
Trước hết tôi xin được bày tỏ lòng cảm ơn sâu sắc và sự kính trọng của mình đến các thầy cô giáo Trường Đại học Công nghệ Thông tin và Truyền thông, Đại học Thái Nguyên, đặc biệt là các thầy cô giáo đã giảng dạy và giúp đỡ tôi trong suốt quá trình học tập nâng cao sau đại học
Nhân dịp hoàn thành luận văn tốt nghiệp cao học của mình, tôi xin trân trọng cảm ơn các thầy giáo, cô giáo đã nhiệt tình hướng dẫn để tôi hoàn thành luận văn này
Tôi xin cảm ơn bạn bè, đồng nghiệp tại Thanh Hóa, đã luôn động viên, giúp
đỡ tôi trong quá trình học tập và công tác, để tôi học tập và hoàn thành luận văn này
Xin gửi đến người thân, gia đình tôi, những người đã tạo điều kiện và động viên, trợ giúp tôi về tinh thần, thông cảm và giúp đỡ tôi rất nhiều trong thời gian học tập này
Trang 3Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn khoa học của thầy giáo hướng dẫn Các số liệu, kết quả nêu trong luận văn là trung thực Những kết luận của luận văn chưa từng được ai công bố trong bất kỳ công trình nào khác
Thái Nguyên, ngày 20 tháng 09 năm 2011
Học viên Dương Đình Sĩ
Trang 4Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
MỤC LỤC
LỜI CẢM ƠN i
LỜI CAM ĐOAN ii
MỤC LỤC iii
DANH MỤC KÍ HIỆU VÀ VIẾT TẮT vii
DANH MỤC HÌNH VÀ BẢNG ix
Danh mục các hình ix
Danh mục các bảng x
MỞ ĐẦU 1
Chương 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH 3
1.1 Các dữ liệu đa phương tiện 3
1.1.1 Khái niệm về dữ liệu đa phương tiện 3
1.1.2 Phân loại dữ liệu đa phương tiện 5
1.1.3 Các đặc tính của dữ liệu đa phương tiện 6
1.2 Tổng quan về cơ sở dữ liệu đa phương tiện 6
1.2.1 Khái niệm về cơ sở dữ liệu đa phương tiện 6
1.2.2 Nhu cầu về cơ sở dữ liệu đa phương tiện 7
1.2.3 Phân loại cơ sở dữ liệu đa phương tiện 7
1.2.4 Đặc trưng của một cơ sở dữ liệu đa phương tiện 8
1.3 Cơ sở dữ liệu âm thanh 9
1.3.1 Về âm thanh 9
1.3.2 Về cơ sở dữ liệu âm thanh 9
1.4 Một số phần mềm cho phép xử lí âm thanh 10
1.5 Nhu cầu về âm thanh nhạc cụ 10
1.6 Kết luận 12
Chương 2 CÁC ĐẶC TRƯNG ÂM THANH 13
2.1 Số hóa dữ liệu âm thanh 13
2.1.1 Đặc tính của âm thanh tương tự 13
2.1.2 Khái niệm tín hiệu 14
Trang 5Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.1.3 Phân loại tín hiệu 14
2.1.4 Mô hình hóa tín hiệu âm thanh 17
2.1.5 Kiến trúc xử lí tín hiệu âm thanh 18
2.1.6 Tần số lấy mẫu 20
2.1.7 Một số khái niệm toán học trong xử lí âm thanh 21
2.1.7.1 Phép biến đổi z 21
2.1.7.2 Phép biến đổi Fourier 22
2.1.7.3 Phép biến đổi Fourier rời rạc 22
2.1.8 Số hóa dữ liệu âm thanh 24
2.1.8.1 Các mô hình lấy mẫu và mã hóa âm thanh 24
2.1.8.2 Kiến trúc của hệ thống mã hóa âm thanh 29
2.2 Đặc trưng của dữ liệu âm thanh 30
2.2.1 Dữ liệu âm thanh 30
2.2.2 Các đặc trưng của âm thanh 32
2.2.2.1 Bản chất vật lí của âm thanh 32
2.2.2.2 Sóng âm 32
2.2.2.3 Pha 32
2.2.2.4 Phổ âm thanh 32
2.2.2.5 Năng lượng âm thanh 33
2.2.2.6 Nhịp và phách 33
2.2.2.7 Cộng hưởng 33
2.2.2.8 Formant 33
2.3 Âm thanh, âm nhạc và tiếng nói 34
2.3.1 Tương quan âm thanh, âm nhạc và tiếng nói 34
2.3.2 Ảnh hưởng của biên độ và tần số 35
2.3.3 Âm sắc nhạc cụ, bồi âm 36
2.4 Nhạc cụ 38
2.4.1 Họ thân tự vang 39
2.4.2 Họ màng rung 39
Trang 6Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.4.3 Họ hơi 40
2.4.4 Họ dây 41
2.5 Kết luận 42
Chương 3 CƠ SỞ DỮ LIỆU ÂM THANH 44
3.1 Phân tích, thiết kế cơ sở dữ liệu đa phương tiện 44
3.1.1 Cấu trúc của cơ sở dữ liệu đa phương tiện 44
3.1.1.1 Phân tích dữ liệu 44
3.1.1.2 Mô hình hóa dữ liệu 44
3.1.1.3 Lưu trữ dữ liệu 45
3.1.1.4 Xác định dữ liệu trả về 45
3.1.1.5 Truy cập dữ liệu 46
3.1.1.6 Phương tiện truyền thông 46
3.1.2 Các bước để tạo ra một cơ sở dữ liệu đa phương tiện 46
3.2 Xử lí âm thanh bằng Cool Edit 47
3.3 Tổ chức cơ sở dữ liệu âm thanh nhạc cụ 48
3.3.1 Tổ chức cơ sở dữ liệu đa phương tiện 48
3.3.1.1 Thiết kế và kiến trúc của cơ sở dữ liệu đa phương tiện 48
3.3.1.2 Tổ chức cơ sở dữ liệu dựa trên nguyên tắc thống nhất 51
3.3.1.3 Mô tả trừu tượng các đối tượng đa phương tiện 52
3.3.1.4 Ngôn ngữ hỏi dữ liệu đa phương tiện 52
3.3.1.5 Kỹ thuật tìm kiếm 53
3.3.2 Tổ chức cơ sở dữ liệu âm thanh nhạc cụ 54
3.3.2.1 Siêu dữ liệu thể hiện nội dung 54
3.3.2.2 Nội dung âm thanh dựa trên tín hiệu 55
3.4 Cài đặt cơ sở dữ liệu âm thanh nhạc cụ dân tộc Việt Nam 56
3.4.1 Mô tả bài toán 56
3.4.2 Phân tích, thiết kế cơ sở dữ liệu âm thanh về nhạc cụ dân tộc 57
3.4.2.1 Bảng dữ liệu về âm thanh, âm thanh nhạc cụ dân tộc 57
3.4.2.2 Bảng dữ liệu về tác giả, người sáng tác bản nhạc 58
Trang 7Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3.4.2.3 Bảng dữ liệu về nghệ sỹ, người trình bày bản nhạc 59
3.4.2.4 Lược đồ quan hệ của cơ sở dữ liệu âm thanh 59
3.4.4 Cài đặt chương trình hỗ trợ việc xây dựng, khai thác cơ sở dữ liệu âm thanh nhạc cụ dân tộc Việt Nam 60
3.4.4.1 Chức năng cập nhật thông tin của nhạc sỹ, người sáng tác nhạc 61
3.4.4.2 Chức năng cập nhật thông tin của nghệ sỹ, người biểu diễn nhạc 61
3.4.4.3 Chức năng cập nhật thông tin bản nhạc 62
3.4.4.4 Chức năng tìm kiếm và trích xuất nhạc 63
3.4.4.5 Chương trình nghe nhạc 64
3.5 Kết luận 64
KẾT LUẬN 66
Các kết quả đạt được 66
Hướng tìm hiểu, nghiên cứu và ứng dụng 66
TÀI LIỆU THAM KHẢO 68
Tài liệu tiếng Việt 68
Tài liệu tiếng Anh 68
Một số Website 69
Trang 8Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
DANH MỤC KÍ HIỆU VÀ VIẾT TẮT
Internationaltelephony And Telegraph
Ủy ban điện thoại và điện tín viễn thông
tín hiệu tương tự
liên kết
RDBMS, Relational Database Management
System
Hệ quản trị cơ sở dữ liệu quan hệ
Trang 9Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Trang 10Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
DANH MỤC HÌNH VÀ BẢNG Danh mục các hình
Hình 1.1 Dữ liệu Đa phương tiện 8
Hình 1.2 Sử dụng nhạc cụ 11
Hình 2.1 Dạng sóng của tín hiệu âm thanh ghi nhận được 13
Hình 2.2 Tín hiệu liên tục theo thời gian 14
Hình 2.3 Tín hiệu rời rạc theo thời gian 15
Hình 2.4 Tín hiệu liên tục giá trị 15
Hình 2.5 Tín hiệu rời rạc giá trị 16
Hình 2.6 Tín hiệu tương tự 16
Hình 2.7 Tín hiệu số 16
Hình 2.8 Dạng sóng của âm thanh nguyên thủy 18
Hình 2.9 Dạng sóng của tín hiệu điện 18
Hình 2.10 Ngõ ra bộ chuyển đổi tín hiệu tương tự sang tín hiệu số 19
Hình 2.11 Thực hiện việc lấy mẫu 19
Hình 2.12 Kết quả của việc lấy mẫu các giá trị 19
Hình 2.13 Dạng sóng được tái tạo lại 20
Hình 2.14 Vòng tròn đơn vị thuộc mặt phẳng z 22
Hình 2.15 Cấu hình hệ thống xử lí tín hiệu tương tự bằng phương pháp số 24
Hình 2.16 Hàm lượng tử với bước lượng tử q=1 26
Hình 2.17 Lỗi lượng tử 27
Hình 2.18 Mô tả luật mã hóa 13 với biên độ dương 29
Hình 2.19 Kiến trúc của hệ thống mã hóa âm thanh 30
Hình 2.20 Mô tả sóng âm 31
Hình 2.21 Formant phân biệt ah, uh 34
Hình 2.22 Sự tương quan giữa âm thanh, âm nhạc và tiếng nói 34
Hình 2.23 Sóng âm không có tính nhạc của cánh cửa sập lại 34
Hình 2.24 Sóng âm của dây đàn Guitar có tính nhạc 35
Hình 2.25 Sóng của âm thanh có tính nhạc (a) và không có tính nhạc (b) 35
Trang 11Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 2.26 Sóng có biên độ thấp (a) và biên độ cao (b) 36
Hình 2.27 Sóng âm có tấn số thấp (a) và tần số cao (b) 36
Hình 2.28 Sự kết hợp bồi âm khác nhau 37
Hình 2.29 Sóng âm nốt A với tần số 440Hz và 880 Hz 37
Hình 2.30 Nhạc cụ dân tộc: Họ thân tự vang 38
Hình 2.31 Nhạc cụ dân tộc: Họ màng rung 39
Hình 2.32 Nhạc cụ dân tộc: Họ hơi 41
Hình 2.33 Nhạc cụ dân tộc: Họ dây 42
Hình 3.1 Giao diện phần mềm Cool Edit Pro 2.1 47
Hình 3.2 Kiến trúc khối chức năng cho hệ thống xử lí dữ liệu đa phương tiện 49
Hình 3.3 Kiến trúc đảm bảo tính thống nhất 49
Hình 3.4 Kiến trúc chỉ số hóa hỗn hợp 51
Hình 3.5 Quan hệ ≤ trong hệ thống cơ sở dữ liệu đa phương tiện có cấu trúc 52
Hình 3.6 Mô hình tìm kiếm thông tin tổng quát 53
Hình 3.7 Phần mềm SQL SERVER 56
Hình 3.8 Lược đồ quan hệ cơ sở dữ liệu âm thanh 60
Hình 3.9 Giao diện cập nhật thông tin nhạc sỹ, người sáng tác 61
Hình 3.10 Giao diện cập nhật thông tin nghệ sỹ, người biểu diễn 62
Hình 3.11 Giao diện cập nhật bản nhạc, thông tin bản nhạc 63
Hình 3.12 Giao diện tìm kiếm và trích xuất nhạc 63
Hình 3.13 Giao diện nghe nhạc từ cơ sở dữ liệu 64
Danh mục các bảng Bảng 2.1 Tương quan giữa cao độ và tần số 37
Bảng 3.1 Mô tả bảng MusicContent 57
Bảng 3.2 Mô tả bảng MusicWriter 58
Bảng 3.3 Mô tả bảng MusicPerformer 59
Trang 12Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Ngày nay, mọi người sống, làm việc và giao tiếp thông qua các dữ liệu đa phương tiện Công nghệ thông tin truyền thông, mạng máy tính và các giao thức truyền thông phát triển mạnh mẽ, kết hợp với khả năng mô tả, đồ họa phong phú của các trình duyệt càng mang lại sự đa dạng về các dữ liệu cho người dùng đầu cuối Do đó, đòi hỏi làm thế nào để tổ chức và cơ cấu một lượng rất lớn các dữ liệu
đa phương tiện để có thể dễ dàng nhận được thông tin cần thiết một cách nhanh chóng tại bất kỳ thời điểm nào Từ đó, cơ sở dữ liệu đa phương tiện được xây dựng
để trở thành một công cụ quản lí, lưu trữ và truy cập một lượng rất lớn các đối tượng đa phương tiện Đó chính là cơ hội cũng như là nguyên nhân để các công nghệ về cơ sở dữ liệu đa phương tiện phát triển và ứng dụng rộng rãi trong đời sống kinh tế xã hội
Các dữ liệu đa phương tiện gồm có: văn bản, hình ảnh tĩnh, hình ảnh động, âm thanh, âm nhạc, video Hiệu quả của các ứng dụng đa phương tiện phụ thuộc vào sức mạnh của cơ sở dữ liệu đa phương tiện, cụ thể là cấu trúc, cách tổ chức, khả năng truy cập nhanh, chính xác Công nghệ đa phương tiện được ứng dụng trong nhiều trường hợp như: e- learning, hội thảo video, thư điện tử, hiện thực ảo, trò chơi điện tử, thương mại điện tử
Việc tìm hiểu bản chất cũng như là các đặc trưng, các thuộc tính, các kỹ thuật
số hóa của từng loại dữ liệu đa phương tiện là yêu cầu để triển khai và ứng dụng công nghệ đa phương tiện vào đời sống Trong đó, việc tìm hiểu các đặc trưng, phương pháp số hóa, phương pháp trích chọn, tìm kiếm của dữ liệu âm thanh trong
Trang 13Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
cơ sở dữ liệu âm thanh hiện đang được quan tâm đặc biệt bởi các đặc thù của dữ liệu âm thanh như: đa dạng, thông dụng với người dùng, thân thiện với mọi đối tượng, truyền tải một lượng lớn thông tin trong khoảng thời gian ngắn, ứng dụng nhiều trong đời sống, đó chính là lí do tôi chọn đề tài “Đặc trưng âm thanh trong cơ
sở dữ liệu âm thanh số”
Do nội dung của đề tài rộng và không thể thực hiện đầy đủ trong thời gian thực tập tốt nghiệp, tôi xác định những việc đầu tiên, phục vụ trực tiếp cho luận văn
là (i) kiến trúc và yêu cầu của cơ sở dữ liệu âm thanh số hóa; (ii) chuẩn bị đặc trưng
dữ liệu cho cơ sở dữ liệu này Để nêu rõ các đặc trưng âm thanh, đối tượng xem xét
là dữ liệu âm thanh nhạc cụ, đặc biệt là âm thanh của các nhạc cụ dân tộc
Cấu trúc của luận văn : Luận văn bao gồm các chương :
1 Chương 1: Tìm hiểu về khái niệm tổng quan của cơ sở dữ liệu âm thanh
2 Chương 2: Nêu các đặc trưng âm thanh
3 Chương 3: Đề cập phân tích, thiết kế và xây dựng cơ sở dữ liệu âm thanh
Cuối cùng là kết luận của luận văn và danh sách các tài liệu tham khảo sử dụng trong luận văn
Trang 14Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Chương 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH
Chương 1 trình bày một số khái niệm tổng quan liên quan đến dữ liệu âm thanh nói riêng, dữ liệu đa phương tiện nói chung và cơ sở dữ liệu âm thanh
1.1 Các dữ liệu đa phương tiện
1.1.1 Khái niệm về dữ liệu đa phương tiện
Dữ liệu đa phương tiện bao gồm: văn bản, đồ họa, hoạt hình, âm thanh, video
Văn bản (Text): Gồm các kí tự (chữ cái, chữ số, các kí hiệu đặc biệt ) Thể hiện chung nhất của kí tự là theo mã ASCII Người ta dùng 7 bit cho mỗi mã, nhưng
sử dụng chung là 8 bit, thêm một bit chẵn lẻ Với các văn bản thể hiện các ngôn ngữ khác nhau người ta sử dụng bộ mã khác nhau Bộ nhớ dành cho văn bản được tính theo số kí tự, số trang Ngày này, người ta thường sử dụng bộ mã Unicode gồm 16 bit cho mỗi kí tự để thể hiện kí tự Với bộ mã 16 bit dễ dàng thể hiện văn bản chứa các ngôn ngữ khác nhau, tuy nhiên bộ nhớ để lưu trữ cũng tăng lên gấp đôi
Hầu hết các tự liệu văn bản có cấu trúc, gồm (i) nhan đề; (ii) đoạn; (iii) mục;… Cầu trúc của văn bản thể hiện ra khi in Có nhiều dạng thức và chuẩn mã hóa văn bản có cấu trúc, như SGML, ODA, LaTex và PDF Trong một tệp văn bản thông thường, đầu tệp lưu thông tin về dạng thức tư liệu, cấu trúc sau đó là nội dung văn bản Khi biết dạng thức tệp, thông tin cấu trúc được trích rút dùng cho tìm kiếm
Trong các ứng dụng đa phương tiện, văn bản hiện được sử dụng rộng rãi Nguyên nhân là do việc thể hiện văn bản trên màn hình rất thuận lợi Đồng thời
có nhiều thông tin không thể hiện được bằng các các công cụ đa phương tiện khác, khi đó văn bản là hình thức được sử dụng để thể hiện thông tin đó
Tiếng nói: Tiếng nói là một dữ liệu có tính liên tục, tiếng nói có thể được sử dụng giới thiệu, trình bày, nêu yêu cầu Tiếng nói được coi như là công cụ giải thích
bổ sung hữu hiệu cho văn bản
Trang 15Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Đồ họa: là một lĩnh vực truyền thông trong đó thông điệp được tiếp nhận qua con đường thị giác Thiết kế đồ họa là tạo ra các giải pháp bằng hình ảnh cho các vấn
đề truyền thông
Có hai loại đồ họa (i) bitmap; (ii) vector Đồ họa bitmap chia nhỏ thành các pixel, mỗi pixel ứng với một chấm trên màn hình Cường độ của pixel được lưu trong tệp đồ họa pixel Đồ họa vector, phần tử đồ họa được thể hiện theo các mô hình xác định trước, hay theo công thức toán học Việc lưu trữ dữ liệu vector đơn giản, là lưu trữ các chỉ dẫn cơ bản cho phép sinh ra đồ họa Đối với đồ họa vector, dễ trích nội dung Thuộc tính của phần tử như hình dáng, kích thước, lấy
ra từ tệp đồ họa được sử dụng để chỉ số hóa và tìm kiếm
Dữ liệu ảnh bitmap, là ma trận các điểm ảnh để thể hiện hình ảnh Số lượng điểm ảnh lớn sẽ làm hình ảnh mịn hơn Dữ liệu ảnh vector, không dùng ma trận điểm ảnh, mà dùng phường trình toán học thể hiện hình ảnh, sau đó thiết bị hiển thị sẽ thể hiện lại hình ảnh dựa trên phương trình của ảnh
Đồ họa là một thành phần đa phương tiện rất mạnh được sử dụng để thể hiện ngữ cảnh Đồ họa là một kiểu dữ liệu độc lập, từ hình ảnh đồ họa có thể xác định được những khoảnh khắc (không gian) và thời gian Đồ họa là loại dữ liệu thích hợp cho việc nghiên cứu và phân tích các mối quan hệ Đồ họa có thể kết hợp với văn bản để mô tả đầy đủ về đối tượng Đồ họa thể hiện đối tượng chi tiết hơn
so với hình ảnh và thể hiện tốt các đối tượng mang tính trừu tượng
Hình ảnh: Thể hiện mối quan hệ từ ảnh đại diện đến nội dung cụ thể Tâm trạng của người quan sát có thể quyết định nội dung của hình ảnh, khi đó sự kết hợp giữa hình ảnh và âm thanh sẽ cho kết quả đầy đủ về nội dung thực
Hoạt hình: là thể hiện nhanh chuỗi các hình ảnh của tác phẩm 2D hay 3D hay các
vị trí mô hình, để tạo nên ảo ảnh về chuyển động Hình động được sinh ra do làm tinh, biểu diễn tuần tự các khung đồ họa Nếu đồ họa dùng bitmap, hình động như đoạn video Đối với hình động theo vector, việc chỉ số hóa và tìm kiếm được thực hiện như với đồ họa vector, trừ việc xử lí yếu tố thời gian
Trang 16Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hoạt hình cũng là một thành phần trong cơ sở dữ liệu đa phương tiện Hoạt hình
có thể hiểu là các hình ảnh thay đổi, thể hiện sự thay đổi các thuộc tính của đối tượng trong một khoảng thời gian Hoạt hình đòi hỏi nhiều không gian bộ nhớ để lưu trữ hơn so với hình ảnh
Dữ liệu hình động: việc mô phỏng chuyển động được tạo bằng cách hiện một loạt các hình (tức khung hình) Phim hoạt hình trên tivi là một ví dụ về hình động Hình động trên máy tính có vai trò chính trong thể hiện đa phương tiện Có nhiều ứng dụng cho phép tạo hình động, rồi thể hiện trên màn hình máy tính
Âm thanh: là các dao động cơ học (biến đổi vị trí qua lại) của các phần tử, nguyên tử hay các hạt làm nên vật chất và lan truyền trong vật chất như các sóng Âm thanh, giống như nhiều sóng, được đặc trưng bởi tần số, bước sóng, chu kì, biên độ và vận tốc lan truyền
Âm thanh hay âm nhạc cũng như các bài phát biểu có sức mạnh về mặt tạo cảm xúc Âm nhạc có thể kích thích tâm trạng tích cực trong phục hồi hoặc thư giản trí tuệ và cơ thể, trong khi đó âm thanh như là tiếng ồn tác động đến con người
Sự kết hợp âm thanh với hình ảnh động sẽ thể hiện thế giới trực quan
Video: là công nghệ điện tử để thu, ghi lại, xử lí, lưu trữ, truyền và tái tạo chuỗi các hình ảnh tĩnh nhằm thể hiện cảnh chuyển động
Video là dữ liệu mạnh nhất của tất cả các loại dữ liệu đa phương tiện Nó có khả năng miêu tả đầy đủ về thế giới thực Nó giúp người xem hiểu và nhớ sâu sắc nội dung cần diễn đạt
Hình động và video khác nhau, trong khi video hiện các chuyển động liên tục bằng cách sử dụng các khung hình rời rạc, thì hình động bắt đầu bằng các ảnh độc lập, rồi đặt chúng với nhau để tạo nên ảo ảnh về chuyển động liên tục
1.1.2 Phân loại dữ liệu đa phương tiện
Các dữ liệu đa phương tiện được chia thành hai lớp: lớp các dữ liệu không liên tục và lớp các dữ liệu liên tục
Trang 17Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Các dữ liệu không liên tục là những dữ liệu khi trình bày không phụ thuộc vào thời gian, các dữ liệu không liên tục gồm: dữ liệu văn bản không có cấu trúc hoặc có cấu trúc, các hình ảnh : bitmap và vector
Các dữ liệu liên tục là những dữ liệu nội dung trình bày phụ thuộc vào thời gian, các dữ liệu liên tục gồm: tiếng nói , âm thanh, video, hoạt hình
1.1.3 Các đặc tính của dữ liệu đa phương tiện
Các đặc tính chung của dữ liệu đa phương tiện gồm:
1 Không có cấu trúc ổn định: các dữ liệu đa phương tiện có khuynh hướng phi cấu trúc, vì vậy các tác nghiệp quản trị dữ liệu chuẩn như: chỉ số hóa, tìm kiếm nội dung, truy cập dữ liệu thường là không áp dụng được hoặc rất khó áp dụng
2 Nội dung mang tính tạm thời: các dữ liệu liên tục như: ảnh động, video, âm thanh và hoạt hình đều phụ thuộc vào thời gian nên việc lưu trữ, thao tác và mô
tả chúng là rất khó khăn và gắn liền với tính thời sự
3 Có dung lượng lớn: các dữ liệu đa phương tiện thường có dung lượng rất lớn, điều này đỏi hỏi nhiều không gian lưu trữ, tốc độ truy cập nhanh, hiệu quả
4 Các ứng dụng yêu cầu hỗ trợ: các dữ liệu phi chuẩn có thể đòi hỏi các quy trình
xử lí phức tạp, lại có dung lượng lớn nên các ứng dụng khai thác thường đòi hỏi các yêu cầu hỗ trợ chặt chẽ, chẳng hạn việc sử dụng các thuật toán nén dữ liệu hiệu quả là yêu cầu của các ứng dụng khai thác dữ liệu đa phương tiện
1.2 Tổng quan về cơ sở dữ liệu đa phương tiện
1.2.1 Khái niệm về cơ sở dữ liệu đa phương tiện
Cơ sở dữ liệu đa phương tiện là một loại cơ sở dữ liệu giống như bất kì một cơ
sở dữ liệu khác, nó có chứa tập các bản ghi mà mỗi bản ghi là một bộ sưu tập đa phương tiện Đa phương tiện được định nghĩa là sự kết hợp của nhiều phương tiện truyền thông, các phương tiện truyền thông được chia thành hai nhóm: phương tiện truyền thông tĩnh và phương tiện truyền thông động Văn bản, ảnh, hình vẽ được coi
là phương tiện truyền thông tĩnh; các đối tượng hoạt hình, âm nhạc, âm thanh, tiếng nói, video được coi là phương tiện truyền thông động Cơ sở dữ liệu đa phương
Trang 18Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
tiện là một hệ thống quản lí một tập rất lớn các dữ liệu đa phương tiện và cung cấp các phương thức truy cập cho người dùng dễ dàng truy cập Nói chung, cơ sở dữ liệu đa phương tiện có chứa văn bản, hình ảnh, hoạt hình, video, phim, âm thanh
1.2.2 Nhu cầu về cơ sở dữ liệu đa phương tiện
Có rất nhiều nguyên nhân đòi hỏi phải có cơ sở dữ liệu đa phương tiện, dưới đây là một số nguyên nhân chính dễ dàng nhận thấy:
1 Cơ sở dữ liệu đa phương tiện có khả năng xử lí một lượng rất lớn các đối tượng đa phương tiện mà một cơ sở dữ liệu thông thường không thực hiện được hoặc thực hiện được nhưng không hiệu quả
2 Cơ sở dữ liệu đa phương tiện giúp tạo ra một thư viện ảo chứa đựng các thông tin bao gồm: các viện bảo tàng, các thư viện
3 Cơ sở dữ liệu đa phương tiện hỗ trợ phát triển các ứng dụng đa phương tiện trong mọi lĩnh vực của cuộc sống như: giáo dục, y tế, nghiên cứu khoa học và thư viện
4 Cơ sở dữ liệu đa phương tiện là công cụ để bảo quản các bức ảnh mục nát, bản đồ cổ, các bộ phim cũ, nhưng có vai trò quan trọng trong cuộc sống
5 Sử dụng cơ sở dữ liệu đa phương tiện giúp chúng ta tạo ra các bài giảng trực quan, sinh động và hiệu quả
6 Cơ sở dữ liệu đa phương tiện là ngân hàng, là kho lưu trữ thông tin đa phương tiện để nhiều người cùng khai thác với các mục đích khác nhau
1.2.3 Phân loại cơ sở dữ liệu đa phương tiện
Có thể phân cơ sở dữ liệu đa phương tiện thành hai loại: cơ sở dữ liệu đa phương tiện liên kết và cơ sở dữ liệu đa phương tiện nhúng
1 LMD là cơ sở dữ liệu được tổ chức như một cơ sở dữ liệu chứa siêu dữ liệu Các siêu dữ liệu thực chất là các liên kết đến dữ liệu cụ thể như: ảnh, hình vẽ, hình ảnh động, âm thanh, video Các dữ liệu này lưu trữ tại chỗ hoặc thông qua mạng Một lợi thế lớn của cơ sở dữ liệu loại này là kích thước nhỏ do các đối tượng đa phương tiện không được lưu trực tiếp vào
cơ sở dữ liệu mà chỉ có các liên kết được nhúng vào
Trang 19Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2 EMD là loại cơ sở dữ liệu mà bản thân các đối tượng đa phương tiện được lưu trực tiếp vào cơ sở dữ liệu và được coi như các thành phần nhị phân
Ưu điểm chính của cơ sở dữ liệu loại này là thời gian truy cập nhanh, tuy nhiên kích thước của cơ sở dữ liệu sẽ rất lớn do các đối tượng đa phương tiện thường có dung lượng rất lớn
Hình 1.1 Dữ liệu Đa phương tiện
1.2.4 Đặc trưng của một cơ sở dữ liệu đa phương tiện
Một cơ sở dữ liệu đa phương tiện có các đặc trưng sau đây:
1 Là phương tiện lưu trữ dữ liệu đa phương tiện
2 Phương thức tìm kiếm phải toàn diện (tìm kiếm phải cho kết quả chính xác hoặc tương đối, nếu có đối tượng cần tìm thì kết quả tìm kiếm phải chứa đối tượng đó)
3 Giao diện phải độc lập với thiết bị và định dạng
4 Cho phép truy cập dữ liệu đồng thời (nhiều người cùng truy cập tại một thời điểm)
5 Lưu trữ được số lượng rất lớn các dữ liệu đa phương tiện
6 Các ràng buộc phải nhất quán, thống nhất
7 Thời gian lưu trữ lâu dài
Khi thiết kế một cơ sở dữ liệu đa phương tiện ta không thể thực hiện theo cách thiết kế một hệ thống cơ sở dữ liệu thông thường, do các đối tượng đa phương tiện
có những đặc điểm sau:
1 Các đối tượng đa phương tiện có cấu trúc rất phức tạp (có thể phụ thuộc vào thời gian)
Trang 20Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2 Các đối tượng đa phương tiện có tính chất nghe hoặc nhìn thấy hoặc cả hai như trong tự nhiên (giống tự nhiên)
3 Các đối tượng đa phương tiện phụ thuộc vào ngữ cảnh
4 Việc truy cập, tìm kiếm các đối tượng đa phương tiện còn chưa rõ ràng trong tự nhiên (chưa có phương thức tìm kiếm hữu hiệu)
1.3 Cơ sở dữ liệu âm thanh
Đối với thính giác của người, âm thanh thường là sự dao động, trong dải tần số
từ khoảng 20Hz đến khoảng 20kHz, của các phân tử không khí, và lan truyền trong không khí, va đập vào màng nhĩ, làm rung màng nhĩ và kích thích bộ não Tuy nhiên âm thanh có thể được định nghĩa rộng hơn, tuỳ vào ứng dụng, bao gồm các tần số cao hơn hay thấp hơn tần số mà tai người có thể nghe thấy, và không chỉ lan truyền trong không khí, mà trong bất cứ vật liệu nào Trong định nghĩa rộng này,
âm thanh là sóng cơ học và theo lưỡng tính sóng hạt của vật chất, sóng này cũng có thể coi là dòng lan truyền của các hạt phonon, các hạt lượng tử của âm thanh
Cả tiếng ồn và âm nhạc đều là các âm thanh Trong việc truyền tín hiệu bằng
âm thanh, tiếng ồn là các dao động ngẫu nhiên không mang tín hiệu
1.3.2 Về cơ sở dữ liệu âm thanh
Cơ sở dữ liệu âm thanh trước hết là một cơ sở dữ liệu đa phương tiện, tức là
cơ sở dữ liệu lưu trữ các đối tượng đa phương tiện Nhưng các đối tượng đa phương tiện được nhắc đến ở đây chính là các đối tượng âm thanh đã được số hóa thành các
dữ liệu âm thanh có thể lưu trữ trên các thiết bị nhớ Thực chất cơ sở dữ liệu âm thanh là cơ sở dữ liệu dùng để lưu trữ và truy cập các đối tượng âm thanh trên máy tính điện tử
Trang 21Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Cũng tương tự như cơ sở dữ liệu đa phương tiện, cơ sở dữ liệu âm thanh cũng
có thể được phân thành hai loại: cơ sở dữ liệu âm thanh liên kết và cơ sở dữ liệu âm thanh nhúng
Trong đời sống, cơ sở dữ liệu âm thanh có vai trò rất quan trọng và được ứng dụng trong nhiều lĩnh vực khác nhau: (i) Kiểm soát điện thoại; (ii) Nhận dạng tín hiệu âm nhạc;…
1.4 Một số phần mềm cho phép xử lí âm thanh
Có nhiều công trình đề cập việc xử lí âm thanh Theo thông tin trên trang Wiki
2011, có nhiều phần mềm xử lí âm thanh, biên tập âm thanh, quản lý âm thanh
Xử lí âm thanh Ardour;
1.5 Nhu cầu về âm thanh nhạc cụ
Âm nhạc (trong đó có âm thanh nhạc cụ) ngoài khả năng đem lại niềm vui, sự sảng khoái và nguồn nghị lực cho con người trong cuộc sống còn có tác dụng thức tỉnh tình cảm của con người qua những cung bậc hết sức tinh tế Sức mạnh cảm hóa của âm nhạc tiến bộ, lành mạnh sẽ giúp con người vươn tới một nhân cách toàn vẹn
Như chúng ta đều biết, nhân cách là một thực thể phức tạp, đồng thời cũng là một thực thể thống nhất biện chứng về sinh lý, tâm lý và xã hội của con người Ở những nhân cách phát triển toàn diện, ý thức tình cảm và hành vi của họ thống nhất biện chứng và tác động tương hỗ lẫn nhau Phát triển nhân cách con người là quá
Trang 22Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
trình tác động toàn diện lên các mặt trên bằng các phương tiện khác nhau, trong đó
âm nhạc là một trong những phương tiện hết sức quan trọng
Hình 1.2 Sử dụng nhạc cụ
Âm nhạc là loại hình nghệ thuật dùng âm thanh làm phương tiện biểu hiện hình tượng nghệ thuật nhằm phản ánh thế giới quan, nhân sinh quan, trình độ phát triển đời sống cộng đồng xã hội, cùng những nét riêng trong đời sống tinh thần của người nghệ sỹ Ngôn ngữ của âm nhạc có tính trừu tượng cao vốn là một thế mạnh trong việc gợi lên hình tượng nghệ thuật và làm cho hình tượng nghệ thuật "dội" thẳng vào con tim, trước khi "vọng" lên trí óc của người thưởng thức Trước đây, người ta thường coi tính trừu tượng đó là hạn chế của nghệ thuật âm nhạc khi phản ánh thế giới Song, cho đến nay đã có thể khẳng định: chính tính trừu tượng cao của nghệ thuật âm nhạc khi biểu hiện hình tượng nghệ thuật lại là một trong những thế mạnh riêng
Người sáng tác tổ chức các âm thanh (thường là có tính nhạc) một cách chặt chẽ theo một hệ thống khúc thức logic để phản ánh sự đa dạng, phong phú của cuộc sống cũng như đời sống nội tâm của con người: niềm vui sướng và nỗi đau thương,
sự say mê lao động và niềm hạnh phúc, cuộc đấu tranh sống còn và tâm tư thầm kín, những bức xúc xã hội và những ước mơ, hoài bão cao đẹp… Hệ thống ngôn ngữ ấy được sống dậy trong âm điệu và nhịp điệu thông qua biểu diễn của người nghệ sỹ, phản ánh một cách lành mạnh hiện thực cuộc sống và tâm tư tình cảm con người, đồng thời luôn tạo nên sự đồng điệu với nền văn hóa của người thưởng thức âm
Trang 23Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
nhạc, hướng họ vào thế giới nội tâm, vào lý tưởng, tình cảm trong sáng, vào tâm hồn cao thượng để vươn tới tương lai tươi đẹp
về cơ sở dữ liệu âm thanh, âm thanh nhạc cụ Với mục tiêu là tìm hiểu và xây dựng cơ sở dữ liệu âm thanh nhạc cụ nên ở chương tiếp theo sẽ trình bày các đặc trưng của dữ liệu đa phương tiện, dữ liệu âm thanh, các thao tác số hóa, chỉ mục
Trang 24Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Chương 2 CÁC ĐẶC TRƯNG ÂM THANH 2.1 Số hóa dữ liệu âm thanh
2.1.1 Đặc tính của âm thanh tương tự
Mục tiêu của âm thanh là truyền tải thông tin Dựa vào lí thuyết thông tin, âm thanh có thể được đại diện bởi thuật ngữ là nội dung thông điệp hoặc là thông tin Một cách khác để biểu thị âm thanh là tín hiệu mang nội dung thông điệp, tín hiệu vật lí dạng sóng âm thanh mang nội dung thông tin
Hình 2.1 Dạng sóng của tín hiệu âm thanh ghi nhận được
Kỹ thuật đầu tiên dùng trong việc ghi âm là sử dụng các thông số về cơ, điện
để biểu diễn sự thay đổi áp suất không khí Chẳng hạn, điện áp tạo ra từ micro là tín hiệu tương tự của áp suất không khí (hoặc đôi khi là vận tốc không khí)
Trong hệ thống xử lí âm thanh tương tự, thông tin được truyền đạt bằng thông
số liên tục biến thiên vô hạn
Hệ thống xử lí âm thanh số lí tưởng có những tính năng tương tự như hệ thống
xử lí âm thanh tương tự lí tưởng: cả hai loại hoạt động một cách “trong suốt” và tạo lại dạng sóng ban đầu không lỗi Tuy nhiên, trong thế giới thực, các điều kiện lí tưởng rất khó để tồn tại, nên hai loại hệ thống xử lí âm thanh này sẽ hoạt động rất khác nhau Tín hiệu số sẽ truyền trong khoảng cách ngắn hơn tín hiệu tương tự và với chi phí thấp hơn
Trang 25Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.1.2 Khái niệm tín hiệu
Tín hiệu nói chung là đại lượng vật lí biến thiên theo thời gian, theo không gian, theo một hoặc nhiều biến độc lập khác nhau Chẳng hạn, âm thanh dao động theo thời gian, hình ảnh là sự biến thiên cường độ sáng theo không gian (toạ độ) Biểu diễn toán học của tín hiệu là một hàm theo biến độc lập, chẳng hạn, u(t)=2t2-5 hoặc f(x,y)=x2-2xy+6y2 Thông thường, các tín hiệu tự nhiên không biểu diễn được bởi một hàm sơ cấp, cho nên trong tính toán, người ta thường dùng hàm xấp xỉ cho tín hiệu tự nhiên
Hệ thống là thiết bị vật lí, thiết bị sinh học, hoặc chương trình thực hiện các phép toán trên tín hiệu nhằm biến đổi tín hiệu, rút trích thông tin Việc thực hiện phép toán còn được gọi là xử lí tín hiệu
2.1.3 Phân loại tín hiệu
1 Tín hiệu đa kênh: là tín hiệu gồm nhiều tín hiệu thành phần, cùng chung mô
tả một đối tượng nào đó và thường biểu diễn dưới dạng vector Ví dụ: tín hiệu điện não, tín hiệu điện tim, tín hiệu ảnh
2 Tín hiệu đa chiều: là tín hiệu biến thiên theo nhiều hơn một biến độc lập
3 Tín hiệu liên tục theo thời gian: là tín hiệu được định nghĩa tại mọi điểm trong đoạn thời gian [a, b], kí hiệu x(t)
Hình 2.2 Tín hiệu liên tục theo thời gian
Trang 26Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
4 Tín hiệu rời rạc theo thời gian: là tín hiệu chỉ được định nghĩa tại những thời điểm rời rạc khác nhau, kí hiệu x(n)
Hình 2.3 Tín hiệu rời rạc theo thời gian
5 Tín hiệu liên tục giá trị: là tín hiệu có thể nhận giá trị bất kỳ trong đoạn [Ymin, Ymax]
Hình 2.4 Tín hiệu liên tục giá trị
6 Tín hiệu rời rạc giá trị: là tín hiệu chỉ nhận giá trị trong tập giá trị rời rạc định trước (tín hiệu số)
Trang 27Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 2.5 Tín hiệu rời rạc giá trị
7 Tín hiệu tương tự: là tín hiệu liên tục về thời gian, liên tục về giá trị
Trang 28Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
10 Tín hiệu tất định: là tín hiệu mà giá trị tín hiệu ở quá khứ, hiện tại và tương lai đều được xác định rõ ràng
2.1.4 Mô hình hóa tín hiệu âm thanh
Có rất nhiều kỹ thuật xử lí tín hiệu được mô hình hóa và áp dụng các giải thuật trong việc khôi phục âm thanh Chất lượng của âm thanh phụ thuộc rất lớn vào mô hình giả định phù hợp với dữ liệu Đối với tín hiệu âm thanh, bao gồm âm thoại, nhạc và nhiễu không mong muốn, mô hình phải tổng quát và không sai lệch so với giả định
Mô hình phù hợp với hầu hết rất nhiều lĩnh vực trong việc xử lí chuỗi thời gian, bao gồm việc phục hồi âm thanh là AR được dùng làm mô hình chuẩn cho việc phân tích dự đoán tuyến tính
Tín hiệu hiện tại được biểu diễn bởi tổng giá trị của P tín hiệu trước đó và tín hiệu nhiễu trắng P được gọi là bậc của mô hình AR
Mô hình AR đại diện cho các quá trình tuyến tính tĩnh, chấp nhận tín hiệu tương tự nhiễu và tín hiệu tương tự điều hòa Một mô hình khác phù hợp hơn đối với nhiều tình huống phân tích là ARMA cho phép các điểm cực cũng như điểm không Tuy nhiên mô hình AR có tính linh động hơn trong phân tính so với mô hình ARMA
Ví dụ một tín hiệu nhạc phức tạp cần mô hình có bậc P>100 để biểu diễn dạng sóng của tín hiệu, trong khi các tín hiệu đơn giản hơn chỉ cần biểu diễn bậc bằng 30 Trong nhiều ứng dụng, việc lựa chọn bậc của mô hình phải phù hợp với bài toán, tức là phải đảm bảo việc biểu diễn tín hiệu sẽ không làm mất mát thông tin của tín hiệu Có rất nhiều phương pháp dùng để ước lượng bậc của mô hình AR như phương pháp láng giềng gần nhất hay bình phương tối thiểu, Makhoul, 1975, và phương pháp bền vững đối với ồn, như Huber, 1981, Spath, 1991 Tuy nhiên, đối với việc xử lí các tín hiệu âm nhạc phức tạp thì thông thường sử dụng mô hình Sin rất có hiệu quả trong nhiều ứng dụng Mô hình Sin rất phù hợp trong các phương pháp dùng để giảm nhiễu
Trang 29Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Đây là mô hình tổng quát đối với các điều chế biên độ và điều chế tần số, tuy nhiên lại không phù hợp đối với các tín hiệu tương tự nhiễu, mặc dù việc biểu diễn tín hiệu nhiễu có thể được biểu diễn bởi số lượng hàm sin rất lớn
2.1.5 Kiến trúc xử lí tín hiệu âm thanh
Đối với máy tính số xử lí âm thanh, thường dùng phương pháp điều chế xung PCM Dạng sóng âm thanh được chuyển sang dãy số PCM như sau, xét tín hiệu hình sin làm ví dụ
Tín hiệu gốc: giả sử có tín hiệu gốc như hình:
Hình 2.8 Dạng sóng của âm thanh nguyên thủy
Tiếp theo, sử dụng một micro để thu tín hiệu âm thanh (trong không khí) và chuyển đổi thành tín hiệu điện, tầm điện áp ngõ ra của micro ±1 volt như hình sau:
Hình 2.9 Dạng sóng của tín hiệu điện
Tín hiệu điện áp dạng tương tự sau đó được chuyển thành dạng số hóa bằng thiết bị chuyển đổi tương tự-số ADC Khi sử dụng bộ chuyển đổi 16 bit tương tự, tần số nguyên ngõ ra có giá trị từ -32768 đến +32767, được mô tả như hình sau:
Trang 30Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 2.10 Ngõ ra bộ chuyển đổi tín hiệu tương tự sang tín hiệu số
Vì số lượng điểm dữ liệu là vô hạn nên không thể lấy tất cả các điểm thuộc trục thời gian, việc lấy mẫu sẽ được thực hiện trong một khoảng thời gian đều đặn
Số lượng mẫu trong một giây được gọi là tần số lấy mẫu Hình sau mô tả 43 mẫu được lấy:
Hình 2.11 Thực hiện việc lấy mẫu
Kết quả của việc lấy mẫu là một chuỗi gồm 43 số biểu diễn cho các vị trí của dạng sóng ứng thời gian là một chu kỳ
Hình 2.12 Kết quả của việc lấy mẫu các giá trị
Trang 31Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Máy tính sau đó sẽ xây dựng lại dạng sóng của tín hiệu bằng việc kết nối các điểm dữ liệu lại với nhau Dạng sóng kết quả được mô tả ở hình sau:
Hình 2.13 Dạng sóng đƣợc tái tạo lại
Sóng tái tạo khác với sóng nguyên thủy nhưng có thể chấp nhận được ở một số điểm sau :
1 Các giá trị được tạo ra tại bộ chuyển đổi tín hiệu tương tự sang tín hiệu số
là các số nguyên và được làm tròn
2 Hình dáng của tín hiệu tái tạo phụ thuộc vào số lượng mẫu được ghi nhận Tổng quát, một dãy số hữu hạn (đại diện cho tín hiệu số) chỉ có thể biểu diễn cho một dạng sóng tín hiệu tương tự với độ chính xác hữu hạn
2.1.6 Tần số lấy mẫu
Khi chuyển đổi một âm thanh sang dạng số, điều cần lưu ý là tần số lấy mẫu của hệ thống xử lí phải đảm bảo tính trung thực và chính xác khi cần phục hồi lại dạng sóng tín hiệu ban đầu
Theo định lí lấy mẫu Nyquist và Shannon, tần số lấy mẫu quyết định tần số cao nhất của tín hiệu phục hồi Để tái tạo lại dạng sóng có tần số là F, cần phải lấy 2F mẫu trong một giây Tần số này còn được gọi là tần số Nyquist Tuy nhiên, định
lí Nyquist không phải là tối ưu cho mọi trường hợp Nếu một dạng sóng hình Sin có tần số là 500Hz, thì tần số lấy mẫu 1000Hz Nếu như tần số lấy mẫu cao hơn tần số Nyquist sẽ gây ra tình trạng hiệu ứng ảnh hưởng đến biên độ của tín hiệu và tín hiệu
bị cộng nhiễu, tuy vậy lúc này các thành phần tần số thấp lại có tín hiệu chính xác hơn khi được phục hồi
Trang 32Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.1.7 Một số khái niệm toán học trong xử lí âm thanh
2.1.7.1 Phép biến đổi z
Phép biến đổi z của một chuỗi được định nghĩa bởi cặp biểu thức:
Biến đối z của x(n) là X(z) Trong đó X(z) còn được gọi là dãy công suất vô hạn theo biến z-1, với các giá trị của x(n) chính là các hệ số của dãy công suất Miền
nói cách khác:
Thông thường, miền hội tụ của z có dạng: R1<|z|<R2
Ví dụ:
Cho x(n)=u(n)-u(n-N) Khi đó phép biến đổi z cho:
Cho x(n)=an.u(n) Phép biến đổi z cho:
Cho x(n)=-bnu(-n-1) Phép biến đổi z cho:
Trang 33Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.1.7.2 Phép biến đổi Fourier
Phép biến đổi Fourier của tín hiệu rời rạc thời gian được cho bởi công thức:
Biến đổi Fourier là trường hợp đặc biệt của phép biến đổi z bằng cách thay thế Như mô tả ở hình dưới, trong mặt phẳng z, tần số w là góc quay Điều
Hình 2.14 Vòng tròn đơn vị thuộc mặt phẳng z
Một đặc tính quan trọng của biến đổi Fourier của một chuỗi là: X(ejw
) là hàm điều hòa w với chu kì 2π
2.1.7.3 Phép biến đổi Fourier rời rạc
Trong trường hợp tín hiệu tương tự, tuần hoàn với chu kỳ N ta có:
Trang 34Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Với có thể có dạng là tổng rời rạc các tín hiệu sin thay vì tích phân Phép biến đổi Fourier cho chuỗi tuần hoàn như sau:
Chuỗi x(n) hữu hạn, có giá trị bằng 0 với 0 ≤ n ≤ N-1, có phép biến đổi z là:
N-1, ta có:
hoàn Như vậy, một chuỗi có chiều dài N có thể được biểu diễn bởi phép biến đổi Fourier rời rạc (DFT) như sau:
Trang 35Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Như vậy đã loại bỏ được kí hiệu “-“ (trong , khi nói đến tín hiệu tuần hoàn) và giới hạn hữu hạn 0 ≤ k ≤ N-1 và 0 ≤ n ≤ N-1 Phép biến đổi Fourier rời rạc DFT chỉ dùng cho tín hiệu tuần hoàn có tính chất module của N:
2.1.8 Số hóa dữ liệu âm thanh
2.1.8.1 Các mô hình lấy mẫu và mã hóa âm thanh
1 Lấy mẫu tín hiệu ở miền thời gian và tái tạo tín hiệu liên tục
Để xử lí một tín hiệu liên tục bằng các phương tiện xử lí tín hiệu số, ta phải chuyển đổi tín hiệu liên tục đó ra dạng một chuối số (một dạng của tín hiệu số, tín hiệu rời rạc) bằng cách lấy mẫu tín hiệu liên tục tuần hoàn có chu kỳ T (giây) Gọi x(n) là tín hiệu rời rạc hình thành trong quá trình lấy mẫu tín hiệu liên tục xa(t), ta có:
Các mẫu x(n) phải được lượng hóa thành một tập các mức biên độ rời rạc rồi mới được đưa vào bộ xử lí số Hình vẽ sau đây minh họa một cấu hình tiêu biểu cho
hệ thống xử lí tín hiệu tương tự bằng phương pháp số Trong quá trình này, ta bỏ qua sai số lượng hóa phát sinh trong quá trình biến đổi A/D:
Hình 2.15 Cấu hình hệ thống xử lí tín hiệu tương tự bằng phương pháp số
Để xác định được quan hệ giữa phổ của tín hiệu liên tục và phổ của tín hiệu rời rạc tạo ra từ quá trình lấy mẫu tín hiệu liên tục đó, ta quan tâm đến quan hệ giữa biến độc lập t và n của tín hiệu xa(t) và x(n):
Trang 36Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Định lí lấy mẫu phát biểu rằng một tín hiệu liên tục có băng tần hữu hạn, có tần số cao nhất là B(Hz) có thể khôi phục từ các mẫu của nó với điều kiện tần số lấy mẫu Fs≥2B(mẫu/giây)
Định lí này xác định điều kiện để một tập mẫu có thể cho phép khôi phục lại tín hiệu trước khi lấy mẫu, trong trường hợp ngược lại tín hiệu khôi phục sẽ khác xa
so với tín hiệu lấy mẫu, hiện tượng này gọi là chồng phổ
2 Lấy mẫu tín hiệu ở miền tần số và tái tạo tín hiệu liên tục
Ta đã biết tín hiệu liên tục có năng lượng hữu hạn thì có phổ liên tục Ta xét quá trình lấy mẫu của tín hiệu này một cách tuần hoàn và sự tái tạo tín hiệu từ các mẫu phổ của chúng
Xét tín hiệu liên tục xa(t) với phổ liên tục Xa(F) Giả sử ta lấy mẫu Xa(F) tại các thời điểm cách nhau F (Hz) Ta muốn tái tạo Xa(F) hoặc xa(t) từ các mẫu
Xa(F)
Nếu tín hiệu tương tự xa(t) có giới hạn thời gian (giây) và Ts được chọn để
Ts ≥ 2 thì hiện tượng chồng phổ không xảy ra và phổ Xa(F) có thể được khôi phục hoàn toàn từ các mẫu
3 Lấy mẫu tín hiệu ở miền tần số và tái tạo tín hiệu rời rạc
Xét một tín hiệu rời rạc không tuần hoàn x(n) có phép biến đổi Fourier:
Giả sử ta lấy mẫu X() tuần hoàn tại các điểm cách nhau rad Vì X() tuần hoàn với chu kì 2π, chỉ có các mẫu trong phạm vi tần số cơ bản là cần thiết Để thuận tiện, ta lấy N mẫu cách đều nhau khoảng 0 ≤ ≤ 2π theo khoảng cách
Trang 37
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
x(n) tại mỗi N mẫu, tín hiệu này tuần hoàn với chu kì N, do đó có thể được triển khai theo khai triển Fourier:
Từ công thức xp(n) trên, ta nhận thấy có thể khôi phục tín hiệu xp(n) từ các mẫu của phổ X() Như vây, ta phải tìm ra mối tương quan giữa xp(n) và x(n) để có thể thực hiện khôi phục x(n) từ X()
Vì xp(n) là sự mở rộng tuần hoàn của x(n), nên x(n) có thể được khôi phục từ
xp(n) nếu không có hiện tượng chồng phổ ở cõi thời gian, nghĩa là nếu x(n) có thời gian giới hạn nhỏ hơn hoặc bằng chu kỳ N của xp(n)
4 Lượng tử hóa tín hiệu
Lượng tử hóa là quá trình xấp xỉ các giá trị của tín hiệu lấy mẫu x(nT) bằng bội của một giá trị q (q gọi là bước lượng tử) Nếu q không thay đổi thì quá trình lượng tử gọi là đồng nhất Quá trình này thực hiện bằng hàm bậc thang mô tả như sau:
Hình 2.16 Hàm lượng tử với bước lượng tử q=1
Trang 38Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Quá trình lượng tử có thể thực hiện bằng cách định nghĩa giá trị trung tâm của
hàm lượng tử Ví dụ trong hình 2.16, các giá trị trong khoảng từ n-1 q
tín hiệu lỗi Một phương pháp khác có thể sử dụng là dùng hàm cắt, nghĩa là các giá trị trong khoảng nq, n+1 q sẽ làm tròn thành n
Hình 2.17 Lỗi lƣợng tử
Như vậy, quá trình lượng tử hóa sẽ làm méo dạng tín hiệu và xem như tồn tại một tín hiệu nhiễu Sự méo dạng này gọi là méo lượng tử hay còn gọi là nhiễu lượng tử: x(n)=xq(n)+e(n) Biên độ của tín hiệu nhiễu lượng tử sẽ nằm trong khoảng
. Do sai số lượng tử không biết trước nên việc mô tả sai số lượng tử mang
tính thống kê Tổng quát ta có thể xem e(n) là chuỗi các biến ngẫu nhiên trong đó:
Thống kê của e(n) không thay đổi theo thời gian (nhiễu lượng tử hóa là quá trình ngẫu nhiên dừng)
Nhiễu lượng tử e(n) là chuỗi các biến ngẫu nhiên không tương quan
Nhiễu lượng tử e(n) không tương quan với tín hiệu vào x(n)
Hàm mật độ xác suất của e(n) phân bố đều trên tổng các giá trị của sai số lượng tử
Trang 39Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Tín hiệu được lấy mẫu và lượng tử hóa bao gồm một tập hợp các số và được lưu trữ ở dạng nhị phân Đối với số nhị phân M bit sẽ có tối đa 2M
giá trị khác nhau ứng với 2M
mức lượng tử khác nhau Như vậy, phạm vi lượng tử sẽ bị giới hạn trong khoảng từ q đến 2Mq, bất kỳ biên độ tín hiệu nào vượt quá giá trị này thì sẽ bị cắt bỏ
giả sử công xuất tín hiệu là thì tỉ số tín hiệu trên nhiễu lượng tử hóa SQNR là:
5 Mã hóa tín hiệu
Tín hiệu ở đầu ra của bộ lượng tử hóa được chuyển đến bộ mã hóa, bộ mã hóa
sẽ gán một số nhị phân cho mỗi mức lượng tử Quá trình này gọi là mã hóa
Có nhiều phương pháp mã hóa khác nhau, nhưng trong đa số hệ thống xử lí tín hiệu số sử dụng phương pháp bù 2
Ngoài phương pháp mã hóa tuyến tính như trên (có các mức lượng tử với cùng
số bit nhị phân bằng nhau), người ta còn sử dụng phương pháp mã hóa phi tuyến tính Phương pháp này sử dụng các bước lượng tử thay đổi theo biên độ tín hiệu Một phương pháp được chuẩn hóa bởi CCITT là luật mã hóa 13 đoạn thường dùng trong mạng viễn thông
Luật mã hóa 13 đoạn thực hiện chuyển đổi biên độ của tín hiệu x thành tín hiệu y như sau:
Trang 40Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn