Để đáp ứng nhu câu của thị trường, một nhóm các chuyên gia về hình ảnh động Moving Picture Experts Group, gọi tat la MPEG, được thành lập để nghiên cứu đưa ra những lược đồ mã hóa phù hợ
Trang 2
Mục lỤC < << 05s <5 5 5 S65 55 9858909 98899988 86 006 9998.9698606660658608609099999006 990099606606666668 1
Lời nói đầu -° se SH hỢ HH HD gpge gen 3 PHẢN I LÝ THUYÉT S.HH.91040014040100040716 E018 08 A1 4e cHae 4
CHƯƠNG 1 CÁC KIÊN THỨC CƠ BẢN VÈ ÂM THANH 5
I NHỮNG KHÁI NIỆM CƠ BẢN - SÓNG CƠ 5cscc<c<cscseescee 6
1.1 Sự hình thành sóng trong môi trường đàn hẳi 6 1.2 Các đặc (trưng của SỐng << S 009 9095 9366 0906000806 366 966 7 1.3 Phương trình sống -< <5 5 S6 S5 56.96 808983.9566668896809639566.6666 8
II SONG AM VA DAC TINH AM THANH cccccsscscsssssssssessssssssesescssssesenseesees 8
2.1 Dao động âm và sự truyền dao động s- -s-o-seecsces«e 8 2.2 Đơn vị vật lý của âm thanh << << < <5 <5<<5S556656556 56595656 9
2.3 Đặc tính sinh lý về sự cảm thụ âm - 2 <=e<ese esess«e 12
CHƯƠNG 2 WAVE FEILLE 5c <- << <s<£<Ssk sEESEsEssEeEsEseseEsEsesessesrsessss 16
I MULTIMEDIA WINDOWG ssssscssscsssssssscssesssscssessseccsssessesessecsesenssseseesesees 16
IT CAU TRÚC WAVE FIL/E - << 5e 5< eeseeEeEseesEsEseEsssesesesersesese 17 2.1 RIFF Ẩile << se Ee<EsEs£E+EsEEEeSEeEsEESESESEsEetsSEsEsessssesresesese 17
; „I8 0à) À(/\ 1 17
THT DOC RIFF EILES «- << <<<< ssusscsssessessssscusecseessseecseesesseesess 21
CHƯƠNG 3 LÝ THUYÉT XỬ LÝ TÍN HIỆU SỐ . - 25
I TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC - -5-<-= scseecseseseescse 25
1 Giới (hiệu sc- < <¿ + se se EsEsEsEEEESEE EoSEEsEsEsSESEkeeseEessEssseerssesree 25
2 Đáp ứng xung trong hệ TT .o- <5 55555 SS56 S165 S6556 55665666 25
3 Tính chất của tổng chập của hệ 'T'TBB -. s5 scse esesese 26
4 Hệ nhân Quả .œ 55 5 63 949.96 68.986.06 0608 9565568888869864999966 6666 27
5 Tính n định .- ¿5< s << se SE E52 eøSE 2EsEsesesEsssesesesesssene 27
6 Phương trình sai phân tuyến tính hệ số hằng . -«- 28
7 Biếu diễn các hệ rời rạc trong miền tần số . -<-<-<cse«<«e 28
8 Định lý lấy mẫu Shannon s-5-< s5 sese ses sesssesesesesssesessse 30
I PHÉP BIẾN ĐỎI FOURIER RỜI RẠC <5 <5 5 <<csessescse 30
1 Chuỗi Fourier rời rạc của (ín hiệu rời rạc tuần hồn 30
2 Biến đổi Fourier rời rạc của tín hiệu có độ dài hữu hạn .- - 31
3 Phép biến đổi nhanh Fourier (EETT) . « «- ce«e cessccessee 32 CHƯƠNG 4 GIỚI THIỆU VỀ MPEG sc << co<cecseseesesesesees 33
I GIOT THIEU, 33
1 ./030005-Ề 7001077 33
2 So sánh các chuẩn MPEG . 5c<c<<cosesssesesesesesesesestsssesesssee 33
3 Aâm thanh IMPEG, -. -<- << << se seEsEsEeSEsEstseEsEsEstsessesrsessse 34
4 Các khái niệm cơ bản .œ << < << < S0 989 895.96.058999688686905660 886 35
5 Hoạt động .- œ5 SH H9 S9908 8066 036.06.036656568688888606000596066606 38
I CÁC KHÁI NIỆM TRONG ÂM THANH MPEG «-sc<- 40
1 Lược đồ mã hóa Perceptual Sub-band -.-s-s-s-<<sesesesc<es 40
2 Giải thích hiệu qúa che (masking efficienCy) << <ssse sssesses 41
3 Các lớp của âm thanh MPEG << 5 S956 5066556686 866.5656 43
ii89 (euy/:(0) 06101777 45
CHƯƠNG 5 CÁC GIẢI THUẬT NÉN ÂM THANH - 50
I LÝ THUYÉT THÔNG TIN -s ssnscensssseesssecesecosenscssesaseenees 50
II CAC GIAI THUAT NEN KHONG CO TỎN THÁTT - 51
Trang 33 MA ha g8 0 0 54
4 Giai thuat Lempel-Ziv-Welch (LZ W) .sccsscsssssssssssssscscscsecsesssseesees 55
IH CÁC GIẢI THUẬT NÉN CÓ TỎN THẤTT - 2 -°sessesscssssee 57
1 Các phương pháp nén âm thanh đơn giản -s s ss«s<eese<s 57
2 Nén âm thanh dùng mô hình âm tầm Ìý s55 5< 55e<< c<ss sese 57 _ 3 Nén 4m thanh theo chuẩn MPEG - c5 5s << cseseseseseseseses 58
PHAN II THIẾT KẾ CHƯƠNG TRÌNH ^959985989898950890998189889090898900808509880 60
CHƯƠNG 6 LƯU ĐỒ GIẢI THUẬT VÀ CẤU TRÚC DỮ LIỆU 61
0004080 61
II CẤU TRÚC DỮ LIỆU VÀ ĐỊNH NGHĨA . -s5cscsscsee 62
' W0 \09:409))060i000 62
1 Các cầu trúc về file << << ©e<ss€Ese eEESEESEEeEEEseEsekseeseeseee 62
2.Các cầu trúc về dòng bít dữ liệu -. 5 scsesesssesssesssssesessss 63 3.Các cấu trúc để định dạng dòng bít dữ liệu 5-s-s-s‹s<<- 63
4.Các cầu trúc huffmancodetab -.5-s«- s5 << e«eseesese seseseesesss 67
5.Các cầu trúc tính MDCTT -<- «<< «se seeseEeEEseeersresesrrervke 67
6.Các cầu trúc scalefac_S(TUCf «- c5 se essscsesEseseseessssse sesesesee 67
;Xe (w;)n/:80 (9:1 68
1.Các định nghĩa dùng trong truy xuất dữ liệu .-. -«se- 68 2.Các định nghĩa dùng trong tính tốn EFTT «-<c<<ecssse«s«ss 68 3.Các định nghĩa dùng trong định dạng dòng dữ liệu 68 4.Các định nghĩa dùng trong bộ mã hố Huffman - 68 5.Các định nghĩa dùng trong phân tích dữ liệu - s««s« << 69 6.Các định nghĩa dùng trong mô hình ầm tâm lý -<« 69 7.Các định nghĩa dùng trong truy xuất nhập dữ liệu .- 69 8.Các định nghĩa dùng trong cấu trúc file Wave và file Mpeg 69
II LƯU ĐỒ -< s<c<e Q.01 03H10 14 1070909138030 004019 1040” 71
CHƯƠNG 7: GIAO DIEN VA THUYET MINH CHUONG TRINH 75
Ic(9)009:/3007 75
iRo (00/0007 T5
TÀI LIỆU THAM KHẢO .2-< 5£ << << s3 seEEs eEsezseeseseesese 87
Lời nói đầu
Công nghệ thông tin là ngành công nghiệp mũi nhọn của thế gidi noi chung và của việt nam nói riêng, nó đã phát triển mạnh mẽ không ngừng trong những năm gần đây Khi đời sống được nâng lên khoa học kỹ thuật phát triển nhu
cầu về giải trí cũng đa dạng lên, các loại hình giải trí không ngừng gia tăng và
ngày càng phong phú, đa dạng các loại hình giải trí như: trò chơi điện tử, nghe nhạc xem phim, xem ca nhạc(video), và đặc biệt là những trong chơi dạng không gian ba chiều Sự phát triển ồ ạt này đã dẫn tới ngành công nghệ phần cứng đã không thể đáp ứng được những đòi hỏi về lưu trữ, đồng hành với sự phát triển này là mạng máy tính đó chính là Internet ngày càng phát triển số lượng người tham gia truy cập ngày càng lớn và nhu cầu của họ thì ngày càng phong phú và đa
Trang 4mạng được quan tâm hơn để cho người dùng không phải sốt ruột ngồi chờ những trang web mà mình truy cập, họ không phải bực mình khi download những file
âm thanh và những bài hát mà họ ưa thích vì đường truyền quá chậm trong khi
công nghệ phần cứng đã phát triển mạnh Chính vì vậy các nhà nghiên cứu phần
mềm đã chú ý đến việc phát triển phần mềm để hỗ trợ phần cứng Họ đã tạo ra
những chương trình phần mềm hỗ trợ tích cực phần cứng, từ đó đã ra đời những
phần mềm nén âm thanh, hình ảnh, nén video, tách âm thanh từ những file
video dé tạo ra những dạng âm thanh, hình ảnh, video nhu mindi, mpeg, mp3,
mp4 những file ảnh dạng øIÍ, Jpeg với dung lượng lưu trữ vô cùng nhỏ mặc
dù chất lượng có giảm đi đôi chút nhưng không đáng kể so với những gì nó đạt
được để truyền tải, truy cập nhanh hơn
Sự tồn tại của chuẩn JPEG (Joint Photographic Experts Group) chỉ để
giảm tốc độ bit và chủ yếu phục vụ cho hình ảnh, rõ ràng là không đủ đáp ứng
cho hình ảnh động có kèm âm thanh Để đáp ứng nhu câu của thị trường, một nhóm các chuyên gia về hình ảnh động (Moving Picture Experts Group), gọi tat
la MPEG, được thành lập để nghiên cứu đưa ra những lược đồ mã hóa phù hợp cho việc truyền hình ảnh động và ghi lại chúng theo tiêu chuẩn trong các thiết bị
lưu trữ số như CD-ROM, Video CD
Phần trình bày của luận văn chỉ nằm trong khuôn khổ "Aâm thanh" Do đó
mọi vẫn đề liên quan tới hình ảnh sẽ không được đề cập tới, dù chuẩn MPEG là
dùng cho cả âm thanh và hình ảnh
Mục tiêu của đề tài chủ yếu chỉ để tìm hiểu về các phương pháp mã hồ và nén âm thanh theo chuẩn Mpeg, từ đó dựa trên một số source code (viet bang C)
đã có trên mạng Internet viết lại bằng ngôn ngữ Visual C++, nhằm hiểu sâu hơn
về giải thuật, đồng thời tạo ra một giao diện thân thiện hơn
Do trình độ và kiến thức có hạn nên không tránh khỏi những thiếu sót, em
kính mong thây tham gia và giúp đỡ em đê em hôn thành được tôt hơn
Em xin chân thành cám ơn thầy đã tạo điều kiện thuân lợi nhất giúp em
hôn thành báo cáo này
Trang 5
PHAN I
LY THUYET CO BAN
Trang 7CHUONG 1 CAC KIEN THUC CO BAN VE AM THANH
I NHUNG KHAI NIEM CO BẢN - SÓNG CƠ
1.1 Sự hình thành sóng tronø môi trường dan hồi
a Định nghĩa:
Các môi trường chất khí, chất lỏng, chất rắn là môi trường đàn hồi
Môi trường đàn hồi có thể coi là những môi trường liên tục gồm những
phân tử liên kêt chặt chẽ với nhau, lúc bình thường mỗi phân tử có một vi trí cân băng bên
b Sư hình thành sóng trong môi trường đàn hồi:
e Do tính chât của môi trường đàn hôi, cho nên nêu tác dụng lên phân tử nào đó của môi trường thì phân tử này rời khỏi vị trí cân băng bên
e Do tuong tác, các phân tử lần cận một mặt kéo phân tử A về vị trí cân
bằng, mặt khác nhận một phần năng lượng do phân tử A truyền sang, do
đó cũng dao động theo, hiện tượng này xảy ra liên tiếp tạo thành sóng Sóng đàn hồi (sóng cơ) là sự lan truyền dao động trong môi trường dan hồi Sóng cơ không thể truyền được trong chân không, vì chân không
không phải là môi trường đàn hồi
e Cần lưu ý trong khi truyền dao động, các phân tử của môi trường không di chuyển theo các dao động được lan truyền mà chỉ dao động quanh vị trí cân băng của nó
c Một sô khái niệm về sóng:
e_ Nguôn sóng: là ngoại vật gây ra kích động sóng
e_ Tia sóng: là phương truyền sóng
e_ Môi trường sóng: là không gian mà sóng truyền qua
e Mặt sóng: là mặt chứa những điểm (phân tử) có cùng trạng thái dao động tại một thời điệm nào đó Tia sóng luôn vuông góc với mặt sóng
e Sóng cầu: mặt sóng là những mặt cầu phân bố đều trong không gian, tâm là nguồn sóng rong môi trường đồng chất và đẳng hướng sẽ có sóng cầu Đối với sóng cầu tia sóng trùng với bán kính của mặt cầu
e Sóng phẳng: mặt sóng là những mặt phắng song song nhau, tỉa sóng vuông góc với mặt sóng Nêu nguôn sóng ở rât xa môi trường đang xét thì mặt sóng có thê co1 là những mặt phăng song song
Trang 8e Sóng dọc: là sóng trong đó các phân tử của môi trường dao động quanh
vị trí cân bằng trên phương trùng với tia sóng Khi có sóng dọc, trên phương của tia sóng các phân tử của môi trường khi thì bị nén chặt, khi thì giãn ra làm cho các phân tử của môi trường có chỗ dày chỗ thưa
e Sóng ngang: là sóng trong đó các phân tử của môi trường dao động quanh vị trí cân băng trên phương vuông góc với tia sóng
d Nguyên nhân øây ra sóng nøanøg và song doc:
e_ Tùy tính chất của môi trường đàn hồi mà trong đó có thể xuất hiện sóng ngang hay sóng dọc
- Khi một lớp của môi trường bị lệch đối với lớp khác làm xuất hiện các lực đàn hồi có xu hướng kéo lớp bị lệch về vị trí cân bằng thì trong môi
trường đó có thể truyền được sóng ngang Vậy vật rắn là một môi trường
có tính chất đó
- Nếu trong môi trường không có các lực đàn hồi khi các lớp song song bị lệch đôi với nhau thì sóng ngang không thê hình thành được Chât lỏng và chât khí là những môi trường đó
- Khi bị biến dạng nén hay căng mà trong môi trường có các lực đàn hồi xuất hiện thì trong môi trường đó có thể truyền được sóng dọc Chang han khi bị nén, chất lỏng hay chất khí sẽ tăng áp suất, lực nén giữ vai trò lực đàn hồi
e_ Như vậy trong chất lỏng và chất khí chỉ có sóng dọc truyền được, còn trong chât răn có thê truyền được cả hai loại sóng
Trang 9F= 1/T (Hz)
1.3 Phương trình sóng
e Sóng phẳng truyền đọc theo phương OY với vận tốc C thì phương trình sóng biểu thị mối quan hệ giữa độ chuyên dời X của phân tử dao động kể tir vị trí cân bằng với thời gian t và khoảng cách y đến các vị trí cân bằng các phân tử dao động trên phương truyền sóng như sau :
2.1 Dao động âm và sự truyền dao động
e Sóng âm là một loại sóng cơ có biên độ dao động nhỏ mà thính giác nhận biệt được Thí dụ dao động phát ra từ dây đàn, mặt trông đang rung
động Sóng âm là một loại sóng cơ nên mọi khái niệm và hiện tượng vê
đao động và sóng cơ trên đây đêu áp dụng cho sóng âm
e Trong không khí cũng như trong mọi chất khí khác, những dao động truyên đi dưới dạng sóng dọc, khi đên tai người những dao động có tân sô
từ 16 đên 20000 Hz sẽ gây cảm giác đặc biệt vê âm
e_ Các dao động đàn hồi có tần số f>20.000 Hz là sóng siêu âm
e_ Các dao động đàn hồi có tần số f<16 Hz là sóng hạ âm
e Mỗi âm có một tần số riêng, đơn vị của tần số là héc (Hz) với định
nghĩa:”Hóc là tân sô của một qúa trình dao động âm trong đó mỗi giây
thực hiện được một dao động”
1 Héc (Hz) = I dao động / I giây
e Việc phân chia sóng hạ âm, sóng siêu ầm và sóng âm (âm thanh) liên quan tới khả năng sinh lý của thính giác
Trang 102.2 Đơn vị vật lý của âm thanh
e©_ Âm thanh hay tiếng động mà con người nhận biết được do tác động của sĩng âm lên màng nhĩ tai
e_ Các dao động âm phát ra từ nguồn lan truyền trong mơi trường đàn hồi
như khơng khí dưới dạng sĩng đàn hồi gọi là sĩng âm Sĩng âm đến kích
động màng nhĩ tai gây cảm giác về âm, do đĩ cần phân biệt hai loại đại lượng về âm:
- Đại lượng âm khách quan: những đại lượng thuần túy vật lý, khơng phụ thuộc vào tai người
- Đại lượng âm chủ quan: những đại lượng tâm lý vật lý phụ thuộc vào tai nguoi
2.2.1 Don vi 4m khách quan:
a Aùp suất âm:
Khi sĩng âm tới một mặt nào đĩ, do các phân tử mơi trường dao
động tác dụng lên mặt đĩ một lực gây ra áp suât Aùp suât ở đây là áp suât
dư do sĩng âm gây ra ngồi áp suất khí quyền
Trong phạm vi nghe được, áp suất âm trong khoảng từ 2.10 đến
2.10 bar, chênh lệch 10 lần, đĩ là một phạm vi rất rộng
b Cường độ âm (D:
- Cường độ âm ở một điểm nào đĩ trên phương đã cho trong trường âm là
sơ năng lượng am di qua don vi diện tích của mặt Š vuơng gĩc với phương truyền âm, tại điêm đĩ trong don vi thoi gian
- Một vài cường độ âm đáng chú ý:
Người nĩi thường I=2.10”W/m?
Cịi báo động I = 3.000 W/m”
- Trong điều kiện chuẩn (t° = 20°C, áp suất 760mmHg):
Vận tốc âm trong khơng khí : C = 340 m/s
p= 0,00121 gr/cm'
y=C/C, = 1,4
SVTH: Do Van Tuan Trang 9
Trang 11- Trong tính tốn người ta quy ước lấy âm đơn tần số f = 1000 Hz làm
chuẩn để so sánh (gọi là âm chuẩn)
- Đối với âm chuẩn, trong phạm vi nghe được
Cường độ âm nhỏ nhất — I„„= 10”“W/cm”
- Aùp suất âm và cường độ âm lớn nhất mà tai người cĩ thể chịu được là:
Prax = 2.107 Hbar
Tmax = 10° W/cm’
- Cong suat 4m nho nhat c6 thé nghe thay duoc Win = 107* Watt
2.2.2 Don vi 4m chu quan:
e Tai ngudi trung binh cĩ thê nhận được những sĩng âm cĩ tần số từ 16
đên 20000 Hz, hiệu qủa này cĩ liên quan tới khả năng sinh lý của tai nguoi
e Nhu vay, 4m thanh 14 mot hién twong tam ly vat ly, khong phai bat ctr sĩng âm nào tới tai cũng gây ra cảm giác âm thanh như nhau Aâm cĩ tân
sơ khác nhau gây ra cảm giác khác nhau
e Cường độ âm nhỏ nhất của một sĩng âm xác định mà tai người nghe thấy được gọi là “Ngưỡng nghe” Aâm cĩ tần số khác nhau giá trị ngưỡng nghe cũng khác nhau Tai người thính nhất với âm cĩ tần số trong khoảng
từ 1000 đến 3000 Hz, trong phạm vi này cường độ âm ngưỡng nghe nhỏ nhất Những tần số khác, tai kém thính hơn, ngưỡng nghe cĩ giá trị lớn hơn
e_ Đối với âm chuẩn, cường độ và áp suất ở ngưỡng nghe bang:
Trang 12Theo định lý sinh lý của Vebe-Fécne, cảm giác nghe to đối với một âm không tỉ lệ thuận với cường độ âm của âm đó Khi cường độ âm tăng từ lQ tới [ thì cảm giác nghe to tăng tỉ lệ với Ig(1/1,) Do đó người ta dùng thang lô-ga-rít cơ sô 10 đê đo mức cảm giác so với mức ngưỡng
Mức ngưỡng gọi là mức zero qui woc :
Ig(I/I,) = 1g(10°'7/ 10°) = 0 bel
Don vi 1a Bel hay db 10db = 1 bel
b Mức cường đô âm (TÚ):
Nêu gọi I là cường độ âm của âm đang xét và l¿ là cường độ âm của mức zero qui ước của âm chuân thì mức cường độ âm L¡ băng :
Thực tế áp suất âm là đại lượng cơ bản hơn cường độ âm, nên thường dùng
mức áp suât âm sau đó suy ra mức cường độ âm Đơn vị chung là bel hay
đb Đơn vị này cũng dùng đê đo mức công suât, mức năng lượng âm Vài mức áp suất âm đáng chú ý :
Nói chuyện thường : 30db
Nói chuyện to : 70db
2.2.3 Quãng độ cao (quãng tần số):
e Quãng tần số của hai âm là khoảng cách tần số của hai âm đó Nếu một
âm tân sô là f¡, một âm khác tân sô là f; (f; > f¡) thì f; / f¡ = 2”
Khi x=l tức f› /f¡ =2 gọi là 1 quãng tần số (hay 1 ốc-ta)
Khi x=1/2 tức †f; /f¡ = 1.41 gọi là nửa Ốc-ta
11
Trang 132.3
Khi x=1/3 tức f; / f¡ = 1.26 gọi là 1/3 ốc-ta
- Mức áp suất âm của 1 ốc-ta bằng mức áp suất âm của 1/2 éc-ta cộng thêm 3db
- Mức áp suất âm của 1 6c-ta bang mức áp suất âm của 1/3 ốc-ta cộng thêm 5db
e_ Vì quãng tần số của một âm qui định độ cao của âm đó nên còn gọi là quãng độ cao Theo tập quán âm nhạc thì quãng độ cao gọi là quãng § (bát độ)
e_ Chẳng hạn âm LA, tần số f=440 Hz tang 1 bat độ là tăng gấp đôi tần sé,
tức là 880 Hz
e Trong thực tế thường gặp những âm phức tạp bao gom nhiéu tần số Tập hợp tất cả những tần số cấu tạo trong một âm thanh gọi la * ‘tan pho” của âm đó, tần phố có thể gián đoạn hay liên tục Một âm có tần phổ liên
tục được đặc trưng bằng “Mức tần phố B” với định nghĩa:
- Mức tân phô là mức áp suât âm trong chiêu rộng của dải tân sô băng 1
- Một âm có mức tân phô B không đôi với mọi tân sô gọi là tiêng On trang
A»
- Một âm có tần phổ gián đoạn được đặc trưng bằng “mức dải tần số với định nghĩa: mức dải tần số là mức áp suất âm trong chiều rộng của dải tần
số lớn hơn 1 Hz
Đặc tính sinh lý về sự cảm thụ âm thanh
2.3.1 Mức to, độ to, mức âm cảm øiác:
e Mức áp suất âm, mức cường độ âm trên đây vừa mang tính chất chủ quan vừa mang tính chất khách quan vì những đại lượng này xác định từ những đại lượng thuần túy vật lý Vẫn đề có ý nghĩa to lớn trong thực tế là cần biết được sức mạnh của âm thanh đo bằng tai người
e Mức to, độ to của một âm là sức mạnh cảm giác do âm thanh gây nên trong tai người, nó không những phụ thuộc vào áp suất âm mà còn phụ thuộc vào tần số của âm đó Thí dụ 2 âm có tần số 100 Hz và 1000 Hz áp suất âm đều bằng 0,02 bar nhưng nghe to nhỏ khác nhau, âm 1000 Hz
nghe to hơn âm 100 Hz Muốn nghe to bằng âm 1000 Hz thì âm 100 Hz
phải có áp suất bằng 0,25 Hbar Như vậy tai người không nhạy đối với âm
100 Hz bằng âm 1000 Hz Tần số càng thấp tai người càng kém nhạy
a Mức to:
Trang 14- Đê biêu thị mức to trên cảm giác chủ quan, ta dùng đại lượng “mức to”, don vi là “Fôn” với định nghĩa như sau :
Fôn là mức to của âm chuẩn, về giá trị bằng mức áp suất âm của âm chuẩn tức là :
L=201g P/Po (Fôn)
- Vậy mức to của một âm bất kỳ đo bằng Fôn, về giá trị bằng mức áp suất
âm của âm chuân đo băng db có cùng mức to với âm đó Thí dụ: âm có tân
sô 500 Hz mức áp suât âm băng 25 db và âm có tân sô 50 Hz mức áp suât
âm băng 64 đb sẽ có cùng mức to băng 20 Eôn, băng mức to của âm 1000
Hz mức áp suât băng 20 db
- Muôn biêt mức to của một âm bât kỳ phải so sánh với âm chuân
- Đối với âm chuẩn, mức to ở ngưỡng nghe là 0 Fôn, ngưỡng chói tai là
Sô lượng Sôn biêu thị sô lân mạnh hơn của một âm nào đó so với âm
chuân mà tai người có thê phân biệt được
- Độ to là một thuộc tính của thính giác, cho phép phán đốn tính chất mạnh yếu của âm thanh Căn cứ vào độ to mà sắp xếp âm từ nhỏ tới to
- Mức to tăng 10 Fôn thì độ to tăng gấp đôi và ngược lại
2.3.2 Aâm điệu và âm sắc:
e Am điệu chỉ âm cao hay thấp, trâm hay bỗng Âm điệu chủ yêu phụ
thuộc vào tần số của âm, tần số càng cao, âm nghe càng cao, tần số càng
thấp âm nghe càng trầm
e Am sac chi sac thdi cla 4m du dương hay thô kệch, thanh hay rè, trong
hay đục Âm sắc phụ thuộc vào cấu tạo của sóng âm điều hòa, biểu thị bằng số lượng các loại tân số, cường độ và sự phân bố của chúng quanh
âm cơ bản Âm sắc có quan hệ mật thiết với cường độ, âm điệu và thời gian âm vang, sự trưởng thành và tắt dần của trường âm
13
Trang 15e Khi hai ca sĩ cùng hát một cầu ở cùng một độ cao, ta vẫn phân biệt
được giọng hát của từng người Khi dan ghi-ta, sáo, kèn cùng tấu lên một đoạn nhạc ở cùng một độ cao, ta vẫn phân biệt được tiếng của từng nhạc
cụ Mỗi người, mỗi nhạc cụ phát ra những âm có sắc thái khác nhau mà tai
ta phân biệt được Đặc tính đó của âm chính là âm sắc
e Âm sắc là một đặc tính sinh lý của âm, được hình thành trên cơ sở các
đặc tính vật lý của âm là tân số và biên độ Thực nghiệm chứng tỏ rằng khi
một nhạc cụ phát ra một âm có tần số f1 thì đồng thời cũng phát ra các âm
có tần số f2=2f1, f3=3f1
e Âm có tần số f1 gọi là âm cơ bán hay họa âm thứ nhất, các âm có tần
số f2, f3 gọi là các họa âm thứ hai, thứ ba Âm cơ bản bao giờ cũng
mạnh nhất, các họa âm có tác dụng quyết định âm sắc của âm cơ bản, giúp
ta phân biệt các nguồn âm khác nhau Chẳng hạn tiếng đàn Pi-a-nô và tiếng sáo tuy cùng một âm cơ bản nhưng lại rất dễ phân biệt, nguyên nhân
là do số lượng, cầu trúc những họa âm quanh âm cơ bản của chúng khác nhau Họa âm càng nhiều âm nghe càng du dương phong phú
3 Thính øiác đinh vi (hiệu ứng Stereo):
e Khi nghe â âm tuy mắt không nhìn thấy nguồn âm nhưng có thê xác định chính xác vị trí của nguồn âm Đặc điểm này là kết qủa của hai tác dụng:
- Do cường độ, độ to, âm sắc của âm đên hai tai không giông nhau
- Do âm đến hai tai lệch pha nhau, vì thời gian đến hai tai không giống nhau
se Cường độ, độ to của âm đến hai tai chênh lệch nhau là do nhiễu xạ gây
ra Âm có tân sô f < 1000 Hz sự chênh lệch cường độ do nhiêu xạ gây ra
rât bé nhưng ở những tân sô cao, sự chênh lệch này có thê đạt tới 20 - 30
db
e Do khả năng định vị của tai như vậy cho nên khi nghe âm có thé tap trung chu y vao nguồn âm cần nghe, bỏ qua một cách tự nhiên những âm không cần nghe Nhờ hiệu qủa này mà tiếng ồn bị phủ lấp hoặc giảm nhỏ một cách tự nhiên Nếu chỉ nghe âm một tai thì hiệu qủa này mắt
4 Noshe âm và chênh léch thoi gian:
e_ Tương tự như tác dụng lưu ảnh của mắt, tai người cũng có tác dụng lưu
âm
e Thínghiệm với nhiều thính giác bình thường cho thấy rằng, nếu hai âm
như nhau đến tai người cách nhau < 50 ms thì tai người không phân biệt được, nghe như một âm duy nhất
Trang 16CHƯƠNG 2 TAP TIN DANG SONG (WAVE FILE)
I MULTIMEDIA WINDOWS
e Tw phién ban Windows 3.1, Multimedia đã trở thành một tính năng của Windows Multimedia Windows da bé sung mét tinh nang mdi: dé 1a su
độc lập thiết bị trong việc xử lý âm thanh Sự độc lập thiết bị này thể hiện
qua bộ API (Applycation Program Interface - Bộ giao diện lập trình ứng
dụng) Bộ API độc lập về thiết bị đối với phần cứng và đó là một chức năng quan trọng của Windows Người lập trình sẽ lập trình điều khiến phần cứng trên Windows dựa trên chức năng của phan cứng hơn là các chỉ tiết cụ thể của nó Các nhà cung cấp phần cứng chỉ cần cung cấp một bộ điều khiển thiết bị (device driver) cho Windows, nhờ đó một ứng dụng trên Windows có thể điều khiển phần cứng thông qua Windows API
e Voi Multimedia Windows, hang Microsoft da thuc hién duoc ba điều :
e Định nghĩa một tiêu chuẩn phần cứng tối thiểu cho loại máy Multimedia
PC (viết tắt là MPC) Tiêu chuẩn này dựa trên chức năng tổng quát hơn là sản phẩm cụ thể Ví dụ nếu PC có thêm ổ đĩa CD-ROM và một card âm thanh thì trở thành MPC cấp 1
e Microsoft đã cung cấp phần mềm Multimedia Extension cho Windows 3.0 và đã được ghép luôn vào hệ điều hành Windows từ phiên bản 3.1 Phần mềm này bao gồm các bộ điều khiển thiết bị dành cho việc truy xuất đến các phần cứng gắn thêm vào MPC
e Microsoft đưa ra công cụ phát trién Multimedia Development Kit
(MDK) Lap trinh vién kêt hợp công cụ trên với bộ Windows Software
Development Kit (SDK) đê việt các tng dung vé Multimedia
e Có hai dạng xử lý âm thanh số hóa trên Windows Loại thứ nhất
microsoft gọi là “Wave Form Audio” (Aâm thanh dạng sóng), dựa trên
nguyên tắc số hóa sóng âm, MPC lưu chúng trên bộ nhớ hay tập tin WAV
trên đĩa Các dữ liệu số này có thể thông qua phần cứng biến đổi lại thành
âm thanh
e Dang thu hai 1a MIDI Khac voi 4m thanh dang séng, MIDI chỉ lưu lại những thông điệp điêu khiên bộ tông hợp phát ra âm thanh Do đó kích thước của tập tin MID nhỏ hơn nhiêu so với tap tin WAV
Il CAU TRUC WAVE FILE
1 RIFF file
15
Trang 17Wave File là tập tin chứa các dữ liệu của mẫu âm thanh đã được số
hóa Phương pháp số hóa âm thanh hiện nay là phương pháp PCM Phương pháp này sẽ lay mau 4 am thanh voi tần số khoảng 11.025 kHz cho đến 44.1 kHz Mỗi lần lẫy mẫu, số liệu này lại được lượng tử hóa bằng một hay hai byte cho một mau âm thanh Như vậy tần số lây mẫu càng cao, số byte dùng lượng tử hóa càng nhiều thì âm thanh phát lại càng trung thực, nhưng lại tăng số byte cần lưu trữ Với một mẫu âm thanh phát ra
trong một phút cần phải lưu trữ ít nhất 660 kB Đó là lý do tại sao các File
Wave luôn có kích thước khá lớn so với MIDI File
Câu trúc của Wave File thuộc vào lớp file được sử dụng bởi các
ham Multimedia cia Windows: dé 1A RIFF FILE RIFF 1a chii viét tat của
Resource Interchange File Format (dang file trao đôi tài nguyên) Một RIFF file gom một hoặc nhiéu loai chunks, trong mỗi chunk lại chứa con
trỏ chỉ đến chunk kế tiếp Mỗi chunk bao gồm loại chunk và đữ liệu theo sau loại chunk đó Một ứng dụng muốn đọc RIFF file có thể đi qua lần lượt từng chunk, đọc đữ liệu ở chunk nó quan tâm và có thể bỏ qua các chunk mà nó không quan tâm, m6t chunk cia RIFF file luôn bắt đầu bởi
một header có câu trúc như sau:
tự còn lại bên phải sẽ được đệm thêm vào các khoảng trắng Cần chú ý là
các ký tự trong FOURCC có phân biệt chữ hoa và chữ thường
Trường DWORPD chứa kích thước vùng dữ liệu của chunk, ving dir liệu này năm ngay sau header và có kích thước là ckS1ze bytes
Chunk có thể chứa các subchunks Subchunk cũng là một chunk
Một RIFF file luôn bắt đầu bằng mot chunk loai “RIFF”
2 Cau tric Wave file
Wave file bat dau là chunk loai “RIFF”
Hai subchunk trong wave chunk dic tả thông tin về âm thanh của wave file
và tiệp đó là dữ liệu của từng subchunk Đó là subchunk “fmt” và
subchunk “data”
a subchunk “fmt”:
Trang 18Dir liéu cua “fmt” chunk 18 d6i trong WAVEFORMAT c6 cau tric như
Giá trị này báo cho phần mềm đang đọc Wave File biết kiểu mã hóa
dữ liệu âm thanh sang dữ liệu sô là kiêu mã hóa PCM Hiện nay đây là kiểu mã hóa duy nhất của Wave file
- nChannels: có hai giá trị bằng 1 cho âm thanh mono và bằng 2 cho âm thanh stereo
- nSamplesPerSec: cho biết tốc độ lây mẫu, có các giá trị:
- nBlockAlign: cho biết số byte dùng để chứa một mẫu âm thanh Như vậy
mau 8 bit hay ít hơn sẽ yêu cầu 1 byte, mẫu 9 đến 16 bit sẽ yêu cầu 2
bytes Nếu âm thanh là Stereo thì yêu cầu gấp 2 lần số byte dùng cho âm thanh mono
Ta thấy trong WAVEFORMAT chưa có thông tin về số bit dùng để
lượng tử hóa một mâu dữ liệu của sóng âm Thực tê Wave File sẽ xác lập
17
Trang 19số bit dùng cho một mẫu dữ liệu bằng một trường gắn vào cuối cấu trúc của WAVEFORMATT Câu trúc đó như sau:
Typedef struct pcmwaveformat_tag
{
WAVEFORMAT wif;
WORD wBitsPerSample;
} PCMWAVEFORMAT;
- wBitsPerSample: cho biết số bit trong một mẫu đữ liệu Chú ý rằng các
mẫu dữ liệu vẫn phải lưu trữ ở dạng byte hoặc word Do đó, nếu một Wave
File dùng 12 bit để lượng tử hóa một mẫu sóng âm thì sẽ phải lưu trữ 4 bit thừa không dùng đến
b Subchunk “data`
Dữ liệu của “data” subchunk của wave file chứa các số liệu của âm
thanh đã được số hóa Đối với mẫu âm thanh 8 bit, dữ liệu của “data”
subchunk bao gồm các giá trị 1 byte (có giá trị từ 0 — 255) của các mẫu âm
thanh Đối với mẫu âm thanh 16 bits, mỗi mẫu dữ liệu gồm 2 bytes (có giá trị từ — 32768 đến 32767) Điều này không có nghĩa là file wave 16 bits sé
nghe to hơn 256 lần file wave 8 bits, mà nó có nghĩa là âm thanh được
lượng tử hóa chính xác hơn, nghe trung thực hơn
Trong mẫu mono 8 bits, dữ liệu của subchunk “data” gồm chuỗi các gid tri 1 byte Voi stereo 8 bits, mỗi mẫu gồm 2 bytes, dữ liệu sẽ được sắp xếp xen kẽ (interleave), với byte đầu (byte chẵn) là mẫu âm thanh của kênh bên trái, byte sau (byte lẻ) là của kênh bên phải
Tóm la cầu trúc của Wave File như sau:
Trang 20IH ĐỌC RIFF FILES
e_ Để làm việc với file RIFE, ta phải mở nó và “descend” vào chunk ma ta cần Điều này có nghĩa là ta cần phải định vị được chunk này, rồi chuyên
con trỏ file vào đầu khối dữ liệu của chunk Khi làm việc xong với Ì
chunk, ta phải “ascend” ra khỏi chunk và “descend” xuống chunk khác
e_ Các hàm dùng xử lý RIFF file déu c6 tiền tổ là mmio và làm việc với
file handle dang HMMIO, dé bat đâu, ta phải mở file băng đoạn mã sau:
MMIO_READWRITE Nếu mở file thành công, mmioOpen sẽ trả về một
19
Trang 21handle loại HMMIO Nếu thất bại, nó sẽ trả về trị NULL Sau khi mở file
xong, ta bắt đầu định vị WAVE chunk băng đoạn mã sau:
Cấu trúc của MMCKINFO chứa các thông tin về chunk Nó được
định nghĩa trong MMSYSTEM.H như sau:
định vị thành công, hàm này trả về zero và đối tượng MMCKINFO truyền
cho hàm sẽ được điền vào các thông tin về chunk
Trường cksize định nghĩa kích thước tính bằng byte của chunk Đối số thứ ba của mmioDescend là cờ MMIO_FINDRIFF Cờ này chỉ thị cho mmioDescend tìm một file có ID là RIFE với loại chunk được xác định bởi ckid Nếu muốn tìm một chunk trong Wave file ta cho cờ này
Trang 22Đôi sô đâu tiên của mmioRead là handle của file đang đọc Đôi sô
thứ hai là con trỏ xa trỏ tới vùng đệm đê chứa dữ liệu Đôi sô thứ ba là sô byte cân đọc Hàm này sẽ trả vê sô byte thực sự đọc được
e Sau khi da đọc nội dung của chunk, ta đi ra khỏi chunk để chuẩn bị đọc
chunk ké tiép:
MmAscend(h,(LPMMCKINFO)&mmSub,0);
Déi sé thtr hai cua mmAscend 14 d6i trong MMCKINFO cia chunk ma ta
“đi ra” Đôi sô thứ ba là đôi sô giả
e Công việc còn lại là đọc dữ liệu mã hóa mẫu âm thanh của Wave file
vào bộ nhớ Chú ý răng giá trị cksize trả vê bởi mmioDescend được sử dụng đê xác định kích thước vùng đệm cân câp phát đê chứa đữ liệu