Mô hình hóa quá trình truyền âm thanh trong phòng thu sử dụng phương pháp nguồn ảnh Mô hình hóa quá trình truyền âm thanh trong phòng thu sử dụng phương pháp nguồn ảnh Mô hình hóa quá trình truyền âm thanh trong phòng thu sử dụng phương pháp nguồn ảnh luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-
ĐINH HUY CƯƠNG
MÔ HÌNH HÓA QUÁ TRÌNH TRUYỀN ÂM THANH TRONG PHÒNG THU SỬ DỤNG PHƯƠNG PHÁP NGUỒN ẢNH
CHUYÊN NGÀNH: KỸ THUẬT VIỄN THÔNG
LUẬN VĂN THẠC SĨ KỸ THUẬT
KỸ THUẬT VIỄN THÔNG
NGƯỜI HƯỚNG DẪN KHOA HỌC
VƯƠNG HOÀNG NAM
Hà Nội – 2017
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này đã được cảm ơn và các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc
Tác giả Luận văn
Đinh Huy Cương
Trang 31
MỤC LỤC
LỜI CAM ĐOAN 0
MỤC LỤC 1
DANH SÁCH CÁC TỪ VIẾT TẮT 3
DANH SÁCH HÌNH VẼ 4
CHƯƠNG 1 : TỔNG QUAN CỦA MÔ HÌNH VÀ CƠ SỞ LÝ THUYẾT 7
1.1 Tổng quan về mô hình 7
1.2 Mục đích của phần mềm Mô Phỏng Phòng Thu Âm 8
1.3 Lý thuyết đáp ứng xung của phòng thu 9
1.3.1 Tổng quan 9
1.3.2 Lý thuyết sóng 11
1.3.3 Lý thuyết tính toán thời gian phản hồi RT60 tại các bề mặt phòng thu 14
1.3.4 Mô hình nguồn ảnh tính toán đáp ứng xung phòng thu 16
1.3.4.1 Tổng quan 16
1.3.4.2 Tính toán đáp ứng xung bằng phương pháp nguồn ảnh 21
1.4 Tín hiệu âm và một vài đặc tính âm thanh phòng thu 23
1.5 Phản xạ sóng âm 25
1.6 Kết luận chương 1 26
CHƯƠNG 2 : CÁC PHƯƠNG PHÁP TÍNH TOÁN XỬ LÝ KẾ THỪA DỮ LIỆU 27
2.1.Tổng quan các phương pháp đo đáp ứng xung phòng thu 27
2.1.1 Phương pháp kiểm tra xung tuần hoàn 27
2.1.2 Phương pháp đo phổ trễ thời gian 28
2.1.3 Đo kích thích ngẫu nhiên 28
2.1.4 Đo kích thích tạp âm giả ngẫu nhiên 28
2.2 MLS ( maximum length sequence ) 29
2.2.1 Khái niệm 29
3.2.2 Thuộc tính tương quan của MLS 31
2.2.3 Biến đổi Hadamard nhanh cho MLS 34
Trang 42
2.3 Lý thuyết HRTF ( Head – Related transfer Function) 37
2.3.1 Khái niệm 37
2.3.2 Đo HRTF 38
2.4 Các hệ thống công cụ để thực hiện xây dựng phần mềm 42
2.4.1 Hệ thống nhận diện tiếng nói tự động (Automatic speech recognition systtôi) 42
2.4.2 Hệ thống xử lý âm thanh ( Binaural pathway) 42
2.4.3 Hệ thống xử lý đơn kênh ( Monuaral pathway) 43
2.4.4 Bộ tính năng nhận diện lỗi âm thanh (Missing feature speech recogniser) 44
2.4.5 Phân nhóm phương vị phổ biến (Grouping by common azimuth) 45
2.4.6 Yêu cầu phần cứng 45
2.5 Kết luận chương 2 46
CHƯƠNG 3 : CHƯƠNG TRÌNH MÔ PHỎNG 47
3.1 MENU Chương trình : Main Menu 47
3.1.1 Mophong_setup: Nhập các thông số theo hướng dẫn 49
3.1.2 Đọc dữ liệu từ các MAT file có sẵn 68
3.2 MENU mophong _setup : đọc dữ liệu từ Text file 69
3.3 MENU : Các tiện ích hiển thị phòng thu 70
3.4 Kết luận chương 3 75
KẾT LUẬN CHUNG VÀ KIẾN NGHỊ 76
TÀI LIỆU THAM KHẢO 77
PHỤ LỤC 78
Phụ lục A : Các thông số mô phỏng 78
Phụ lục B: Các định dạng hỗ trợ 79
Trang 53
DANH SÁCH CÁC TỪ VIẾT TẮT
Ký tự viết tắt Tiếng Anh Tiếng Việt
DSP Digital Signal Srocessing Xử lý tín hiệu số
ISM Image-Source Method Mô hình nguồn ảnh
ITD Interaural time difference Khác biệt thời gian nội tại ILD Interaural level difference Khác biệt mức độ nội tại HRIR Head Related Impulse
Response
Tương quan đáp ứng xung
và đầu người HRRIR Head-related room impulse
response
Tương quan đáp ứng xung
và đầu người HRTF Head Related Transfer
SNR Signal-to-noise ratio Tỷ số tín hiệu trên nhiễu
RT Reverberation time Thời gian phản hồi
IR Impulse response Đáp ứng xung MLS Maximum Length Sequence Chuỗi chiều dài tối đa FFT Fast Fourier Tranform Biến đổi Fourier nhanh
TF Tranfer Function Hàm truyền đạt DFT Descrete Fourier Tranform Biến đổi Fourier rời rạc
FIR Finite impulse response Bộ lọc đáp ứng xung hữu
hạn
IIR Infinite impulse response Bộ lọc đáp ứng xung vô
hạn
Trang 64
DANH SÁCH HÌNH VẼ
Hình 1 1 Mô hình tuyến tính của âm thanh trong phòng thu 9
Hình 1 2 Mô hình truyền âm thanh 10
Hình 1 3 Đáp ứng xung âm thanh trong phòng ở miền thời gian 10
Hình 1 4 Mô hình nguồn ảnh 18
Hình 1 5 Các bước thực hiện mô hình nguồn ảnh 19
Hình 1 6 Đáp ứng xung phòng với các thành phần cụ thể 20
Hình 1 7 Mặt cắt ngang của phương pháp nguồn ảnh trong mặt phẳng xy 21
Hình 1 8 Cách tiếp nhận âm thanh ở người 23
Hình 2 1 Thực hiện bộ tạo tín hiệu MLS 4bit 30
Hình 2 2 Mô hình đo MLS 33
Hình 2 3 Hệ thống đơn giản đo HRTF 39
Hình 2 4 Các hình dạng tai người 41
Hình 3 1 Mô hình phòng thu âm 58
Hình 3 2 Mối quan hệ giữa hệ số hấp thụ và tần số của âm thanh 59
Hình 3 3 Mối quan hệ thời gian phan hồi (RT60) và tần số (Hz) 60
Hình 3 4 Đáp ứng xung theo Thời gian(giây) 62
Hình 3 5 Suy hao năng lượng theo số mẫu 63
Hình 3 6 Magnitude vs Frequency 65
Hình 3 7 Hình ảnh 2 chiều của phòng thu và nguồn âm với vị trí,cường độ sáng 66
Hình 3 8 Hình ảnh 3 chiều của phòng thu và nguồn âm với vị trí,cường độ sáng 67
Hình 3 9 Menu lựa chọn Text file 69
Hình 3 10 Các tiện ích hiển thị phòng thu 70
Hình 3 11 Mô hình cường độ âm thanh 72
Hình 3 12 Hình ảnh 3 chiều phòng thu 73
Hình 3 13 Hình ảnh 3 chiều phòng thu 74
Trang 75
MỞ ĐẦU
Trước những yêu cầu đặt ra về nghiên cứu âm thanh và ứng dụng của nó vào thực
tế, cũng như đáp ứng được những yêu cầu về chất lượng âm thanh trong các phòng thu âm Đi cùng với nó là việc phục vụ những yêu cầu trong thiết kế và chọn lựa các dụng cụ âm thanh một cách tốt nhất Trong một thời gian dài tìm hiểu và nghiên cứu tôi đã nghiên cứu và phát triển một công cụ mô phỏng phòng thu âm dưới dạng hình hộp chữ nhật
Hiện nay các phòng thu âm mini trong các gia đình hay tổ chức có hình dạng và kích thước rất đa dạng theo yêu cầu riêng của từng người sử dụng cho các hoạt động
ca nhạc khác nhau Không những thế các ứng dụng âm thanh trong các phòng thu còn được sử dụng trong các doanh nghiệp, công ty sản xuất âm nhạc, trong các chương trình ca nhạc và đã trở thành phổ biến ở những buổi thuyết trình diễn ra trong phòng thu hoặc ngoài trời Tuy nhiên do còn hạn chế về nhiều mặt nên trong luận văn này tôi đã tập trung vào giải quyết và xây dựng chương trình mô phỏng tín hiệu âm thanh trong một phòng thu âm hình hộp chữ nhật với 6 bề mặt phản xạ âm thanh Với các cơ sở dữ liệu kế thừa từ “CIPIC HRTF Database” phát triển bởi giáo
sư Ralph Algazi phòng LAB CIPIC-University of California Davis
Luận văn của tôi được chia làm 3 phần chính:
Chương 1: Tổng quan của mô hình và cơ sở lý thuyết
Chương đầu tiên của luận văn, tôi sẽ giới thiệu một cách tổng quan về phần mềm
mô phỏng, các phương pháp xây dựng chương trình, yêu cầu đặt ra với phần mềm Đồng thời nội dung của chương này trình bày về các lý thuyết cơ bản về âm thanh bao gồm quá trình lan truyền âm thanh trong môi trường phòng thu, lý thuyết đáp ứng xung, thuật toán xác định tín hiệu âm và một vài đặc tính của âm thanh
Chương 2: Các phương pháp tính toán và xử lý kế thừa từ các cơ sở dữ liệu
Trang 86
Trong chương này sẽ trình bày về những lý thuyết được đưa ra từ các công trình nghiên cứu của các nghiên cứu sinh tại các phòng LAB trên thế giới Những lý thuyết này được áp dụng để xây dựng các cơ sở dữ liệu phục vụ cho luận văn này
Chương 3 Chương trình mô phỏng
Kết quả thu được từ phần mềm được thực hiện thông qua các bước cơ bản như nhập
số liệu về phòng thu âm, các yêu cầu liên quan tới nguồn thu phát âm… Các biểu đồ
sẽ được thu lại và hiển thị cho người dùng
Trang 97
CHƯƠNG 1 : TỔNG QUAN CỦA MÔ HÌNH VÀ
CƠ SỞ LÝ THUYẾT 1.1 Tổng quan về mô hình
Lý thuyết âm học và ứng dụng của nó đã được nghiên cứu trong một thời gian dài bởi các bác sĩ, kỹ sư, kiến trúc sư và nhiều người khác Với sự hiểu biết đúng đắn
về âm thanh, có thể dự đoán hành vi của âm thanh bên trong một căn phòng, cho phép tính toán đáp ứng xung của một nguồn âm thanh phát ra tại một nguồn âm Đáp ứng xung được tính toán ở những môi trường có kích thước và vật liệu xây dựng khác nhau bằng cách sử dụng những lý thuyết kinh điển về xử lý tín hiệu số Khả năng mô phỏng các tính chất âm thanh của một căn phòng cũng đặc biệt hữu ích cho các kiến trúc sư Âm thanh của các tòa nhà hoặc các phòng sẽ được thiết kế
và tính toán, do đó đặc tính âm thanh không mong muốn có thể được sửa chữa trước khi bắt đầu xây dựng
Kết quả của việc mô phỏng phòng âm thanh sẽ được áp dụng một cách rất phổ biến khi tiến hành xây dựng những phòng thu với các thiết bị âm thanh và các thiết bị video Các hiệu ứng thiết lập hiện nay như bên trong các phòng họp, nhà hát, rạp chiếu phim hoặc phòng hòa nhạc được phổ biến với các đầu phát video hoặc các hệ thống âm thanh nổi Các thiết lập hiệu ứng cho phép người dùng nghe được âm thanh hoặc âm nhạc thông qua thiết bị như thể họ đang nghe nó bên trong phòng quy định Tuy nhiên, các hiệu ứng được tìm thấy trên các hệ thống này thường chung chung và thực hiện bằng cách cân bằng tần số và mô phỏng của một loạt các tiếng vang, với sự trễ thời gian lớn hơn giữa mỗi tiếng vang cho các phòng lớn hơn Một hệ thống đo lường và mô phỏng phòng âm thanh có vô số các ứng dụng tiềm năng Nó có thể được sử dụng cho việc tăng cường các âm thanh trong các lĩnh vực giải trí như âm nhạc, truyền hình và máy tính đa phương tiện Hệ thống cũng có thể được điều chỉnh để đo lường phản ứng của một căn phòng hoặc các thiết bị điện, âm thanh như loa phóng thanh Sau khi phân tích, những thiếu sót trong các phản ứng
Trang 108
đo có thể được bù lại bằng cách áp dụng một chức năng chuyển giao mới được tính toán để trước khi âm thanh được phát lại thông qua các loa phóng thanh hoặc vào phòng Ngoài ra còn có nhiều ứng dụng âm thanh ảo Các phép đo tín hiệu đầu vào tại các vị trí khác nhau bên trong phòng bằng cách giả một đầu thu Microphone, và thực hiện tính toán dựa trên hàm HRTF Sự mở rộng của âm thanh trong âm thanh
ba chiều cũng có thể được tăng cường bằng cách áp dụng một phản ứng phòng đo kết hợp với HRTF cho kết quả tốt hơn…
Chương trình là một phần mềm mô phỏng âm thanh bên trong một phòng lăng trụ hình chữ nhật đơn giản, được xây dựng trên nền của ngôn ngữ lập trình MATLAB Bằng cách sử dụng mô hình nguồn - ảnh (image-source method) để tạo ra một đáp ứng xung từ mỗi nguồn đẳng hướng tới một hệ thống máy thu định hướng có thể là một cảm biến duy nhất, một cặp cảm biến…
Thuật toán đã được sử dụng bao gồm tính toán các hệ số hấp thụ âm thanh phụ thuộc vào tần số Bằng cách này, chương trình cung cấp khả năng lựa chọn các vật liệu khác nhau cho một trong sáu bề mặt chính của phòng mô phỏng theo một danh sách hiện tại là 20 tiêu chuẩn vật liệu xây dựng (cộng với 4 phòng chống dội vang Anechoic) và có bảng hệ số hấp thụ phụ thuộc tần số
1.2 Mục đích của phần mềm Mô Phỏng Phòng Thu Âm
Mục tiêu cốt lõi của phần mềm là cung cấp một công cụ phát tín hiệu phục vụ cho việc nghiên cứu giọng nói và âm thanh Phần mềm mô phỏng một phòng thu một cách trực quan, các tín hiệu âm thanh được biểu diễn dưới dạng các biểu đồ chuẩn
để từ đó có thể giúp cho sinh viên có công cụ để thực hành các bài tập liên quan đến
âm thanh, hiểu được bản chất, hành vi của tín hiệu…Bên cạnh đó thì phần mềm cũng đáp ứng được yêu cầu của các nhà nghiên cứu lấy phần mềm làm công cụ so sánh hữu ích khi tiến hành thực nghiệm xây dựng các thuật toán mới về xử lý tín hiệu
Trang 119
Cùng với việc sử dụng công cụ mô phỏng MATLAB có sự tương tác tạo ra những hình ảnh mô phỏng trong không gian ba chiều Thêm vào đó phần mềm cũng được thiết kế để đo và hiển thị các tín hiệu dưới dạng biểu đồ đáp ứng xung, đáp ứng tần
số trong miền thời gian…
1.3 Lý thuyết đáp ứng xung của phòng thu
1.3.1 Tổng quan
Mô tả vật lý cơ bản nhất đối với phòng âm học là đáp ứng xung giữa nguồn và vị trí của một máy thu trong phòng Tất cả các thuộc tính của một phòng âm thanh, chẳng hạn như thời gian phản hồi, có thể được bắt nguồn từ đáp ứng xung này
Hình 1 1 Mô hình tuyến tính của âm thanh trong phòng thu
Ta coi một hệ thống tín hiệu trong phòng thu tổng quát bao gồm tín hiệu đầu vào (âm thanh) và tín hiệu đầu ra sau khi đi qua môi trường trong phòng như trên hình
vẽ Hàm truyền đạt của hệ thống này sẽ mô tả đẩy đủ bản chất và hành vi của âm thanh Xuyên suốt luận văn này là việc tìm những phương pháp và thuật toán để xác định được hàm truyền đạt, cũng chính là đáp ứng tần số Để xác định được đáp ứng tần số, trước hết ta xét về mặt lý thuyết âm thanh sẽ được truyền đi như thế nào Sau những nghiên cứu của các nhà khoa học về tín hiệu âm thanh truyền đi trong môi trường kín ( phòng thu), ta có mô hình âm thanh được thể hiện như hình bên dưới :
Trang 1210
Hình 1 2 Mô hình truyền âm thanh
Hình bên trên cho thấy làm thế nào âm thanh truyền để tới được người nghe bên trong một căn phòng Khi một âm thanh lần đầu tiên được tạo ra, nó trước hết sẽ đi đến vị trí của người nghe thông qua các đường dẫn trực tiếp từ nguồn Sau đó, cường độ âm thanh giảm xuống như một kết quả của sự phản xạ từ các bức tường
và âm thanh trong phòng sẽ đi đến người nghe vào những thời điểm khác nhau sau
âm thanh gốc Mỗi phản hồi sau đó sẽ lần lượt bị chậm lại và suy yếu
Hình 1 3 Đáp ứng xung âm thanh trong phòng ở miền thời gian
Hình trên đây biểu diễn miền thời gian của một phòng đáp ứng xung tùy ý như là một kết quả của quá trình truyền âm thanh vào trong một căn phòng như thể hiện trong hình trước đó Sau khi âm thanh trực tiếp ban đầu tại thời điểm t0, âm thanh phản xạ xuất hiện tùy thuộc vào thời gian mà nó truyền đến người nghe Sự suy
Trang 131.3.2 Lý thuyết sóng
Để tính toán đáp ứng xung của phòng, trước hết ta cần xtôi xét tính chất sóng của
âm thanh trong phòng thu Âm thanh từ một nguồn S phát đi tới nguồn thu tạo ra áp
lực âm thanh p(r,t) Hàm sóng tổng quát là hàm của áp lực âm thanh p(r,t) với r = [
x,y,z ] theo vị trí và thời gian :
(1.1) Với :
– toán tử Laplace
c – vận tốc âm thanh
|p(r,t)| < poc2 trong đó po là mật độ sóng truyền ở trạng thái cân bằng
Để tính toán đáp ứng xung trong phòng thu cụ thể ta phải thêm một hàm nguồn vào biểu thức (2.1) và cần có điều kiện biên để mô tả âm thanh phản xạ và hấp thụ ở
tường.Gọi s(r,t) là hàm nguồn ta có phương trình sóng :
(1.2) Chúng ta đưa phương trình sóng chuyển về miền tần số.Áp dụng biến đổi Fourier:
Với exp = và i =
Trang 14Do vị trí của nguồn là rs=[xs,ys,zs] nên chúng ta có :
với Là hàm delta Kronecker Phương trình (2.5) được viết lại :
(1.6) Với là hàm Green
Đối với một hàm nguồn tùy ý áp lực nguồn có thể tính toán dựa vào mối quan hệ sau :
(1.7)
Với là thể tích nguồn , và Như vậy hàm bây giờ có thể được tính bằng cách biến đổi Fourier ngược từ (2.7)
Cách thông thường để giải quyết phương trình (2.6) là tìm một bộ trực giao với toán
tử Laplacian và sau đó lấy mở rộng bằng cách lấy tổng các hàm trực giao Cụ thể đó là một hàm thỏa mãn : Khi đó hàm Green được viết lại :
(1.8)
Trang 15Xét một phòng hình chữ nhật có kích thước vật lý (Lx,Ly,Lz), có tường cứng phản
xạ hoàn toàn, hàm trong tọa độ cầu là:
(1.10) Với m = ( mx,my,mz) và mv là số nguyên không âm Đặt kv = , v (x,y,z)
Khi đó phương trình (10) có thể viết lại :
(1.11)
Hàm có được giải thích bằng mô hình sóng đứng ba chiều với giá trị riêng tương ứng là : Giải pháp giải quyết hàm không đồng nhất (2.6) cho phòng hình chữ nhật là :
(1.12) Với m = {( mx,my,mz) : mx, my, mz } là tổ hợp các giá trị của m và là một giá trị liên tục được xác định bởi :
Trang 16Biến đổi Fourier ngược của hàm G(r,r s ; ) ta được đáp ứng xung của phòng thu
Như vậy để có thể tính toán được đáp ứng xung của phòng thu ta phải tính toán hàm Green với những điều kiện và các thông số đã nêu ở trên
1.3.3 Lý thuyết tính toán thời gian phản hồi RT60 tại các bề mặt phòng thu
Khi âm thanh truyền đi trong không khí, chúng sẽ phản xạ và một phần âm thanh được vọng lại gọi là âm vang Âm vang là sự tồn tại của âm thanh trong một không gian đặc biệt sau khi âm thanh gốc được tạo ra Âm vang sẽ từ từ phân rã bởi sự hấp thụ của các bức tường và không khí Thời gian của sự phân rã âm thanh (hoặc thời gian vang), nhận được sự quan tâm đặc biệt trong thiết kế kiến trúc của căn phòng lớn, mà cần phải có thời gian vang cụ thể để đạt được hiệu suất tối ưu cho hoạt động
dự tính Thời gian vang khoảng từ 50 đến 100 ms, khoảng cách giữa các tiếng vang
từ 0,01-1 ms Theo thời gian, tiếng vang giảm cho đến khi những tiếng vọng không thể nghe thấy nữa Sau khi nghiên cứu các nhà khoa học đã đưa ra khái niệm
Trang 17âm thanh phản xạ từ một âm tiết vẫn còn nghe được khi âm tiết tiếp theo được nói,
nó có thể gây ra khó khăn để hiểu được những gì đã nói trước đó Mặt khác, nếu thời gian vang là quá ngắn, cân bằng âm và âm lượng có thể bị ảnh hưởng Ảnh hưởng vang thường được sử dụng trong studio để thêm chiều sâu cho âm thanh Các yếu tố cơ bản ảnh hưởng đến thời gian vang của một phòng bao gồm kích thước và hình dạng xung quanh phòng cũng như các vật liệu được sử dụng trong việc xây dựng nên các phòng Mỗi đối tượng được đặt trong phòng cũng có thể ảnh hưởng đến thời vang này, bao gồm cả người và đồ đạc của họ
Nói tóm lại, thời gian phản hồi Reverberation Time là khoảng thời gian mà tín hiệu dược phát đi từ nguồn âm cho tới khi va đập vào bề mặt phòng thu và suy hao Khái niệm hàm sử dụng để tính toán thời gian phản hồi của tín hiệu từ lúc phát đi cho tới khi suy hao 60dB, lượng suy hao này đủ để sensor tại đầu thu có thể nhận dạng được tín hiệu
Trong cuối thế kỷ 19, Waent Sallace Cltôibine bắt đầu thí nghiệm tại Đại học Harvard để kiểm tra tác động của sự hấp thụ vào thời gian vang Ông sử dụng một một nguồn âm thanh, một đồng hồ bấm giờ và đôi tai của mình, ông đã đo thời gian
từ sự gián đoạn của nguồn không thể nghe được (khoảng 60 dB) Ông thấy rằng thời gian vang tỷ lệ thuận với kích thước của căn phòng và tỷ lệ nghịch với số lượng hấp thụ hiện tại Năm 1898, Wallace C.Sabine đã đưa ra công thức tính toán kinh điển cho hàm như sau :
(2.15)
Trang 18C 20 là vận tốc âm thanh 343 m/s tại nhiệt độ tiêu chuẩn 20
Về mặt đo đạc có thể dùng một hệ thống đo lường hai cổng để đo tiếng ồn đưa vào không gian và so sánh nó với những gì sau đó đo được trong không gian Một cổng xác định âm thanh tái tạo bằng một loa Một cổng chứa bộ ghi âm để ghi lại âm thanh trong phòng để có thể kiểm tra và so sánh với những gì đã được gửi đến loa Hai tín hiệu có thể được so sánh toán học Hệ thống đo lường hai cổng này sử dụng một biến đổi Fourier để lấy được đáp ứng xung của căn phòng Từ đáp ứng xung, thời gian vang có thể được tính toán Ưu điểm của việc sử dụng một hệ thống hai cổn đó là cho phép đo thời gian vang với các tín hiệu khác nhau với những xung lớn
1.3.4 Mô hình nguồn ảnh tính toán đáp ứng xung phòng thu
1.3.4.1 Tổng quan
"Phương pháp nguồn ảnh" (ISM Image Source Method) là một kỹ thuật thường được sử dụng trong các mô hình âm thanh không gian khép kín hoặc mở Trong phương pháp này sử dụng tính đối xứng để xác định bậc phản xạ của âm thanh truyền đi trong phòng thu và bị phản xạ bởi các bề mặt của phòng
Mặc dù ISM là đơn giản và dễ dàng sử dụng, nhưng nhược điểm chính của nó là sự tăng lên theo hàm mũ của thời gian tính toán tỷ lệ với bậc của phản xạ Ngoài ra, thời gian tính toán sẽ tiếp tục tăng khi mô hình âm thanh với nhiều nguồn âm Do
Trang 19Cơ sở của phương pháp nguồn ảnh được chỉ ra trong hình 1.4 Các tuyến phản xạ từ nguồn âm thực được thay bằng các các tuyến trực tiếp từ ảnh phản xạ của nguồn chính
Hình 1.4 mô tả một phần đơn giản của khán phòng bao gồm nền, trần, tường và ban công Các nguồn ảnh Sc và Sf biểu diễn bởi phản xạ bởi trần và nền nhà Cũng có thể có các nguồn ảnh bậc hai Sfc là ảnh phản xạ của Sf theo trần nhà
Sau khi xác định các nguồn ảnh cần thực hiện thao tác kiểm tra các tuyến khuất so với người nghe Xtôi xét các tuyến phản xạ (Pc Pfc Pf trong hình 1.4) Kiểm tra các tuyến không gian với các mặt của phòng Các nguồn Sc và Sfc nằm trong thị trường của người nghe, trong khi đó nguồn ảnh Sf ẩn bởi ban công do tuyến Pf giao với nó Đây là môt mô hình đơn giản để có cái nhìn trực quan về phương pháp nguồn ảnh Nếu trong trường hợp phòng có 6 mặt, ảnh nguồn là tương đối phức tạp, bậc phản
xạ cũng tăng lên, trong luận văn này bậc phản xạ được giới hạn cao nhất là 10 Đó
là vì theo các tính toán của các nhà khoa học với việc phản xạ đến bậc 10 thì đáp ứng xung được xtôi như là rất nhỏ có thể bỏ qua Lưu ý quan trọng ở đây là vị trí nguồn âm không phụ thuộc vào vị trí người nghe, mà chỉ khả năng thấy của mỗi nguồn ảnh có thể thay đổi khi người nghe di chuyển Khi cả vị trí nguồn âm và vị trí người nghe đều thay đổi thì âm thanh được phản xạ ở những vị trí khác nhau
Trang 2018
Hình 1 4 Mô hình nguồn ảnh
Thuật toán phương pháp nguồn ảnh được thể hiện theo bốn bước như trong hình 1.5
Trang 2119
Hình 1 5 Các bước thực hiện mô hình nguồn ảnh
Bước 1: Ước tính ảnh của nguồn âm
Bước 2: Vẽ một đường thẳng nối từ điểm nguồn ảnh tới người nhận
Bước 3: Tìm điểm giao nhau giữa đường thẳng và bề mặt phản xạ và nối từ điểm đó với vị trí nguồn âm thanh
Bước 4: Xác nhận sự phản xạ (tức là xác định các điểm giao nhau nằm trong đường biên của bề mặt phản xạ tới người nhận)
Như vậy bằng thuật toán này ta có thể tính toán được thời gian mà âm thanh đến vị trí người nghe thông qua ảnh của nguồn phát thay vì tính toán trực tiếp tia phản xạ Cách làm như vậy để có thể xác định rõ được bậc phản xạ của âm thanh khi phản
xạ Những âm phản xạ nhiều lần sẽ có bậc phản xạ lớn và âm thanh bị suy hao nhiều hơn Âm thanh nhận được sau khi thực hiện thuật toán để tính toán có thể nhận được đáp ứng xung theo thời gian như hình 1.6, chúng được chia thành nhiều thành phần Thuật toán chi tiết để tính toán và mô phỏng sẽ được thể hiện rõ ràng ở phần sau
Trang 2220
Hình 1 6 Đáp ứng xung phòng với các thành phần cụ thể Theo quan điểm vật lý, thành phần phản xạ sớm và trễ có thể xtôi như là các thành phần âm riêng biệt Có nghĩa là thành phần âm trực tiếp (DS) trong hình 1.6 và mỗi thành phần phản xạ sớm (r1 đến r2 trong hình 1.2) có thể đặc trưng bởi các hướng,
độ trễ, suy hao và các biến thể nội dung phổ tần của chúng (gây ra bởi hấp thụ không khí, các hấp thụ bề mặt phản xạ)
Dạng biểu diễn chi tiết trong miền thời gian của thành phần phản xạ sớm trong một đáp ứng phòng thu phụ thuộc chặt chẽ vào đặc trưng hình học của không gian âm, các vị trí nguồn âm và người nghe Trong khi đó các âm vang trễ tương tự như một quá trình ngẫu nhiên, có thể xtôi như là chuỗi ngẫu nhiên giảm theo hàm mũ (đặc trưng bởi thời gian vang, RT60, hình 1.6) Trường âm cũng được xtôi như là khuếch tán, tức là đáp ứng trễ độc lập với vị trí nguồn và người nghe, và xác suất phản xạ tới từ tất cả các hướng là như nhau
Theo quan điểm trực quan, thành phần sớm của đáp ứng xung phòng tác động mạnh theo hình học phòng, trong khi các phản xạ trong quá trình vang trễ không phân biệt
rõ ràng Từ đó có thể kết luận rằng mô phỏng âm học phòng không cần mô tả chi tiết phần vang trễ, nhưng cũng cần đưa ra các hiệu ứng vang nhân tạo nhằm đạt kết quả mô phỏng trực quan gần như thật
Trang 2321
1.3.4.2 Tính toán đáp ứng xung bằng phương pháp nguồn ảnh
Gọi phòng hình chữ nhật có chiều dài, chiều rộng, chiều cao lần lượt là L x ,L y ,L z Đặt
nguồn âm tại vị trí có vector tọa độ rs = [x s ,y s , z s], đặt vị trí nguồn thu microphone tại
vị trí có vector tọa độ r = [x, y, z] Vị trí tương đối của ảnh đo so với vị trí thu và
nhận, xét ở vị trí x=0; y=0; z=0 (x = 0; y = 0; z = 0 lần lượt tương ứng với mặt phẳng yOz, xOz, xOy ) được viết như sau:
R p = [(1-2q)x s – x, (1-2j)y s – y, (1-2k)z s – z] (1.16)
Hình 1 7 Mặt cắt ngang của phương pháp nguồn ảnh trong mặt phẳng xy
Mỗi phần tử trong R p = (q, j, k) có thể nhận giá trị 0 hoặc 1 Tổ hợp các giá trị ta
được tập Ƥ = {(q, j, k):q, j, k {0,1}} Khi giá trị của p là một kích thước bất kì thì
ảnh của nguồn trong hướng đó được xtôi xét Để xét tất cả các ảnh chúng ta thêm
vector R m vào R p với R m :
Rm = [ 2m x L x , 2m y L y , 2m z L z ] (1.17)
Trong đó m x , m y , m z là số nguyên Bậc phản xạ ở vị trí Rp+Rm+r được cho bởi công thức:
Trang 24là hệ số phản xạ của 6 bức tường Chú ý rằng tường ở vị trí v = 0 với v
tương ứng với , và tường ở vị trí v = L v với v tương ứng với
Các phần tử của p có giá trị 0 hoặc 1 tức là có tổ hợp 8 bộ giá trị từ (0,0,0) đến
(1,1,1) Bộ ba phần tử của m có giới hạn từ -N đến N nghĩa là có 8(2N + 1)3 sự kết hợp Độ trễ của các xung được tính toán tương ứng bằng công thức (1.19)
Trong khi mô phỏng một việc cần xtôi xét nữa đó là thời gian âm vang đặc trưng bằng hàm RT60, được xác định bằng công thức :
RT60 = (1.22)
Trong đó V là thể tích của phòng, β i và S i là hệ số phản xạ và diện tích bề mặt của
mặt tường thứ i
Trang 2523
1.4 Tín hiệu âm và một vài đặc tính âm thanh phòng thu
Hãy tưởng tượng ta đang ngồi một mình trong một căn phòng rất yên tĩnh và đột nhiên có một âm thanh bất chợt vang lên, chẳng hạn một đồng tiền xu vừa rơi xuống sàn nhà Thông thường mọi người sẽ gần như ngay lập tức quay đầu về phía nguồn âm đó Việc quay về hướng âm thanh dường như là một bản năng – bởi gần như ngay lập tức, não bộ đã xác định được vị trí phát âm Và nói chung, ngay kể cả
Hình 1 8 Cách tiếp nhận âm thanh ở người
với những người chỉ nghe bằng một tai, não bộ vẫn có thể định vị được.Khả năng định vị nguồn âm bắt nguồn từ năng lực phân tích của não đối với các thuộc tính
âm Một trong số các thuộc tính đó là sự khác nhau giữa âm thanh mà tai phải nghe được và âm thanh tai trái nghe được Hay có những thuộc tính liên quan tới sự tương tác giữa sóng âm với đầu và thân người Kết hợp tất cả các thuộc tính sẽ tạo nên những tín hiệu âm khác nhau, qua đó não dùng để xác định chính xác nguồn âm đến từ đâu
Hãy tưởng tượng đồng xu rơi trong một phòng học yên tĩnh ở đâu đó phía bên phải của ta Do sóng âm dịch chuyển vật lý qua không khí – một quá trình đòi hỏi thời gian - nó sẽ đến tai phải của bạn trước một vài phần giây so với tai trái Thêm vào
Trang 2624
đó, âm thanh đến tai trái cũng bị giảm đi chút ít về mặt âm lượng do tính tiêu hao của sóng âm và một phần bị nhiễu do các âm bị hấp thụ và phản xạ qua tóc, đầu Sự khác biệt về âm lượng giữa tai trái và tai phải gọi là khác biệt mức độ âm nội tại (interaural level difference_ILD), còn độ trễ thời gian giữa hai tai được gọi là sự khác biệt thời gian âm nội tại (interaural time difference _ITD)
Bằng thực nghiệm người ta đã chứng minh rằng ITDs và IIDs là hai thông số quan trọng trong việc nhận thức các âm thanh trong mặt phẳng nằm ngang, trong đó bao gồm cả hai tai và nửa trên, nửa dưới của đầu Nói chung một âm thanh từ một nguồn âm đến tai gần hơn khi mà góc xác định ITD lớn hơn Nói cách khác chúng tỉ
lệ với góc phương vị của âm thanh nhận được ở hai tai
Tuy nhiên ở tần số khoảng 1500 Hz , việc xác định góc phương vị là rất khó do độ dài của bước sóng ITD tỉ lệ với đường kính của đầu Một vấn đề xảy ra đối với âm thanh ở tần số trên 1500 Hz chỉ ra rằng góc phương vị của nó không còn được xác định nữa Ở tần số trên 1500 Hz đầu bắt đầu ảnh hưởng đến việc nhận thức âm thanh đến tai Trong trường hợp này phải kể đến sự khác biệt cường độ nội tại IID Lúc này góc phương vị tỉ lệ với lgIID
Sự khác biệt về thời gian và mức độ âm thanh giữa hai tai tạo cho não một ý tưởng
rõ ràng về việc âm thanh đến từ phía trái hay phải Tuy nhiên, những sự khác biệt này không thể hiện được âm thanh đến từ phía trên hay phía dưới Đó là bởi vì kể cả khi có sự thay đổi về độ cao, quãng đường âm thanh đi tới tai có thể vẫn không thay đổi Hoặc ở một số trường hợp, nếu chỉ dựa vào sự khác biệt giữa thời gian và mức
độ cũng khó có thể xác định liệu âm thanh đến từ phía trước hay phía sau nếu quãng đường chúng đến tai là bằng nhau Mô hình này thường được mô tả là mô hình nón nhiễu (cone of confusion) (hình 1.8), trong đó nếu chỉ dựa vào các thông số ILD và ITD sẽ không thể xác định được nguồn âm đến từ đâu
Trang 2725
Một vấn đề cần lưu ý nữa là các thông số ILD và ITD đòi hỏi con người phải nghe bằng hai tai Tuy nhiên, thực tế cho thấy kể cả những người chỉ nghe bằng một tai, não bộ vẫn có thể định vị nguồn âm nhờ các phản xạ âm nội tại trong mỗi tai
Khi một sóng âm tới cơ thể người, nó sẽ bị phản xạ cả với đầu và vai Ngay cả khi đến tai, một phần sóng âm cũng bị phản xạ với vành tai ngoài của người Mỗi phản
xạ đều tạo nên những thay đổi dù nhỏ trong sóng âm Các sóng phản xạ này giao thoa với nhau, tạo thành các phần sóng âm to nhỏ khác nhau, làm thay đổi âm lượng
và chất lượng âm thanh Các thay đổi này được biết đến với khái niệm HRTF related transfer functions) sẽ được trình bày trong chương sau Không giống như thông số ILD hay ITD, góc độ từ đó âm thanh tới tai người dù cao hay thấp sẽ thể hiện sự khác biệt thông qua các phản xạ âm khác nhau trên bề mặt cơ thể Phản xạ này cũng khác nhau giữa các âm thanh đến từ trước và sau cơ thể.Những thông số HRTF tuy nhỏ nhưng có những tác động phức tạp tới hình dạng của sóng Não bộ
(head-sẽ biên dịch các sự khác biệt về hình dạng sóng này, từ đó phân tích để định vị được nguồn âm
1.5 Phản xạ sóng âm
Vành tai ngoài của người có nhiều bề mặt có thể phản xạ sóng âm Hầu hết bề mặt này đều cong Một số có thể hướng âm thanh về phía bề mặt khác trong tai, khiến cho sóng âm va đập xung quanh tai vài lần trước khi tới được màng nhĩ Các tương tác sóng âm với mặt người, đầu, tóc và thân cũng rất phức tạp Vì thế, các nhà khoa học đã nghiên cứu thông số HRTF ảnh hưởng tới cách thức tiếp nhận âm thông qua các thí nghiệm với nhiều nguồn âm, nhiều microphone và sự trợ giúp từ các phần mềm máy tính
Trong một số trường hợp, các nhà nghiên cứu gắn trực tiếp rất nhiều microphone siêu nhỏ lên bề mặt ngoài thân của người làm thí nghiệm Hoặc trong một số trường hợp khác, họ thay vì sử dụng người sẽ sử dụng một ma-nơ-canh được thiết kế như một mẫu người thật Ma-nơ-canh dùng trong nghiên cứu âm thanh này còn được
Trang 2826
được biết đến với tên gọi KTÔIAR (Knowles Electronic Manikin for Acoustic Research) và vẫn được sử dụng trong nghiên cứu âm học tại phòng lab của Đại học công nghệ Masachusset
Các microphone siêu nhỏ khi được gắn lên cơ thể thực hiện nghiên cứu chỉ có một nhiệm vụ duy nhất là thu âm Máy tính sau đó sẽ phân tích những khác biệt âm thanh nhỏ nhất tại từng điểm khác nhau theo nguồn hoặc đo sự khác nhau của cùng một âm thanh trên từng phần khác nhau của cơ thể Cuối cùng, các thông tin này sẽ được quy về một thuật toán hoặc tập các thuật toán Thuật toán này về cơ bản là tập nguyên tắc mô tả các thông số HRTF và các yếu tố khác có ảnh hưởng tới hình dạng sóng âm Khi áp dụng chúng với các sóng âm, thuật toán sẽ làm thay đổi hình dạng của sóng âm, gán cho nó một thuộc tính tương tự như thể nó đã được tương tác thật với cơ thể người
1.6 Kết luận chương 1
Toàn bộ chương vừa rồi đã thể hiện được mục đích, phương pháp để xây dựng nên
mô hình âm thanh truyền đi trong phòng thu qua những khái niệm về: lý thuyết sóng, lý thuyết tính toán thời gian phản hồi, đặc tính của sóng âm truyền đi trong môi trường phòng thu Từ những lý thuyết này chúng ta sẽ có cơ sở để đánh giá kết quả của phần mềm có đúng như lý thuyết đã đưa ra hay không
Sau khi nắm được những khái niệm cơ bản chúng ta sẽ thực tiếp tiếp các bước tính toán số liệu của âm thanh để có thể thực hiện mô phỏng, phần này sẽ được thể hiện
ở chương tiếp theo
Trang 2927
CHƯƠNG 2 : CÁC PHƯƠNG PHÁP TÍNH TOÁN
XỬ LÝ KẾ THỪA DỮ LIỆU 2.1.Tổng quan các phương pháp đo đáp ứng xung phòng thu
2.1.1 Phương pháp kiểm tra xung tuần hoàn
Lựa chọn hợp lý nhất cho việc tính toán đáp ứng xung của hệ thống tuyến tính là phương pháp kiểm tra xung tuần hoàn hoặc phương pháp tích hợp xung, được đưa
ra bởi Schroeder và Rife & Vanderkooy, tại đó đáp ứng xung của hệ thống được lấy trực tiếp mà không cần bất kỳ quá trình xử lý nào từ đầu ra của hệ thống ghi lại
từ sự kích thích bởi một tín hiệu xung hẹp được sử dụng để mô phỏng một xung hoàn hảo
Đối với các phép đo âm thanh, những khó khăn của phương pháp này nằm chủ yếu trong việc tạo ra một xung mô phỏng Rất khó khăn để tạo ra một xung tín hiệu có năng lượng lớn, trong đó có một phổ tần số điện phẳng trên phạm vi tần số quan tâm Do đó các phép đo bằng cách sử dụng một xung trước khi ghi cần phải được trung bình để bảo toàn tỷ số tín hiệu trên tạp âm có thể chấp nhận được Thông thường các tín hiệu xung hẹp có thể được tạo ra bằng cách sử dụng các thiết bị như tia lửa điện, phích cắm hoặc súng ngắn Sau đó các tín hiệu xung thường được ghi lại và chiếu vào phòng liên tục với loa phóng thanh
Xung định kỳ thử nghiệm xung tuần hoàn có thể là một lựa chọn tốt bởi sự đơn giản của nó và lợi thế chi phí thấp Tuy nhiên, phương pháp này không thể tách rời các thành phần tuyến tính và phi tuyến tính của đáp ứng Nếu các phòng đo là phi tuyến tính, có thể xảy ra nếu căn phòng chứa các vật thể di động hoặc người, tuyến tính,
hệ thống phi tuyến tính sẽ sửa đổi trực tiếp đáp ứng xung đo và sự biến dạng gây ra
sẽ không bị giảm bởi bất kỳ số lượng trung bình áp dụng cho các phép đo đáp ứng
Trang 3028
2.1.2 Phương pháp đo phổ trễ thời gian
Kỹ thuật đo phổ trễ thời gian cũng được sử dụng để đo đáp ứng xung của phòng thu Các kết quả thu được với phương pháp này có thể rất chính xác Phương pháp này là cấp trên để kiểm tra xung tuần hoàn bởi vì nó có thể được sử dụng để theo dõi các tần số cơ bản của đáp ứng tức thời hệ thống (các thành phần tuyến tính) hoặc những âm điệu riêng của đáp ứng hệ thống (các thành phần phi tuyến tính) Tuy nhiên, phép đo này có hạn chế là chi phí cao do các thiết bị sử dụng
2.1.3 Đo kích thích ngẫu nhiên
Một cách tiếp cận thay thế cho phương pháp nói trên là để kích thích các phòng với tiếng ồn Tiếng ồn có thể được áp dụng cho một phòng có chu kỳ thời gian dài, cung cấp nhiều năng lượng để hệ thống cho một biên độ tín hiệu nhất định và do đó đảm bảo rằng tỷ lệ tín hiệu trên tạp âm có thể được duy trì Nó cũng dễ dàng hơn để đảm bảo rằng năng lượng được phân phối đều trên toàn bộ phổ tần số kích thích tiếng ồn
Trong bộ phân tích FFT song kênh, sự kích thích nhiễu trắng ngẫu nhiên được sử dụng, kết hợp với phương pháp thống kê để đo lường đáp ứng xung Tuy nhiên, vì bản chất ngẫu nhiên của các kích thích, thời gian đo cần thiết rất dài để giảm các ảnh hưởng ngẫu nhiên Một bất lợi của hệ thống như vậy là cả hai hệ thống đầu vào
và đầu ra cần phải được đo, khi đầu vào là không xác định
2.1.4 Đo kích thích tạp âm giả ngẫu nhiên
Thay vì sử dụng nhiễu trắng ngẫu nhiên, tạp âm giả ngẫu nhiên có thể được sử dụng
để thay thế cho sự kích thích Tiếng ồn giả ngẫu nhiên có tính chất tương tự như những tiếng ồn trắng Ví dụ, phổ năng lượng của tiếng ồn giả ngẫu nhiên, được tạo
ra bằng cách sử dụng chuỗi nhị phân MLS, có phổ năng lượng phẳng Cũng giống như kích thích nhiễu trắng, kích thích tạp âm giả ngẫu nhiên có thể được áp dụng trong một thời gian dài cho kết quả tỷ lệ tín hiệu trên nhiễu cao trong môi trường
ồn Tạp âm giả ngẫu nhiên xác định và có thể được lặp đi lặp lại một cách chính
Trang 3129
xác Vì vậy không cần phải đo cả hai hệ thống đầu vào và đầu ra cùng một lúc theo yêu cầu của bộ phân tích FFT
Các phép đo nhiễu bằng cách sử dụng cùng một đầu vào cũng có thể được thực hiện
và trung bình cho kết quả tốt hơn Với đầu ra hệ thống ghi lại từ một tạp âm giả ngẫu nhiên, đáp ứng xung có thể được rút ra từ phép tương quan chéo tương ứng tín hiệu tạp âm đầu vào với đầu ra Một hệ thống đo lường MLS cũng có thể từ chối hoặc chọn phi tuyến trong hệ thống như các kỹ thuật “đo phổ trễ thời gian”
Do những ưu điểm trên của phương pháp “Đo tạp âm giả ngẫu nhiên” mà nó được
sử dụng rộng rãi trong các hệ thống nhận dạng và các hệ thống đo đạc âm thanh Ở trong khuôn khổ của luận văn này, các tác giả lựa chọn phương pháp trên để đo đáp ứng xung của phòng thu
2.2 MLS ( maximum length sequence )
2.2.1 Khái niệm
Tiếng ồn giả ngẫu nhiên có thể tạo ra bằng cách sử dụng MLS Trong đó MLS là một chuỗi số nguyên định kì ak Một MLS nhị phân bao gồm 2 giá trị 0 và 1 Các chuỗi này đặc biệt phù hợp với việc đo lường âm thanh trong phòng thí nghiệm bởi chúng dễ dàng được tạo ra bở thanh ghi dịch hoặc trên 1 máy tính số mà chỉ cần tối thiểu thời gian thực hiện
Để tạo ra một MLS bậc m, ta phải tìm được mối quan hệ đệ quy của bậc đó Những mối quan hệ đệ quy là khác nhau với MLS của các bậc khác nhau Tuy nhiên, chúng
có liên quan trực tiếp liên quan đến các đa thức bất khả quy của cùng một bậc trên trường Galois GF Các đa thức nguyên thủy đã được tính toán cho các bậc đến khoảng 168 và có thể được tìm thấy trong nhiều tài liệu tham khảo Sau khi đa thức được gọi, các thanh ghi dịch với tín hiệu phản hồi có thể được thiết lập tương ứng với đa thức này để tạo ra các MLS Ví dụ, ta xét các đa thức bất khả quy bậc 4 trong trường Galois Field (GF) như sau:
h(x) = x4 + x + 1
Trang 32Bảng phép toán logic OR
Hình 2 1 Thực hiện bộ tạo tín hiệu MLS 4bit
Với thiết lập này, thanh ghi dịch có thể tạo ra một chuỗi tuần hoàn đáp ứng các mối quan hệ đệ quy như trong hình trên Nó có thể được dễ dàng nhìn thấy rằng nếu
Trang 3331
thanh ghi dịch khởi tạo một giá trị số trong mỗi bit, MLS yêu cầu sẽ không tạo ra bởi vì hoạt động riêng hoặc hai số không vẫn còn một số không Bởi vì có m-bit trong thanh ghi dịch, nó có thể có một số có thể có của 2m bảng
Do đó nếu thanh ghi dịch khởi tạo 1 giá trị khác 0 sẽ tạo ra một chuỗi có chiều dài lớn nhất là 2m - 1.Để sử dụng chuỗi nhị phân như một tín hiệu đo kiểm để điều khiển thiết bị thử nghiệm ,các giá trị nhị phân được ánh xạ tới các giá trị 1 và -1 tương ứng
3.2.2 Thuộc tính tương quan của MLS
Chuỗi MLS n(k) áp dụng cho hệ thống có đáp ứng đầu ra y(k) Tín hiệu đầu ra y(k)
và tín hiệu đầu vào n(k) có liên hệ với nhau :
(2.1) Hàm tương quan giữa tín hiệu vào và tín hiệu ra :
Rny(k) = (2.2)
Thay (1) vào (2) ta có tương quan chéo giữa tín hiệu vào x(k) và tín hiệu ra y(k) có liên quan đến tích chập của hàm tự tương quan của tín hiệu đầu vào với đáp ứng xung :
Trang 3432
Rny(t) = δ(k) * h(k) h(k) (2.5)
Sự tự tương quan của MLS thực hiện dưới dạng tự tương quan nối tiếp thành vòng tròn, do vậy mối tương quan giữa đầu vào và đầu ra phải thực hiện dưới dạng module Sự tuần hoàn của thanh ghi dịch tạo ra một ma trận N Khi đó phép tương quan chéo được mô tả bằng phép nhân ma trận:
2, thuật toán biến đổi Fourier cơ số -2 không thể sử dụng được khi biến đổi thuận
và biến đổi ngược đầu vào và đầu ra Để giải quyết vấn đề này ta nội suy thêm 1 mẫu để làm cho chiều dài chuỗi có dạng lũy thừa bậc hai Tuy nhiên việc tính toán với thuật toán FFT (fast fourier transform) cơ số 2 bao gồm cả phép nhân và phép cộng, cùng với việc lấy mẫu cuối cùng sẽ mất rất nhiều thời gian để có thể sử dụng MLS
Thay vì nội suy thêm một mẫu bằng cách sử dụng biến đổi Fourier nhanh, vấn đề tương quan chéo có thể giải quyết bằng cách sử dụng một kĩ thuật được phát triển
Trang 35MLS thực sự là một tín hiệu xác định, nhưng nó có tính chất tương tự quang phổ là tín hiệu nhiễu trắng Một lợi thế lớn của kỹ thuật MLS là khi dãy (sequence) xác định, nó có thể được lặp đi lặp lại một cách chính xác Do đó, có thể tăng tỷ lệ tín hiệu trên nhiễu (S/N) bằng cách trung bình đồng bộ của chuỗi phản ứng y (k) Bất
kỳ tiếng ồn xung quanh, không liên quan sau đó sẽ được giảm bằng cách lấy trung bình Tỷ lệ S / N tăng 3 dB cho mỗi tăng gấp đôi số lượng trung bình
Trang 3634
Khi MLS là một tín hiệu tuần hoàn, phổ của dãy bao gồm các dòng cách nhau bằng nghịch đảo của thời gian Tp Nó có thể được hiển thị những dòng tần số thấp hơn tần số đồng hồ và bằng nhau về độ lớn Quang phổ do đó xấp xỉ băng tần giới hạn nhiễu trắng Khi tổng số điện năng độc lập với tần số đồng hồ, mật độ quang phổ được tăng lên bằng cách giảm tần số đồng hồ
Nếu chiều dài chuỗi dài hơn một nửa thời gian vang của một căn phòng, nó có thể được hiển thị mà có ít nhất một dòng quang phổ sẽ rơi vào trong mọi chế độ của phòng Một yêu cầu chung là chiều dài của MLS ít nhất bằng thời gian vang
2.2.3 Biến đổi Hadamard nhanh cho MLS
Các thuật toán biến đổi nhanh Hadamard được dựa trên việc sử dụng các ma trận đặc biệt được gọi là ma trận Hadamard - Sylvester Định nghĩa ma trận:
Trang 3735
được phát triển để tính toán hiệu quả phép nhân ma trận dạng này Các bước cần thiết cho các thuật toán này đã được mô tả bởi nhiều bài viết
Bằng cách kiểm tra ma trận Hadmard – Sylvester Hk và ma trận MLS Nk với k=2m
và n = 2m – 1 Có thể thấy rằng ngoài các hàng và cột đầu thì 2 ma trận hoàn toàn giống nhau qua một vài phép hoán vị hàng và cột
Thật vậy, việc sử dụng biểu diễn nhị phân (0 và 1), bất kỳ ma trận MLS N có kích thước nxn có thể được tách thành 2 ma trận : ma trận R kích thước nxm và một ma trận C kích thước mxn Ma trận C có thể được xây dựng chỉ đơn giản bằng cách lấy
m hàng đầu tiên của ma trận MLS N Còn ma trận R được chọn từ m cột của ma trận MLS N Như vậy ta được ma trận R có kích thước mxn
Hình dưới đây mô tả ma trận C và R được tách ra từ ma trận N Mỗi cột của ma trận
C và hàng của ma trận R được gắn số nguyên ứng vs m-bit để sử dụng cho việc hoán vị
C7 = (2.8)
4 6 7 3 5 2 1
R7 = (2.9)
Tương tự như vậy ma trận H kích thước n+1 x n+1 cũng có thể tách thành ma trận
B kích thước n+1 x m và ma trận BT có kích thước m x n+1 Trong đó ma trận BT là
Trang 3836
ma trận chuyển vị của ma trận B.Hàng thứ i của ma trận B có m-bit,với i = 0, 1, 2
…, n Các hàng của B và cột của BT được đánh dấu như trong ma trận R và C
BT
7 = (2.10)
B8= (2.11)
Nhìn vào các giá trị của ma trận R,B và C, BT ta thấy rằng bên trong chúng giống
nhau , chỉ khác cách sắp xếp hàng và cột khác nhau Như vậy việc biến đổi các ma
trận cho phép ta biến đổi ma trận MLS N thành ma trận Hadamard theo ba bước
sau:
1 Sử dụng các thẻ đánh dấu của ma trận C có thể sắp xếp lại các cột của ma trận
N để chuyển thành ma trận N’.Ví dụ như : cột thứ 7 của ma trận N ( được
đánh số 1 ) được chuyển vị trí thành cột đầu tiên hay cột thứ 6 của ma trận N
( được đánh số 2 ) được chuyển vị trí thành cột đầu tiên.vv…
2 Sử dụng các thẻ đánh dấu của ma trận R để chuyển hàng của ma trận R thành
ma trận N’’.Ví dụ như : hàng thứ ba của ma trận R ( được đánh số 1 ) chuyển
vị trí lên hàng thứ nhất, hay hàng thứ 2 ( được đánh số 2 ) được chuyển lên vị
trí thứ 2.vv…
Trang 3937
3 Từ ma trận chuyển đổi N’ và N’’ ta được ma trận N”’.Thêm một hàng và một cột toàn 0 vào ma trận N”’ ta được ma trận H
Các bước xác định tính tương quan trong MLS sử dụng biến đổi Hadamard nhanh:
Từ mối liên hệ giữa ma trận MLS N và ma trận Hadamard – Sylvester H đã biết, tương quan chéo giữa đầu ra (Y) và đầu vào MLS có thể tính toán theo phương pháp sau:
1 Tạo ma trận MLS Nn từ MLS
2 Tách Nn thành Cn và Rn
3 Gắn các thẻ cho hàng của Rn và cột của Cn theo các số nguyên m-bit
4 Sắp xếp lại Yn sử dụng thẻ gắn vào cột Cn và thêm cột số 0 để tạo thành Yn’
5 Áp dụng biến đổi Hadamard nhanh Y’n để tạo thành đáp ứng xung trung gian H”n
6 Bỏ qua hàng và cột đầu tiên của H”n để tạo thành ma trận H’n.Bằng cách sử dụng H’n các thẻ gắn lên Rn sắp xếp lại H’n ta tạo được đáp ứng xung Hn theo thứ tự các số nguyên đánh dấu từ 1 đến m
7 Các giá trị trong vector đáp ứng xung H sẽ được chuẩn hóa.Tức là mỗi phần
tử trong vector sẽ được chia bởi chiều dài MLS để được kết quả cuối cùng được chỉ ra trong phương trình (2.6)
2.3 Lý thuyết HRTF ( Head – Related transfer Function)
2.3.1 Khái niệm
Con người có khả năng sử dụng các tín hiệu âm thanh để ước tính vị trí không gian của một mục tiêu Gần đây, những tiến bộ trong khả năng tính toán và kỹ thuật đo lường âm thanh cho phép có thể đo lường thực nghiệm, phân tích, và tổng hợp các tín hiệu ảnh hưởng đến thính giác trong không gian Những tín hiệu ảnh hưởng đó được gọi là HRTF, là trọng tâm của nhiều kỹ thuật nghiên cứu về âm học Những thông số HRTF tuy nhỏ nhưng có những tác động phức tạp tới hình dạng của sóng
Trang 4038
Não bộ sẽ biên dịch các sự khác biệt về hình dạng sóng này, từ đó phân tích để định
vị được nguồn âm
HRTF là đáp ứng tần số cụ thể của tai trái hoặc tai phải trong trường khu xa, được
đo đạc từ một điểm cụ thể trong trường tự do đến một điểm xác định trong màng tai Thông thường HRTF được đo đạc nhờ thí nghiệm trên người hay ma-nơ-canh cho cả hai tai trái và phải tại một khoảng cách cố định từ đầu của người nghe HRTF được xác định tại những góc phương vị (hướng trái-phải) và cao độ (hướng lên xuống) khác nhau, trong đó cả hai được tính bằng độ hoặc radian
HRTF có thể coi như là một bộ lọc FIR có pha tối thiểu.HRTF bao gồm cả thông tin ITD, IID : thông tin ITD_thời gian trễ được mã hóa thành phổ pha của bộ lọc, còn thông tin về IID là công suất của bộ lọc Bằng cách này ta có thể đơn giản bộ lọc FIR để tính toán HRTF theo hai cách sau:
1 Giả định pha tối thiểu cho phép chúng ta xác định pha của HRTF chỉ tại một đáp ứng cường độ Có được điều này là do hệ quả của cặp biến đổi Hilbert cho một hệ thống có pha tối thiểu
2 Giả định pha tối thiểu cho phép chúng ta tách thông tin ITD từ bộ lọc FIR của HRTF do trễ nhóm và trễ công suất là nhỏ nhất
Hầu hết năng lượng của HRTF xảy ra tại thời điểm bắt đầu của đáp ứng xung nên pha tối thiểu của hệ thống HRTF cho cả tai trái và tai phải hầu như không có trễ Vì vậy đặc tính của thính và vị trí được đo đạc theo ba đại lượng : đáp ứng cường độ tai trái , tai phải và ITD
2.3.2 Đo HRTF
Một kỹ thuật phổ biến được sử dụng để đo lường HRTF của tai phải và trái là gắn một micro nhỏ một phần vào vành tai của một đối tượng Sau đó thực hiện một hệ thống nhận diện đơn giản bằng cách tạo ra phổ kích thích s(n) thông qua một loa đặt tại góc phương vị θ , góc ngẩng ϕ như trong hình 3.3