Dựa trên điều này và các số đo khác, các nguyên âm đôi có thể được đặc trưng bởi hàm diện tích của bộ máy phát âm theo thời gian thay đổi giữa hai nguyên âm cấu thành.. Các phụ âm xát vô
Trang 1CAO QUYẾT THẮNG Trang 26
sách này, mặc dù được viết để hướng dẫn "đọc" các ảnh phổ, cung cấp nhập môn tuyệt vời về ngữ âm học
2.2.Ngữ âm học (Acoustic Phonetics): Nhiều ngôn ngữ, bao gồm cả tiếng Anh Mỹ, có thể
mô tả theo tập hợp các âm khác nhau gọi là các âm vị (phoneme) Tiếng Anh Mỹ có khoảng 42 âm vị, bao gồm các nguyên âm (vowel), nguyên âm đôi (diphthong), bán
nguyên âm (semivowel) và phụ âm (consonant) Có nhiều cách để nghiên cứu ngữ âm
học; chẳng hạn, các nhà ngôn ngữ nghiên cứu các đặc trưng của âm vị Với mục đích của chúng ta, nghiên cứu xử lý tiếng nói, chỉ cần xét đặc trưng âm học của các âm vị, bao gồm vị trí và cách phát âm, các dạng sóng âm và các đặc trưng về phổ của các âm này
Bảng 3.1 nêu cách phân các âm tiếng Anh Mỹ ra các lớp âm vị Bốn lớp lớn của
được chia thành các lớp con theo cách thức, vị trí phát âm của âm trong bộ máy phát âm
Mỗi âm vị của bảng 3.1 có thể phân ra thành âm xát (continuant) hoặc âm không
xát (noncontinuant) Các âm xát được tạo ra bởi hình dạng bộ máy phát âm cố định (không biến đổi theo thời gian) được tác động bởi nguồn hơi thích hợp Lớp các âm xát
bao gồm nguyên âm, âm mũi (nasal) và phụ âm rung (fricative) Các âm còn lại (nguyên
âm đôi (diphthong), bán nguyên âm (semivowel), dừng (stop) và tắc xát (affricate)) được
tạo ra bằng cách thay đổi hình dạng bộ máy phát âm và do vậy được phân lớp là không xát
2.2a Nguyên âm (NA) được tạo ra bằng cách kích động bộ máy phát âm cố định với
các xung gần tuần hoàn của không khí do các dây thanh âm rung động
Theo Từ điển Tiếng Việt, nguyên âm là âm mà khi phát âm, luồng hơi từ phổi ra không gặp trở ngại đáng kể Ví dụ của nguyên âm tiếng Việt là a, e, i, o, u, y; phụ âm là
âm mà khi phát âm, luồng hơi từ phổi ra đi lên qua thanh hầu, gặp phải trở ngại đáng kể
Ví dụ của phụ âm tiếng Việt là b, c, d, đ, g,
Người ta thấy diện tích mặt cắt ngang thay đổi dọc theo bộ máy phát âm xác định các tăng cường và do đó âm được tạo ra Sự phụ thuộc của diện tích mặt cắt ngang vào
khoảng cách dọc theo bộ máy phát âm được gọi là hàm diện tích (area function) của bộ
máy phát âm Hàm diện tích của một nguyên âm nào đó đầu tiên được xác định bởi vị trí của lưỡi, tuy nhiên các vị trí của hàm, môi và vòm miệng mềm cũng ảnh hưởng đến kết
quả của âm Ví dụ để tạo ra âm a: trong từ "father" fa:ðә (cha), Bộ máy phát âm mở ở
phía trước và đôi khi thu hẹp lại ở phía sau do thân lưỡi Trái lại, nguyên âm i trong từ
"eve" iv (buổi chiều) được tạo ra bằng cách nâng lưỡi lên vòm miệng, do vậy tạo ra khe hẹp ở phía trước và tăng khe hở ở cuối bộ máy phát âm Như vậy, mỗi nguyên âm có thể đặc trưng bởi cấu hình bộ máy phát âm (hàm diện tích) dùng để phát ra nó Đặc trưng này không chính xác lắm vì sự khác nhau bên trong của bộ máy phát âm của những
người nói khác nhau Một biểu diễn khác được xây dựng trên tần số cộng hưởng của bộ
máy phát âm Việc này cũng vướng mắc phải sự đa dạng của bộ máy phát âm của người nói Peterson và Barney (J Acoust Soc Am Vol24 No2, 1952) đã đo tần số tăng cường (dùng đồ thị phổ của âm) của các nguyên âm
Người ta đo các dạng sóng âm và ảnh phổ (spectrogram) cho mỗi nguyên âm
tiếng Anh (ở hình 3.6 gồm i , i: , e , ổ , ә , a , Ɔ , u , u: , Ə: ) Các ảnh phổ thể hiện
Trang 2CAO QUYẾT THẮNG Trang 27
rõ ràng mẫu các cộng hưởng khác nhau cho mỗi nguyên âm Các dạng sóng âm, bên cạnh việc chỉ ra đặc trưng tuần hoàn của các âm hữu thanh, còn hiển thị các tính chất
phổ thô (gros) của các "chu kỳ" (period) đơn Chẳng hạn, nguyên âm i thể hiện dao động
tắt dần với tần số thấp mà ở trên nó có một dao động tần số cao đè lên Điều này phù hợp với tăng cường thứ nhất thấp và hai tăng cường sau cao Trái lại, nguyên âm u thể hiện năng lượng tần số cao tương đối ít vì là kết quả của tần số tăng cường thứ nhất và thứ hai thấp
vị nào là nguyên âm đôi, một định nghĩa có thể chấp nhận được của nguyên âm đôi là:
"phát âm đơn âm lướt bắt đầu ở hoặc gần ở vị trí phát âm cho một nguyên âm và di chuyển đến hoặc về phía vị trí phát âm cho nguyên âm kia." Theo định nghĩa này có 6
nguyên âm đôi trong tiếng Anh Mỹ, bao gồm: ei: (ở bay), ou: (ở boat), ai: (ở buy), au:
(ở how), i: (ở boy) và ju (ở you)
Các nguyên âm đôi được tạo ra bằng cách thay đổi bộ máy phát âm mềm mại giữa các cấu hình nguyên âm thích hợp với nguyên âm đôi Dựa trên điều này và các số
đo khác, các nguyên âm đôi có thể được đặc trưng bởi hàm diện tích của bộ máy phát
âm theo thời gian thay đổi giữa hai nguyên âm cấu thành
2.2c Các bán nguyên âm: Nhóm các âm gồm w , l , r và y khá khó mô tả đặc điểm Các âm này gọi là bán nguyên âm vì bản chất khá giống nguyên âm của chúng Nói
chung, chúng được đặc trưng bởi việc thay đổi chút ít ở hàm diện tích của bộ máy phát
âm giữa các âm vị liền kề Như vậy, các đặc trưng âm học của các âm này bị tác động lớn của ngữ cảnh mà chúng được tạo ra Chúng được mô tả tốt nhất như là các âm giống nguyên âm, chuyển tiếp và do đó, về bản chất, tương tự như các nguyên âm và nguyên
âm đôi
2.2d Các âm mũi: Các âm mũi /m/, /n/ và / / được tạo ra do kích thích thanh môn và
bộ máy phát âm thắt lại hoàn toàn tại một điểm ở đường miệng Vòm miệng mềm hạ xuống làm không khí đi qua đường mũi với âm được phát xạ tại lỗ mũi Khoang miệng, mặc dù hẹp lại ở phía trước, vẫn nối âm với cổ họng Như vậy, mồm dùng làm khoang cộng hưởng, bẫy năng lượng âm ở các tần số tự nhiên xác định Theo chừng mực âm phát xạ được chú ý đến, các tần số cộng hưởng của khoang miệng xuất hiện như các
phản cộng hưởng (anti-resonance) hay là các không điểm của việc truyền âm (zero of
sound transmission) (theo J L Flanagan [2]) Hơn nữa, các phụ âm mũi và các nguyên
âm phát âm theo giọng mũi ( một số nguyên âm đi trước hoặc đi sau phụ âm mũi) được đặc trưng bởi các cộng hưởng rộng hơn về phổ, hoặc là bị tắt dần nhanh hơn các cộng hưởng cho các nguyên âm Việc mở rộng của các cộng hưởng mũi là do mặt trong của BMmũi bị quấn xoắn lại, như vậy khoang mũi có tỷ lệ bề mặt tương đối rộng so với diện tích mặt cắt của nó Do vậy, việc dẫn nhiệt và các mất mát nhớt lớn hơn bình thường
Ba phụ âm mũi được phân biệt do vị trí thắt lại hoàn toàn dọc theo bộ máy miệng được thực hiện của chúng Với /m/ thì việc thắt lại ở môi; /n/ thì ở ngay sau răng; còn / / thì ở ngay trước vòm miệng mềm Rõ ràng là các dạng sóng của /m/ và /n/ nhìn rất giống nhau Các ảnh phổ cho thấy việc tập trung của năng lượng tần số thấp với phạm vi trung bình của các tần số chứa các đỉnh lồi lên Điều này là do tổ hợp riêng của các cộng hưởng và các phản cộng hưởng là kết quả của việc ghép đôi bộ máy mũi và bộ máy
Trang 3CAO QUYẾT THẮNG Trang 28
miệng (xem O Fujimura, Analysis of Nasal Consonants (Phân tích các phụ âm mũi), J Acoust Soc Am., Vol 34, No12, pp1865-1875, December 1962)
2.2e Các phụ âm xát vô thanh (Unvoiced Fricatives) Các phụ âm xát vô thanh /f/, / /, /s/
và /sh/ được tạo ra khi kích thích bộ máy phát âm bằng luồng không khí đều đặn, luồng
này trở nên hỗn loạn (turbulent) trong vùng hẹp của bộ máy phát âm Vị trí của vùng hẹp
xác định phụ âm xát được tạo ra Với âm /f/ vùng hẹp ở gần môi; âm / / vùng hẹp ở gần răng; âm /s/ vùng hẹp ở gần giữa bộ máy miệng; còn âm /sh/ thì vùng hẹp ở gần cuối của
bộ máy miệng Như vậy, hệ thống để tạo ra các phụ âm xát vô thanh có nguồn của tiếng
ồn ở vùng hẹp, vùng này chia bộ máy phát âm thành 2 khu vực Âm được phát ra từ môi,từ khu vực trước Khu vực sau, giống như trường hợp các phụ âm mũi, dùng để bẫy năng lượng và do đó đưa ra các phản cộng hưởng vào đầu ra của phụ âm Bản chất không tuần hoàn của các kích thích phụ âm xát thấy rõ ở dạng sóng Các sai khác về phổ trong các phụ âm xát dễ dàng thấy được khi so sánh các ảnh phổ
2.2f Các phụ âm xát hữu thanh (Voiced Fricatives) Các phụ âm xát hữu thanh /v/, /th/, /z/
và /zh/ là các bản sao (counterpart) của các phụ âm xát vô thanh /f/, / /, /s/ và /sh/ tương
ứng, theo nghĩa là vị trí của vùng hẹp cho mỗi âm vị tương ứng là đồng nhất Tuy nhiên, các phụ âm xát hữu thanh khác biệt rõ ràng với các phụ âm xát vô thanh ở chỗ là 2 nguồn kích thích có liên quan với nhau khi tạo ra chúng Với các phụ âm xát hữu thanh, các dây thanh âm rung động và như vậy, một nguồn kích thích là ở thanh môn Tuy nhiên, vì bộ máy phát âm bị thu hẹp ở một vị trí nào đó phía trước thanh môn nên luồng khí bị xáo trộn ở gần chỗ thu hẹp Như vậy, các phổ của các phụ âm xát hữu thanh có thể
hy vọng là có 2 thành phần phân biệt Sự tương tự của phụ âm xát vô thanh /f/ với phụ
âm xát hữu thanh /v/ có thể thấy rõ ràng bằng cách so sánh các ảnh phổ
2.2g Các phụ âm tắc hữu thanh (Voiced Stops): Các phụ âm tắc hữu thanh /b/, /d/ và /g/
là các âm ngắn (transient, tạm thời), không xát (noncontinuant), được phát âm bằng cách
tạo ra áp lực sau khi đóng hoàn toàn ở một chỗ nào đó trong khoang miệng và bất ngờ giải phóng áp lực ấy Với âm /b/ đóng tại môi; âm /d/ đóng sau răng; còn âm /g/ đóng ở gần vòm miệng mềm Trong khoảng thời gian đóng hoàn toàn khoang miệng, không có một âm nào phát xạ từ môi cả Tuy nhiên, thường có một lượng nhỏ năng lượng tần số
thấp phát xạ qua các vách ngăn của họng (đôi khi gọi là thanh âm (voice bar)) Điều này xảy ra khi các dây thanh âm (vocal cord) có thể rung động dù bộ máy phát âm bị đóng ở
một chỗ nào đó
lớn bởi nguyên âm đi liền sau (xem P.C Delattre, A.M Liberman, and F.S Cooper, A
coustic Loci and Transitional Cues for Consonant (Vị trí âm học và các dấu hiệu chuyển tiếp cho Phụ âm), J Acoust Soc Am., Vol 27, ¹ 4, pp 769-773, July 1955) Như vậy, các dạng sóng của các phụ âm tắc cung cấp ít thông tin về chúng Dạng sóng của /b/ cho thấy các nét khác biệt nhỏ trừ ra kích thích hữu thanh và thiếu năng lượng tần số cao
2.2h Các phụ âm tắc vô thanh (Unvoiced Stops): Các phụ âm tắc vô thanh /p/, /t/ và /k/
giống như các phụ âm hữu thanh bản sao của chúng /b/, /d/ và /g/, chỉ trừ ra một ngoại lệ lớn Trong lúc BMmiệng đóng hoàn toàn, để áp lực tăng lên thì các dây thanh âm không rung Như vậy, sau thời gian đóng kín, khi áp suất không khí được thoát ra, có một khoảng ngắn ma sát (do sự náo động bất ngờ của không khí thoát ra), tiếp sau là một
Trang 4CAO QUYẾT THẮNG Trang 29
khoảng bật hơi (luồng không khí đều đặn từ thanh môn kích thích các cộng hưởng của bộ máy phát âm) trước khi kích thích hữu thanh bắt đầu
Xét hình vẽ dạng sóng và ảnh phổ của các phụ âm tắc vô thanh /p/ và /t/ "Lỗ hổng
tắc" (Stop gap), hoặc là khoảng thời gian trong đó áp lực tạo ra, được nhìn thấy rõ ràng
Cũng có thể thấy chiều dài và tần số của ồn cọ xát (frication noise) và sự bật hơi
(aspiration) thay đổi lớn ở phụ âm tắc
2.2i Các phụ âm tắc xát và /h/ (affricate): Các phụ âm còn lại của tiếng Anh Mỹ là các
phụ âm tắc xát /t∫/, /j/ và âm /h/ phụ âm tắc xát vô thanh /t∫/ là âm động, có thể mô hình hoá như dán phụ âm tắc /t/ vào phụ âm xát /∫/ Phụ âm tắc xát /j/ có thể mô hình hoá như
thích bộ máy phát âm bằng luồng không khí đều đặn,không rung các dây thanh âm mà tạo ra luồng không khí náo động ở thanh môn (đó cũng là kiểu kích thích để nói thầm)
Trang 5CAO QUYẾT THẮNG Trang 30
§ 3 LÝ THUYẾT ÂM HỌC CỦA VIỆC TẠO TIẾNG NÓI
Phần trên đã xét sơ lược mô tả định tính của các âm tiếng nói và cách tạo ra chúng ở phần này ta sẽ xét các biểu diễn toán học của quá trình tạo Các biểu diễn toán
học này là cơ sở để phân tích (analysis) và tổng hợp (synthesis)
3.1 Sự truyền âm (Sound Propagation): Âm gần như đồng nghĩa với rung động
(vibration) Sóng âm được tạo ra do rung động và được lan truyền trong không khí hoặc các môi trường khác bằng các dao động của các hạt của môi trường Do vậy, các định luật vật lý là cơ sở để mô tả việc tạo ra và truyền đi của âm thanh trong hệ thống phát âm Đặc biệt, các định luật cơ bản về bảo toàn khối lượng, bảo toàn động lượng và bảo toàn năng lượng cùng với các luật nhiệt động học và cơ chất lỏng, đều được áp dụng cho dòng chất lỏng (không khí) ít dẻo, chịu nén là môi trường để truyền âm trong Dùng các nguyên lý vật lý này, có thể thu được một tập hợp các phương trình vi phân đạo hàm riêng mô tả chuyển động của không khí trong hệ thống phát âm Việc phát biểu và giải các phương trình này là cực kỳ khó, trừ ra khi đặt các giả thiết đơn giản về bộ máy phát
âm và về việc mất năng lượng trong hệ thống âm Lý thuyết âm chi tiết phải gồm những phần sau:
1 Sự thay đổi theo thời gian của hình dạng bộ máy phát âm
2 Các tổn hao do dẫn nhiệt và ma sát nhớt ở các vách ngăn của bộ máy phát âm
3 Tính mềm của các vách ngăn của bộ máy phát âm
4 Các bức xạ của âm tại môi
5 Ghép nối âm mũi (Nasal coupling)
6 Kích thích âm trong bộ máy phát âm
Lý thuyết âm học chi tiết, đầy đủ, kết hợp chặt chẽ tất cả các phần trên vượt quá phạm vi của chương này, và dĩ nhiên, còn chưa có thể có được Chúng ta đành phải hài lòng với việc xét các nhân tố này, cung cấp các tài liệu chi tiết khi có thể, và thảo luận định tính khi chưa có các tài liệu thích hợp
Bộ máy phát âm được mô phỏng như một ống không đều, có diện tích mặt cắt ngang thay đổi theo thời gian Cho các tần số tương ứng với những bước sóng dài so với những kích thước của bộ máy phát âm (nhỏ hơn khoảng 4000 Hz), có thể giả thiết hợp lý
là việc truyền sóng phẳng dọc theo chiều dài ống Một giả thiết làm đơn giản hoá hơn nữa
là không có mất mát do nhớt hoặc dẫn nhiệt cả trong khối chất lỏng hoặc ở thanhf ống Với các giả thiết này và các định luật bảo toàn khối lượng, động lượng và năng lượng, Portnoff đã chứng tỏ, trong luận án Thạc sỹ (năm 1973) của ông, là các sóng âm trong ống thoả mãn cặp phương trình vi phân đạo hàm riêng sau:
p = p(x,t) là biến đổi của áp lực âm lên ống tại vị trí x và thời gian t
u = u(x,t) là biến đổi của luồng vận tốc âm tại vị trí x và thời gian t
Trang 6CAO QUYẾT THẮNG Trang 31
là mật độ không khí trong ống; c là vận tốc âm
A = A(x,t) là "hàm diện tích" của ống;giá trị của diện tích mặt cắt vuông góc với trục ống, phụ thuộc vào vị trí x và thời gian t
Người ta chưa có lời giải dạng giải tích của các phương trình (1), ngoại trừ các trường hợp có cấu hình đơn giản Tuy nhiên có thể có các lời giải bằng số Lời giải đầy
đủ của hệ phương trình vi phân yêu cầu phải có p và u tại mọi giá trị x và t trong miền giới
hạn bởi thanh môn và môi Để có lời giải phải cho các điều kiện biên tại mỗi đầu của ống Điều kiện biên tại môi phải tính đến hiệu suất truyền âm Tại thanh môn (hoặc một điểm nào đó ở giữa) điều kiện biên chịu tác động của kích thích tự nhiên
Bên cạnh các điều kiện biên, còn phải biết hàm diện tích A(x,t) Với các phụ âm xát có thể giả sử A(x,t) không thay đổi theo thời gian, còn với các phụ âm không xát thì không phải như vậy Đo đạc chi tiết A(x,t) là cực kỳ khó ngay cả với các phụ âm xát Một
cách đo dùng X-quang đã được thực hiện vào năm1969 (xem J.S Perkell, Phisology of
Speech Production: Results and Implications of a Quantitative Cineradiographic Study,
(Sinh lý học của việc tạo ra tiếng nói: Các kết quả và liên quan của nghiên cứu chụp phim X-quang định lượng), MIT Press, Cambridge, Mass., 1969), nhưng cách đo này chỉ thực hiện được ở một phạm vi hạn chế Một cách tiếp cận khác là coi bộ máy phát âm như hình thành từ các dụng cụ đo âm, Sondhi và Gopinath đã mô tả một cách tiếp cận có kích thích bên ngoài vào bộ máy phát âm (M.M Sondhi and B Gopinath, Determination of
Vocal- Tract Shape from Impulse Response at the Lips, (Xác định sự hình thành của bộ máy phát âm từ đáp ứng xung tại môi), J Acoust Soc Am., Vol 49, ¹ 6 (Part 2), pp 1847-1873, June 1971) Cả hai cách tiếp cận này cho thấy tính chất động của việc tạo ra tiếng nói, tuy nhiên chúng không có ứng dụng trực tiếp vào việc biểu diễn các tín hiệu tiếng nói (cho mục đích truyền tiếng nói) Atal đã đưa ra các nghiên cứu để nhận được
A(x,t) trực tiếp từ tín hiệu tiếng nói trong các điều kiện nói chuẩn (B.S Atal, Towards
Determining Articulator Positions from the Speech Signal, (Về việc xác định những vị trí phát âm rõ từ tín hiệu tiếng nói), Proc Speech Comm Seminar, Stockholm, Sweden, pp
1-9, 1974)
Năm 1973 M.R Portnoff đã đưa ra lời giải phương trình (1) theo A(x,t) Tuy nhiên cũng không cần phải giải các phương trình theo các điều kiện chung nhất để nhận được bản chất bên trong của tín hiệu tiếng nói Nhiều cách giải gần đúng và đơn giản đã được đưa ra để thu được các lời giải chấp nhận được
3.2 Ống mất ít đều (Uniform Lossless Tube): Bằng cách xét mô hình rất đơn giản, trong
đó hàm diện tích của bộ máy phát âm được giả thiết là không đổi theo cả x và t (mặt cắt
đều và thời gian không đổi), ta có thể có được hiểu biết sâu về bản chất của tín hiệu tiếng nói Trước hết, ta sẽ kiểm tra mô hình này, sau đó quay lại kiểm tra các mô hình hiện thực hơn Nguồn lý tưởng được biểu diễn bằng pittông có thể chuyển động theo cách mong muốn, độc lập với việc thay đổi áp lực trong ống Giả thiết thêm nữa là ở đầu mở cuối ống không có tác động của áp lực không khí mà chỉ có tác động của tốc độ âm Các giả thiết này, rõ ràng là để đơn giản đi rất nhiều, khó có thể đạt được trong thực tế; tuy nhiên, ta phải xét ví dụ như vậy do vì muốn tiếp cận cơ bản đến việc phân tích và các nét căn bản của lời giải thu được có rất nhiều điểm chung với các mô hình thực tế hơn Sau đây ta sẽ chửng tỏ là các mô hình tổng quát hơn có thể xây dựng bằng cách ghép các ống đều
Trang 7CAO QUYẾT THẮNG Trang 32
Nếu A(x,t) = A là hằng số thì các phương trình vi phân DHR (1) có dạng:
phương trình để kiểm tra):
u(x,t) = u + (t - x/c) - u - (t + x/c) (3a) p(x,t) = c
A [ u
+ (t - x/c) + u - (t + x/c)] (3b)
Ở các phương trình (3), các hàm u + (t - x/c) và u - (t + x/c) có thể hiểu là các sóng
chạy tương ứng theo các hướng dương và âm Quan hệ giữa các sóng chạy (traveling
wave) này được xác định bởi các điều kiện biên
Các biểu diễn miền tần số của các hệ thống tuyến tính theo các đường truyền và các vòng tròn truyền là rất hữu ích Tương tự, ta có thể có các biểu diễn như vậy cho ống mất ít đều Có thể nhận được biểu diễn miền tần số của mô hình này bằng cách giả thiết
điều kiện biên tại x = 0 là
u(0,t) = uG(t) = UG( )e j t Điều này có nghĩa là ống được kích thích bởi biến đổi luỹ thừa phức của tốc độ âm có tần
số và biên độ phức UG( ) Do các phương trình (2) tuyến tính, lời giải u + (t - x/c) và u (t + x/c) phải có dạng:
-u + (t - x/c) = K + ej (t - x/c)
u - (t + x/c) = K - ej (t + x/c)Thế các phương trình này vào (3.3) và dùng điều kiện biên
p(l,t) = 0 tại môi của ống và điều kiện biên tại thanh âm, ta có thể tìm các hằng số K +
và K - Lời giải là:
được gọi là trở kháng âm học đặc trưng (characteristic acoustic impedance) của ống
Ta sẽ dùng một cách viết khác để tránh lời giải viết bằng các sóng chạy xuôi và
chạy ngược là biểu diễn trực tiếp p(x,t) và u(x,t) dưới dạng kích thích luỹ thừa phức
(complex exponential excitation):
p(x,t) = P(x, ) ej tu(x,t) = U(x, ) ej t(Do vậy ta sẽ ký hiệu các biến trong miền thời gian bằng chữ thường, như u(x,t), còn các biểu diễn trong miền tần số tương ứng bằng chữ hoa, như U(x, )) Thay các lời giải này vào phương trình (1) ta có các phương trình vi phân thường liên hệ các biên độ phức
Trang 8CAO QUYẾT THẮNG Trang 33
là độ dẫn tạp âm (acoustic admittance) theo đơn vị dài Các Phương trình vi phân (5) có
các lời giải dạng
P(x, ) = A e x + B e - xU(x, ) = C e x + D e - xtrong đó
ZY j / c
Các hệ số chưa biết có thể xác định được bằng cách dùng các điều kiện biên
P(ℓ, ) = 0 U(0, ) = UG( )
Dĩ nhiên kết quả cũng là các phương trình (4) Các phương trình (4) biểu diễn quan hệ giữa nguồn vận tốc âm hình sin, áp lực và vận tốc âm tại mọi điểm của ống Đặc biệt, nếu ta xét quan hệ giữa vận tốc âm tại môi và nguồn vận tốc âm thì từ phương trình (4b) ta có:
U ( )ecos( / c)
là đáp ứng tần số (frequency response) liên kết các tốc độ âm vào và ra Thay bằng s/j
ta được biến đổi Laplace hay hàm hệ thống
Va(s) =
s / c s2 / c
2e
1 e
Lưu ý rằng Va(s) có số vô hạn các cực đặt tại các điểm cách đều trên trục j tại
j
Các vị trí cực này vẽ ở hình 3.15b Các cực của hàm Hệ thống của Hệ thống tuyến tính
bất biến theo thời gian là các tần số riêng (tần số tự nhiên) của hệ thống Các cực cũng
tương ứng với các tần số cộng hưởng (resonnance frequency) của hệ thống Các tần số cộng hưởng còn được gọi là các tần số tăng cường (formant frequency) khi xét việc tạo ra tiếng nói Ta sẽ thấy là các hiệu ứng cộng hưởng (resonance effect) sẽ được xét theo độ
chính xác của tuyến âm
Trang 9CAO QUYẾT THẮNG Trang 34
Cần nhắc lại ở đây là hàm đáp ứng tần số (frequency response function) Va(j ) cho phép ta xác định đáp ứng của hệ thống không chỉ cho các cái vào hình sin mà còn cho các cái vào bất kỳ bằng việc sử dụng giải tích Fourier Có thể suy luận tổng quát hơn rằng Va(j ) là tỷ số của biến đổi Fourier (FT, Fourier Transform) của tốc độ âm tại môi (cái
ra) với FT của tốc độ âm tại thanh môn (cái vào hoặc nguồn) đáp ứng tần số là đặc trưng thuận tiện của mô hình cho Hệ thống âm Như vậy, ta đã xác định đáp ứng tần số của mô hình âm học tạo tiếng nói đơn giản nhất có thể có được, bây giờ ta có thể xét các mô hình sát với thực tế hơn
chuyển động cho việc truyền âm trong bộ máy phát âm đã cho ở trên được thiết lập theo giả thiết là không có năng lượng bị mất trong ống Trong thực tế, năng lượng bị mất do
ma sát nhớt (viscous friction) giữa không khí và thành ống, do sự dẫn nhiệt qua thành ống
và do rung động của thành ống Để tính đến các hiệu ứng này, ta phải trở lại các luật vật
lý cơ bản và đưa ra các phương trình chuyển động mới Việc này rất khó do sự phụ thuộc tần số của các mất mát Người ta đã có cách tiếp cận chung để mô phỏng biểu diễn miền tần số của các phương trình chuyển động ([2]) Sau đây ta sẽ xét qua các kết quả của cách tiếp cận chung này
Trước hết, ta xét các hiệu ứng rung động (effect of the vibration) của thành bộ
máy phát âm Các thay đổi áp lực không khí bên trong bộ máy phát âm làm cho các thành
ống rung động Như vậy, nếu thành ống đàn hồi (elastic) thì diện tích mặt cắt của ống sẽ
thay đổi phụ thuộc vào áp lực trong ống Giả sử ống phản ứng "địa phương" thì diện tích A(x,t) là hàm của p(x,t) Do sự biến đổi của áp lực rất nhỏ thì dao động của diện tích mặt
cắt có thể coi là thay đổi nhỏ của diện tích "định sẵn" ("norminal" area),có thể giả thiết
rằng
trong đó A0(x,t) là diện tích định sẵn, còn A(x,t) là thay đổi nhỏ Điều này được minh hoạ
ở hình 3.16 Do khối lượng (mass) và đàn hồi (elasticity) của thành bộ máy phát âm nên
quan hệ giữa thay đổi nhỏ A(x,t) và áp lực p(x,t) có thể mô hình hoá bằng Phương trìnhVP
mw2 2
Hình 3.16 Minh hoạ các hiệu ứng rung động của thành bộ máy phát âm
Bỏ qua số hạng bậc hai ở các đại lượng u/A và pA ta có thể viết các phương trình
(pA )1
Trang 10CAO QUYẾT THẮNG Trang 35
Như vậy, sự truyền âm trong ống thành mềm như bộ máy phát âm được biểu diễn bằng tập hợp các phương trình (6), (7), (8)
Để kiểm tra hiệu ứng này chi tiết hơn ta lấy biểu diễn miền tần số như ở trên, xét ống bất biến theo thời gian được kích thích bởi nguồn vận tốc âm phức,điều kiện biên ở thanh môn là
Chú ý rằng các phương trình (10) đồng nhất với các phương trình (5) trừ ra việc cộng với
số hạng hầp thụ của thành Y và ở đây trở kháng âm học Z và độ dẫn nạp Y là các hàm
của biến x Nếu ta xét ống đều thì A0(x) là hằng số và các phương trình (5) đồng nhất với
các phương trình (11)
Dùng các ước lượng nhận được từ việc đo các vật thể mịn màng ([2]), người ta xác định các tham số ở (11c) và các Phương trình vi phân (10) được giải với điều kiện biên tại môi (xem M R Portnoff, MS Thesis MIT, Cambridge, Mass., 1973) Tỉ số
( )
G
U U
(11) được vẽ theo biến ở hình 3.17 cho trường hợp ống đều dài 17,5 cm (xem M R Portnoff) Các kết quả cũng giống ở hình 3.15, nhưng có khác biệt ở một điểm quan
trọng Rõ ràng là các cộng hưởng không thể chính xác trên trục j của s - mặt phẳng vì
đáp ứng tần số không thể là vô hạn ở các tần số 500 Hz, 1500 Hz, 2500 Hz, v v , dù
các ĐƯ là cao nhất ở gần các tần số này Các tần số trung tâm và các độ rộng dải của
cộng hưởng (bandwidths of the resonances), được định nghĩa là khoảng tần số xung
quanh cộng hưởng mà trong đó đáp ứng tần số lớn hơn 0,707 lần giá trị lớn nhất ở tần số trung tâm, của các tần số trong hình 3.17 được cho trong bảng kèm theo ở Ví dụ này
Trang 11CAO QUYẾT THẮNG Trang 36
cũng thấy được một vài hiệu ứng quan trọng Đầu tiên là các tần số trung tâm hơi cao hơn ở trường hợp ống mất ít Thứ hai là các độ rộng dải của cộng hưởng không bằng 0 (không) nữa như ở trường hợp mất ít vì giá trị cao nhất không là vô hạn Có thể thấy hiệu ứng các thành đàn hồi là rõ ràng, nhất là ở các tần số thấp Đó cũng là điều mong đợi vì
ta hy vọng chuyển động rất nhỏ của thành ở các tần số cao Các kết quả của Ví dụ này là mẫu mực cho hiệu ứng chung của dao động của thành bộ máy phát âm,các tần số ở trung tâm tăng nhẹ và các cộng hưởng tần số thấp rộng ra so với trường hợp thành cứng
Các hiệu ứng của ma sát nhớt (the effect of viscous friction) và dẫn nhiệt ở thành
(thermal conduction at the walls) không rõ ràng bằng các hiệu ứng rung động của thành Flanagan ([2]) đã xét các hiệu ứng này một cách chi tiết và đã chứng tơ rằng hiệu ứng ma sát nhớt có thể giải thích trong biểu diễn miền tần số bằng cách thêm vào số hạng là số thực phụ thuộc tần số trong biểu thức của trở kháng âm, Z,
trong đó S(x) là chu vi (circumference) của ống, là hệ số nhớt (coefficient of friction), còn
là mật độ không khí (density of air) trong ống Các hiệu ứng truyền nhiệt qua thành bộ
máy phát âm cũng được tính tương tự bằng cách thêm số hạng là số thực phụ thuộc tần
số vào độ dẫn nạp âm, Y(x, ),
( ) ( )( 1)
trong đó cp là nhiệt dung riêng (specific heat) ở áp lực không đổi, là tỉ số của nhiệt dung
riêng ở áp lực không đổi với nhiệt dung riêng ở âm lượng (volume) không đổi, còn là hệ
số dẫn nhiệt Giá trị tiêu biểu cho các hằng ở (12) đã được Flanagan ([2]) xác định Với mục đích của chúng ta, chỉ cần lưu ý là mất mát do ma sát tỉ lệ với phần thực của Z(x, )
Y (x, ) cho ở (11c) ta cũng giải số được các phương trình (10) (xem M R Portnoff, 1973) đáp ứng tần số kết quả với điều kiện biên p(ℓ, t) = 0 được vẽ ở hình 3.18b Các tần
số tâm và độ rộng dải được viết ở bảng So sánh các hình 3.18 và 3.17 ta thấy tần số tâm giảm khi thêm vào các mất mát ma sát và nhiệt, còn độ rộng dải lại tăng Do mất mát ma sát và nhiệt tăng theo thì các cộng hưởng tần số cao hơn trải rộng hơn các cộng hưởng tần số thấp
Các Ví dụ vẽ ở hình 3.17 và 3.18 là kiểu mẫu cho các hiệu ứng mất mát tổng quát
theo tần số và có hiệu ứng lớn nhất ở các cộng hưởng tần số cao, trong khi mất mát do thành ống là rõ ràng nhất ở các tần số thấp; 2) Các thành đàn hồi làm tăng các tần số cộng hưởng, còn các mất mát do nhiệt và ma sát nhớt làm giảm chúng; 3) Hiệu ứng thực cho các cộng hưởng thấp hơn hơi được nâng lên hơn so với mô hình thành cứng, mất ít; 4) Hiệu ứng mất mát do nhiệt và ma sát là nhỏ so với các hiệu ứng rung động thành ống ở các tần số thấp hơn 3-4 Hz Do vậy, các phương trình (7) và (8), bỏ qua các mất mát này,
không bao giờ là biểu diễn tốt của việc truyền âm trong bộ máy phát âm Ta sẽ thấy ở phần sau là kết thúc phát xạ tại môi là nguồn mất mát tần số cao lớn hơn nhiều Điều này
Trang 12CAO QUYẾT THẮNG Trang 37
cung cấp lí lẽ bào chữa cho việc bỏ qua mất mát do nhiệt và ma sát trong các mô hình hoặc các mô phỏng tạo ra tiếng nói
3.4 Các hiệu ứng của phát xạ tại môi (Effects of Radiation at the Lips) Cho đến đây ta
đã xét cách mà các mất mát nội tại tác động lên các tính chất truyền âm của bộ máy phát
âm ở các Ví dụ ta đã giả thiết điều kiện biên là p(ℓ, t) = 0 tại môi ở đường truyền điện
tương tự, điều này ứng với mạch chập (short- circuit) Tương ứng âm học của mạch chập
khó có thể tạo ra như ở điện vì nó đòi hỏi một cấu hình trong đó các thay đổi vận tốc âm
có thể xảy ra tại cuối ống của bộ máy phát âm mà không hề thay đổi áp lực tương ứng
Các hiệu ứng nhiễu xạ phức tạp và khó biểu diễn, tuy nhiên, để xác định điều kiện biên tại môi cần phải có quan hệ giữa áp lực và vận tốc âm tại mặt phát xạ Điều này rất phức tạp cho cấu hình ở hình 3.19a Tuy nhiên, nếu mặt phát xạ (khe hở của môi) nhỏ so với cỡ của hình cầu thì xấp xỉ chấp nhận được là giả thiết mặt phát xạ đặt ở tấm chắn phẳng vô hạn như ở hình 3.19b Khi đó, có thể chứng minh là quan hệ trạng thái ổn định hình sin giữa các biên độ phức của áp lực và vận tốc âm tại môi là
Tương tự với tải trọng phát xạ này là nối song song trở kháng phát xạ, Rr, và tự cảm phát
xạ, Lr Các giá trị Rr và Lr cho một xấp xỉ tốt với trường hợp tấm chắn phẳng vô hạn do Flanagan [2] đưa ra là
Rr = 12829
Lr = 83
a c
ở đây a là bán kính của khe hở, còn c là tốc độ âm thanh
Hoạt động của tải trọng phát xạ ảnh hưởng đến bản chất của việc truyền sóng
các tần số rất thấp ZL( ) = 0,tại các tần số rất thấp trở kháng phát xạ xấp xỉ kết thúc ngắn mạch lý tưởng được giả thiết cho điểm này Cũng vậy, ta thấy rõ ràng từ phương trình (13b) là tại giá trị giữa của các tần số, (khi Lr < < Rr), ZL( ) ≈ j Lr ở các tần số cao ( Lr
> > Rr), ZL( ) ≈ Rr Năng lượng tiêu tán (energy dissipated) do phát xạ tỉ lệ với phần thực
của trở kháng phát xạ Như vậy, ta có thể thấy là với Hệ thống tạo ra tiếng nói đầy đủ (Bộ máy phát âm và tán xạ), các mất mát do tán xạ là quan trọng nhất ở các tần số cao Để đánh giá độ lớn của hiệu ứng này, các phương trình (10), (11c) và (13) được giải đồng thời cho trường hợp ống bất biến thời gian có thành mềm, các mất mát nhiệt và ma sát, cùng mất mát phát xạ tương ứng với tấm chắn phẳng vô hạn Hình 3.21 vẽ đáp ứng tần