định của chuyển tiếp formant trong việc nhận ra vị trí cấu âm của các phụ âm, các tác giả đã đưa ra giả định nếu chuyển tiếp formant này “nhúng” vào trong một môi trường nhiễu, và tiến h
Trang 1MỞ ĐẦU
1 L DO CH N Í Ọ ĐỀ À T I
Tiếng Việt là một ngôn ngữ thuộc loại hình đơn lập, trong đó mỗi âm tiết là một đơn vị hoàn chỉnh độc lập, là đơn vị cuối cùng trong việc phân xuất các đơn vị của lời nói, đồng thời âm tiết cũng là cơ sở để phân tích cấu trúc kết hợp các âm vị
Các âm vị trong tiếng Việt có ba loại: nguyên âm, phụ âm và thanh điệu Nguyên âm và phụ âm là những âm vị tuyến tính, chúng kết hợp với nhau theo trật tự trước sau trong quá trình phát âm Chúng là những âm vị có thể phân tách ra thành từng đơn vị nhỏ hơn, nên còn gọi là những âm vị đoạn tính Trái với loại âm vị trên, thanh điệu là âm vị phi tuyến tính, bao trùm toàn
bộ âm tiết và gắn liền với âm tiết trong suốt quá trình phát âm Thanh không thể chiết ra khỏi âm tiết được, mà nhất thiết phải gắn với âm tiết, vì thế nên thanh còn gọi là âm vị siêu đoạn tính
Chính do vai trò của âm tiết như vậy nên từ lâu nhiều tác giả đã quan tâm nghiên cứu đơn vị cơ bản này, đặc biệt là bằng phương pháp thực nghiệm Các công trình thực nghiệm đã được công bố nhiều hơn cả là nghiên
cứu về hệ thanh điệu và formant của nguyên âm đơn
Có thể coi Lê Văn Lý là người đầu tiên nghiên cứu thực nghiệm về
thanh điệu Những nghiên cứu thực nghiệm về thanh điệu tiếng Việt còn có
thể kể: Nguyễn Hàm Dương (1962); Han Mieko(1968), Hoàng Cao cương (1982); Cao Xuân Hạo (1986), Vũ Kim Bảng (1984), Nguyễn Văn Lợi, Vũ Thanh Phương, Andrea Phạm Hoa
Những nghiên cứu thực nghiệm về formant tiếng Việt có thể kể:
Nguyễn Văn Ái (1973, 1974); Vũ Kim Bảng (2002)
Trang 2Tuy nhiên, trong phạm vi âm tiết tiếng Việt, xét về các đặc trưng âm học của nó, còn có một số vấn đề chưa được đề cập tới, đó là: mối quan hệ hay vai trò của âm đầu và âm cuối đối với nguyên âm (formant) và thanh điệu (âm vực và đường nét) Những kết quả nghiên cứu này có giá trị cả về mặt lí thuyết cũng như ứng dụng thực tiễn.
Trong vòng 50 năm qua, công nghệ thông tin đã phát triển nhanh chóng
và mạnh mẽ Trong xu hướng chung đó cùng với vai trò của mạng Internet và
thông tin di động viễn thông nói riêng, sự phát triển các hệ tự động nhận dạng
và tổng hợp tiếng nói như là một nhu cầu tất yếu Trên thế giới đã có những
bộ phần mềm thương mại thuộc lĩnh vực này dành cho tiếng Anh như: IBM Via Voice, Dragon Naturally Speaking, L&H Voice Xpress Gần đây nhất, hãng Microsoft đã công bố việc tích hợp VUI (Voice User Interface) thay cho GUI (Graphic User Intreface) truyền thống vào phiên bản điều hành Windows thế hệ mới
Tại Việt Nam, nội dung nghiên cứu về nhận dạng tiếng Việt đã được đề
cập tới từ năm 1981 Bắt đầu từ năm 1991 cho đến nay, trong các chương
trình, đề tài về khoa học và công nghệ, vấn đề nhận dạng và tổng hợp tiếng Việt luôn là một nội dung được ưu tiên Gần đây, nhiều đề tài các cấp về nghiên cứu phát triển công nghệ nhận dạng và tổng hợp và xử lí ngôn ngữ tiếng Việt đã có những kết quả đột phá trong lĩnh vực này
Trong giai đoạn hiện nay, vấn đề xử lí tiếng Việt cho tổng hợp và nhận dạng là một nhu cầu cấp bách đòi hỏi có những nghiên cứu thực nghiệm cụ thể về ngữ âm tiếng Việt
Từ những tiền đề trên chúng tôi lựa chọn đề tài: Cấu trúc formant của nguyên âm tiếng Việt trong kết hợp với âm tắc và thanh điệu (Trên cơ sở khảo sát thực nghiệm) làm đề tài luận án.
Trang 32 TỔNG QUAN
2.1 Những nghiên cứu về formant của nguyên âm trên thế giới
Formant và cấu trúc formant của nguyên âm là một trong những lĩnh
vực nghiên cứu mang tính ứng dụng cao đã được thực hiện ở nhiều ngôn ngữ trên thế giới Theo hướng nghiên cứu này, người ta đã thu được nhiều thành công và đã có kết quả nghiên cứu ứng dụng vào công nghệ xử lí tiếng nói: phần mềm tổng hợp tiếng nói thực hiện bằng phương pháp tổng hợp formant
đã được tích hợp vào các tiện ích của điện thoại di động, hộp thư trả lời tự động, xếp hàng tự động Những tiến bộ và điều kiện kĩ thuật hiện nay, đặc biệt là sự phát triển của công nghệ thông tin cho phép các nhà khoa học nghiên cứu một cách toàn diện và có hệ thống đặc trưng âm học của các ngôn ngữ nói chung và của nguyên âm nói riêng
Vào thế kỉ thứ 19, các nhà khoa học đã nhận thấy vai trò của cộng hưởng trong bộ máy phát âm, đặc biệt là cấu trúc formant của nguyên âm trong việc tạo ra bộ máy phát âm nhân tạo, tiền đề cho những máy tổng hợp lời nói và phần mềm tổng hợp có thể bắt chước giọng nói của con người trong những năm sau này Các nhà ngữ âm học và cả kĩ sư tin học trong lĩnh vực công nghệ tiếng nói đã quan tâm đến ba khía cạnh của formant trong lời nói
tự nhiên: đặc điểm cấu trúc formant, đặc điểm địa phương (regional characteristics), và đặc trưng cá nhân của người nói (subject characteristics)
Đặc điểm cấu trúc âm học của formant được nghiên cứu khảo sát sâu
và kĩ hơn ở nhiều ngôn ngữ khác nhau mà điển hình là tiếng Anh Việc lập bản đồ âm học các nguyên âm tiếng Anh đã thực hiện bằng cách dùng tần số formant của các nguyên âm làm cơ sở Việc lập bản đồ nguyên âm này được tiến hành ngay sau khi xuất hiện máy phân tích phổ lời nói, do hai tác giả Peterson và Barney tiến hành vào năm 1952, các tác giả đã phân tích một tập
Trang 4hợp gồm 10 nguyên âm đơn của mỗi người nói trong tổng số 76 người gồm cả nam, nữ và trẻ em [126, tr 175]
Các tác giả cũng chỉ ra rằng ở những người khác nhau có sự hiện thực hoá về mặt ngữ âm rất khác nhau trong phát âm các nguyên âm của họ, nhưng
họ vẫn duy trì các đối lập hệ thống một cách bình thường Vì vậy, hai người phát âm có thể thay đổi về hình dáng khoảng cách nguyên âm, và các giá trị formant đối với âm //, chẳng hạn, ở người này có thể gần với các giá trị formant đối với âm // ở người kia; nhưng cả hai người đều sẽ thể hiện nét khu biệt âm học thoả đáng giữa // và // trong hệ thống nguyên âm của họ Bên cạnh đó, những người khác nhau có trường độ riêng của bộ máy phát âm,
và những khác biệt này có ảnh hưởng cố hữu lên mô hình các giá trị formant theo nhiều cách mà người phát âm cũng thực sự không thể kiểm soát nổi Vì thế không có một phân biệt tuyệt đối về mặt âm học giữa các nguyên âm cận
kề hoặc gần nhau đối với nhiều người khác nhau Là người sử dụng ngôn ngữ mọi người hầu như không gặp khó khăn gì trong việc giải quyết vấn đề này,
vì chúng ta có thể, chỉ cần một mẫu lời nói rất nhỏ của một người nói bình thường đối với hệ thống nguyên âm của người đó Nói cách khác, chúng ta có thể điều chỉnh bản đồ này ở tất cả mọi người, nhưng vẫn có những vùng chung nhất định phụ thuộc vào giới tính, tuổi tác cũng như giọng nói của từng vùng phương ngữ [126, tr 178]
Khi nghiên cứu tần số của các formant phía trên, Peterson và Barney (1952) đã tiến hành thu âm các nguyên âm tự nhiên ở các từ bắt đầu bằng /h/
và kết thúc bằng /d/ của nhiều người khác nhau (đàn ông, phụ nữ và trẻ em), các tác giả đã phân tích cấu trúc formant của những nguyên âm này, và hình thành nên những nghiên cứu thẩm nhận bằng cách dùng các bản ghi âm tương
tự Từ phân tích của hai ông, rồi đến công trình của Shepard (1972) sau này,
đã chỉ ra rằng ở đâu có sự nhầm lẫn thẩm nhận thì ở đó chúng có liên quan
Trang 5mật thiết với sự gần gũi âm học được xác định bằng ba formant thấp nhất Tư liệu của họ cũng cho thấy một mức thay đổi đáng kể giữa các nguyên âm được coi là điển hình và sự gối lên nhau giữa các nguyên âm khác nhau Các tác giả đã chỉ ra sự thay đổi của rất nhiều nguyên âm khác nhau khi các formant của chúng được dựng lên so sánh với nhau [126, tr 176].
Những tư liệu này đã hé mở một khía cạnh quan trọng trong hoạt động tiếp nhận nguyên âm, đặc biệt là bản chất hệ thống của formant liên quan đến các giá trị tuyệt đối của chúng Họ đã lưu ý rằng có một sự đa dạng trong các thuộc tính âm học của các nguyên âm ở trẻ em, phụ nữ và đàn ông nảy sinh từ những khác biệt về độ dài của bộ máy phát âm, cũng như sự đa dạng do những khác biệt giữa các cá thể ở bộ máy phát âm và thay đổi mang tính thói quen của cơ quan phát âm Kết quả là nhiều nhà nghiên cứu đã lập ra các thuật toán nhằm chuẩn hoá nét biến thể của tư liệu, trên cơ sở sự khác biệt về trường độ của bộ máy phát âm
Thí nghiệm của Ladefoged và Maddieson chứng minh các tần số formant xác định đặc trưng âm vị học của hệ thống nguyên âm Bằng việc dùng lời nói tổng hợp, họ đã chứng minh nếu một hệ thống nguyên âm trong một câu bị dịch chuyển thì người nghe sẽ thẩm nhận sự di chuyển mang tính
hệ thống của nguyên âm vào trong đường giao âm học của một nguyên âm khác xét về mặt âm vị học
Ví dụ: nguyên âm của từ head (cái đầu) có thể bị làm cho nghe thành nguyên âm của từ hid (trốn) nếu các tần số formant của tất cả các nguyên âm
khác bị hạ xuống Dường như người nghe có thể tiếp nhận một cách bình thường đối với một người nói ở một vài từ ban đầu mà họ nghe thấy [109, tr 74]
Bên cạnh những kết quả nghiên cứu cấu trúc formant của tiếng Anh cấu trúc formant của các nguyên âm tiếng Thụy Điển cũng được nghiên cứu rất kĩ
Trang 6lưỡng trong các công trình của G Fant và các cộng sự (1959) Việc khảo sát thực nghiệm được thực hiện với một nhóm 24 sinh viên nam tại Viện Kĩ thuật Hoàng gia, những người từng tham gia một khóa học truyền thông, họ đọc một danh sách các nguyên âm độc lập tiếng Thụy Điển bao gồm: /o, a, ă, e, i,
y, u, o/ với khoảng cách 1,5 giây giữa các âm Tương ứng với bảng phiên âm quốc tế IPA của các kí tự được phát âm là /u:, o:, a:, e:, y:, i:/ Tần số formant được đo qua bộ lọc mẫu phổ tại một vị trí thời gian bằng 1/4 độ dài của nguyên âm Mục đích trong nghiên cứu của Fant là tập hợp một dữ liệu liên quan đến tần số formant của nguyên âm tiếng Thụy Điển Những nghiên cứu của Fant (1959) nhằm phục vụ những ứng dụng của công ty điện thoại Erricson từ năm 1946 đến 1948 Thời gian đầu những nguyên âm trong nghiên cứu được thể hiện trong khoảng thời gian là 4 giây để thực hiện một dải phân tích tần số Những nghiên cứu bước đầu của Fant có những hạn chế trong việc tạo ra giọng nói tổng hợp một cách đều đặn và giọng này được thể hiện giống như tiếng hát hơn là lời nói Trong nghiên cứu tiếp theo, dữ liệu được bổ sung là giọng nói của trẻ em và phụ nữ, giới hạn của nghiên cứu hiện tại chỉ gồm các nguyên âm dài [92, tr 1] Ngoài ra, trong công trình “Stops in CV”, Fant cũng đã mô tả ảnh hưởng của phụ âm tắc đến formant của nguyên
âm tiếng Thụy Điển ở trường độ và vùng tần số giữa phụ âm và nguyên âm
Năm 1998, Manjari Ohala và John J Ohala đã tiến hành khảo sát sự tương quan giữa các chuyển tiếp (formant) trong cấu trúc VC phụ âm tính (trong đó V là các nguyên âm /a i u/ còn C là các phụ âm /p t t k/) với mức độ lẫn lộn của thính giác về đối lập vị trí trong tiếng Hindi Bằng thủ pháp thử và sai, tác giả đã đánh giá vai trò của các chuyển tiếp formant VC độc lập với sự giải phóng âm tắc [124, tr1]
Năm 1999, James J.Hant và Abeer Alwan đã nghiên cứu và lập mô hình cho chuyển tiếp formant trong bối cảnh nhiễu Đánh giá cao vai trò quyết
Trang 7định của chuyển tiếp formant trong việc nhận ra vị trí cấu âm của các phụ âm, các tác giả đã đưa ra giả định nếu chuyển tiếp formant này “nhúng” vào trong một môi trường nhiễu, và tiến hành xác định ngưỡng của các trượt lướt thanh điệu (tone glides) và đường formant cá thể ở các tần số khác nhau, có trường
độ khác nhau Kết quả nghiên cứu cho thấy ngưỡng là độc lập với mức tần số
và chỉ phụ thuộc vào trường độ và tần số trung tâm của chuyển tiếp [96, tr 1896]
Năm 1958, trong bài viết Effect of Third-Formant Transitions on Perception of Voiced Stop Consonants đăng trên The Journal of Acoustical Society of America, Vol 30, No 2, 122-126, tác giả dựa trên lời nói tổng hợp
(synthetic speech) đã tiến hành thực nghiệm và đi đến nhận xét “chuyển tiếp formant thứ ba là chìa khóa cho việc thẩm nhận các âm /b d /”, “sự đa dạng của chuyển tiếp formant thứ ba tương ứng cặp đôi với chuyển tiếp formant thứ hai ở vị trí đầu trước nguyên âm /i/ và //” Từ kết quả miêu tả về chuyển tiếp và mức độ ổn định của formant thứ ba các tác giả đi đến nhận xét “sự tồn tại của locus formant thứ ba tương tự với locus đã được tìm thấy trước đó đối với formant thứ nhất và thứ hai” [103, tr 124]
Cũng năm 1958, P.C Delattre, A M Liberman, F S Cooper qua khảo sát âm xát tiếng Anh Mĩ, đã cho rằng chuyển tiếp formant là các tương liên
âm học của vị trí cấu âm Tác giả cũng đã tổng kết những nghiên cứu đã có trước đó và cho rằng có hai loại tín hiệu âm học để nhận ra vị trí cấu âm của
phụ âm: một là những đặc trưng bản thể, có ở âm tắc (stop) ,âm xát, và âm
tắc xát, là điểm mà tỉ lệ tần số của tiếng ồn hay tiếng rít được tạo ra tại điểm
rít, và hai là những chuyển tiếp hay biến đổi (sự thay đổi tần số tương đối
nhanh) của các formant thứ hai và thứ ba Trong bài viết này, các tác giả cũng khẳng định chuyển tiếp của formant thứ hai và thứ ba là những dấu hiệu nhận dạng vị trí cấu âm của phụ âm theo hướng chuyển dịch tần số [87, tr 773]
Trang 8Năm 1955, nhóm tác giả này trong bài viết "Acoustic Loci and Transitional Cues for Consonants" cho rằng những nghiên cứu tổng hợp tiếng
nói trước đây đã mô tả sự quá độ của formant thứ hai là những tiêu điểm cho nhận dạng các phụ âm tắc và mũi Kết quả của những thí nghiệm này có thể đơn giản hóa nếu nó giả định rằng: mỗi phụ âm có một nét đặc trưng và vị trí tần số cố định, hoặc tiêu điểm cho formant thứ hai, tương ứng với vị trí cố định của cơ chế tạo phụ âm Trên nền tảng đó, những dấu hiệu quá độ có thể được xem như "những sự biến động (sự vận động)" từ tiêu điểm tới trạng thái bền vững của nguyên âm Thí nghiệm trong bài viết này đã cung cấp thêm một bằng chứng liên quan đến sự tồn tại và những vị trí là tiêu điểm của formant thứ hai cho những phụ âm tắc hữu thanh /b, d, g/ Ở đó xuất hiện một tiêu điểm cho /d/ tại 1800 cps và cho /b/ tại 720 cps Một tiêu điểm cho /g/ có thể được chứng minh chỉ khi nguyên âm bên cạnh có formant thứ hai của nó trên khoảng 1200 cps Đối với những phụ âm tắc hữu thanh, thời kì quá độ không thể bắt đầu tại tiêu điểm và đi từ điểm đó đến vị trí cố định của nguyên
âm Đúng hơn là, nếu chúng ta nghe phụ âm một cách thích hợp, phần đầu của đoạn quá độ phải là khoảng lặng Và nghiên cứu chỉ ra rằng, trong tổng hợp lời nói phụ âm tắc hữu thanh được tổng hợp tốt nhất bằng cách tạo ra trường độ thời gian giữa các khoảng lặng cân bằng với trường độ của chính đoạn quá độ [88, tr 771]
Năm 1995, một nghiên cứu chuyển tiếp formant giữa âm tiết đầu có kết thúc là nguyên âm và âm tiết thứ hai có nguyên âm là âm đầu trong chuỗi kết hợp hai âm tiết trong tiếng Trung Quốc chuẩn cũng đã được nghiên cứu, (Yan Jingzhu) Trong nghiên cứu này 661 chuỗi kết hợp âm tiết tiếng Trung trong
đó âm tiết đầu có kết thúc là nguyên âm và âm tiết thứ hai bắt đầu bằng một nguyên âm (VV) được một người bản ngữ nam nói tiếng Bắc Kinh tạo ra, âm thanh tiếng nói là chuỗi kết hợp âm tiết được phân tích bằng máy Kay và
Trang 9Sonagraph 5500 Kết quả cho thấy một sự chuyển tiếp formant được hình thành trong kết hợp âm tiết Tần số formant có giá trị tại điểm bắt đầu của sự chuyển tiếp cân bằng với formant của nguyên âm hạt nhân của âm tiết đầu [97, tr 42].
Đặc điểm địa phương ở formant được quan tâm nghiên cứu trên
phương diện tìm các đặc trưng phương ngữ thể hiện trong cấu trúc của formant Theo hướng này, người ta mới chỉ quan tâm đến những khác biệt
vùng địa phương formant của một ngôn ngữ Ví dụ bài viết "Tần số formant của nguyên âm trong âm tiết /hVd/ trong lời nói của phụ nữ người miền Nam Australia" của Andrew Butcher, năm 2006.Trong khoảng thời gian 5 năm
(2002 - 2006) các nguyên âm được ghi âm bởi các sinh viên năm thứ hai chuyên ngành bệnh học lời nói tại trường đại học Flinder ở Adelaide Trong nghiên cứu này, dữ liệu chỉ bao gồm những phụ nữ trẻ, những người lớn lên ở miền nam Australia (n = 92, độ tuổi trung bình là 22 tuổi), đa số họ được huấn luyện Trước khi phát âm danh sách các từ có cấu trúc /hVd/ được chuẩn bị trước và ba dấu hiệu của mỗi nguyên âm là đọc từ những danh sách ngẫu nhiên (năm 2006, n = 22 ghi âm cộng thêm vào từ "Who'll (ai sẽ) " theo trật
tự tạo ra dấu hiệu của tha âm vị trước bên của /u/) Trong tất cả các trường hợp lời nói được ghi âm trực tiếp trên ổ cứng máy vi tính trong môi trường yên tĩnh, số hóa tại 22,5kHz, với độ phân giải 16 - bit Tần số formant được
đo được từ sự hiển thị LPC, những điểm đo được xác định bằng sự liên quan tới những dải phổ rộng, sử dụng chương trình SIL phân tích tiếng nói (phiên bản thuộc 1.5 đến 2.7) Formant được đo ở giữa của sự phân chia đều đặn F1 lớn đối với nguyên âm mở và F1 nhỏ cho những nguyên âm đóng Nguyên
âm đóng /i/ và /u/ trong trường hợp đặc biệt thường không đạt tới F1 nhỏ này cho đến khi nguyên âm kết thúc hoàn toàn Kết quả miêu tả giá trị trung bình
Trang 10formant thu được cho tất cả các nguyên âm bao gồm cả nguyên âm đơn và nguyên âm đôi của những người ở miền nam Australia [81, tr 450].
Đặc trưng cá nhân người nói thể hiện ở cấu trúc formant bao gồm giới
tính, độ tuổi và cả những người mắc các tật phát âm như nói lắp, nói ngọng hay phẫu thuật thanh quản Và mô hình chuyển tiếp formant đặc thù cá nhân
thể hiện trong một vài tổ hợp âm học "Cấu trúc formant của nguyên âm được tạo ra bởi những người có tật nói lắp với tốc độ nói nhanh và bình thường"
Trong nghiên cứu này tác giả Martine Toda, Shinji Maeda, Micheal Aron, và Marie-Odile Berger đã phân tích phần cố định của hai formant F1 và F2 trong cấu trúc CV, chứa nguyên âm /a, i, u/ được phát âm với hai tốc độ nhanh và bình thường, bởi hai nhóm: được điều trị tật nói lắp và không được điều trị tật nói lắp Quỹ tích bằng nhau được tính toán để quan sát những khả năng khác nhau trong đồng cấu âm giữa ba nhóm Dữ liệu phân tích bộc lộ sự giảm bớt khoảng cách của nguyên âm cho những người mắc tật nói lắp trong lời nói bình thường Khi tốc độ lời nói tăng lên, dễ nhận thấy khoảng cách nguyên
âm không hề giảm đối với những nhóm người nói sau, tương phản với cách xem xét những người nói lắp với tốc độ nhanh [134, tr 357]
2.2 Những nghiên cứu về formant của nguyên âm tiếng Việt
Nghiên cứu formant của nguyên âm tiếng Việt đã được một tác giả người nước ngoài là Han Mieko (1968) đề cập đến khi thực hiện một loạt
nghiên cứu âm vị học các ngôn ngữ châu Á Cụ thể, trong công trình "Studies
in phonology of Asian Languages: Vietnamese Vowel" 11 nguyên âm đơn
tiếng Hà Nội đã được nghiên cứu và mô tả F1 và F2 của 11 nguyên âm được
đo, phân tích, cuối cùng tác giả đi đến kết luận rằng có sự chi phối ảnh hưởng bởi các yếu tố khác là thanh tính và phụ âm tính đến chất lượng của nguyên
âm Khi thực hiện một nghiên cứu về trường độ cố hữu của 11 nguyên âm đơn tiếng Việt, kết quả nghiên cứu của Han Mieko cho thấy có sự ảnh hưởng
Trang 11của thanh điệu đối với các cấu trúc formant của nguyên âm Theo bà thanh 6 làm thay đổi vị trí F1 của nguyên âm, nó ảnh hưởng mạnh nhất đến các nguyên âm có độ mở hẹp và trung bình và ảnh yếu đến các nguyên âm có độ
mở rộng Thanh này hầu như không ảnh hưởng đến F2 [98, tr 92]
Khi nghiên cứu số lượng formant của nguyên âm tiếng Việt, Nguyễn Văn Ái (1974) đã phân tích 11 nguyên âm đơn tiếng Việt ở vị trí mạnh (nguyên âm đứng riêng thành âm tiết) và ở vị trí yếu (nguyên âm nằm trong kết hợp âm tố, nhằm để phân tích hai nguyên âm ngắn ă, â là hai nguyên âm không bao giờ xuất hiện riêng thành âm tiết) bằng máy xônagorap đã ghi được khoảng 1300 đơn vị âm tiết do ba người phát âm (1 nữ, 2 nam) Kết quả thực nghiệm cho thấy: số lượng formant của mỗi nguyên âm không giống nhau hoàn toàn Ở nguyên âm u, thường xuất hiện từ một đến hai formant; đôi khi có formant thứ ba nhưng cường độ rất yếu Những nguyên âm khác có số lượng formant tương đối cố định: /i, e, , , , o, / đều có bốn formant, riêng /o/, trong một số biến thể phát âm cá nhân, chỉ xuất hiện hai formant;
ở /e, a, ă/, xuất hiện năm formant, riêng /ă/ có khi chỉ có 4 formant Phần lớn những formant thứ 4, thứ 5 này có cường độ rất yếu Tác giả kết luận các nguyên âm đơn tiếng Việt có từ 2 đến 5 formant [2]
Trước đó, năm 1973 trong bài viết công bố trên tạp chí Ngôn ngữ, Nguyễn Văn Ái khi nghiên cứu thực nghiệm về mặt vật lí, với việc phân tích
400 ảnh sóng âm của 9 nguyên âm đơn tiếng Việt được lấy từ 10 CTV Tác giả đi đến kết luận: Ngoài đặc điểm cấu âm đầu tiên chung của các nguyên âm
là sự sản sinh tiếng thanh cơ bản trong thanh quản ra, tất cả các nguyên âm tiếng Việt đều được hình thành cuối cùng ở khoang miệng (không có sự tham gia của khoang mũi, vì khi cấu âm, phần sau của ngạc mềm nâng lên đóng chặt đường thông lên khoang mũi) Do đó, chính hiện tượng cấu âm ở khoang miệng: độ mở của miệng, góc độ của hàm và vị trí của lưỡi là nguyên nhân
Trang 12trực tiếp có tính chất quyết định đến hiệu quả âm học của từng nguyên âm Trong nghiên cứu này, tác giả đã đưa ra vùng tần số F1 và F2 của từng nguyên âm tiếng Việt như sau:
Nguyên âm dòng trước /i, e, / có vùng tần số F1 và vùng tần số F2 nằm cách xa nhau; u, o, là những nguyên âm dòng sau, bản thân chúng có vùng tần số F1 và F2 cách nhau trung bình Các nguyên âm tiếng Việt nằm trong khoảng tần số 250 -3800Hz [1]
Hoàng Cao Cương (1986) [13] khi phân tích các sonagram đã nhận thấy ở các âm tiết có chứa các thanh điệu 1, 3, 5, F2 của nguyên âm thường được thể hiện rõ hơn, trong khi đó các âm tiết chứa các thanh còn lại thể hiện F1 rõ hơn Về dạng của formant, trong mọi trường hợp các F1 đều bằng phẳng, trong khi F2 của các âm tiết chứa các thanh 3, 5 lại có dạng đi lên Tác giả cho rằng nếu quan niệm F2 là đặc trưng quan trọng của nguyên âm thì dễ
Trang 13nhận thấy trong hệ thanh điệu Việt chỉ có thanh 1 là giúp cho dễ nhận diện các chiết đoạn Các thanh 4 và 6 làm cho người ta khó nhận diện các đoạn nằm ở vị trí chung âm Các thanh 3 và 5 có những ảnh hưởng nhất định đối với F2
Ngoài ra khi nghiên cứu sự ảnh hưởng của phụ âm tới nguyên âm, tác giả nhận thấy đặc trưng chuyển tiếp giữa C1 tới V và từ V tới C2 rất khác nhau Trong khi các chuyển tiếp C1V thường dễ dàng được thẩm nhận vì kích thước lớn (giảm hoặc tăng cường độ từ 3-5dB, trường độ ít nhất là 15ms) thì các chuyển tiếp VC2 thường thể hiện mờ nhạt (dao động và biến thái cường
độ không vượt quá 2dB, trường độ không vượt quá 10ms) Trong khi các dạng chuyển tiếp C1V thường ổn định, phụ thuộc chặt chẽ vào các đặc trưng
cố hữu của C1 thì chuyển tiếp VC2 thường chỉ phụ thuộc vào đặc trưng cố hữu của V và thanh điệu mà âm tiết chuyển tải Các dạng chuyển tiếp của C1V trong âm tiết kiểu Việt là bị nổi bật lên, trong khi chuyển tiếp VC2 bị hòa kết, làm liền lại các chiết đoạn vốn dĩ có các đặc trưng cố hữu khác biệt nhau Nếu coi đặc trưng về tính tách biệt như là một biểu hiện quan trọng nhất của các yếu tố âm thanh chiết đoạn thì có thể kết luận là C1 bảo lưu được nhiều đặc trưng cố hữu của chúng hơn C2 khi cả hai đều tham gia vào cấu trúc âm tiết Xét từ quan điểm chiết đoạn, C1 là đồng chất hơn C2
Một tình trạng tương tự xảy ra trong khu vực các âm thanh vốn được coi là siêu đoạn của tiếng Việt Nếu coi rằng điệu tính là nét ngữ âm (hoặc) chùm nét ngữ âm hành chức bao trùm lên một chỉnh thể lớn hơn một chiết đoạn và sự thể hiện nó là có tính quy luật theo đặc điểm tuyến tính của cấu trúc chỉnh thể ấy (được phân bố theo thời gian), thì trong số thanh Việt chỉ có thanh 1 là thanh vị đủ tư cách một đơn vị thuần điệu tính Sự hoạt động của thanh này không làm cho cấu trúc mà nó bao trùm lên bị phá vỡ các đặc điểm
cố hữu, không lấy các vùng chiết đoạn dễ cảm ứng với sự phá vỡ cấu trúc làm
Trang 14nơi thể hiện các điểm đặc biệt của mình Và cái quan trọng, sự thể hiện của nó bao trùm lên toàn bộ âm tiết tới mức không để lộ ra các đặc điểm tuyến tính của các chiết đoạn thành phần ở cái chỉnh thể mà nó phủ lên Những thanh 3,
6, 5', 6' tạo thành một nhóm thanh vị khác, ở đó sự thể hiện thanh bị chi phối bởi cấu trúc chiết đoạn Chúng đều phải lấy phần cuối của cấu trúc chiết đoạn làm nơi thể hiện các đặc thù của mình Phần dễ cảm ứng với các thay đổi về phân bố năng lượng (các đoạn transient) của cấu trúc chiết đoạn cũng là khu vực gánh lấy thông tin cần yếu của thanh Đoản độ của C2 cùng sự phá vỡ cấu trúc chùm nét khu biệt của các chiết đoạn nằm trong khoảng đo 75 -100
Hz chính là biểu hiện của xu thế này Những biểu hiện này đạt đến mức cực đoan ở các thanh 5' và 6' Ở các âm tiết có chứa hai thanh này, C2 bị biến mất
và để nhận diện ra chúng, người bản ngữ phải tận dụng các đặc thù locus bộc
lộ ở cuối cấu trúc chính âm Tuy nhiên, do chỗ các bộ phận nằm ở cuối các
âm tiết có chứa thanh thường nghèo nàn về các đặc trưng cố hữu cho nên sự nhận diện những bộ phận này thường gặp nhiều khó khăn trong thực tế
Năm 2002, những kết quả nghiên cứu về hệ formant của 9 nguyên âm đơn tiếng Hà Nội đọc tách rời đã được tác giả Vũ Kim Bảng trình bày trong giới hạn phạm vi nghiên cứu là các CTV người Hà Nội và kết quả nghiên cứu được tính theo giới tính Việc trình bày giá trị khách quan của formant tính bằng Hz trong mối tương quan với giá trị cảm nhận tính bằng đơn vị Bark cho phép đưa ra các nhận xét về sự phân bố của hệ thống nguyên âm đơn tiếng Hà Nội Đây chính là cơ sở để tiếp tục thực hiện nghiên cứu các formant này trong chuỗi lời nói liên tục cũng như các nguyên âm có sự tác động của thanh điệu Các đặc trưng âm học khác của tiếng Việt được nghiên cứu theo trình tự âm tố (nguyên âm, phụ âm), âm tiết bao gồm cả thanh điệu và chuỗi lời nói góp phần làm sáng tỏ đặc điểm đơn lập của tiếng Việt [6]
Trang 153 MỤC ĐÍCH NGHIÊN CỨU
Dựa vào việc mô tả cấu trúc formant của các nguyên âm đơn trong kết hợp với thanh điệu và âm tắc ở các vị trí khác nhau trong âm tiết, mục đích chính của luận án là: cung cấp các thông số âm học quan trọng cho quá trình tổng hợp tiếng Việt, nhận dạng giọng nói tiếng Việt
4 NHIỆM VỤ NGHIÊN CỨU
Để đạt được mục đích trên, luận án có các nhiệm vụ cụ thể sau:
- Tổng quan tình hình nghiên cứu cấu trúc formant của nguyên âm ở nước ngoài và ở Việt Nam nhằm xác định rõ hướng nghiên cứu của đề tài
- Xây dựng cơ sở lí thuyết cho đề tài trên cơ sở định rõ khái niệm cấu trúc formant của nguyên âm và những vấn đề liên quan
- Tìm các đặc điểm âm học liên quan đến formant của nguyên âm trong quan hệ với thanh điệu và phụ âm tắc, phụ âm mũi; đồng thời xác định
sự tác động qua lại của yếu tố như phụ âm (phụ âm tắc, phụ âm mũi) và thanh điệu đến formant của nguyên âm trên ba phương diện: trường độ formant, vùng tần số formant và diễn tiến formant
- Luận án sẽ chỉ ra các đặc điểm âm học của mối quan hệ giữa phụ âm
và nguyên âm, giữa thanh điệu và nguyên âm
- Phân tích và mô tả đặc điểm liên cấu âm giữa thanh điệu và nguyên
Trang 165 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu của luận án là cấu trúc formant của các nguyên
âm đơn tiếng Việt trong bối cảnh kết hợp với thanh điệu và phụ âm tắc ở cả hai vị trí mở đầu và kết thúc âm tiết
Phạm vi nghiên cứu: Nghiên cứu chỉ giới hạn với cấu trúc formant của
9 nguyên âm đơn tiếng Việt với 6 phụ âm đầu tắc, mũi /m, n, , p, t, k/ và 6 phụ âm cuối tắc, mũi /m, n, p, t/ và /, k/
6 PHƯƠNG PHÁP NGHIÊN CỨU
Để phục vụ cho việc mô tả cấu trúc formant của nguyên âm trong các kết hợp, chúng tôi chủ yếu sử dụng hai phương pháp: phương pháp miêu tả và ngữ âm học thực nghiệm Ngoài ra, để chỉ rõ sự ảnh hưởng giữa thanh điệu đến formant của nguyên âm, giữa phụ âm đầu và cuối đến formant so sánh với formant nguyên âm ở trạng thái độc lập, một số thủ pháp thống kê và so sánh cũng được sử dụng để trình bày, thể hiện và nhận xét các kết quả
Để quan sát, miêu tả, phân tích các thông số âm học (các giá trị formant (F1, F2) của nguyên âm) cũng như vẽ các biểu đồ, luận án đã sử dụng phần mềm phân tích ngữ âm Praat
Minh hoạ chương trình Praat và các cửa sổ của nó Praat gồm màn hình phía trên hiển thị dạng sóng của âm; màn hình dưới hiển thị các tham số:
1- Cửa sổ phía trên biểu thị dạng sóng của nguyên âm
2 - Cửa sổ phía dưới biểu thị ảnh phổ trong đó có hiển thị đường nét diễn tiến formant của nguyên âm Ảnh phổ biểu thị vùng năng lượng của formant là những khoảng tối sậm màu; vùng sậm màu ở dưới cùng biểu thị F1 của nguyên âm, những vùng sậm màu phía trên biểu thị vùng tần số F2 Đường nét của formant của nguyên âm được hiển thị bằng những điểm liên tục màu đen nhạt;
Trang 173- Cửa sổ nhỏ phía trên bên phải hiển thị các giá trị formant của nguyên
âm trên từng điểm đo
Trục tung bên trái là thang đo và các mức tần số Hertz (Hz), trục hoành phía dưới là trường độ của âm được tính bằng mili giây (ms) Các khoảng đo cách đều nhau 10 ms cho phép theo dõi sự diễn tiến của formant và sự biến đổi của cường độ đo bằng decibel (dB) và ranh giới trường độ mỗi bộ phận cấu thành âm tiết theo hàm thời gian
Căn cứ vào Spectrogam này, chúng tôi phải xác định được hai thông số
âm học:
- Trường độ của phụ âm đầu tính bằng mili giây (ms) liên quan đến
phương thức và thanh tính của phụ âm đó
- Trường độ formant của nguyên âm tính bằng mili giây (ms) liên
quan đến phương thức và vị trí cấu âm của nguyên âm
Diễn tiến tần số F1 Diễn tiến tần số F2
Diễn tiến tần số F3
Giá trị tần số F1, F2, F3, F4 trên
từng điểm đo
Trang 18- Diễn tiến của formant tính bằng Herz (Hz) theo thời gian (ms) trong
đó quan trọng nhất là diễn tiến ở giai đoạn chuyển tiếp của F1 và F2 kết hợp với âm đầu và âm cuối Đây là thông số âm học được quan tâm nghiên cứu
Để xác định được hai thông số trên, ở mỗi Spectrogam phải xác định hai điểm quan trọng:
- Điểm bắt đầu của đỉnh chuyển tiếp tức là ranh giới giữa phụ âm đầu
và nguyên âm
- Điểm kết thúc chuyển tiếp của các formant, thời điểm mà các
formant kết thúc quá trình đi lên hoặc đi xuống, bắt đầu diễn tiến đều đặn như formant của âm tiết trong kết hợp thanh điệu không bị chi phối bởi phụ âm đầu
Chương trình Praat tính toán diễn tiến tần số của tất cả các formant (F1,
F2, F3, F4) của nguyên âm theo thời gian từ đầu đến cuối của một âm tiết Như vậy, khi đã xác định được hai điểm trên trong một Spectrogam, chúng tôi
Trang 19- Biểu đồ thể hiện trường độ formant của các nguyên âm trong các kết hợp.
Tất cả các dữ liệu thông số âm học về trường độ (ms), vùng tần số formant (Hz) của những CTV tiêu biểu, sau khi xử lí, được chuyển sang dạng văn bản Excel Dữ liệu được trình bày ở phụ lục
Về ghi âm, chúng tôi lựa chọn 6 CTV là các phát thanh viên của Đài tiếng nói Việt Nam, giọng Hà Nội, có độ tuổi từ 30 đến 40, được yêu cầu phát
âm theo bảng từ Nguyên âm được chọn làm thực nghiệm ở đây là 9 nguyên
âm đơn dài, xuất hiện trong kết hợp với 6 thanh điệu, và kết hợp với phụ âm ở các kiểu cấu trúc âm tiết khác nhau (CV, VC) Các kiểu cấu trúc âm tiết được khảo sát trong luận án chỉ có nguyên âm và phụ âm mà chưa xét đến những trường hợp có âm đệm đi kèm Cụ thể về các kiểu cấu trúc âm tiết tiếng Việt được khảo sát như sau:
+ Kiểu cấu trúc âm tiết 1 (V) bao gồm 9 nguyên âm đơn tiếng Việt kết hợp với 6 thanh điệu: i, ì, ĩ, ỉ, í, ị ê, e, ư, ơ, a, u, ô, o,…
9 nguyên âm x 6 thanh điệu x 6 CTV = 324 mẫu
+ Kiểu cấu trúc âm tiết 2 (CV) bao gồm 3 âm đầu ở vị trí C là các phụ
âm /p, t, k/: ví dụ: pa, pi, pê, pe, ta, ti, tê, te, ca, ki, kê…
3 phụ âm x 9 nguyên âm x 6 CTV = 162 mẫu
+ Kiểu cấu trúc âm tiết 3 (CV) bao gồm 3 âm đầu ở vị trí C là các phụ
âm /m, n, ŋ/, ví dụ: ma, mi, mê, mư, ni, nê, nghi, nghê
3 phụ âm x 9 nguyên âm x 6 CTV = 162 mẫu
+ Kiểu cấu trúc âm tiết 4 (VC) bao gồm 3 âm cuối ở vị trí C là các phụ
âm /m, n, ŋ/, ví dụ: am, im, êm, em, in, ên, en, inh, ang, eng
3 phụ âm x 9 nguyên âm x 6 CTV = 162 mẫu
+ Kiểu cấu trúc âm tiết 5 (VC) bao gồm 3 âm cuối ở vị trí C là các phụ
âm /p, t, k/, ví dụ: át, ít, ết, ét, ứt
Trang 203 phụ âm x 9 nguyên âm x 2 thanh điệu x 6 CTV = 324 mẫu
Tổng số các âm tiết khảo sát là 1134 mẫu
Việc tiến hành thu âm được thực hiện trong phòng thu của Đài tiếng nói Việt Nam với độ cách âm cao (mức độ ồn nhiễu ≅ 1dB), sử dụng microphone (SHURE SM 58) với khoảng cách 5-10 cm Ghi âm bằng phần mềm CoolEdit Pro, tín hiệu ghi âm được số hóa 16 bit, Mono, tần số lấy mẫu
11025 Hz
7 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
Những kết quả nghiên cứu của luận án góp phần chỉ ra các đặc điểm cấu trúc formant nguyên âm tiếng Việt trong quan hệ với các đơn vị chiết đoạn và siêu đoạn Trên cơ sở so sánh với một số tác giả khác nhằm chỉ ra các nét đặc thù riêng của tiếng Việt được thể hiện ở các formant
Những kết quả khảo sát của luận án là một tổng quan nghiên cứu về formant của nguyên âm trong mối quan hệ với thanh điệu và âm tắc Nó có thể làm cơ sở và được tiếp tục nghiên cứu rộng hơn sang các phong cách nói khác, ở những vùng phương ngữ khác nhau, các cá nhân ở nhóm tuổi khác
nhau, ứng dụng cho các mục đích tổng hợp, nhận dạng và giám định âm thanh lời nói tiếng Việt.
Luận án sẽ đóng góp các kết quả khoa học mới:
- Nghiên cứu quy luật biến đổi cấu trúc formant của nguyên âm khi kết hợp với thanh điệu và âm tắc mô tả trên ba phương diện: trường độ, vùng tần
số và diễn tiến vùng tần số
- Mô hình hoá và đưa ra các tham số đặc trưng cho vùng quá độ giữa formant và âm tắc, giữa formant và thanh điệu Những nghiên cứu này tạo tiền đề cho việc cải tiến, nâng cao chất lượng của các hệ tổng hợp âm thanh tiếng nói, nhận dạng tiếng Việt
Trang 218 BỐ CỤC CỦA LUẬN ÁN
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, và phụ lục luận án được cấu trúc gồm 4 chương như sau:
Chương 1: Cơ sở lí thuyết
Trong chương này chúng tôi trình bày tổng quan về nghiên cứu formant của nguyên âm của một số ngôn ngữ trên thế giới và tiếng Việt Một số khái niệm cơ sở lí thuyết liên quan đến formant của nguyên âm, đặc điểm cấu trúc
âm tiết tiếng Việt và mối quan hệ giữa các đơn vị chiết đoạn và siêu đoạn trong tiếng Việt
Chương 2: Mối quan hệ giữa formant của nguyên âm và thanh điệu
Chương này trình bày mối quan hệ của thanh điệu đối với cấu trúc formant của nguyên âm
Chương 3: Formant của nguyên âm trong kết hợp với âm đầu tắc
và thanh điệu
Nội dung chương 3 mô tả sự ảnh hưởng của nhóm phụ âm đầu tắc vô thanh /p, t, k/, nhóm phụ âm mũi /m, n, ŋ/ đến formant của các nguyên âm trên các phương diện: vùng tần số, diễn tiến đường nét và trường độ
Chương 4: Formant của nguyên âm trong kết hợp với âm cuối tắc
và thanh điệu
Nội dung chương 4 mô tả ảnh hưởng của nhóm phụ âm cuối tắc vô thanh /p, t, k/ trong tương quan so sánh với nhóm phụ âm mũi /m, n, ŋ/ đến formant của các nguyên âm trên các phương diện vùng tần số, diễn tiến đường nét và trường độ
Trang 22CHƯƠNG 1: CƠ SỞ LÍ THUYẾT
Để có cơ sở cho việc phân tích và miêu tả cấu trúc formant của nguyên
âm tiếng Việt trong kết hợp với thanh điệu và các phụ âm ở các chương tiếp theo, chương này luận án giới thiệu một số cơ sở lí thuyết có liên quan đến nguyên âm và cấu trúc formant của nguyên âm
1.1 Khái niệm formant của nguyên âm
Formant được định nghĩa bởi Gunnar Fant (1960) "những đỉnh quang phổ của phổ âm thanh được gọi là các formant" Định nghĩa này được sử
dụng rộng rãi trong nghiên cứu ngữ âm học và các xử lí âm thanh trong công nghệ [93] Khái niệm này còn được Benade (1976) sử dụng với nghĩa tương
tự "formant là những đỉnh được quan sát trong sự bao phủ của phổ được gọi
và Maddieson, I, 1990) Han Mieko (1969) trong ""Studies in phonology of Asian Languages: Vietnamese Vowel" đã định nghĩa: "Nguyên âm được mô tả
bởi khoang cộng hưởng tương đối lớn trong so sánh với phụ âm Khoang cộng hưởng này được mạnh thêm ở những vùng khác nhau theo khẩu hình đặc trưng của bộ máy phát âm của âm thanh lời nói Những vùng có cộng hưởng tăng mạnh được gọi là các formant Mỗi nguyên âm có một kiểu formant đặc trưng, và thực nghiệm đã chứng tỏ rằng hai formant đầu tiên mang hầu hết thông tin về phẩm chất của nguyên âm" [98, tr 11]
Trang 23Có hai khoang cộng hưởng quan trọng nhất được ngăn cách và thay đổi
do sự chuyển động của lưỡi tạo nên hai formant cơ bản của một nguyên âm:
F1: ứng với cộng hưởng vùng họng
F2: ứng với cộng hưởng khoang miệng
Khi ta nói, các âm mũi sẽ có sự xuất hiện của formant F3, các formant khác F4, F5… liên quan đến các đặc trưng giọng nói riêng của mỗi cá nhân Mỗi lần môi, lưỡi, hàm ở những vị trí khác nhau là một lần hộp cộng hưởng miệng và yết hầu thay đổi hình dáng, thể tích, lối thoát của không khí làm biến đổi âm sắc của âm thanh đi qua chúng Chính vì vậy, hai khoang miệng
và họng là hai hộp cộng hưởng quan trọng nhất, chúng tạo nên hai formant chính F1 và F2 đặc trưng của mỗi nguyên âm
Hình 1.1: Đỉnh formant của nguyên âm /ee, uh, ah/ trong tiếng Anh (theo
Ladefoged)
Hiện nay, nhờ sự phát triển của các phần mềm tin học, người ta có thể
đo được chính xác tần số formant, số lượng formant của nguyên âm tương ứng với vị trí cấu âm khác nhau
Trang 241.2 Cấu tạo bộ máy phát âm của con người
Các cơ quan cấu âm được miêu tả dưới đây bao gồm có phổi, khí quản, thanh hầu, các khoang họng, khoang miệng cùng với các bộ phận cấu thành của chúng tạo thành một nhóm được gọi bằng thuật ngữ là bộ máy phát âm (vocal tract) Vì các lí do miêu tả và chức năng hoạt động mà bộ máy phát âm thường được chia ra thành hai phần, một phần nằm ở phía trên thanh hầu, và một phần nằm ở phía dưới thanh hầu Nằm trong thanh hầu là các dây thanh:
kẽ hở giữa các dây thanh được gọi là khe thanh (glottis), và bộ máy phát âm phía trên khe thanh vì thế được gọi là bộ máy phát âm phía trên thanh hầu (supraglottal), còn ở phía dưới nó là bộ máy phát âm phía dưới thanh hầu (subglottal) Việc lựa chọn điểm phân chia này được dựa vào sự phân biệt có tính chức năng Hệ hô hấp ở phía dưới khe thanh cung cấp nguồn năng lượng chính cho việc tạo ra các âm thanh lời nói, trong khi đó bộ máy phát âm phía trên khe thanh xác định chất lượng ngữ âm của các âm thanh lời nói Các công trình mô tả ngữ âm về âm thanh lời nói chủ yếu quan tâm đến hoạt động phía trên thanh hầu
Phổi (Lung): là một bộ phận gồm có vô số những bọng hơi nước rất
nhỏ có đường kính từ 0,1 đến 0,3mm, xung quanh có một màng lưới vi ti huyết quản Mỗi bọng hơi kết thúc một chi nhánh rất nhỏ của các nhánh phổi,
từ hai nhánh phổi chia ra như cành cây Hai nhánh phổi hợp nhau lại ở gốc khí quản Nhánh phổi có một bộ cơ nhẵn cho phép nó co bóp
Khí quản (Trachea): là một cái ống do những miếng xương sụn hình
bán nguyệt ép sát vào nhau làm thành
Thanh Hầu (Larynx): được cấu tạo bởi một loạt xương sụn nối liền với
nhau bằng những cơ thịt và gân Ở phía dưới thanh hầu có xương sụn hình nhẫn gắn vào khâu trên cùng của khí quản khít cả bốn phía Xương sụn này
Trang 25trông như một chiếc nhẫn, phần hẹp ở phía sau, phần rộng (mặt nhẫn) quay về phía trước.
Phía trên xương sụn hình nhẫn là xương sụn hình giáp, gồm có hai mảng hình tứ giác không đều gắn chặt với nhau ở phía trước làm thành một góc 900 ở nam giới và 1200 ở phụ nữ Ở nam giới phần trên của góc này lồi ra thành "cuống họng" hay còn gọi là "quả táo của Ađam"
Hình 1.2: Hình ảnh minh họa các cơ quan cấu âm của con người
(nguồn: Courtesy of Mike Gasser/Indiana University) Dây thanh (Vocal Cord): gồm hai sợi ở cơ đàn hồi, hình nẹp có cấu
trúc niêm mạc Một đầu dây thanh nối liền với sụn giáp cố định; một đầu kia nối với sụn phễu Nhờ các cơ mà sụn phễu có thể cử động linh hoạt làm cho hai dây thanh có thể khép chặt để ngăn luồng hơi từ phổi đi ra hoặc mở ra theo những dạng khác nhau Ở trạng thái tĩnh dây thanh của đàn ông dài khoảng 1,5 cm, của phụ nữ khoảng 1,2 cm Dây thanh dày lên theo tuổi tác, đặc biệt vào tuổi 14 -15, dây thanh dày lên rất nhanh, tạo nên hiện tượng gọi
lưỡi
Trang 26Hình 1.3:Hình minh họa thanh quản, nhìn từ trên khi phát âm và khi thở
( http://www.phys.unsw.edu.au/jw/voice.html ) Khe thanh (Glottis) là khe hở giữa hai dây thanh khi chúng chuyển
động theo chiều ngang sang hai bên nhờ sụn phễu Khi các cơ co lại, hai dây thanh ngắn đi và độ căng của nó cũng thay đổi Khác với dây thanh thật, trong dây thanh giả không có cơ thịt, nó cấu tạo bằng vô số những lớp mô ngăn cách nhau bằng nhưng tuyến nhờn nhỏ Âm ban đầu được tạo ra ở hầu do sự rung của hai dây thanh Nguyên tắc tạo âm đó được gọi là lí thuyết cơ đàn hồi (nyo- elastish) được đa số các nhà khoa học ủng hộ Áp lực tăng lên đến mức làm khe thanh hé mở, không khí thoát ra ngoài làm áp lực giảm xuống, dây thanh lại trở về vị trí cũ Cứ như vậy quá trình khép mở của hai dây thanh lặp
đi lặp lại Do tính chất đàn hồi của dây thanh, âm ban đầu được phát ra nhờ sự rung của dây thanh trong quá trình khép - mở Dây thanh rung nhanh thì âm phát ra cao, dây thanh rung chậm thì âm phát ra trầm
khí quản
sụn phễu dây thanh
yết hầu
trước cổ
Trang 27Hình 1.4: Lát cắt dọc của khe thanh Các cơ quan cấu âm: bao gồm môi, răng, lợi, ngạc cứng, ngạc mềm,
lưỡi con và họng, trong đó lưỡi đóng vai trò quan trọng nhất Bản thân các cơ quan này lại được phân thành cơ quan chủ động và cơ quan bị động
Các cơ quan trên tự nó có thể trực tiếp tạo ra hiệu quả âm học nhờ sự rung động của môi, lưỡi, lưỡi con….hoặc gián tiếp khi chúng nhích lại gần nhau để tạo thành điểm tắc hay các khe sát
Khoang cộng hưởng: bao gồm khoang hầu, khoang miệng và khoang
mũi, trong đó khoang hầu và khoang miệng có vai trò đặc biệt quan trọng Các khoang này có chức năng thay đổi (modification) âm ban đầu được hình thành ở hầu để tạo nên sự khác biệt giữa các âm về chất Chúng được gọi là khoang cộng hưởng Âm ban đầu là một tập hợp âm bao gồm một âm có tần
số thấp nhất (âm cơ bản) và các âm khác có tần số bằng bội số của âm cơ bản (họa âm hay thượng âm) Mỗi khoang cấu âm có tần số riêng phụ thuộc vào thể tích của chúng Khi âm ban đầu được truyền ra ngoài, nếu họa âm nào có tần số bằng tần số riêng của khoang cấu âm thì cường độ của nó được tăng
Trang 28mạnh Đó là hiện tượng cộng hưởng (Reronance) Các nguyên âm được hình thành theo nguyên tắc này.
Chiều dài của khoang cộng hưởng chính là chiều dài của bộ máy phát âm
từ môi đến thanh môn Tất nhiên bộ máy phát âm người có chiều dài không giống nhau, nó sự khác nhau rõ rệt, phụ thuộc vào người đó là nam hay nữ, vào sự trưởng thành về thể chất Với những suy nghĩ như vậy, chúng ta có thể xem bộ máy phát âm của người đàn ông điển hình có chiều dài là 17,6cm (Fant 1960) Theo tư liệu của Pickett (1980), chiều dài bộ máy phát âm của nữ bằng khoảng 80 - 90 % chiều dài bộ máy phát âm của nam, trong đó chiều dài
bộ máy phát âm của trẻ em phụ thuộc vào tuổi, có thể bằng khoảng 50% chiều dài bộ máy phát âm của người lớn (nam)
Mỗi formant tương ứng với khoang cộng hưởng nhất định, các formant phụ thuộc chặt chẽ vào hình dạng, kích thước của các khoang cộng hưởng Do
đó, việc xác định giá trị các formant sẽ cho phép miêu tả được hình dáng, kích thước của khoang cộng hưởng, tức là độ mở của miệng, vị trí của lưỡi, hình dáng của môi
Như đã biết, mỗi nguyên âm được quy định bởi hai (hoặc ba, bốn ) formant ứng với hai hộp cộng hưởng chính là yết hầu và miệng Khoang miệng và khoang yết hầu tách biệt nhau do sự nâng cao của lưỡi Chính vì vậy, những thay đổi của khoang này đều kéo theo sự thay đổi của khoang kia
Ta có thể đưa ra ví dụ về 3 nguyên âm /i, a, u/ trong tiếng Anh Khi phát âm nguyên âm trước như [i] hoặc nguyên âm sau như [u], lưỡi hoặc nhích ra trước hoặc lùi về sau một cách cực đoan, làm cho hai khoang miệng
và khoang yết hầu chênh lệch hẳn nhau về thể tích, một rất hẹp và một rất rộng và ngược lại Chính vì thế một formant xuất hiện ở vùng tần số cao, một formant xuất hiện ở vùng tần số thấp Trái lại, khi phát âm nguyên âm [a], lưỡi chia khoang miệng và khoang yết hầu thành hai khoang có thể tích gần
Trang 29như cân bằng Do đó, tạo nên những formant ở những vùng tần số gần nhau Điều này cho thấy giá trị của các formant đặc trưng cho vị trí và hình dạng của khoang cộng hưởng Khoang cộng hưởng càng nhỏ thì formant càng cao
và ngược lại, khoang cộng hưởng càng lớn thì formant càng thấp
Hình 1.5: Hình ảnh mô tả các khoang cộng hưởng của nguyên âm [i, a, u]
Trên cơ sở đó, người ta có thể xây dựng lược đồ các nguyên âm căn cứ vào tần số formant như sau:
Hình 1.6: Hình thang nguyên âm tiếng Anh căn cứ vào tần số formant
Như vậy, lược đồ các nguyên âm được xây dựng bằng những cứ liệu
âm học so với lược đồ được xây dựng trên những cứ liệu khảo sát sinh lý học
Trang 30bộ máy phát âm trong khi phát âm các nguyên âm về cơ bản là thống nhất Đây chính là cơ sở của hình thang nguyên âm quốc tế.
Hình 1.7: Hình thang nguyên âm quốc tế (theo bảng mẫu tự phiên âm quốc tế
âm thanh khác, âm thanh của ngôn ngữ chỉ có thể là sự chấn động mà bộ máy thính giác của con người có thể cảm thụ được Những sự chấn động không nghe được, gọi là siêu âm và âm ngoại, đều không phải là những âm thanh của ngôn ngữ
Bộ máy phát ra tiếng thanh của con người giống như một ống có lưỡi
gà Ở chỗ miệng ống (nơi thổi không khí vào) có một miếng kim loại mỏng
và đàn hồi (lưỡi gà), gặp luồng không khí thổi vào thì chấn động và làm cho không khí đựng trong ống chấn động theo
Trang 311.3.2 Sóng âm
Sóng âm (Sound waves) là một dạng dao động phức tạp Sóng âm được tạo ra do sự chấn động của dây thanh Khi luồng không khí bị ép ở phổi đạt tới một áp suất đủ lớn, nó sẽ đẩy dây thanh bật tách ra khỏi nhau Luồng không khí được giải phóng, áp lực mất đi, thanh môn lại sập lại Thanh môn đóng làm cho không khí trong phổi không thoát ra được và áp suất lại tăng lên, khi đủ mạnh sẽ đẩy dây thanh bật tách ra Dây thanh liên tiếp đóng mở như thế khiến luồng không khí từ phổi thoát ra ngoài thành từng đợt cách nhau đều đặn, tạo thành sóng âm
Sóng âm không có dạng hình sin đơn giản Nó có thể tuần hoàn song cũng có thể không tuần hoàn Các nguyên âm có sóng tuần hoàn, âm được thoát ra tự do (không bị cản trở) Người ta gọi đó là tiếng thanh để phân biệt với tiếng động là đặc trưng của phụ âm (do âm phát ra bị cản trở tại các vị trí cấu âm, sóng âm không tuần hoàn)
Hình 1.8: Dạng sóng tuần hoàn (nguyên âm[a]) và dạng sóng không tuần
hoàn (phụ âm[]) của tiếng Việt
1.3.3 Cao độ của âm thanh
Hai thuộc tính sinh âm nổi bật giữ vị trí quan trọng trong việc miêu tả
giọng nói: một là, cao độ là một chỉ tố xác định nổi bật nhất của sự nổi trội
Nó thường được đo theo tỉ lệ, ví dụ, tần số dao động của thanh quản trong quá
Trang 32trình sinh âm, có thể được đo trực tiếp từ dạng sóng lời nói; và hai là, cường
độ, như một yếu tố xác định chính của cường độ lời nói nói chung Không thể
gộp các kiểu sinh âm (phonation modes) theo một cách hoàn toàn giống nhau, bởi vì mặc dù chúng có thể được phân loại một cách dễ dàng về mặt thính giác, nhưng chúng nằm trong mối quan hệ phức tạp hơn nhiều, gián tiếp hơn
và không nhất quán với các giá trị âm học khác nhau
"Cao độ là đại lượng cảm thụ, tương quan với tần số của sóng âm;
trong lời nói, cao độ tương quan với tần số thanh cơ bản của dây thanh" (định nghĩa của R L Trask trong Dictionary of Phonetics and Phonology, tr 278)
Cao độ thể hiện bằng vùng tần số cơ bản phản ánh những sự khác nhau
có tính chất sinh học về thanh quản, đặc biệt ở chiều dài và các cấu trúc cơ của các khe thanh ở nam giới, nữ giới và trẻ em Tần số càng lớn âm phát ra càng cao Một âm thanh có thể là tổ hợp của nhiều tần số, trong tiếng nói, tần
số cơ bản là đáp ứng của sự rung động các dây thanh âm, tần số cơ bản thường được ký hiệu là F0 Tần số cơ bản phụ thuộc vào khối lượng và sự căng của đôi dây thanh Dây thanh của phụ nữ, trẻ em thường mảnh hơn và căng hơn của đàn ông, người già do đó âm phát ra có tần số cao hơn Có một khoảng biến cá nhân khá rộng, tuy nhiên các vùng F0 chung đối với người nói tiếng Anh là:
1.3.4 Cường độ âm thanh
"Cường độ - trị số chỉ năng lượng sóng âm đạt được, đo bằng decibel Cường độ tương quan với đại lượng về mặt cảm thụ là độ vang (loudness)"
Trang 33(định nghĩa của R L Trask trong Dictionary of Phonetics and Phonology, tr 181)
Khi dao động trong quá trình truyền sóng, sóng âm tạo ra một áp lực lên không khí Để đo áp lực âm thanh, người ta dùng công thức:
P (áp lực) = F(lực) /A (diện tích)
Đơn vị của áp lực là Pascal (Pa) hoặc Newton trên diện tích 1 mét vuông (N/m2) Nhưng áp lực âm thanh tác động vào tai người nghe chỉ là rất nhỏ, do vậy người ta không sử dụng các đơn vị Pa hay N/m2 mà lập ra một hệ
đo cường độ âm thanh tương ứng với áp lực âm thanh theo tỉ lệ logarit 1:10 được gọi là hệ đo Bel Nguyên tắc của hệ này là: nếu áp lực tăng lên 10 lần so với áp lực ban đầu thì giá trị của cường độ âm thanh tăng lên 1 Bel (tương tự:
áp lực tăng 100 lần bằng cường độ 2 Bel; 1000 lần bằng 3 Bel…) Trong thực
tế, người ta thường dùng đơn vị Decibel (1dB = 1/10 Bel)
Cường độ của âm thanh không ảnh hưởng đến những đặc điểm về phẩm chất, tức về âm sắc của nguyên âm Cường độ của nguyên âm tùy thuộc trước hết vào mức độ to nhỏ của toàn câu nói, ngoài ra cũng tùy thuộc vào vị trí của nguyên âm đối với trọng âm từ và trọng âm câu Nếu trọng âm là trọng
âm lực thì nguyên âm có trọng âm sẽ mạnh hơn nguyên âm không có trọng
âm, và ngược lại Ngoài ra, cường độ của nguyên âm còn gắn liền với phẩm chất của nó; chẳng hạn các nguyên âm hẹp thường yếu hơn nguyên âm rộng
Sự khác nhau về cường độ bao giờ cũng do những nhân tố bên ngoài nào đó gây nên và bao giờ cũng lệ thuộc vào những nhân tố đó, cho nên nó không có giá trị âm vị học được Không có một ngôn ngữ nào mà trong đó một đôi âm
vị nguyên âm lại chỉ khu biệt với nhau về cường độ Cường độ không phải trước sau như một trong suốt thời gian phát âm nguyên âm, nhưng phần nhiều
sự thay đổi cường độ lệ thuộc vào những điều kiện nhất định (vị trí của nguyên âm so với trọng âm, sự tiếp cận với các loại phụ âm khác nhau…)
Trang 34Song cũng có những ngôn ngữ trong đó sự thay đổi về cường độ ở bên trong nguyên âm có một tính chất độc lập.
Nghiên cứu cường độ là một công việc không đơn giản nhưng có thể thực hiện bằng những phương pháp ngữ âm học thực nghiệm Trên quan điểm ngữ âm học chỉ cần khảo sát cường độ tương đối Nghiên cứu cường độ tương đối là xác định xem nguyên âm nào trong từ mạnh hơn nguyên âm nào yếu hơn
1.3.5 Trường độ âm thanh
Là độ dài của âm thanh hay nói cách khác là thời gian diễn ra dao động sóng âm từ lúc bắt đầu đến khi kết thúc tạo nên sự tương phản giữa các bộ phận của lời nói Nó là yếu tố tạo nên sự đối lập giữa nguyên âm này với nguyên âm khác trong một số ngôn ngữ Đơn vị đo trường độ tính bằng mili giây (1 ms = 1/1000s) Không có quy luật chung về trường độ tất yếu cho mọi ngôn ngữ Quy luật duy nhất có thể được xem là phổ biến đó là trường độ của nguyên âm phụ thuộc vào nhịp điệu nói Đối với mỗi ngôn ngữ trường độ trung bình của một nguyên âm ở một vị trí nhất định là một đại lượng ít nhiều
cố định Trường độ thường lệ thuộc vào những điều kiện ngữ âm học, hay nói cách khác là phụ thuộc vào vị trí ngữ âm học Trường độ trong âm tiết khép
và trong âm tiết mở nhiều khi khác nhau, nó cũng có thể phụ thuộc vào tính chất của phụ âm đi sau (tắc, xát, hữu thanh, vô thanh), vào số lượng phụ âm đi sau, vào vị trí của trọng âm và vào số âm tiết có trong từ Ngoài ra, trường độ của nguyên âm cũng lệ thuộc một phần vào phẩm chất của nó
1.4 Đặc trưng cấu âm của nguyên âm và phụ âm
Để tạo ra một âm bất kì thì phải cần có một nguồn năng lượng nhất định nào đó Đối với lời nói, đó là luồng không khí để tạo sản các âm, còn thể tích
và áp suất của không khí sẽ quyết định trường độ (duration) và độ lớn (loudness) của âm tạo ra Đại đa số các âm thanh lời nói đều sử dụng luồng
Trang 35không khí từ phổi phục vụ cho hoạt động này Hệ thống hô hấp được xem là nguồn năng lượng, còn phổi tạo thành hồ chứa khí Các cánh phổi thường bị nén bởi nhiều lực hô hấp khác nhau, và khi bị nén lại, không khí sẽ thổi ra, và hoạt động này đều đặn có chu kì, hoặc siết, hoặc tắc hoàn toàn luồng không khí này, và tất cả đều tạo ra ở trong chuỗi âm liên tục mà chúng ta xác định với tư cách như là một chuỗi các âm lời nói.
Luồng không khí có thể bị gián đoạn một cách có chu kì bởi các dây thanh, được định vị trên lối thoát không khí ở bên trên phổi và tạo thành một
bộ phận của cấu trúc nắp thanh quản Khi luồng không khí từ phổi đi qua khí quản bị chặn lại bởi hai dây thanh đóng, áp suất khí dưới chúng tăng lên Áp suất này nhanh chóng đẩy hai dây thanh tách ra Khi không khí đi qua khe thanh, áp suất khí cục bộ lúc đó giảm xuống và các dây thanh lại khép lại Vì vậy không khí được giải phóng thành các đợt ngắn có chu kì Quá trình rung
động của khe thanh này, được gọi là sinh âm (phonation), giống như quá
trình tạo ra tiếng ồn khi bạn bơm một chiếc khinh khí cầu, kéo dài cổ ra thành một kẽ hở hẹp, và cho không khí thoát ra Các đợt hơi được tạo thành do sự rung động của khe thanh diễn ra với một tần số hay tỉ lệ xác định Tần số này
có thể thay đổi và được xác định bởi các lực cơ điều khiển độ căng của các dây thanh và bởi áp suất không khí ở phía dưới dây thanh Tần số này được
tiếp nhận là cao độ (pitch) của giọng nói Các âm được tạo ra theo cách này,
với luồng không khí đi ra từ phổi đi qua các khe thanh đang rung động, bao gồm tất cả các nguyên âm và các âm giống nguyên âm
Ở các nguyên âm, các dây thanh rung động như đã mô tả, giải phóng một chuỗi các đợt không khí ra ngoài Ngạc mềm (mà trong trạng thái thở im lặng bình thường thường rủ xuống cho phép luồng không khí tự do đi qua khoang mũi và các lỗ mũi) được nâng lên, vì trong suốt quá trình nói nó thường ngăn cản hoặc giảm luồng không khí đi vào khoang mũi Luồng không khí vì thế đi
Trang 36qua họng (khoang họng) và miệng (khoang miệng) Hình dáng, hay các thuộc tính cộng hưởng của hai khoang này được điều khiển bởi vị trí của lưỡi, độ
mở của hàm, và hình dáng của đôi môi Vì vậy, đối với [i:] trong từ heed lưỡi
sẽ đẩy về phía trước và được nâng lên đến khu vực ngay dưới ngạc cứng,
trong khi đó hai môi lại nhành ra Đối với [a:] trong từ hard lưỡi lại ở tư thế
tương đối trung hoà hoặc hơi rụt lại phía sau một tí chút trên sàn miệng, hàm
mở hơn so với [i:], còn môi mở ra ở một tư thế trung hoà hoặc tự nhiên Đối
với [:] trong từ hoard, lưỡi rụt lại, chỗ lưỡi phồng lên được nâng lên về phía
ngạc mềm, và hai môi tròn lại Mỗi một trong số ba vị trí cấu âm này làm thay đổi thể tích và hình dạng của các khoang họng và miệng, và mỗi vị trí đều có các thuộc tính cộng hưởng đặc trưng riêng của mình Âm được phát ra bởi các đợt không khí từ các khe thanh rung động sẽ bị thay đổi bởi các thuộc tính cộng hưởng này, với kết quả là mỗi một âm nguyên âm đều có một chất lượng riêng Mọi người có thể cảm thấy một cái gì thay đổi về cấu âm nếu muốn nói một trong ba âm nguyên âm này trong khi đó tập trung để ý đến vị trí của lưỡi, hàm và hai môi; cũng có thể thay đổi các hiệu ứng cộng hưởng của một khoang bằng cách phát ra một nguyên âm [a:] trong khi khum hoặc không khum tay xung quanh hai môi Các nguyên âm và các âm giống nguyên âm được tạo thành bằng cách thay đổi hình dạng của các khoang họng và miệng, nhưng không có một sự tắc hoặc sự cản trở nào đối với luồng không khí Bên cạnh đó, kích cỡ và hình dáng của bộ máy phát âm có thể bị thay đổi, về cơ bản hoạt động định vị của lưỡi và hai môi; khi bộ máy phát âm bị thay đổi thì chất lượng âm tiếp nhận của các âm nguyên âm cũng bị thay đổi theo Vì vậy, hai hoạt động phát âm cơ bản nhất trong khi tạo ra các âm nguyên âm khác nhau là hình dáng và vị trí của lưỡi xác định hình dáng khoang miệng và khoang họng, còn hai môi điều khiển hình dáng và khu vực thuộc phía trước
Trang 37của bộ máy phát âm Sự chúm môi cũng cung cấp một phương tiện mở rộng chiều dài chung của bộ máy phát âm.
Đặc trưng cấu âm của phụ âm được tạo ra do cơ chế luồng hơi từ hầu sử dụng luồng hơi phía trên dây thanh Dây thanh khép lại, và thanh quản bị di chuyển lên trên và xuống dưới họng, dưới sự điều khiển của các cơ thanh quản ngoài, để tạo ra luồng hơi Vì dây thanh bị khép lại, cho nên không khí phía dưới hầu không có liên quan và thanh quản hoạt động giống như một đầu mút hay quả nén trong cái xi lanh Nếu thanh quản di chuyển lên phía trên theo cách này, nó có thể tạo ra luồng hơi thở ra từ họng; và khi di chuyển xuống phía dưới, nó lại tạo ra một luồng hơi hít vào từ họng Các âm thở ra từ
họng thường được biết đến là các âm bật, và đôi khi được gọi là “các âm tắc
thanh hầu hoá” (glottalized stops) Sự dịch chuyển lên phía trên của thanh
quản, với dây thanh khép lại, nén không khí ở phía trên lại và làm cho luồng khí đi ra Chúng ta có thể phát âm các âm như vậy bằng cách lấy hơi và cứ giữ như thế, sau đó phát âm các âm [p, t, k] hoặc [s] mà không mở khe thanh, chỉ dùng luồng hơi bị nén lại bằng cách nâng thanh quản lên
Ngoài ra, các âm phụ âm còn được tạo ra bằng cách sử dụng các khả năng cấu âm của lưỡi, răng và môi theo cách luồng không khí đi qua khoang miệng sẽ bị siết lại một cách đột ngột hoặc tạm thời bị cản trở hoàn toàn
Ví dụ, âm [b] của từ bạn, được coi là một âm tắc (stop), được phát ra như
tên gọi của nó nhằm chỉ sự tắc nghẽn có tính chất chuyển tiếp của luồng hơi Ở
âm này, ngạc mềm được nâng lên để ngăn không cho không khí đi qua khoang mũi, hai môi được khép lại trong một khoảng thời gian ngắn ngủi, và trong khi khép, áp suất không khí tăng lên ở các khoang họng và miệng Hai môi khi đó được tách ra, giải phóng áp suất khí ở phía sau chúng và cho phép luồng không khí bình thường đối với nguyên âm đi sau Âm điển hình của hành động cấu
âm này phần lớn là do những thay đổi nhanh chóng ở các thuộc tính cộng
Trang 38hưởng của khoang miệng trong suốt khoảng thời gian rất ngắn từ điểm mà hai môi bắt đầu mở đến điểm khi hoạt động cấu âm nguyên âm bình thường đã bắt đầu.
Các âm nguyên âm khác phụ thuộc vào sự cản trở đột ngột của luồng hơi
ở trong khoang miệng, chứ không phải là sự cản trở có tính chất chuyển tiếp
Vì vậy [l] ở trong từ linh được tạo ra bằng cách giữ cho đầu lưỡi tì vào lợi
ngay sau răng trước và cho luồng hơi đi chệch về một bên hoặc cả hai bên
lưỡi Những âm như thế được gọi là các âm bên Hoạt động cấu âm này có
các thuộc tính cộng hưởng xác định rất riêng của mình tạo ra một chất lượng nguyên âm đặc trưng
Tất cả các âm được nhắc đến cho đến nay đều phụ thuộc vào luồng hơi
đi qua khoang họng và khoang miệng Có thể làm cản trở khoang miệng, sao
cho không khí thổi qua khoang họng và khoang mũi, như ở âm [m] của từ ma
Các phụ âm mũi kiểu như vậy được tạo ra với ngạc mềm hạ thấp xuống để cho luồng hơi đi qua đường mũi, và với khoang miệng bị ngăn chặn trong suốt khoảng thời gian phát âm phụ âm Trong hoạt động này, khoang họng và khoang mũi mở, khoang miệng đóng tất cả đều tham gia vào các thuộc tính cộng hưởng của âm
Tuy nhiên, có một cách khác tạo ra các âm phụ âm bằng cách đặt các cơ quan cấu âm theo cách sao cho tạo ra một chỗ xát hoặc sự hỗn loạn Ví dụ
đơn giản nhất về một phụ âm xát là [h] như trong từ họ Ở âm xát này, sự hỗn
loạn xảy ra ở cả khi mở khe thanh và suốt trên đường thoát không khí và các khoang mà không khí đi qua Tuy nhiên, ở hầu hết các âm xát, âm được tạo ra bởi sự hỗn loạn không khí tại một điểm xác định nào đó Vì thế âm [v] trong
từ viên được tạo ra với môi dưới hơi tì vào mép hàm răng trước phía trên, sao
cho sự hỗn loạn xảy ra khi không khí bị đẩy ra
Trang 39Ở hầu hết các âm mà đã nhắc đến cho đến nay, sự rung động của các dây thanh đều diễn ra liên tục trong suốt quá trình phát âm âm đó Tất cả các âm
như vậy được gọi là hữu thanh Nhưng một số âm là vô thanh; chúng đều sử
dụng các kiểu dáng cấu âm hoàn toàn giống như đã miêu tả đối với các âm hữu thanh nhưng luồng hơi bị ngắt quãng, vì các dây thanh không rung động Hiện tại có nhiều đợt không khí không có chu kì hoạt động với tư cách như một nguồn âm, và chỗ tắc hoặc chỗ ngắt ở một vị trí nào đó trong lối thoát không khí và các khoang phía trên thanh quản trở thành nguồn âm Ở một âm xát vô
thanh, chẳng hạn như âm [f] trong từ phố, sự hỗn loạn sinh ra khi môi dưới hơi
tì vào mép hàm răng trước phía trên là nguồn âm Vì vậy, các âm xát có thể là
vô thanh hoặc hữu thanh, và âm [f] vô thanh là âm giống hệt với âm [v] hữu thanh, vốn sử dụng cả rung động của khe thanh lẫn sự hỗn loạn được sinh ra do
tắc nghẽn cục bộ So sánh các từ phố và vố, trong đó nét khu biệt chính là hữu
thanh, hay rung động dây thanh, trong suốt quá trình phát âm âm [v]
Các âm tắc cũng có tính chất vô thanh nếu rung động dây thanh không bắt đầu cho đến khi bắt đầu sự giải phóng sự tắc nghẽn ở trong khoang miệng
Nét khu biệt chính giữa các âm đầu ở trong các từ pin và bin, khi được phát
âm, là ở chỗ ở từ đầu, rung động dây thanh bắt đầu sau khi hai môi đã bắt đầu tách ra, và ở từ sau, các khe thanh đã đang rung động khi hai môi tách ra Trong lời nói liên tục bình thường một số quá trình này diễn ra rất nhanh, và kết quả là có thể kết hợp với nhau Âm tạo ra có thể cho biết những thay đổi chất lượng nhanh chóng, và khía cạnh động lực học lời nói này cũng quan trọng trong việc cung cấp các dấu hiệu cho người nghe một chuỗi cố hữu các âm lời nói
Trang 401.5 Cấu trúc âm tiết tiếng Việt và mối quan hệ giữa các đơn vị đoạn tính và siêu đoạn tính trong âm tiết
1.5.1 Cấu trúc âm tiết tiếng Việt
Cho đến nay, trong phân tích ngữ âm tiếng Việt, có ít nhất là ba quan điểm khác nhau về cấu trúc nội tại của âm tiết Sau đây là phác họa các mô hình cấu trúc âm tiết:
1 Trong công trình nghiên cứu về tiếng Việt, Lê Văn Lý bàn về các
cách kết hợp của âm vị tiếng Việt thành những âm có ý nghĩa, tức là một âm tiết Và ông cho rằng có bốn loại âm tiết tiếng Việt như sau [73, tr 123]:
Chỉ có nguyên âm;
Nguyên âm + Phụ âm;
Phụ âm + Nguyên âm
Phụ âm + Nguyên âm + Phụ âm
Mặc dù thừa nhận rằng mỗi âm tiết tiếng Việt chỉ có thể mang một thanh (tr.126), tác giả vẫn cho rằng mỗi âm tiết tiếng Việt không thể có quá ba
âm vị vì ông cho rằng thanh chỉ là một yếu tố ngôn điệu như trong ngữ âm tiếng Ấn Âu, và do vậy không phải là một âm vị gắn liền với âm tiết Nói các khác, âm tiết tiếng Việt theo như mô tả của Lê Văn Lý chỉ gồm ba âm vị tuyến tính Vì lẽ đó chúng tôi xếp quan điểm của ông vào quan điểm mô tả theo cấu trúc CV hiểu theo nghĩa rằng quan điểm của tác giả là chỉ chú trọng đến các yếu tố tuyến tính mà bỏ ra ngoài các yếu tố phi tuyến tính: