3 Mục tiêu của đề tài Xây dựng một ứng dụng thử nghiệm nhận dạng tiếng nói tiếng Việt.. 5 Mô hình tổng quát của ứng dụng Giao tiếp Nhận dạng Xử lý Tổng Voice Server... 9 Kiến tr
Trang 22
Nội dung
Mục tiêu của đề tài
Demo
Trang 33
Mục tiêu của đề tài
Xây dựng một ứng dụng
thử nghiệm nhận dạng
tiếng nói tiếng Việt
Thông qua xây dựng một
Voice Server nhằm cung
cấp thông tin chứng khoán
qua mạng điện thoại
Trang 44
Nội dung
Mục tiêu của đề tài
Mô hình tổng quát của ứng dụng
Demo
Trang 55
Mô hình tổng quát của ứng dụng
Giao tiếp
Nhận dạng
Xử lý
Tổng
Voice Server
Trang 66
Hoạt động
Giao tiếp
Nhận dạng
Thông tin:wav
Trang 77
Nội dung
Mục tiêu của đề tài
Nhận dạng
Demo
Trang 99
Kiến trúc tổng quát
Kiến trúc tổng quan của một hệ thống nhận dạng tiếng nói điển hình
Trang 1010
Kiến trúc tổng quát (tt)
Bộ trích đặc trưng : thực hiện rút trích đặc trưng từ tín hiệu âm thanh trước khi đưa vào nhận dạng
Mô hình ngữ âm : liên quan đến
việc biểu diễn tri thức cho tín
hiệu ngữ âm, âm vị, ngữ
điệu…
Mô hình ngôn ngữ : liên quan đến việc biểu diễn tri thức của các từ, chuỗi từ, hình thành nên câu
Trang 12Trích đặc trưng
12
Các bước rút trích đặc trưng MFCC từ tín hiệu âm thanh
MFCC: Mel-Frequency Cepstral Coefficients
Mục tiêu của bộ trích đặc trưng là tham số
hoá tín hiệu tiếng nói thành chuỗi vector đặc
trưng, chứa thông tin liên quan đến âm
thanh của câu nói.
Trang 14Mô hình ngữ âm
14
Mô hình ngữ âm dựa trên HMM biểu diễn cho từ “kiếng”
Mô hình hóa cách phát âm và ngữ
điệu của các vị, âm tiết, các từ v.v…
Có 2 hướng tiếp cận chính để xây
Trang 16trong danh sách các ứng viên chọn
lọc được bởi tiến trình nhận dạng.
Trang 20Hướng nghiên cứu và kết quả
Thử nghiệm ba mô hình ngữ âm:
Mô hình tổng quát (Mô hình 0):
Mô hình ESAT SPRAAK
Mô hình cải tiến thứ 1 (Mô hình 1):
Thay đổi mô hình ngữ âm và từ điển phát âm.
Mô hình cải tiến thứ 2 (Mô hình 2):
Thay đổi từ điển phát âm
20
Trang 21Mô hình tổng quát (Mô hình 0)
21
Các thành phần và cơ chế hoạt động của ESAT SPRAAK
Trang 22Mô hình cải tiến thứ 1 (Mô hình 1)
22
Mô hình cải tiến thứ 1
Trang 23Mô hình cải tiến thứ 1 (Mô hình 1)
23
Mô hình cải tiến thứ 2
Trang 24Thực nghiệm
Dữ liệu chuẩn bị cho quá trình huấn luyện:
Dữ liệu chuẩn bị cho quá trình test:
Trang 2626
Nội dung
Mục tiêu của đề tài
Tổng kết
Demo
Trang 28Nội dung
Mục tiêu của đề tài
Demo
Trang 29Demo
29
Trang 30Kết thúc
30
0612568 : Nguyễn Trần Vọng
0612481 : Trần Minh Trường
Trang 31Tham khảo
PaulTaylor, “Text-to-SpeechSynthesis”,University of Cambridge, 2006
Minghui Dong, Kim-Teng Lua, Haizhou Li, “A Unit Selection-based
Speech Synthesis Approach for Mandarin Chinese”
m
Bài báo cáo khóa luận năm 2009: “Tiếng nói phương nam” do nhóm
sinh viên Võ Quang Diệu Hà – Nguyễn Mạnh Tuấn thực hiện
Bài báo cáo khóa luận năm 2010: “Nghiên cứu và xây dựng hệ
thốngVoice Server ứng dụng trên các dịch vụ truy vấn thông tin qua
mạng điện thoại”do nhóm sinh viên Nguyễn Thị Mỹ Dung – Dương Chí
Trưởng thực hiện
Microsoft Platform SDK
31