Hệ thống cung cấp thông tin qua mạng điện thoại và ứng dụng

3 Mục tiêu của đề tài  Xây dựng một ứng dụng thử nghiệm nhận dạng tiếng nói tiếng Việt.. 5 Mô hình tổng quát của ứng dụng Giao tiếp Nhận dạng Xử lý Tổng Voice Server... 9 Kiến tr

Trang 2

2

Nội dung

 Mục tiêu của đề tài

 Demo

Trang 3

3

Mục tiêu của đề tài

 Xây dựng một ứng dụng

thử nghiệm nhận dạng

tiếng nói tiếng Việt

 Thông qua xây dựng một

Voice Server nhằm cung

cấp thông tin chứng khoán

qua mạng điện thoại

Trang 4

4

Nội dung

 Mô hình tổng quát của ứng dụng

 Demo

Trang 5

5

Mô hình tổng quát của ứng dụng

Giao tiếp

Nhận dạng

Xử lý

Tổng

Voice Server

Trang 6

6

Hoạt động

Giao tiếp

Nhận dạng

Thông tin:wav

Trang 7

7

Nội dung

 Nhận dạng

 Demo

Trang 9

9

Kiến trúc tổng quát

 Kiến trúc tổng quan của một hệ thống nhận dạng tiếng nói điển hình

Trang 10

10

Kiến trúc tổng quát (tt)

 Bộ trích đặc trưng : thực hiện rút trích đặc trưng từ tín hiệu âm thanh trước khi đưa vào nhận dạng

Mô hình ngữ âm : liên quan đến

việc biểu diễn tri thức cho tín

hiệu ngữ âm, âm vị, ngữ

điệu…

Mô hình ngôn ngữ : liên quan đến việc biểu diễn tri thức của các từ, chuỗi từ, hình thành nên câu

Trang 12

Trích đặc trưng

12

Các bước rút trích đặc trưng MFCC từ tín hiệu âm thanh

MFCC: Mel-Frequency Cepstral Coefficients

Mục tiêu của bộ trích đặc trưng là tham số

hoá tín hiệu tiếng nói thành chuỗi vector đặc

trưng, chứa thông tin liên quan đến âm

thanh của câu nói.

Trang 14

Mô hình ngữ âm

14

Mô hình ngữ âm dựa trên HMM biểu diễn cho từ “kiếng”

 Mô hình hóa cách phát âm và ngữ

điệu của các vị, âm tiết, các từ v.v…

 Có 2 hướng tiếp cận chính để xây

Trang 16

trong danh sách các ứng viên chọn

lọc được bởi tiến trình nhận dạng.

Trang 20

Hướng nghiên cứu và kết quả

Thử nghiệm ba mô hình ngữ âm:

 Mô hình tổng quát (Mô hình 0):

Mô hình ESAT SPRAAK

 Mô hình cải tiến thứ 1 (Mô hình 1):

Thay đổi mô hình ngữ âm và từ điển phát âm.

 Mô hình cải tiến thứ 2 (Mô hình 2):

Thay đổi từ điển phát âm

20

Trang 21

Mô hình tổng quát (Mô hình 0)

21

Các thành phần và cơ chế hoạt động của ESAT SPRAAK

Trang 22

Mô hình cải tiến thứ 1 (Mô hình 1)

22

Mô hình cải tiến thứ 1

Trang 23

Mô hình cải tiến thứ 1 (Mô hình 1)

23

Mô hình cải tiến thứ 2

Trang 24

Thực nghiệm

 Dữ liệu chuẩn bị cho quá trình huấn luyện:

 Dữ liệu chuẩn bị cho quá trình test:

Trang 26

26

Nội dung

 Tổng kết

 Demo

Trang 28

Nội dung

 Demo

Trang 29

Demo

29

Trang 30

Kết thúc

30

0612568 : Nguyễn Trần Vọng

0612481 : Trần Minh Trường

Trang 31

Tham khảo

 PaulTaylor, “Text-to-SpeechSynthesis”,University of Cambridge, 2006

 Minghui Dong, Kim-Teng Lua, Haizhou Li, “A Unit Selection-based

Speech Synthesis Approach for Mandarin Chinese”

m

 Bài báo cáo khóa luận năm 2009: “Tiếng nói phương nam” do nhóm

sinh viên Võ Quang Diệu Hà – Nguyễn Mạnh Tuấn thực hiện

 Bài báo cáo khóa luận năm 2010: “Nghiên cứu và xây dựng hệ

thốngVoice Server ứng dụng trên các dịch vụ truy vấn thông tin qua

mạng điện thoại”do nhóm sinh viên Nguyễn Thị Mỹ Dung – Dương Chí

Trưởng thực hiện

 Microsoft Platform SDK

31

Định dạng
Số trang	32
Dung lượng	1,04 MB