MON HOC: XU LY TIENG NOI + m Mục địch: — Cung cap cho sinh viên những kiến thức cơ ban về lĩnh vực xử lý tiếng nói Giảng viên: Lễ Ba Dũng Địa chỉ: Khoa Công nghề Thông tin- Trường Đạ
Trang 1MON HOC: XU LY TIENG NOI
+
m Mục địch:
— Cung cap cho sinh viên những kiến thức cơ ban
về lĩnh vực xử lý tiếng nói Giảng viên: Lễ Ba Dũng
Địa chỉ: Khoa Công nghề Thông tin- Trường Đại
hoc Hang Hai Viet Nam- so 484 Lach Tray- Ngo
Quyen- Tp Hai Phong
Email: dungleba@gmail.com
Website khoa hoc:
— http://www.fit.vimaru.edu.vn/cntt/~dunglb/teaching/spee chprocessing08
Trang 2NOI DUNG CHINH
Giới thiệu vẽ xử ly tiếng nói
Các kiến thức cơ bản về xử lý tín hiệu số Cac mo hinh so cho tin hiệu tiếng nói
Cac mo hinh trong mién thoi gian cho xu lý tiếng noi
Biểu diễn số cho dạng sóng tiếng nói
Tổng hợp tiếng nói
Nhận dạng tiếng nói
Trang 3TAI LIEU THAM KHAO
=» Xuedong Huang, Alex Acero, Hsiao Wuen Hon,
Spoken Language Processing, Prentice Hall, 2001
» Lawrence R.Rabiner, Ronald W.Schafer, Digital Processing of Speech Signal, Prentice Hall, 1978
Trang 4Bài 1:
Giơi thiêu
ra tu bo may phat am cua con người
m Mục đích của tiếng nói là dùng để giao tiếp
Trang 5Quá trình giao tiếp bằng tiếng nói
ee
= Thông tin muốn trao đổi được chuyển thành
tạp hợp các tín hiệu nơron được dùng đề
điều khiến các bộ phận trong bộ máy phát
am (lưỡi, môi, họng, )
m Sự chuyển động của các bộ phận này tạo ra
một dãy các cử chi, kết qua của nó là sóng
am tương ứng mang thông tin cần trao đối
Trang 6` Thông tin được giao tiep thong qua tieng
nói có thể được biểu diễn bằng sự ghép nối nhieu thanh phan tu một tập hợp hữu hạn
cac ký hiệu
z Ký hiệu mà dựa vào đó mỗi âm thanh có
the mang y nghĩa được gọi là âm vị
m Mỗi ngôn ngữ có tập hợp các âm vi của
riêng nó, thông thường số lượng tư 30 đến
50
Trang 7Qua trinh xu ly tin hieu
5
INFORMATION SOURCE
ais
=
SIGNAL PROCESSING
SIGNAL REPRESENTATION
SIGNAL TRANSFORMATION
= AND UTILIZATION OF INFORMATION
Fig 1.1 General view of information manipulation and processing
Trang 8Qua trinh xu ly tin hiéu tiéng noi
ee
m Nguôn thông tin: người nói
a Luong gia: dang song của am thanh
m Biểu diễn tín hiệu: biểu diễn tín hiệu dưới
dạng số
m Biến đổi tín hiệu: chuyển tín hiệu sang một
dạng thịch hợp hơn
m Trích xuất và sử dụng thông tin: có thể
được thực hiện bởi người nghe hoặc may tự
9[9)816
Trang 9oe AZ
Cac ung dụng xử lý tiếng nó
SPEECH COMMUNICATION
APPLICATIONS
QUALITY IDENTIFICATION
1.4 Some typical speech communications applications
Trang 10i 4 od
i@ng noi
Cac ung dung xu ly t
T m Truyen va lưu trừ tiếng nói: mã hóa tiếng
nói (voice coder) Mục đích của mã hóa
tiếng nói là làm giảm thiểu băng thông cần
thiết để truyền tiếng nói
m Các hệ thống tổng hợp tiếng nói: các hệ
thống trả lời tự động bằng máy tính là các
hệ thông cung cap thong tin dang so tu động cho người sử dụng dười dạng tiếng nói
Trang 11a He thong định danh người nói: là các hệ
thong co kha nang xác định người đang truy
cạp hệ thống co hap le hay khong thong
qua tiếng nói của người đó
a Cac hệ thong nhận dạng tiếng nói: là các
ứng dụng chuyển đổi dạng sóng âm thanh
sang thông tin dạng viết tương đương
Trang 12m Nâng cao chất lượng tín hiệu: là các ứng
dụng như loại bỏ nhiều, loại bỏ tiếng vang trong tiếng nói