Bai 3: ' TA Kiến trúc hề thống ngồn ngữ nói a Xu ly ngoOn ngữ nói liên quan đến các kỹ thuật như: - Nhận dạng tiếng nói: chuyển nội dung tiếng nói thanh văn bản tương ứng — Đọc n
Trang 1Bai 3:
' TA
Kiến trúc hề thống ngồn ngữ nói
a Xu ly ngoOn ngữ nói liên quan đến các kỹ
thuật như:
- Nhận dạng tiếng nói: chuyển nội dung tiếng nói
thanh văn bản tương ứng
— Đọc nội dung văn bản: chuyển nội dung văn bản
sang tiếng nói tương ứng
— Hiểu ngôn ngữ nói: chuyển nội dung van ban thành hành động tương ứng để hệ thống thực
hiện
Trang 2=» BO nao cua ngudi noi quyet dinh day cac tu
cần nói W
m Tin hiệu aslo được chuyển qua một kênh giao tiếp có nhiều solu bộ máy phát âm để sinh ra sóng tiếng nói
m BỘ giải mã tiếng nói có nhiệm vụ giải mã tin hiệu âm học X thành chuỗi từ W“ sao cho W' gan giống nhất với chuốõi tử ban đầu W
Trang 3me A’
Tu dong nhan dang tiéng no
Communication Channel
Text (Generator
Figure 1.1 A source-channel model for a speech recognition system [15]
Speech Recognizer
Trang 4a Mot he thong nhan dang tiéng noi thong
thưởng trong thực tế bao göm các thành phan:
— Các mô hình ngữ âm: biểu diễn tri thức về ngữ
am, ầm vi, tác động của nhiều, cách phát am
của nhiều người nói khác nhau
— Các mồ hình ngồn ngữ: bao gồm tri thức vẽ các
thanh phân cầu tạo nên từ ngữ, đặc điểm cua tu ngữ
Trang 5m Bộ xử lý tín hiệu trích xuất các đặc điểm
quan trọng cho bộ giải mã
m BỘ gial mã sử dụng cả mö hình ngữ ảm và
ngôn ngữ để sinh ra chuỗi các từ có khả năng đúng nhất với các đặc điểm được đưa
VaO
Trang 6
Ù
Decoder
a
s
s
%
9
*
Figure 1.2 Basic system architecture of a speech recognition system [1 2]
Trang 7Chuyển đổi văn bản thành tiếng nói
ee
m Hệ thống chuyển văn bản thành tiếng nói
(Text-to-Speech) là một hệ thống có thể
sinh ra tiếng nói gân giống với con người từ cac van bản được đưa vào (còn được gọi là
hệ thống tổng hợp tiếng nói)
m Sự chuyển đổi các từ dưới dạng viết sang
tiếng nói là một công việc khó khan vị hệ thong TTS can du liéu tu vung rat Ion va nhiêu ngữ điệu của âm thanh
Trang 8Cac thành phần co ban cua mot hé thong TTS
ee
m Bộ phân tích văn bản: chuẩn hóa văn bản
sang dạng thịch hợp cho hệ thống TTS
m Bộ phân tích ngữ âm chuyển đổi văn bản đã
được xử ly thanh dãy các am tương ứng sau
đó được phân tích ngữ điệu để xác định trọng âm, ngất nhịp, thời gian,
m Cuối cùng, bộ tổng hợp tiếng nói nhận các
tham so dau vao tu day am vi da xu ly day
đủ
Trang 9TTS Engine
Text Analysis
Document Structure Detection Text Normalization
tagged text
Phonetic Analysis
Grapheme-to-Phoneme Conversion
tagged phones
Prosodic Analysis
Pitch & Duration Attachment
controls
Speech Synthesis
V ose Rendermeg
Figure 1.3 Basw system architecture ol a TT Ssvstem
Trang 10Hệ thống hiểu ngôn ngữ nói
ee
m Một hệ thống hiểu ngôn ngữ nói có kha
năng hiếu được lời nói và thực hiện hành
động tương ứng
m Hệ thống hiểu ngôn ngữ nói thông thường
gom bo phan nhận dạng tiếng nói và bộ
phận tổng hợp tiếng nói
a Thanh phan phiên dịch câu nói có chức
năng chuyển đổi kết quả nhận dạng tiếng
nói sang dạng ngữ nghĩa được quy ước
Trang 11m Thanh phan quan ly hội thoại có chức nắng
giao tiếp với các ứng dụng và các thành phân khác trong hệ thống
Trang 12
Application
y
Response Generation | Sentence Interpretation
Y
: Text-To-Speech