lời gọi TAPI khác nhau tuỳ thuộc vào thiết bị mà từng lĩnh vực sủ dụng:+ Các thiết bị ñường truyền Line Devices : Là mô hình sử dụng ñường truyền vật lý ñiện thoại ñể gửi và nhận tiếng n
Trang 1Chương 7: Mô hình thiết kế của TAPI
Mô hình thiết kế TAPI ñược chia làm 2 lĩnh vực, mỗi lĩnh vực có các
Trang 2lời gọi TAPI khác nhau tuỳ thuộc vào thiết bị mà từng lĩnh vực sủ dụng:
+ Các thiết bị ñường truyền (Line Devices) : Là mô hình sử dụng ñường truyền vật lý ñiện thoại ñể gửi và nhận tiếng nói (voice) và dữ liệu giữa 2 ñịa ñiểm
+ Các thiết bị ñiện thoại (Phone Devices) : Là mô hình
ñể thực hiện và nhận cuộc các gọi
Lines
Trong TAPI, các thiết bị ñường truyền thực chất không phải là một ñường dây vật lý Nó như là một ñối tượng ñại diện cho 1 ñường dây vật lý Trong các hàm TAPI, một chương trình có thể nắm giữ nhiều thiết bị ñường truyền, mỗi thiết bị ñường truyền này kết nối tới một ñường dây vật lý
Ví dụ như một chương trình TAPI có thể ñược thiết kế ñể cung cấp voice (gọi ñiện thoại), fax, và liên kết dữ liệu cho người sủ dụng Ứng dụng sẽ ñịnh danh 3 thiết bị ñường truyền Một là ñể cho voice, một ñể truyền dẫn fax, một là ñể gửi và nhận dữ liệu thông qua một modem Nếu PC chỉ có một ñường truyền ñiện thoại vật lý, ứng dụng TAPI sẽ chia sẻ ñường tryền này cho cả 3 thiết bị ñường truyền ðiều này ñược gọi là qui hoạch ñộng ñường truyền (dynamic line mapping)
Trang 4Hình 2 2: Mô hình của TAPI
Vào mỗi thời ñiểm, ứng dụng TAPI sẽ khởi ñộng một thiết bị ñường truyền, nó sẽ yêu cầu ñường truyền vật lý Nếu ñường truyền vật lý chưa sẵn sàng, một thông báo sẽ ñược gửi trả về Trong một
số trường hợp, ví dụ như truyền dẫn fax, ứng dụng có thể “xếp hàng” các yêu cầu ñể xử lý dần dần
Nếu có 2 ñường truyền sẵn sàng, TAPI sẽ ñiều khiển chúng như chúng yêu cầu Nếu thiết bị ñường truyền thứ 3 lúc này cũng gửi yêu cầu thì ứng dụng TAPI sẽ nhận biết rằng không còn ñường truyền nào rỗi và sẽ thông báo cho người sử dụng biết
Phone
Mô hình này cho phép người lập trình dễ dàng tạo ra các
“máy ñiện thoại ảo” Ví dụ như 1 PC với 1 sound card, loa, và microphone có thể thực hiện ñược tất cả các chức năng của một ñiện thoại ñể bàn Những “ñiện thoại ảo” này cũng giống như các thiết bị ñường truyền, tức là không cần có sự tương quan 1-1 với ñường truyền vật lý Một PC có thể có nhiều thiết bị ñiện thoại, mỗi thiết
bị ñiện thoại có ñặc ñiểm riêng Khi “1 cuộc gọi thực sự” ñược yêu cầu, người sủ dụng có thể lựa chọn một trong các thiết bị ñiện thoại, gõ số ñiện thoại và sau ñó ứng dụng TAPI sẽ gán thiết bị ñiện thoại với một thiết bị ñường truyền sẵn có(sẵn sàng)
2 1 7 Cấu trúc các lớp của TAPI.
Trang 5Cấu trúc lớp của TAPI ñược gói gọn trong 5 phần :
LineApp, Line, Call, PhoneApp, Phone Chúng ñược mô tả như hình
vẽ dưới ñây:
Trang 6Hình 2 3: Cấu trúc các lớp Của TAPI
2 2 Công nghệ tổng hợp giọng nói.
2 2 1 Lịch sử.
Từ lâu trước khi kỹ thuật xử lý tín hiệu bằng thiết bị ñiện tử hiện ñại ra ñời, các nhà nghiên cứu giọng nói ñã cố gắng xây dựng các máy móc bắt chước giọng nói của người Các ví dụ ñầu tiên của các máy này ñược chế tạo bởi Gerbert ở Aurillac (1003, Albertus Magnus(1198–1280), và Roger Bacon (1214–1294) Năm
1779, nhà khoa học người ðan Mạch Christian Kratzenstein, lúc ñó làm việc tại Viện Hàn lâm Khoa học Nga, xây dựng một mô hình có thể bắt chước giọng nói người với năm nguyên âm ([a], [e], [I], [o]
và [u])
Năm 1961, nhà vật lý học John Larry Kelly, Jr dùng máy tính IBM 704 ñể tổng hợp giọng nói, ñây là sự kiện ñáng nhớ trong lịch
sử của phòng thí nghiệm Bell Máy ghi âm và tổng hợp giọng nói của Kelly tạo ra bài hát Daisy Bell, với âm nhạc phụ họa bởi Max Mathews Vào lúc trình diễn, Arthur C Clarke ñang thăm Ta
Trang 7và ñồng nghiệp John Pierce ở khu thí nghiệm Bell ở Murray Hill Clarke ñã bị ấn tượng mạnh bởi trình diễn của máy phát âm và ñã dùng hình ảnh này trong tiểu thuyết và kịch bản phim của ông 2001:
A Space Odyssey, [1] trong ñó máy tính HAL 9000 hát cùng bài hát khi nó
Trang 8sắp bị nhà du hành vũ trụ Dave Bowman ñặt vào trạng thái ngủ [2] Công nghệ tổng hợp giọng nói ñã tiến hóa nhanh kể từ ñó Hiện nay có hàng trăm hệ thống tổng hợp giọng nói, thương mại cũng như
tự do (xem liên kết ngoài) Tuy ñã ñạt ñược thành tựu trong tổng hợp giọng nói bằng kỹ thuật ñiện tử, các nghiên cứu vẫn ñang ñược tiến hành ñể tạo ra bộ tổng hợp giọng nói cơ học, mô phỏng thanh quản của người, dùng trong robot dạng người Các bộ tổng hợp giọng nói ñiện tử bị giới hạn bởi chất lượng của loa, bộ phận cuối cùng tạo ra âm thanh, dù tín hiệu ñiện tử có hoàn hảo Có hy vọng rằng bộ thanh quản cơ khí có thể tạo ra giọng nói chuẩn hơn loa thông thường
2 2 2 Khái Niệm.
Trên máy tính, tổng hợp giọng nói là việc tạo ra giọng nói của người từ ñầu vào là văn bản hay các mã hóa việc phát âm Hệ thống thực hiện việc này còn gọi là máy tổng hợp giọng nói, có thể là hệ thống phần mềm hoặc phần cứng Hệ thống này còn ñược gọi là văn bản-sang-tiếng nói (text-to-speech, TTS); tuy rằng không phải hệ thống tổng hợp giọng nói nào cũng có ñầu vào là văn bản (nhiều hệ thống thu nhận mã hóa cách phát âm, ví dụ mã IPA, như ñầu vào) Các hệ thống này có nhiều ứng dụng Ví dụ như hệ thống này có thể giúp người khiếm thị nghe ñược máy ñọc ra văn bản; ñặc biệt là các văn bản có thể xử lý trên máy tính Hệ thống như vậy có thể lắp ñặt trong phần mềm xử lý văn bản hay trình duyệt mạng
Trang 9Hình 2.4 Mô hình hệ thống mã hóa giọng nói.
2 2 3 Tổng quan.
Trang 10Một máy tổng hợp giọng nói bao gồm hai phần: ngoại diện và hậu trường Phần ngoại diện nhận ñầu vào ở dạng văn bản rồi cho ñầu ra là thể hiện biểu tượng ngôn ngữ của văn bản (tức là một cách mã hóa cách phát âm văn bản) Phần hậu trường nhận lấy thể hiện biểu tượng ngôn ngữ như ñầu vào và cho ra giọng nói tổng hợp ở dạng sóng âm thanh
Phần ngoại diện có hai nhiệm vụ chính Trước tiên, nó nhận văn bản và chuyển ñổi các ký tự như các chữ số hay cách viết tắt thành dạng viết ñầy ñủ Quá trình này gọi là chuẩn hóa văn bản, hay tiền xử lý Sau ñó nó cho ra mã phát âm ứng với từng từ, rồi phân chia và ñánh dấu văn bản thành từng ñoạn văn, nhóm từ, mệnh ñề, hay câu văn Quá trình chuyển văn bản sang mã phát âm ñược gọi là văn bản-sang-âm vị Kết hợp mã phát âm và thông tin ñoạn văn tạo nên ñầu ra cuối cùng thể hiện biểu tượng ngôn ngữ Phần hậu trường, nhận lấy thể hiện biểu tượng ngôn ngữ rồi chuyển nó thành âm thanh Phần này thường ñược gọi là máy tổng hợp Có nhiều kỹ thuật tổng hợp, ñược
mô tả bên dưới