TÍCH HỢP CÔNG CỤ NHẬN DẠNG TIẾNG NÓI VÀO CÁC HỆ THỐNG ĐIỀU KHIỂN TỰ ĐỘNG TÍCH HỢP NGƯỜI MÁY , CÁC THIẾT BỊ MÁY MÓC, PHƯƠNG TIỆN GIAO THÔNG... Nhận dạng giọng nóiO Nhận dạng giọng nói là
Trang 1TÍCH HỢP CÔNG CỤ
NHẬN DẠNG TIẾNG
NÓI VÀO CÁC HỆ THỐNG ĐIỀU KHIỂN TỰ ĐỘNG
(TÍCH HỢP NGƯỜI MÁY ,
CÁC THIẾT BỊ MÁY MÓC, PHƯƠNG TIỆN GIAO THÔNG)
Trang 2I Nhận dạng giọng nói
O Nhận dạng giọng nói là một quá trình nhận dạng mẫu, với mục đích là phân lớp (classify) thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu
đã được học trước đó và lưu trữ trong bộ nhớ
Trang 3Thuật ngữ nhận dạng giọng nói
O Voice recognition liên quan đến việc xác định giọng nói chính xác của một cá
nhân nào đó, tương tự một phương pháp nhận diện sinh trắc học
O Speech recognition là việc xác định những từ ngữ trong câu nói rồi dịch chúng
sang ngôn ngữ máy tính
Trang 42 Cách thức hoạt động
O Bộ chuyển đổi tín hiệu tương tự sang số (Analog-to-Digital
Converter, ADC) chuyển các sóng tương tự (analog) này thành dữ liệu mà máy tính có thể hiểu được.
Trang 5O Hệ thống thu thập các mẫu (hoặc số hóa) âm thanh bằng cách đo chính xác sóng âm ở các khoảng thời gian gần nhau, sau đó lọc âm thanh đã được số hoá để loại bỏ tiếng ồn, đôi khi tách chúng thành các dải tần số khác nhau
Trang 6O Tín hiệu được chia thành nhiều phần nhỏ (thời gian khoảng vài phần trăm giây, thậm chí là phần ngàn giây trong trường hợp có phụ âm cuối khó phân biệt như
"p" hoặc "t")
O Chương trình sau đó đặt những phần âm thanh này vào các âm vị có sẵn trong ngôn ngữ thích hợp
Trang 8Ứng dụng
O Đã có nhiều nghiên cứu về việc triển khai hoặc giới thiệu thành công những ứng dụng giọng nói Chúng có thể nhắc đến Ask.com, một dịch vụ cho phép người dùng hỏi và nhận câu trả lời, đã tích hợp công nghệ nhận dạng giọng nói do Nuance phát triển vào ứng dụng iOS và Android của mình Sự liên kết này cho phép người dùng hỏi, trả lời cũng như đăng tải các lời bình luận
Trang 9O Amazon cũng cập nhật app Kindle trên iOS để hỗ trợ tính năng VoiceOver trong iOS VoiceOver sẽ tự động đọc nội dung trên màn hình để giúp cho việc xem sách của những người bị khiếm thị được dễ dàng và thuận tiện hơn
O Và rồi chúng ta có Siri, Google Voice hay Cortana Đây đều là những ứng dụng được phát triển bởi các tập đoàn công nghệ lớn với tiềm lực mạnh mẽ và quy tụ nhiều nhân tài
Trang 103.Tác dụng
O Chuyển thành văn bản hoặc điều khiển máy là tác dụng phổ biến nhất của nhận diện giọng nói, tuy nhiên công nghệ này còn mang đến nhiều hứa hẹn cho người khuyết tật
Trang 114 Ưu, ngược điểm
O Ưu điểm:
- Khả năng truy cập
- Kiểm tra chính tả
- Tốc độ nhanh
O Nhược điểm:
- Thiết lập và "dạy“
- Chưa thực sự ổn định
- Kho từ vựng hạn chế
Trang 12II HỆ THỐNG ĐIỀU KHIỂN TỰ ĐỘNG
O Hệ thống điều khiển tự động (điều chỉnh tự động): Tập hợp tất cả các thiết bị kỹthuật, đảm bảo điều khiển hoặc điều chỉnh tự động một quá trình nào đó
Trang 13Ý nghĩa
O Đáp ứng của hệ thống không thõa mãn yêu cầu công nghệ
O Tăng độ chính xác
O Tăng năng suất
O Tăng hiệu quả kinh tế
Trang 14Sơ đồ tổng quát
O Trong đó: u(t) tín hiệu vào ;
O e(t) Sai lệch điều khiển ;
O x(t) Tín hiệu điều khiển ;
O y(t) Tín hiệu ra ;
O z(t) Tín hiệu phản hồi (hồi tiếp)
Trang 15Các bài toán cơ bản
O Phân tích hệ thống
O Thiết kế hệ thống
O Nhận dạng hệ thống
Trang 16Phân loại
O Dựa trên mô tả toán học của hệ thống
O Dựa trên số ngõ vào – ngõ ra hệ thống
O Theo chiến lược điều khiển
Trang 17Quá trình thiết lập một hệ thống điều khiển
O Bước 1: Chuyển đổi các yêu cầu kỹ thuật thành một hệ thống vật lý
O Bước 2: Vẽ sơ đồ khối chức năng
O Bước 3: Thiết lập sơ đồ nguyên lí
O Bước 4: Sử dụng sơ đồ nguyên lý thiết lập sơ đồ khối hoặc graph tín hiệu hoặc biểu diễn không gian trạng thái
O Bước 5: Rút gọn sơ đồ khối
O Bước 6: Phân tích và thiết kế
Trang 18Tích hợp nhận dạng tiếng nói vào điều khiển tự
động
O Mọi thứ không chỉ dừng ở việc điều khiển bằng cử chỉ, việc giao tiếp bằng
giọng nói với xe hơi cũng là công nghệ tuyệt vời để tích hợp.
Trang 19O Hệ thống Blue Link của Hyundai được tích hợp Google Maps vào tháng 1/2013
và tiếp theo là Siri thông qua công nghệ Eyes của Apple, cho phép tài xế có thể gọi điện, nhắn tin, mở nhạc mà không cần phải mất tập trung khi lái xe, tất cả đều được thực hiện qua giọng nói
O Trước đây Nuance Dragon Drive đã mang công nghệ nhận diện giọng nói lên xe hơi, ứng dụng này cho phép tài xế soạn tin nhắn, lấy thông tin giao thông và lộ trình thông qua tương tác giọng nói