• Tiếng nói tự nhiên ngoài thông tin ngữ nghĩa mà người nói muốn truyền đạt thông tin có thể ghi lại dưới dạng chữ viết còn chứa các thông tin như trạng thái tình cảm khi nói, hay những
Trang 1Nhóm báo cáo số 3
Thực hiện: Ngô Anh Tuấn
Ứng dụng:
Nhận dạng người nói
Trang 2• Tiếng nói tự nhiên ngoài thông tin ngữ nghĩa mà người nói muốn truyền đạt (thông
tin có thể ghi lại dưới dạng chữ viết) còn chứa các thông tin như trạng thái tình cảm khi nói, hay những thông tin riêng của giọng người nói…
• Các thông tin riêng biệt này được chia làm hai loại: mức cao và mức thấp.
Mức cao gồm các thông tin như phương ngữ, ngữ cảnh, phong cách nói…
Mức thấp là các thông tin như cao độ (pitch), trường độ…Các thông tin này không phải bất biến từ lúc người biết nói đến lúc già, nhưng nó có tính khá ổn định trong giai đoạn dài của cuộc đời
• Khi con người đã trưởng thành, những thói tật khi nói, những đặc trưng khu biệt trong cấu âm sẽ hình thành và mang tính ổn định cao Đây chính là cơ sở khoa
học cho việc xây dựng các hệ thống nhận dạng người nói
Cơ sở lý thuyết về nhận dạng người nói
Trang 3Phân loại bài toán nhận dạng tiếng nói
Định danh người nói (speaker identification):
kiểm tra xem người cần kiểm tra là ai, hay là không
có trong hệ thống
Xác thực người nói (speaker
verification): xác minh liệu người
đang nói có đúng là người mà máy
tính đã được biết trước hay không?
(tính xác thật của giọng nói)
Trang 4Phương pháp nhận dạng người nói
Nhận dạng phụ thuộc vào từ khóa
người nói với nội dung nói (mật khẩu)
Nhận dạng không phụ thuộc vào từ khóa
của người nói
Trang 5Nhận dạng người nói không phụ thuộc vào từ khóa
Tín hiệu đầu vào
Trích chọn đặc trưng
Mô hình người
nói
So khớp mẫu
Điều kiện quyết định
Cơ sở dữ liệu
Quyết định
Huấn luyện Xác th ực
ID người nói
Trang 6• Đặc trưng vật lý
1 Độ cao: Độ cao hay độ trầm bổng của âm thanh chính là tần số của sóng
cơ học của âm thanh Đối với tiếng nói, tần số dao động của dây thanh quy định độ cao giọng nói của con người.
2 Cường độ: Độ to nhỏ của âm thanh Trong tiếng nói cường độ của nguyên
âm phát ra thường lớn hơn của
phụ âm Do vậy chúng ta thường dễ phát hiện ra nguyên âm hơn là phụ âm.
Đặc trưng tiếng nói của người nói
Trang 7• Đặc trưng vật lý
3 Trường độ: Trường độ hay độ dài của âm phụ thuộc vào sự chấn động
lâu hay nhanh của các phần tử không khí
4 Âm sắc: Âm sắc là bản sắc, sắc thái riêng của âm Cùng một nội dung,
độ cao nhưng khi nói mỗi người có một âm vị khác nhau
Đặc trưng tiếng nói của người nói
Trang 8- Điều khiểu truy cập
Một vài ứng dụng của nhận dạng người nói
Trang 9- Nhận dạng tội phạm
Một vài ứng dụng của nhận dạng người nói
- Chứng thực giao dịch
Trang 10- Thu thập thông tin cá nhân
Một vài ứng dụng của nhận dạng người nói
- Hệ thống bán hàng gián tiếp (thu thập lại thông tin khách hàng)