Với sự phát triển nhanh chóng về kỹ thuật và công nghệ, các thiết bị di động ngày càng trở nên “thông minh” hơn smart phone và được trang bị thêm nhiều tính năng tiện ích như Camera, Mic
Trang 1ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
FOG
BÁO CÁO TỔNG KẾT KẾT QUẢ
ĐỀ TÀI KHCN CẤP TRƯỜNG
Tên đề tài:
Xác thực người dùng dựa trên sinh trắc học
cho thiết bị di động thông minh
Mã số đề tài: T-KHMT-2013-21
Thời gian thực hiện: 5/2013 đến 5/2014
Chủ nhiệm đề tài: ThS Trương Quỳnh Chi
Cán bộ tham gia đề tài:1 ThS Đặng Trần Trí
2 ThS Nguyễn Ngọc Thiên An
3 ThS Nguyễn Thị Ái Thảo
Thành phố Hồ Chí Minh – Tháng 6 /2014
Trang 2Mục lục
I GIỚI THIỆU ĐỀ TÀI 4
II MỤC TIÊU CỦA ĐỀ TÀI 5
III TÓM TẮT NỘI DUNG CỦA ĐỀ TÀI 5
3.1 Nội dung 1: 5
3.2 Nội dung 2: 6
3.3 Nội dung 3: 6
IV NỘI DUNG THỰC HIỆN 7
4.1 Tìm hiểu về xác thực dựa trên sinh trắc học (biometrics) 7
4.1.1 Xác thực 7
4.1.2 Sinh trắc học 7
4.1.3 Phân loại các đặc điểm sinh trắc học 8
4.1.4 Phân loại hệ thống xác thực sinh trắc học 9
4.1.5 Xác thực dựa trên sinh trắc học trên thiết bị di động 10
4.1.6 Xác thực khuôn mặt bằng phương pháp PCA 10
4.1.7 Xác thực giọng nói bằng MFCC 12
4.2 Thiết kế và hiện thực hệ thống 17
4.2.1 Thiết kế hệ thống 17
4.2.2 Hiện thực hiện thống 20
4.2.3 Giao diện hệ thống 23
4.3 Đánh giá hệ thống 25
4.3.1 Tỉ lệ chấp nhận sai và Tỉ lệ từ chối sai 25
4.3.2 Tập dữ liệu 26
4.3.3 Kết quả 26
V CÁC KẾT QUẢ ĐẠT ĐƯỢC CỦA ĐỀ TÀI 29
VI KẾT LUẬN VÀ KIẾN NGHỊ 29
Trang 3Danh sách các cán bộ tham gia thực hiện đề tài
Trang 4I GIỚI THIỆU ĐỀ TÀI
Theo thống kê của Micro Trax [1], cứ mỗi phút trôi qua, có 113 điện thoại bị mất hoặc bị đánh cắp tại cắp tại Mỹ, tức khoản gần 60 triệu điện thoại bị mất hoặc bị đánh cắp mỗi năm Một con số khổng lồ đối với đất nước tiến bộ có đến 96% dân số sử dụng điện thoại (thống kê của Lockout Mobile Security [2]) và cung cấp nhiều dịch vụ tiện ích trên di động Điều đáng nói là điện thoại thường là nơi có chứa những thông tin nhạy cảmvà quan trọng như danh bạ điện thoại, tải khoản ngân hang, hình ảnh cá nhân hay quan trọng hơn đó chính
là những mối quan hệ trong công việc có thể ảnh hưởng đến chủ nhân của thiết bị gấp nhiều lần Thử tưởng tượng, bạn có hơn 100 số điện thoại liên lạc và chẳng may điện thoại của bạn
bị mất, điều đó đồng nghĩa với việc bạn phải mất hơn 100 liên lạc của bạn bè và đối tác hoặc bạn phải tốn một khoản chi phí rất lớn để khôi phục số lượng liên lạc đó, chưa kể kẻ trộm có thể dùng số liên lạc của bạn để thực hiện những giao dịch đặc biệt hoặc làm tổn hại đến những quan hệ công việc Cũng theo thống kê trên, hiện có đến hơn 54% các thiết bị di động không hỗ trợ mật khẩu dẫn đến các dữ liệu trên di động trở thành món mồi ngon cho các kẻ tấn công
Và thị trường Việt Nam cũng không là ngoại lệ với tốc độ phát triển viễn thông nhanh chóng, theo số liệu mới nhất, số lượng người dùng di động hiện nay hơn 30,2 triệu người (theo số liệu của Bộ Thông tin và Truyền thông, năm 2010 [3]), vấn đề về an toàn dữ liệu trên thiết bị di động cũng cần được quan tâm một cách xác đáng Bên cạnh đó, tại Việt Nam, với
sự bùng nổ thiết bị di động ưu việt, nhỏ gọn, tiện lợi và sự phát triển mạnh mẽ của công nghệ, các dịch vụ dành riêng cho các thiết bị di động ngày một nở rộ như các hệ thống tin nhắn qua các tổng đài, thanh toán trực tuyến qua thiết bị di động, xác thực bằng tin nhắn, chuyển khoản, tra cứu số dư Đi kèm theo điều này là những thông tin cá nhân hay đặc biệt là các thông tin nhạy cảm hầu như được lưu trữ trong các thiết bị di động như danh bạ liên lạc, tin nhắn, email hay các file hình ảnh, video clips, v.v Chính vì vậy bảo mật dữ liệu trên thiết bị
di động đang trở thành một nhu cầu không thể thiếu của người dùng hiện tại nhằm tránh các
sự cố bị lộ dữ liệu đáng tiếc như mất điện thoại hoặc sử dụng các dịnh vụ sửa chữa thiết bị di động chẳng hạn
Để bảo vệ các thông tin cá nhân trên thiết bị di dộng thì việc xác thực là bước đầu tiên cần được thực hiện Xác thực người dùng trước khi họ sử dụng thiết bị di động đóng vai trò như một cánh cửa cho một ngôi nhà Cửa có chắc chắn thì mới đảm bảo an toàn cho ngôi nhà Hầu hết các thiết bị di động đều có trang bị một phương thức xác thực người dùng cơ bản là dùng password hoặc mã pin Đây là phương pháp đơn giản và có hiệu quả khá tốt Tuy nhiên, ngày nay, các kẻ tấn công ngày càng trở nên tinh vi thì phương pháp xác thực này dễ dàng bị đánh bại bằng cách thử sai (do độ phức tạp của password/mã pin trên thiết bị di động không cao), hoặc bằng các cách social engineering, hoặc đơn giản hơn là do ý thức bảo vệ dữ liệu cá nhân của người dùng còn chưa cao (viết password/mã pin ra giấy, dùng password/mã pin mặc định, …) Do vậy các thiết bị di động cần được trang bị thêm các phương pháp xác thực khác
để bảo vệ người dùng
Trang 5Với sự phát triển nhanh chóng về kỹ thuật và công nghệ, các thiết bị di động ngày càng trở nên “thông minh” hơn (smart phone) và được trang bị thêm nhiều tính năng tiện ích như Camera, Microphone, built-in finger scanner hay các thiết bị đo gia tốc, từ trường đã mang lại tính khả thi cho phương xác thực người dùng thông qua các đặc điểm sinh học của con người
II MỤC TIÊU CỦA ĐỀ TÀI
a) Tìm hiểu về các phương pháp xác thực dựa trên sinh trắc học (biometrics) như nhận dạng dấu vân tay, cử chỉ, khuôn mặt, giọng nói, mống mắt,
b) Phân tích,lựa chọn và đề nghị phương pháp xác thực dựa trên sinh trắc học phù hợp
để có thể áp dụng trên thiết bị di động thông minh (smart phone) qua đó nhằm bảo vệ những dữ liệu các nhân của người dùng như hình ảnh, danh bạ, SMS, hiệu quả hơn c) Kết hợp phương pháp xác thực dựa trên sinh trắc học với các phương pháp xác thực thông thường (dùng password, mã pin, …) để tăng khả năng bảo vệ cho thiết bị di động thông minh
d) Xây dựng hệ thống xác thực dựa trên sinh trắc học cho thiết bị di động thông minh e) Đánh giá hệ thống
III TÓM TẮT NỘI DUNG CỦA ĐỀ TÀI
3.1 Nội dung 1:
Mục tiêu: Tìm hiểu về xác thực dựa trên sinh trắc học (biometrics) và đề xuất phương
pháp xác thực dựa trên sinh trắc học trên thiết bị di động
Chỉ tiêu đánh giá: báo cáo
Kế hoạch thực hiện: 5 tháng
Stt Nội dung thực hiện Người thực hiện Từ đến (tháng)
1.1 Tìm hiểu về các phương pháp xác
thực thông thường và phương pháp
xác thực dựa trên sinh trắc học
1.4 Đề xuất phương pháp xác thực dựa
trên sinh trắc học phù hợp trên thiết
Trang 6• Đi sâu vào tìm hiểu và nghiên cứu các phương pháp xác thực dựa trên sinh trắc học
• Lựa chọn thiết bị di động thông minh và đề xuất phương pháp phù hợp để xác thực trên thiết bị di động thông minh
Phân tích và diễn giải số liệu thu được:
2.2 Hiện thực hệ thống Nguyễn Thị Ái Thảo,
Nguyễn Ngọc Thiên An, Đặng Trần Trí
8-10
Phương pháp :
• Thiết kế kiến trúc hệ thống xác thực cho phương pháp đề xuất ở nội dung 1
• Hiên thực hệ thống với những chức năng cơ bản phục vụ cho việc xác thực dựa trên sinh trắc học
• Tích hợp với phương pháp xác thực thông thường
• Kiểm thử và đánh giá hệ thống
Phân tích và diễn giải số liệu thu được:
• Đánh giá hệ thống xác thực dựa trên 2 tỷ lệ lỗi là tỷ lệ chấp nhận sai (FAR) và tỷ lệ từ chối sai (FRR)
3.3 Nội dung 3:
Mục tiêu: Viết báo cáo tổng kết
Trang 7Chỉ tiêu đánh giá: báo cáo
Kế hoạch thực hiện: 1 tháng
Stt Nội dung thực hiện Người thực hiện Từ đến (tháng)
Phương pháp :
• Viết báo cáo
Phân tích và diễn giải số liệu thu được:
IV NỘI DUNG THỰC HIỆN
4.1 Tìm hiểu về xác thực dựa trên sinh trắc học (biometrics)
người dùng là đúng với chính họ” [4] Trong khi đó, ủy quyền là “quá trình giới hạn các hành
vi được phép làm của người dùng đã được xác thực” [5] Nói cách khác, xác thực dùng để trả lời cho câu hỏi “bạn là ai?” và ủy quyền dùng để trả lời cho câu hỏi “bạn được phép làm gì?” Trong giới hạn của đề tài, đề cương này chỉ đề cập đến các lý thuyết liên quan đến phần xác thực
Để xác thực được người dùng thì trước tiên họ cần thực hiện việc đăng ký (register, enronment) với hệ thống Việc đăng ký này cần hai thông tin cơ bản là danh định (identity)
và bằng chứng để kiểm tra sau này Loại bằng chứng đi kèm với danh định dùng để xác thực được chia làm ba loại sau [5]:
• Những gì bạn biết (something we know): mật khẩu (password), số PIN
• Những gì bạn có (something we have): smart card (token)
• Những gì là chính bạn (something we are): Sinh trắc học (biometrics)
4.1.2 Sinh trắc học
Sinh trắc học (biometrics) là quá trình tự động xác thực mỗi cá thể con người dựa trên các đặc điểm về sinh lý hay hành vi riêng của họ (Biometrics is the automated recognition of
Xác thực dựa trên sinh trắc học không phải là một ngành khoa học chính xác (an exact science) Kết quả của việc xác thực được dựa vào tỷ lệ (phần trăm) giống nhau (match score) giữa input và mẫu (template) được lưu trong CSDL Một hệ thống sử dụng xác thực sinh trắc
Trang 8học sẽ định nghĩa một ngưỡng (threshold) Nếu tỷ lệ giống nhau giữa input và mẫu lớn hơn hoặc bằng ngưỡng thì người dùng đã được xác thực thành công, còn nếu nếu tỷ lệ giống nhau giữa input và mẫu thấp hơn ngưỡng thì việc xác thực không thành công
Hệ thống xác thực dựa trên sinh trắc học có 2 loại tỷ lệ sai (error rates):
• Tỷ lệ chấp nhận sai (a false accept rate, FAR): chấp nhận sai là khi một người dùng giả mạo nhưng được hệ thống xác thực là đúng
• Tỷ lệ từ chối sai (a false reject rate, FRR): từ chối sai là khi một người dùng đúng nhưng được hệ thống xác thực là giả mạo và từ chối truy cập/giao dịch
Æ Cần cân bằng giữa FAR và FRR: ngưỡng (threshold) càng cao thì FAR sẽ giảm (tăng tính bảo mật), FRR sẽ tăng (giảm tính tiện dụng) và ngược lại
Một đặc điểm sinh học có thể dùng trong việc xác thực khi đáp ứng đủ 7 yếu tố [6]
• Tính phố biến (Universality): Mọi người đều sở hữu đặc tính này
• Tính duy nhất (Uniqueness): Không có 2 người khác nhau có cùng chung đặc tính này
• Tính không thay đổi theo thời gian (Permanence): Tính chất không thay đổi theo thời gian hoặc thay đổi không đáng kể
• Tính tính toán được (Measurability): Đặc tính sinh học có thể số hóa và so sánh giữa các cá nhân
• Tính hiệu quả (Performance): Đặc tính phải so sánh được trong thời gian và nguồn tài nguyên giới hạn
• Tính chấp nhận được (Acceptability): Mọi người chấp nhận phương pháp xác thực đó đối với hệ thống
• Tính không thể gian lận (Circumvention): Đặc điểm sinh học đó phải không thể hoặc khó làm giả
4.1.3 Phân loại các đặc điểm sinh trắc học
Các đặc điểm sinh học được phân loại vào các nhóm như sau:
• Đặc điểm sinh lý (Physiological)
o Vân tay (fingerprint)
Trang 9o Hình học ngón tay (finger geometry)
o Hình dạng lỗ tai (ear shape)
o Mùi (smell, odor)
o Tĩnh mạch tay (hand vein)
• Đặc điểm hành vi (Behavioral)
o Giọng nói (voice)
o Cách gõ phím (typing pattern, keyboard strokes)
o Chữ ký (signature)
o Dáng đi (gait)
4.1.4 Phân loại hệ thống xác thực sinh trắc học
Việc phân loại các hệ thống xác thực sinh trắc học dựa trên cách thu thập, sử dụng và kết hợp các đặc điểm sinh trắc học vào việc xác thực
Hệ thống xác thực dựa trên sinh trắc học đơn chỉ sử dụng một đặc điểm sinh trắc học
o Multi-sensor systems: thu thập nhiều hình ảnh của cùng một mẫu sinh trắc từ nhiều (loại) cảm ứng khác nhau (sensor)
o Multi-algorithm systems: tạo vector đặc điểm của cùng một mẫu sinh trắc từ nhiều giải thuật khác nhau
o Multi-instance systems: thu thập nhiều bản (instance) của cùng một mẫu sinh trắc, ví dụ: chụp khuôn mặt từ nhiều góc độ, mắt trái và mắt phải
o Multi-sample systems: đọc một mẫu sinh trắc nhiều lần để tăng độ chính xác của mẫu
• Thu thập nhiều loại sinh trắc khác nhau của người dùng Æ đánh giá tỷ lệ trùng hợp của từng loại và so sánh với ngưỡng Æ thông hàm các hàm kết hợp đại số hoặc luận
lý Æ kết luận [7]
o Multimodal systems: kết hợp nhiều loại sinh trắc học khác nhau của cùng một người dùng
Trang 10• Hybrid-systems: kết hợp cả hai cách trên
4.1.5 Xác thực dựa trên sinh trắc học trên thiết bị di động
Hệ thống sinh trắc học có thể được tích hợp vào thiết bị di động theo hai hướng Hướng thứ nhất thiết bị di động đóng vài trò như là thiết bị thu thập dữ liệu sinh trắc học và hướng thứ hai thì nó là một hệ thống độc lập sử dụng sinh trắc học để bảo vệ dữ liệu trên thiết
bị động Trong hướng đầu tiên, thiết bị di động sẽ lấy dữ liệu sinh trắc học từ người dùng và truyền qua Internet đến một hệ thống xác thực chuyên biệt để được xử lý và so trùng Cách này đã chứng minh được sự hữu dụng khi giao dịch ở khoảng cách xa và yêu cầu người dùng cần phải được xác minh Ví dụ như có một khách hàng gọi đến ngân hàng và yêu cầu một giao dịch, khách hàng đó sẽ giới thiệu anh ta như là John Smith và để xác minh danh tính, anh ta được yêu cầu phải đọc mật khẩu Giọng nói của anh ta sẽ được ghi lại, xử lý và so sánh với mẫu dữ liệu mà hệ thống đã ghi lại được khi người dùng đăng nhập vào hệ thống Khuôn mặt, chữ ký hay gõ bàn phím là những đặc điểm sinh trắc học mà điện thoại ngày nay có khả năng ghi lại và chuyển chúng sang địa điểm ở khoảng cách xa
Một cách hiện thực khác của hệ thống sinh trắc học trên thiết bị di động là toàn bộ hệ thống sẽ được tích hợp trên thiết bị di động và nó sẽ phục vụ cho mục đích ngăn chặn sự truy xuất không được cho phép vào điện thoại Đây cũng là cách mà đề tài này hướng đến
Do đặc tính nhỏ gọn và tiện dụng nên việc áp dụng xác thực sinh trắc học trên thiết bị
di động cần dựa vào các thiết bị built-in có sẵn trên thiết bị Các đặc điểm sinh trắc có tính khả thi cao khi áp dụng trên thiết bị di động:
• Khuôn mặt: thông qua camera của thiết bị
• Giọng nói: thông qua microphone
• Chữ ký: với thiết bị di động có màn hình cảm ứng
• Cách gõ bàn phím
Trong đề tài này, chúng tôi chọn khuôn mặt và giọng nói để xác thực người dùng
4.1.6 Xác thực khuôn mặt bằng phương pháp PCA
Bằng phương pháp PCA, có thể biến đổi một hình ảnh ban đầu của tập học (training set) thành các eigenfaces tương ứng Một tính năng quan trọng của PCA là người ta có thể tái tạo lại cấu trúc của hình ảnh bất kì ban đầu từ tập học bằng cách kết hợp các eigenfaces Do
đó có thể nói rằng hình ảnh của khuôn mặt ban đầu có thể được dựng lại từ các eigenfaces bằng cách kết hợp các eigenfaces này đúng tỉ lệ Mỗi eigenface chỉ đại diện một số đặc điểm của khuôn mặt, có thể có hoặc không có trong hình ảnh ban đầu.Nếu đặc điểm có trong ảnh gốc với mức độ cao hơn, phần đóng góp của eigenface tương ứng trong tập eigenfaces lớn.Nếu ngược lại, các đặc điểm không có hiện diện trong ảnh ban đầu thì eigenface tương ứng đóng góp một phần nhỏ hơn trong tập eigenfaces Vì vậy để tái tạo hình ảnh ban đầu từ các eigenfaces, chúng ta xây dựng nên tập tổng hợp các trọng số của tất cả các eigenfaces Để tái tạo lại hình ảnh bằng đầu bằng cách tổng hợp tất cả các eigenfaces, mỗi eigenface có một
Trang 11trọng số tương ứng Trọng số này mô tả những đặc điểm cụ thể nào hiện diện trong ảnh ban đầu Bằng cách này trích xuất các trọng số từ các eigenfaces và khuôn mặt sẽ được nhận ra:
• Xác định một hình ảnh đầu vào có phải là khuôn mặt Trong trường hợp này trọng số của ảnh quá khác biệt với trọng số của khuôn mặt (ví dụ những ảnh mà biết chắc đó là khuôn mặt), hình ảnh đầu vào không là khuôn mặt
• Những khuôn mặt tương tự có những đặc điểm tương tự (eigenfaces) sẽ có trọng số giống nhau Nếu trọng số chiết xuất từ hình ảnh có sẵn, các hình ảnh đó có thể nhóm lại thành cụm.Tất cả hình ảnh có trọng số tương tự có thể là những ảnh (khuôn mặt) tương tự
Các thuật toán nhận dạng khuôn mặt bằng cách sử dụng eigenfaces về cơ bản được
mô tả trong Hình 1:
Đầu tiên những hình ảnh ban đầu của tập huấn luyện được chuyển thành tập hợp các eigenfaces E Sau đó trọng số sẽ được tính toán cho mỗi ảnh của tập học (training set) và được lưu trữ trong tập W
Khi quan sát thấy hình ảnh không rõ X, trọng số được tính toán và lưu trữ trong vector WX Sau đó, WX được so sánh với trọng số của các ảnh (biết chắc là khuôn mặt trong tập W).Một cách để thực hiện là xem mỗi vector trọng số như là một điểm trong không gian
và tính toán khoảng cách D (khoảng cách trung bình giữa các vector từ W và vector của ảnh không rõ WX) Nếu khoảng cách trung bình vượt qua ngưỡng θ , thì các vector trọng số của
WX nằm quá xa các vector trọng số khuôn mặt W Trong trường hợp này X không phải là khuôn mặt Nếu ngược lại (X là khuôn mặt) vector trọng lượng WX của nó sẽ được lưu lại để phân loại sau này.Giá trị tối ưu của ngưỡng θ được xác định bằng thực nghiệm
Trang 12Hình 1 Nguyên tắc của giải thuật nhận dạng khuôn mặt dựa vào PCA [8]
4.1.7 Xác thực giọng nói bằng MFCC
Trong quá trình xác thực bằng giọng nói, mẫu âm từ giọng nói của một người dùng chưa xác định sẽ được phân tích và so sánh với các mẫu âm của những người đã biết Người dùng chưa xác định đó sẽ được hệ thống xác định là người trong cơ sở dữ liệu với mẫu âm phù hợp nhất với mẫu âm của người dùng Trong quá trình kiểm chứng bằng giọng nói, một định danh sẽ được khai báo bởi người dùng, và giọng nói của người dùng này sẽ được so sánh với mẫu âm của người mà có định danh được báo đó Nếu hai mẫu âm phù hợp, khi giá trị so sánh trên giá trị ngưỡng, thì định danh khai báo trước đó sẽ được chấp nhận Với giá trị
Trang 13ngưỡng cao, những kẻ giả danh sẽ khó qua mặt được hệ thống, nhưng bù lại những người dùng hợp lệ lại có tỉ lệ bị từ chối cao Ngược lại, với giá trị ngưỡng thấp, người dùng hợp lệ
sẽ được hệ thống chấp nhận cao hơn, nhưng đồng thời tỉ lệ chấp nhận kẻ giả danh cũng đồng thời cao hơn Để thiết lập được giá trị ngưỡng một cách hiệu quả, hệ thống cần biết các giá trị
dữ liệu thể hiện sự phân bố người dùng và kẻ giả danh
Trong đề tài này, điều quan trọng nhất là chiết xuất đặc tính từ tín hiệu giọng nói.Việc chiết xuất này nhằm giảm chiều của vector đầu vào trong khi vẫn duy trì được khả năng phân biệt các tín hiệu khác nhau Như ta đã biết, số lượng vector cần trong tập training và tập kiểm tra cần thiết cho quá trình phân loại tăng lên theo hàm mũ với số chiều của vector, vì thế ta cần quá trình chiết xuất đặc tính
Một trong những phương pháp phổ biến và hiệu quả nhất là sử dụng Mel-frequency cepstral coefficient (MFCC) Phương pháp này bắt nguồn từ quá trình nhận dạng tiếng nói nhưng ngày nay đã trở thành một trong những phương pháp chiết xuất đặc tính của việc xác thực người dùng bằng giọng nói Ý tưởng bắt nguồn từ phương pháp MFCC là giả thiết rằng tai người là một cỗ máy nhận diện hoàn hảo, mặc dù đến nay điều này vẫn chưa được xác thực bởi người các nghiên cứu khoa học
Dự án này sử dụng kỹ thuật MFCC để chiết xuất đặc tính từ tín hiệu giọng nói và so sánh người dùng chưa xác định với người dùng đã tôn tại trong hệ thống Quá trình chiết xuất
đặc tính MFCC bao gốm 6 bước sau Error! Reference source not found.: Framing,
Windowing, Discrete Fourier Transforming, Mel-Frequency Warping, Log Compression và Discrete Cosine Transforming, Calculation of Delta và Delta-Delta Coefficients
Framing
Bước đầu tiên là quá trình framing (hình 2).Tín hiệu giọng nói được chia thành nhiều khung với chiểu dài từ 10 đến 30ms Chiều dài của các khung đóng một vai trò quan trọng do phụ thuộc vào thời gian và độ phân giải tần số Chiều dài của khung quá lớn sẽ không lấy được những đặc tính quang phổ và nếu thời gian quá ngẳn sẽ làm giảm độ phân giải tần số.Các khung này sẽ trùng lắp nhau từ 25 đến 75% chiều dài của chúng.Sự trùng lắp này nhằm đảm bảo mỗi âm thanh phát ra sẽ có các khung nằm ở trung tâm của chúng
Trang 14Hình 2.Hình ảnh các khung, với chiều dài mỗi khung là 23.2 ms, trùng nhau 50%
Windowing
Sau khi tín hiệu được chia thành nhiều khung, mỗi khung sẽ được nhân với hàm window.Một hàm window được xem là tốt khi nó có vòng cung hẹp ở chính giữa và vòng cung rộng dần về hai bên.Hàm window được sử dụng phổ biến nhất trong lãnh vực xử lý tín hiệu giọng nói là hàm Hamming window
Hàm Hamming window được định nghĩa như sau:
Dạng sóng và độ lớn được thể hiện ở hình 3 Hình 4 là hình ảnh của khung trước khi
và sau khi áp dụng hàm Hamming window
Trang 15Hình 3.Hàm cửa sổ Hamming
Hình 4.Trước và sau khi hàm cử sổ Hamming được áp dụng vào 1 khung
Discrete Fourier Transforming
Bước thứ 3 là áp dụng hàm Discrete Fourier Transforming (DTF) cho mỗi khung:
Cách nhanh nhất để tính toán DTF là sử dụng FFT (Fast Fourier Transforming) để tăng tốc quá trình tính toán DTF
Mel-Frequency Warping
Thang đo Mel được sử dụng dựa trên cách lỗ tai con người tiếp nhận tần số Nó được định nghĩa bằng việc thiết lập 1000 mels tương ứng với 1000 Hz như là điểm gốc Thang đo