1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xác thực người dùng dựa trên sinh trắc học cho thiết bị di động thông minh báo cáo tổng kết kết quả đề tài khcn cấp trường msđt t khmt 2013 21

31 55 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 886,14 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Với sự phát triển nhanh chóng về kỹ thuật và công nghệ, các thiết bị di động ngày càng trở nên “thông minh” hơn smart phone và được trang bị thêm nhiều tính năng tiện ích như Camera, Mic

Trang 1

ĐẠI HỌC QUỐC GIA TP HCM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

FOG

BÁO CÁO TỔNG KẾT KẾT QUẢ

ĐỀ TÀI KHCN CẤP TRƯỜNG

Tên đề tài:

Xác thực người dùng dựa trên sinh trắc học

cho thiết bị di động thông minh

Mã số đề tài: T-KHMT-2013-21

Thời gian thực hiện: 5/2013 đến 5/2014

Chủ nhiệm đề tài: ThS Trương Quỳnh Chi

Cán bộ tham gia đề tài:1 ThS Đặng Trần Trí

2 ThS Nguyễn Ngọc Thiên An

3 ThS Nguyễn Thị Ái Thảo

Thành phố Hồ Chí Minh – Tháng 6 /2014

Trang 2

Mục lục

 

I GIỚI THIỆU ĐỀ TÀI 4 

II MỤC TIÊU CỦA ĐỀ TÀI 5 

III TÓM TẮT NỘI DUNG CỦA ĐỀ TÀI 5 

3.1 Nội dung 1: 5 

3.2 Nội dung 2: 6 

3.3 Nội dung 3: 6 

IV NỘI DUNG THỰC HIỆN 7 

4.1 Tìm hiểu về xác thực dựa trên sinh trắc học (biometrics) 7 

4.1.1 Xác thực 7

4.1.2 Sinh trắc học 7

4.1.3 Phân loại các đặc điểm sinh trắc học 8

4.1.4 Phân loại hệ thống xác thực sinh trắc học 9

4.1.5 Xác thực dựa trên sinh trắc học trên thiết bị di động 10

4.1.6 Xác thực khuôn mặt bằng phương pháp PCA 10

4.1.7 Xác thực giọng nói bằng MFCC 12

4.2 Thiết kế và hiện thực hệ thống 17 

4.2.1 Thiết kế hệ thống 17

4.2.2 Hiện thực hiện thống 20

4.2.3 Giao diện hệ thống 23

4.3 Đánh giá hệ thống 25 

4.3.1 Tỉ lệ chấp nhận sai và Tỉ lệ từ chối sai 25

4.3.2 Tập dữ liệu 26

4.3.3 Kết quả 26

V CÁC KẾT QUẢ ĐẠT ĐƯỢC CỦA ĐỀ TÀI 29 

VI KẾT LUẬN VÀ KIẾN NGHỊ 29 

Trang 3

Danh sách các cán bộ tham gia thực hiện đề tài

Trang 4

I GIỚI THIỆU ĐỀ TÀI

Theo thống kê của Micro Trax [1], cứ mỗi phút trôi qua, có 113 điện thoại bị mất hoặc bị đánh cắp tại cắp tại Mỹ, tức khoản gần 60 triệu điện thoại bị mất hoặc bị đánh cắp mỗi năm Một con số khổng lồ đối với đất nước tiến bộ có đến 96% dân số sử dụng điện thoại (thống kê của Lockout Mobile Security [2]) và cung cấp nhiều dịch vụ tiện ích trên di động Điều đáng nói là điện thoại thường là nơi có chứa những thông tin nhạy cảmvà quan trọng như danh bạ điện thoại, tải khoản ngân hang, hình ảnh cá nhân hay quan trọng hơn đó chính

là những mối quan hệ trong công việc có thể ảnh hưởng đến chủ nhân của thiết bị gấp nhiều lần Thử tưởng tượng, bạn có hơn 100 số điện thoại liên lạc và chẳng may điện thoại của bạn

bị mất, điều đó đồng nghĩa với việc bạn phải mất hơn 100 liên lạc của bạn bè và đối tác hoặc bạn phải tốn một khoản chi phí rất lớn để khôi phục số lượng liên lạc đó, chưa kể kẻ trộm có thể dùng số liên lạc của bạn để thực hiện những giao dịch đặc biệt hoặc làm tổn hại đến những quan hệ công việc Cũng theo thống kê trên, hiện có đến hơn 54% các thiết bị di động không hỗ trợ mật khẩu dẫn đến các dữ liệu trên di động trở thành món mồi ngon cho các kẻ tấn công

Và thị trường Việt Nam cũng không là ngoại lệ với tốc độ phát triển viễn thông nhanh chóng, theo số liệu mới nhất, số lượng người dùng di động hiện nay hơn 30,2 triệu người (theo số liệu của Bộ Thông tin và Truyền thông, năm 2010 [3]), vấn đề về an toàn dữ liệu trên thiết bị di động cũng cần được quan tâm một cách xác đáng Bên cạnh đó, tại Việt Nam, với

sự bùng nổ thiết bị di động ưu việt, nhỏ gọn, tiện lợi và sự phát triển mạnh mẽ của công nghệ, các dịch vụ dành riêng cho các thiết bị di động ngày một nở rộ như các hệ thống tin nhắn qua các tổng đài, thanh toán trực tuyến qua thiết bị di động, xác thực bằng tin nhắn, chuyển khoản, tra cứu số dư Đi kèm theo điều này là những thông tin cá nhân hay đặc biệt là các thông tin nhạy cảm hầu như được lưu trữ trong các thiết bị di động như danh bạ liên lạc, tin nhắn, email hay các file hình ảnh, video clips, v.v Chính vì vậy bảo mật dữ liệu trên thiết bị

di động đang trở thành một nhu cầu không thể thiếu của người dùng hiện tại nhằm tránh các

sự cố bị lộ dữ liệu đáng tiếc như mất điện thoại hoặc sử dụng các dịnh vụ sửa chữa thiết bị di động chẳng hạn

Để bảo vệ các thông tin cá nhân trên thiết bị di dộng thì việc xác thực là bước đầu tiên cần được thực hiện Xác thực người dùng trước khi họ sử dụng thiết bị di động đóng vai trò như một cánh cửa cho một ngôi nhà Cửa có chắc chắn thì mới đảm bảo an toàn cho ngôi nhà Hầu hết các thiết bị di động đều có trang bị một phương thức xác thực người dùng cơ bản là dùng password hoặc mã pin Đây là phương pháp đơn giản và có hiệu quả khá tốt Tuy nhiên, ngày nay, các kẻ tấn công ngày càng trở nên tinh vi thì phương pháp xác thực này dễ dàng bị đánh bại bằng cách thử sai (do độ phức tạp của password/mã pin trên thiết bị di động không cao), hoặc bằng các cách social engineering, hoặc đơn giản hơn là do ý thức bảo vệ dữ liệu cá nhân của người dùng còn chưa cao (viết password/mã pin ra giấy, dùng password/mã pin mặc định, …) Do vậy các thiết bị di động cần được trang bị thêm các phương pháp xác thực khác

để bảo vệ người dùng

Trang 5

Với sự phát triển nhanh chóng về kỹ thuật và công nghệ, các thiết bị di động ngày càng trở nên “thông minh” hơn (smart phone) và được trang bị thêm nhiều tính năng tiện ích như Camera, Microphone, built-in finger scanner hay các thiết bị đo gia tốc, từ trường đã mang lại tính khả thi cho phương xác thực người dùng thông qua các đặc điểm sinh học của con người

II MỤC TIÊU CỦA ĐỀ TÀI

a) Tìm hiểu về các phương pháp xác thực dựa trên sinh trắc học (biometrics) như nhận dạng dấu vân tay, cử chỉ, khuôn mặt, giọng nói, mống mắt,

b) Phân tích,lựa chọn và đề nghị phương pháp xác thực dựa trên sinh trắc học phù hợp

để có thể áp dụng trên thiết bị di động thông minh (smart phone) qua đó nhằm bảo vệ những dữ liệu các nhân của người dùng như hình ảnh, danh bạ, SMS, hiệu quả hơn c) Kết hợp phương pháp xác thực dựa trên sinh trắc học với các phương pháp xác thực thông thường (dùng password, mã pin, …) để tăng khả năng bảo vệ cho thiết bị di động thông minh

d) Xây dựng hệ thống xác thực dựa trên sinh trắc học cho thiết bị di động thông minh e) Đánh giá hệ thống

III TÓM TẮT NỘI DUNG CỦA ĐỀ TÀI

3.1 Nội dung 1:

Mục tiêu: Tìm hiểu về xác thực dựa trên sinh trắc học (biometrics) và đề xuất phương

pháp xác thực dựa trên sinh trắc học trên thiết bị di động

Chỉ tiêu đánh giá: báo cáo

Kế hoạch thực hiện: 5 tháng

Stt Nội dung thực hiện Người thực hiện Từ đến (tháng)

1.1 Tìm hiểu về các phương pháp xác

thực thông thường và phương pháp

xác thực dựa trên sinh trắc học

1.4 Đề xuất phương pháp xác thực dựa

trên sinh trắc học phù hợp trên thiết

Trang 6

• Đi sâu vào tìm hiểu và nghiên cứu các phương pháp xác thực dựa trên sinh trắc học

• Lựa chọn thiết bị di động thông minh và đề xuất phương pháp phù hợp để xác thực trên thiết bị di động thông minh

Phân tích và diễn giải số liệu thu được:

2.2 Hiện thực hệ thống Nguyễn Thị Ái Thảo,

Nguyễn Ngọc Thiên An, Đặng Trần Trí

8-10

Phương pháp :

• Thiết kế kiến trúc hệ thống xác thực cho phương pháp đề xuất ở nội dung 1

• Hiên thực hệ thống với những chức năng cơ bản phục vụ cho việc xác thực dựa trên sinh trắc học

• Tích hợp với phương pháp xác thực thông thường

• Kiểm thử và đánh giá hệ thống

Phân tích và diễn giải số liệu thu được:

• Đánh giá hệ thống xác thực dựa trên 2 tỷ lệ lỗi là tỷ lệ chấp nhận sai (FAR) và tỷ lệ từ chối sai (FRR)

3.3 Nội dung 3:

Mục tiêu: Viết báo cáo tổng kết

Trang 7

Chỉ tiêu đánh giá: báo cáo

Kế hoạch thực hiện: 1 tháng

Stt Nội dung thực hiện Người thực hiện Từ đến (tháng)

Phương pháp :

• Viết báo cáo

Phân tích và diễn giải số liệu thu được:

IV NỘI DUNG THỰC HIỆN

4.1 Tìm hiểu về xác thực dựa trên sinh trắc học (biometrics)

người dùng là đúng với chính họ” [4] Trong khi đó, ủy quyền là “quá trình giới hạn các hành

vi được phép làm của người dùng đã được xác thực” [5] Nói cách khác, xác thực dùng để trả lời cho câu hỏi “bạn là ai?” và ủy quyền dùng để trả lời cho câu hỏi “bạn được phép làm gì?” Trong giới hạn của đề tài, đề cương này chỉ đề cập đến các lý thuyết liên quan đến phần xác thực

Để xác thực được người dùng thì trước tiên họ cần thực hiện việc đăng ký (register, enronment) với hệ thống Việc đăng ký này cần hai thông tin cơ bản là danh định (identity)

và bằng chứng để kiểm tra sau này Loại bằng chứng đi kèm với danh định dùng để xác thực được chia làm ba loại sau [5]:

• Những gì bạn biết (something we know): mật khẩu (password), số PIN

• Những gì bạn có (something we have): smart card (token)

• Những gì là chính bạn (something we are): Sinh trắc học (biometrics)

4.1.2 Sinh trắc học

Sinh trắc học (biometrics) là quá trình tự động xác thực mỗi cá thể con người dựa trên các đặc điểm về sinh lý hay hành vi riêng của họ (Biometrics is the automated recognition of

Xác thực dựa trên sinh trắc học không phải là một ngành khoa học chính xác (an exact science) Kết quả của việc xác thực được dựa vào tỷ lệ (phần trăm) giống nhau (match score) giữa input và mẫu (template) được lưu trong CSDL Một hệ thống sử dụng xác thực sinh trắc

Trang 8

học sẽ định nghĩa một ngưỡng (threshold) Nếu tỷ lệ giống nhau giữa input và mẫu lớn hơn hoặc bằng ngưỡng thì người dùng đã được xác thực thành công, còn nếu nếu tỷ lệ giống nhau giữa input và mẫu thấp hơn ngưỡng thì việc xác thực không thành công

Hệ thống xác thực dựa trên sinh trắc học có 2 loại tỷ lệ sai (error rates):

• Tỷ lệ chấp nhận sai (a false accept rate, FAR): chấp nhận sai là khi một người dùng giả mạo nhưng được hệ thống xác thực là đúng

• Tỷ lệ từ chối sai (a false reject rate, FRR): từ chối sai là khi một người dùng đúng nhưng được hệ thống xác thực là giả mạo và từ chối truy cập/giao dịch

Æ Cần cân bằng giữa FAR và FRR: ngưỡng (threshold) càng cao thì FAR sẽ giảm (tăng tính bảo mật), FRR sẽ tăng (giảm tính tiện dụng) và ngược lại

Một đặc điểm sinh học có thể dùng trong việc xác thực khi đáp ứng đủ 7 yếu tố [6]

• Tính phố biến (Universality): Mọi người đều sở hữu đặc tính này

• Tính duy nhất (Uniqueness): Không có 2 người khác nhau có cùng chung đặc tính này

• Tính không thay đổi theo thời gian (Permanence): Tính chất không thay đổi theo thời gian hoặc thay đổi không đáng kể

• Tính tính toán được (Measurability): Đặc tính sinh học có thể số hóa và so sánh giữa các cá nhân

• Tính hiệu quả (Performance): Đặc tính phải so sánh được trong thời gian và nguồn tài nguyên giới hạn

• Tính chấp nhận được (Acceptability): Mọi người chấp nhận phương pháp xác thực đó đối với hệ thống

• Tính không thể gian lận (Circumvention): Đặc điểm sinh học đó phải không thể hoặc khó làm giả

4.1.3 Phân loại các đặc điểm sinh trắc học

Các đặc điểm sinh học được phân loại vào các nhóm như sau:

• Đặc điểm sinh lý (Physiological)

o Vân tay (fingerprint)

Trang 9

o Hình học ngón tay (finger geometry)

o Hình dạng lỗ tai (ear shape)

o Mùi (smell, odor)

o Tĩnh mạch tay (hand vein)

• Đặc điểm hành vi (Behavioral)

o Giọng nói (voice)

o Cách gõ phím (typing pattern, keyboard strokes)

o Chữ ký (signature)

o Dáng đi (gait)

4.1.4 Phân loại hệ thống xác thực sinh trắc học

Việc phân loại các hệ thống xác thực sinh trắc học dựa trên cách thu thập, sử dụng và kết hợp các đặc điểm sinh trắc học vào việc xác thực

Hệ thống xác thực dựa trên sinh trắc học đơn chỉ sử dụng một đặc điểm sinh trắc học

o Multi-sensor systems: thu thập nhiều hình ảnh của cùng một mẫu sinh trắc từ nhiều (loại) cảm ứng khác nhau (sensor)

o Multi-algorithm systems: tạo vector đặc điểm của cùng một mẫu sinh trắc từ nhiều giải thuật khác nhau

o Multi-instance systems: thu thập nhiều bản (instance) của cùng một mẫu sinh trắc, ví dụ: chụp khuôn mặt từ nhiều góc độ, mắt trái và mắt phải

o Multi-sample systems: đọc một mẫu sinh trắc nhiều lần để tăng độ chính xác của mẫu

• Thu thập nhiều loại sinh trắc khác nhau của người dùng Æ đánh giá tỷ lệ trùng hợp của từng loại và so sánh với ngưỡng Æ thông hàm các hàm kết hợp đại số hoặc luận

lý Æ kết luận [7]

o Multimodal systems: kết hợp nhiều loại sinh trắc học khác nhau của cùng một người dùng

Trang 10

• Hybrid-systems: kết hợp cả hai cách trên

4.1.5 Xác thực dựa trên sinh trắc học trên thiết bị di động

Hệ thống sinh trắc học có thể được tích hợp vào thiết bị di động theo hai hướng Hướng thứ nhất thiết bị di động đóng vài trò như là thiết bị thu thập dữ liệu sinh trắc học và hướng thứ hai thì nó là một hệ thống độc lập sử dụng sinh trắc học để bảo vệ dữ liệu trên thiết

bị động Trong hướng đầu tiên, thiết bị di động sẽ lấy dữ liệu sinh trắc học từ người dùng và truyền qua Internet đến một hệ thống xác thực chuyên biệt để được xử lý và so trùng Cách này đã chứng minh được sự hữu dụng khi giao dịch ở khoảng cách xa và yêu cầu người dùng cần phải được xác minh Ví dụ như có một khách hàng gọi đến ngân hàng và yêu cầu một giao dịch, khách hàng đó sẽ giới thiệu anh ta như là John Smith và để xác minh danh tính, anh ta được yêu cầu phải đọc mật khẩu Giọng nói của anh ta sẽ được ghi lại, xử lý và so sánh với mẫu dữ liệu mà hệ thống đã ghi lại được khi người dùng đăng nhập vào hệ thống Khuôn mặt, chữ ký hay gõ bàn phím là những đặc điểm sinh trắc học mà điện thoại ngày nay có khả năng ghi lại và chuyển chúng sang địa điểm ở khoảng cách xa

Một cách hiện thực khác của hệ thống sinh trắc học trên thiết bị di động là toàn bộ hệ thống sẽ được tích hợp trên thiết bị di động và nó sẽ phục vụ cho mục đích ngăn chặn sự truy xuất không được cho phép vào điện thoại Đây cũng là cách mà đề tài này hướng đến

Do đặc tính nhỏ gọn và tiện dụng nên việc áp dụng xác thực sinh trắc học trên thiết bị

di động cần dựa vào các thiết bị built-in có sẵn trên thiết bị Các đặc điểm sinh trắc có tính khả thi cao khi áp dụng trên thiết bị di động:

• Khuôn mặt: thông qua camera của thiết bị

• Giọng nói: thông qua microphone

• Chữ ký: với thiết bị di động có màn hình cảm ứng

• Cách gõ bàn phím

Trong đề tài này, chúng tôi chọn khuôn mặt và giọng nói để xác thực người dùng

4.1.6 Xác thực khuôn mặt bằng phương pháp PCA

Bằng phương pháp PCA, có thể biến đổi một hình ảnh ban đầu của tập học (training set) thành các eigenfaces tương ứng Một tính năng quan trọng của PCA là người ta có thể tái tạo lại cấu trúc của hình ảnh bất kì ban đầu từ tập học bằng cách kết hợp các eigenfaces Do

đó có thể nói rằng hình ảnh của khuôn mặt ban đầu có thể được dựng lại từ các eigenfaces bằng cách kết hợp các eigenfaces này đúng tỉ lệ Mỗi eigenface chỉ đại diện một số đặc điểm của khuôn mặt, có thể có hoặc không có trong hình ảnh ban đầu.Nếu đặc điểm có trong ảnh gốc với mức độ cao hơn, phần đóng góp của eigenface tương ứng trong tập eigenfaces lớn.Nếu ngược lại, các đặc điểm không có hiện diện trong ảnh ban đầu thì eigenface tương ứng đóng góp một phần nhỏ hơn trong tập eigenfaces Vì vậy để tái tạo hình ảnh ban đầu từ các eigenfaces, chúng ta xây dựng nên tập tổng hợp các trọng số của tất cả các eigenfaces Để tái tạo lại hình ảnh bằng đầu bằng cách tổng hợp tất cả các eigenfaces, mỗi eigenface có một

Trang 11

trọng số tương ứng Trọng số này mô tả những đặc điểm cụ thể nào hiện diện trong ảnh ban đầu Bằng cách này trích xuất các trọng số từ các eigenfaces và khuôn mặt sẽ được nhận ra:

• Xác định một hình ảnh đầu vào có phải là khuôn mặt Trong trường hợp này trọng số của ảnh quá khác biệt với trọng số của khuôn mặt (ví dụ những ảnh mà biết chắc đó là khuôn mặt), hình ảnh đầu vào không là khuôn mặt

• Những khuôn mặt tương tự có những đặc điểm tương tự (eigenfaces) sẽ có trọng số giống nhau Nếu trọng số chiết xuất từ hình ảnh có sẵn, các hình ảnh đó có thể nhóm lại thành cụm.Tất cả hình ảnh có trọng số tương tự có thể là những ảnh (khuôn mặt) tương tự

Các thuật toán nhận dạng khuôn mặt bằng cách sử dụng eigenfaces về cơ bản được

mô tả trong Hình 1:

Đầu tiên những hình ảnh ban đầu của tập huấn luyện được chuyển thành tập hợp các eigenfaces E Sau đó trọng số sẽ được tính toán cho mỗi ảnh của tập học (training set) và được lưu trữ trong tập W

Khi quan sát thấy hình ảnh không rõ X, trọng số được tính toán và lưu trữ trong vector WX Sau đó, WX được so sánh với trọng số của các ảnh (biết chắc là khuôn mặt trong tập W).Một cách để thực hiện là xem mỗi vector trọng số như là một điểm trong không gian

và tính toán khoảng cách D (khoảng cách trung bình giữa các vector từ W và vector của ảnh không rõ WX) Nếu khoảng cách trung bình vượt qua ngưỡng θ , thì các vector trọng số của

WX nằm quá xa các vector trọng số khuôn mặt W Trong trường hợp này X không phải là khuôn mặt Nếu ngược lại (X là khuôn mặt) vector trọng lượng WX của nó sẽ được lưu lại để phân loại sau này.Giá trị tối ưu của ngưỡng θ được xác định bằng thực nghiệm

Trang 12

Hình 1 Nguyên tắc của giải thuật nhận dạng khuôn mặt dựa vào PCA [8]

4.1.7 Xác thực giọng nói bằng MFCC

Trong quá trình xác thực bằng giọng nói, mẫu âm từ giọng nói của một người dùng chưa xác định sẽ được phân tích và so sánh với các mẫu âm của những người đã biết Người dùng chưa xác định đó sẽ được hệ thống xác định là người trong cơ sở dữ liệu với mẫu âm phù hợp nhất với mẫu âm của người dùng Trong quá trình kiểm chứng bằng giọng nói, một định danh sẽ được khai báo bởi người dùng, và giọng nói của người dùng này sẽ được so sánh với mẫu âm của người mà có định danh được báo đó Nếu hai mẫu âm phù hợp, khi giá trị so sánh trên giá trị ngưỡng, thì định danh khai báo trước đó sẽ được chấp nhận Với giá trị

Trang 13

ngưỡng cao, những kẻ giả danh sẽ khó qua mặt được hệ thống, nhưng bù lại những người dùng hợp lệ lại có tỉ lệ bị từ chối cao Ngược lại, với giá trị ngưỡng thấp, người dùng hợp lệ

sẽ được hệ thống chấp nhận cao hơn, nhưng đồng thời tỉ lệ chấp nhận kẻ giả danh cũng đồng thời cao hơn Để thiết lập được giá trị ngưỡng một cách hiệu quả, hệ thống cần biết các giá trị

dữ liệu thể hiện sự phân bố người dùng và kẻ giả danh

Trong đề tài này, điều quan trọng nhất là chiết xuất đặc tính từ tín hiệu giọng nói.Việc chiết xuất này nhằm giảm chiều của vector đầu vào trong khi vẫn duy trì được khả năng phân biệt các tín hiệu khác nhau Như ta đã biết, số lượng vector cần trong tập training và tập kiểm tra cần thiết cho quá trình phân loại tăng lên theo hàm mũ với số chiều của vector, vì thế ta cần quá trình chiết xuất đặc tính

Một trong những phương pháp phổ biến và hiệu quả nhất là sử dụng Mel-frequency cepstral coefficient (MFCC) Phương pháp này bắt nguồn từ quá trình nhận dạng tiếng nói nhưng ngày nay đã trở thành một trong những phương pháp chiết xuất đặc tính của việc xác thực người dùng bằng giọng nói Ý tưởng bắt nguồn từ phương pháp MFCC là giả thiết rằng tai người là một cỗ máy nhận diện hoàn hảo, mặc dù đến nay điều này vẫn chưa được xác thực bởi người các nghiên cứu khoa học

Dự án này sử dụng kỹ thuật MFCC để chiết xuất đặc tính từ tín hiệu giọng nói và so sánh người dùng chưa xác định với người dùng đã tôn tại trong hệ thống Quá trình chiết xuất

đặc tính MFCC bao gốm 6 bước sau Error! Reference source not found.: Framing,

Windowing, Discrete Fourier Transforming, Mel-Frequency Warping, Log Compression và Discrete Cosine Transforming, Calculation of Delta và Delta-Delta Coefficients

Framing

Bước đầu tiên là quá trình framing (hình 2).Tín hiệu giọng nói được chia thành nhiều khung với chiểu dài từ 10 đến 30ms Chiều dài của các khung đóng một vai trò quan trọng do phụ thuộc vào thời gian và độ phân giải tần số Chiều dài của khung quá lớn sẽ không lấy được những đặc tính quang phổ và nếu thời gian quá ngẳn sẽ làm giảm độ phân giải tần số.Các khung này sẽ trùng lắp nhau từ 25 đến 75% chiều dài của chúng.Sự trùng lắp này nhằm đảm bảo mỗi âm thanh phát ra sẽ có các khung nằm ở trung tâm của chúng

Trang 14

Hình 2.Hình ảnh các khung, với chiều dài mỗi khung là 23.2 ms, trùng nhau 50%

Windowing

Sau khi tín hiệu được chia thành nhiều khung, mỗi khung sẽ được nhân với hàm window.Một hàm window được xem là tốt khi nó có vòng cung hẹp ở chính giữa và vòng cung rộng dần về hai bên.Hàm window được sử dụng phổ biến nhất trong lãnh vực xử lý tín hiệu giọng nói là hàm Hamming window

Hàm Hamming window được định nghĩa như sau:

Dạng sóng và độ lớn được thể hiện ở hình 3 Hình 4 là hình ảnh của khung trước khi

và sau khi áp dụng hàm Hamming window

Trang 15

Hình 3.Hàm cửa sổ Hamming

Hình 4.Trước và sau khi hàm cử sổ Hamming được áp dụng vào 1 khung

Discrete Fourier Transforming

Bước thứ 3 là áp dụng hàm Discrete Fourier Transforming (DTF) cho mỗi khung:

Cách nhanh nhất để tính toán DTF là sử dụng FFT (Fast Fourier Transforming) để tăng tốc quá trình tính toán DTF

Mel-Frequency Warping

Thang đo Mel được sử dụng dựa trên cách lỗ tai con người tiếp nhận tần số Nó được định nghĩa bằng việc thiết lập 1000 mels tương ứng với 1000 Hz như là điểm gốc Thang đo

Ngày đăng: 01/02/2021, 00:22

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w