Lời mở đầu: • Sinh trắc học là môn khoa học ứng dụng phân tích toán học thống kê xác suất để nghiên cứu các hiện tượng sinh học hoặc các chỉ tiêu sinh học có thể đo lường được.. • Kĩ thu
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Báo cáo cá nhân môn Xử lý ảnh
Đề tài: Phương pháp PCA
Giáo viên bộ môn: thầy Lê Hoàng Thái
Trang 2Mục lục
I Lời mở đầu: 3
II Giới thiệu PCA: 3
III Bài toán: 3
IV Ứng dụng thực tế: 11
V Phụ lục: 11
Trang 3I Lời mở đầu:
• Sinh trắc học là môn khoa học ứng dụng phân tích toán học thống kê xác suất để nghiên cứu các hiện tượng sinh học hoặc các chỉ tiêu sinh học có thể đo lường được Khái niệm này có nguồn gốc từ tiếng Anh
"biometry"
• Kĩ thuật sinh trắc học (biometric) là công nghệ sử dụng những thuộc tính vật lý, đặc điểm sinh học riêng của mỗi cá nhân như vân tay, mống mắt, khuôn mặt để nhận diện
II Giới thiệu PCA:
• Trong bài này ta sẽ tập trung vào một kĩ thuật Nhận diện khuôn mặt (Face Recognition) đó là kĩ thuật Phân tích thành phần chính (Principal Components Analysis) hay còn được gọi tắt là PCA
• Phương pháp PCA sẽ “chiếu” (biễu diễn) dữ liệu đa chiều lên một không gian có cơ sở trực giao, tức nếu ta xem mỗi cơ sở trong không gian mới là một biến thì hình ảnh của dữ liệu gốc trong không gian mới này sẽ được biểu diễn thông qua các biến độc lập (tuyến tính) Vấn đề: nếu chuyển dữ liệu ban đầu sang không gian mới thì những thông tin đáng quan tâm của dữ liệu ban đầu liệu có bị mất? Để giải quyết vấn đề này phương pháp PCA sẽ tìm không gian mới với tiêu chí cố gắng phản ánh được càng nhiều thông tin gốc càng tốt, và thước đo cho khái niệm
“thông tin” ở đây là phương sai
• PCA dùng để duyệt hết những dữ liệu ta đang xem xét chuyển đổi về những chiều (thành phần chính) mới Chiều thứ nhất có phương sai lớn nhất có thể và những chiều thành công còn lại được ưu tiên từ lớn đến nhỏ
III Bài toán:
Cho tập dữ liệu như hình dưới, với các số liệu gene A x=4, y=2; gene B x=0, y=1; gene C x=8, y=7; gene D x=2, y=2; gene E x=6, y=3: (1)
Trang 4• Bước 1: Chuyển đổi trục tọa độ
Tính điểm trung bình bằng cách cộng trung bình các điểm trong tập dữ liệu:
µ1 = (xA + xB + xC + xD + xE) / 5 = (4 + 0 + 8 + 2 + 6) / 5 = 4
µ2 = (yA + yB + yC + yD + yE) / 5 = (2 + 1 + 7 + 2 + 3) / 5 = 3
Sau đó ta trừ tọa độ các phần tử cho điểm trung bình sẽ được hệ trục tọa
độ mới:
Gene A: x = x - µ1 = 4 – 4 = 0, y = y - µ2 = 2 – 3 = -1
Gene B: x = x - µ1 = 0 – 4 = -4, y = y - µ2 = 1 – 3 = -2
Gene C: x = x - µ1 = 8 – 4 = 4, y = y - µ2 = 7 - 3 = 4
Gene D: x = x - µ1 = 2 – 4 = -2, y = y - µ2 = 2 – 3 = -1
Gene E: x = x - µ1 = 6 – 4 = 2, y = y - µ2 = 3 – 3 = 0
Trang 5• Bước 2: Xoay lưới dựa trên phương sai
Tính hiệp phương sai (covariance):
σ2
x,y = E(xy) – E(x)E(y)
x1 (=x’) x2 (=y’)
σ2
x1, x2 = E(x1x2) = (0*(-1) + (-4)*(-2) + 4*4 + (-2)*(-1) + 2*0) / 5 = 5.2
σ2
x2, x1 = σ2x1, x2 = 5.2
σ2
x1, x1 = E(x1x1) = (02 + (-4)2 + 42 + (-2)2 + 22) / 5 = 8
σ2
x2, x2 = E(x2x2) = ((-1)2 + (-2)2 + 42 + (-1)2 + 02) / 5 = 4.4
Tính ma trận hiệp phương sai (Covariance matrix):
Trang 6C = σ2
1,1 σ2
1,2 … σ2
1,m
σ2 2,1 σ2
2,2 … σ2
2,m
… … … …
σ2 m,1 σ2
m,2 … σ2
m,m
1,1 σ2
1,2 = 8 5.2
σ2 2,1 σ2
2,2 5.2 4.4
Cần tìm ma trận trị riêng C’
C = σ2
1,1 σ2
1,2 -> C’ = e'1 0
2,1 σ2
2,2 0 e'2
Sau đó tính vecto riêng tương ứng với trị riêng
I = [1 0
0 1] -> ma trận vecto riêng X = ev1,1 ev1,2
ev2,1 ev2,2
mà vecto riêng tương ứng với hệ trục tọa độ vecto cơ sở C*x = λ*x với mọi λ và x (với |xi| ≡ 1)
[ 8 5.2
5.2 4.4] *x = λ*x = λ*[1 0
0 1]*x=[λ 0
0 λ]*x
[ 8 − λ 5.2
5.2 4.4 − λ]*x = 0 8x1- λx1+5.2x2=0
5.2x1+4.4x2-λx2=0
x2 +x2 =1 Dựa vào phương pháp đại số tuyến tính ta tính ra được λ1 ≈ 73.59 x1 ≈ [0.8428
0.5383]
Ta chọn λ1 vì lớn hơn nhiều -> chọn x1
Trang 9• Bước 3: Rút gọn độ phức tạp
Loại x2 vì có phương sai thấp, chỉ chọn x1
v = [𝑣1
𝑣2] -> v’ = [𝑣1
0] ≈ [𝑣1]
Trang 11IV Ứng dụng thực tế:
• Ứng dụng PCA làm công cụ đánh giá cảm quan cho các sản phẩm thực phẩm lên men
• Sử dụng PCA trong chế biến nước ép rau bằng cách lên men lactic
• Ứng dụng PCA trong sản phẩm sữa tiệt trùng
• Ứng dụng trong việc nhận diện khuôn mặt
V Phụ lục:
(1) Bài toán được lấy từ bài giảng PCA của thầy Lê Hoàng Thái