DANH MỤC BẢNG BIỂU Trang Bảng 1- So sánh ƣu, nhƣợc điểm của một số kỹ thuật phát hiện ảnh giả mạo ..... PHẦN MỞ ĐẦU Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG
***
NGUYỄN HỮU NAM
PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO
DẠNG CẮT/DÁN
Luận văn Thạc sĩ Công nghệ Thông tin
ĐỒNG NAI, 2011
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG
***
NGUYỄN HỮU NAM
PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn thạc sĩ công nghệ thông tin: “Phát hiện ảnh
kỹ thuật số giả mạo dạng cắt/dán” là kết quả của quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên cứu đã được công bố, các website, …
Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý luận
và quá trình nghiên cứu tìm hiểu của tác giả
Đồng Nai, tháng 11 năm 2011
Tác giả
Nguyễn Hữu Nam
Trang 4LỜI CẢM ƠN
Lời đầu tiên tôi xin gửi lời cảm ơn Thầy PGS TS Đỗ Năng Toàn đã tận tình giúp đỡ tôi trong suốt thời gian học tập vừa qua, đặc biệt là định hướng nghiên cứu và tận tình hướng dẫn cho tôi trong suốt quá trình làm luận văn Nếu không có sự giúp đỡ tận tình của thầy, tôi khó có thể hoàn thành luận văn này
Bên cạnh đó, tôi chân thành cám ơn các thầy cô Trung tâm Thông tin
Tư liệu, trường Đại Học Lạc Hồng, nơi tôi công tác và nghiên cứu đã tạo điều kiện và hỗ trợ tôi trong suốt thời gian qua
Tôi cũng xin chân thành cám ơn các thầy cô Khoa Công nghệ Thông tin đã tận tình giảng dạy, chỉ bảo và cung cấp cho tôi những kiến thức cần thiết trong suốt thời gian học và cũng xin gởi lời cám ơn chân thành đến những người thân, bạn bè và đồng nghiệp đã giúp đỡ và động viên tôi trong suốt thời gian học tập cũng như trong thời gian thực hiện luận văn
Chân thành cám ơn !
Biên Hòa, ngày 01 tháng 11 năm 2011
Nguyễn Hữu Nam
Trang 5MỤC LỤC
Trang
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC TỪ VIẾT TẮT iv
DANH MỤC HÌNH v
DANH MỤC BẢNG BIỂU vi
PHẦNMỞĐẦU 1
CHƯƠNG1:KHÁIQUÁTVỀXỬLÝẢNHVÀẢNHGIẢMẠO 3
1.1 Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh 3
1.1.1 Xử lý ảnh là gì ? 3
1.1.2 Biểu diễn ảnh số 3
1.1.3 Một số khái niệm cơ sở trong xử lý ảnh 5
1.1.4 Các giai đoạn trong xử lý ảnh 10
1.1.4.1 Thu nhận ảnh 10
1.1.4.2 Tiền xử lý 10
1.1.4.3 Phân đoạn ảnh 11
1.1.4.4 Hệ quyết định 12
1.1.4.5 Trích chọn đặc điểm 12
1.1.4.6 Nhận dạng 13
1.1.5 Biên và các phương pháp dò biên 14
1.1.5.1 Biên và các kiểu biên cơ bản trong ảnh 14
1.1.5.2 Vai trò của biên trong nhận dạng 15
1.1.5.3 Các phương pháp dò biên trực tiếp 17
1.1.5.4 Một số phương pháp dò biên 19
1.1.5.4.1 Phương pháp Canny 19
Trang 61.1.5.4.2 Phương pháp Shen – Castan 21
1.1.6 Phát hiện và so khớp các đặc trưng bất biến 21
1.1.6.1 Điểm bất động và đặc trưng bất biến 21
1.1.6.2 So khớp đặc trưng 24
1.2 Ảnh giả mạo và phát hiện ảnh giả mạo 25
1.2.1 Giới thiệu ảnh giả mạo 25
1.2.2 Các dạng ảnh giả mạo cơ bản 28
1.2.3 Một số ảnh nổi tiếng đã được phát hiện là ảnh giả mạo [18] 30
1.2.4 Hướng tiếp cận bài toán phát hiện ảnh giả mạo 35
1.2.4.1 Dựa vào hình dạng 35
1.2.4.2 Dựa vào phân tích nguồn sáng 36
1.2.4.3 Dựa vào biến đổi màu sắc 36
1.2.4.4 Dựa vào cơ sở dữ liệu 36
1.2.4.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ 37
1.2.4.6 Dựa vào phân tích ánh sáng 37
CHƯƠNG2:MỘTSỐKỸTHUẬTPHÁTHIỆN ẢNHKỸTHUẬTSỐGIẢ MẠO 38
2.1 Phát hiện ảnh giả mạo dựa vào Thuật toán Exact Match [3] 38
2.2 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước [3] 40
2.3 Phát hiện ảnh giả mạo dựa trên sự khác biệt hướng nguồn sáng 42
2.3.1 Các dạng nguồn sáng 42
2.3.1.1 Nguồn sáng ở vô tận (3-D) 43
2.3.1.2 Nguồn sáng ở vô tận (2-D) 45
2.3.1.3 Nguồn sáng ở gần (bộ phận) (2-D) 46
2.3.1.4 Nhiều nguồn sáng 47
2.3.2 Phương pháp ước lượng hướng chiếu nguồn sáng 48
2.3.2.1 Ước lượng hướng chiếu của nguồn sáng 48
Trang 72.3.2.2 Tìm những đường có khả năng là biên khuất 49
2.3.2.3 Ước lượng hướng chiếu sáng cho từng đường biên tìm được 50
2.3.2.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất 50
2.3.3 Phương Pháp dựa trên sự khác biệt hướng nguồn sáng 50
2.3.4 Phương pháp xác định hướng ánh sáng theo đường biên 53
2.3.4.1 Loại bỏ các đối tượng nhỏ, nhiễu và làm mảnh biên 56
2.3.4.1.1 Loại bỏ các đối tượng nhỏ và nhiễu 56
2.3.4.1.2 Làm mảnh biên và nối nét đứt 56
2.3.4.2 Lựa chọn các đoạn biên liên thông của đối tượng dùng ước lượng hướng nguồn sáng 59
2.3.4.3 Xây dựng thuật toán xác định hướng ánh sáng trên mỗi đường biên 60
2.3.4.4 Kết quả thực nghiệm 61
2.4 Phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán dựa vào thuật toán SIFT 64
2.5 So sánh một số kỹ thuật phát hiện ảnh giả mạo 84
CHƯƠNG3:CHƯƠNGTRÌNHTHỰCNGHIỆM 85
3.1 Bài toán 85
3.2 Mô hình bài toán phát hiện ảnh giả mạo 86
3.3 Chương trình phát hiện ảnh kỹ thuật số giả mạo FImage 1.0 86
3.3.1 Cài đặt chương trình 86
3.3.2 Kết quả thực nghiệm 87
PHẦNKẾTLUẬN 90 TÀI LIỆU THAM KHẢO
Trang 8CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
2D 2 Dimensions (Không gian 2 chiều) 3D 3 Dimensions (Không gian 3 chiều) ADC Analog to Digital Converter
RANSAC RANdom Sample Consensus algorithm SIFT Scale Invarian Feature Tranorms
Trang 9DANH MỤC HÌNH ẢNH
Trang
Hình 1.1- Biểu diễn ảnh bằng hàm f(X Y, ) 3
Hình 1.2 - Ma trận 8 láng giềng 6
Hình 1.3 - Các bước cơ bản trong xử lý ảnh số 10
Hình 1.4 - Các thành phần cơ bản của một hệ xử lý ảnh 14
Hình 1.5 - Sơ đồ phân tích ảnh 15
Hình 1.6 – Làm trơn ảnh 20
Hình 1.7 - Minh họa về việc giả mạo ảnh [3] 26
Hình 1.8 - Ghép ảnh từ 2 ảnh riêng rẽ [3] 28
Hình 1.9 - Ảnh che phủ và bỏ đi đối tượng [16] 29
Hình 1.10 - Ảnh bổ sung đối tượng [16] 29
Hình 1.11 - Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh [18] 30
Hình 1.12 - Ảnh giả của John Kerry và Jane Fonda được cắt/dán từ hai ảnh riêng lẻ [16] 31
Hình 1.13 - Ảnh giả mạo Tổng thống Bush đọc sách ngược [18] 31
Hình 1.14 - Dàn khoan dầu, bão và sét [18] 32
Hình 1.15 - Ảnh giả của Holmes với nam diễn viên Tom Cruise được cắt/dán từ tạp chí bao gồm hiển thị Kimo với nữ diễn viên Katie Holmes [16] 33
Hình 1.16 - Cá mập tấn công trực thăng [18] 33
Hình 1.17 - Con mèo trắng khổng lồ [18] 34
Hình 1.18 - Sóng Thần ở Thái Lan [18] 35
Hình 1.19 - Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu [3] 36
Hình 1.20 - Sự khác biệt của các hướng nguồn sáng khác nhau [8] 37
Trang 10Hình 2.1 - Minh họa cho việc tìm kiếm khối bao của thuật toán Exact Match
38
Hình 2.2 - Mô hình ánh xạ các điểm ảnh từ ảnh gốc sang ảnh đích [3] 40
Hình 2.3 - Minh họa hướng nguồn sáng và pháp tuyến bề mặt của đối tượng 45
Hình 2.4 - Hai đối tượng được chiếu bởi 1 nguồn sáng ở gần [8] 47
Hình 2.5 – Quả cầu hiển thị 3 nguồn sáng khác nhau trong khoảng từ – 200 tới +200 48
Hình 2.6 – Hướng nguồn sang từ bên trái sang 50
Hình 2.7 - Ảnh ghép giữa căn nhà và cây thông có nguồn sáng khác nhau 51
Hình 2.8 - Sơ đồ chức năng phát hiện ảnh giả mạo 52
Hình 2.9 - Kết quả đạo hàm theo 2 hướng x và y 54
Hình 2.10 - Kết quả minh họa tính độ lớn biên 54
Hình 2.11 – Hướng pháp tuyến 55
Hình 2.12 - Minh họa các liên thông theo 4, 8, 6 láng giềng 56
Hình 2.13 - Minh họa các điểm được đánh dấu để xóa [2] 56
Hình 2.14 - Lân cận 8 của điểm p1 57
Hình 2.15 - Minh họa các điểm được đánh dấu để nối nét đứt [2] 58
Hình 2.16 - Ảnh minh họa để xem có giả mạo không 61
Hình 2.17 - Ảnh minh họa kết quả xác định hướng ánh sáng trên bức ảnh là khác nhau nên đây là ảnh giả mạo dạng cắt/dán 61
Hình 2.18 – Chỉ ra hướng nguồn sáng khác nhau bằng mũi trên 62
Hình 2.19 – Hình gốc chưa cắt/dán, chỉ có 1 nguồn sáng duy nhất 1250 62
Hình 2.20 – Hình gốc chưa cắt/dán, chỉ có 1 nguồn sáng duy nhất 800 63
Hình 2.21 - Minh họa kết quả xác định hướng ánh sáng trên bức ảnh giả mạo có sẵn [15] 63
Hình 2.22 - Xây dựng một không gian tỷ lệ [9] 65
Trang 11Hình 2.23 - Các giá trị cực đại và cực tiểu của các ảnh DoG 66
Hình 2.24 – Hình ảnh ban đầu để xác định điểm khóa 70
Hình 2.25 - Minh họa mô tả 4099 điểm khóa tìm được 70
Hình 2.26 – Trước khi định vị điểm hấp dẫn 71
Hình 2.27 - Sau khi định vị điểm hấp dẫn 72
Hình 2.28 - Tính độ lớn và hướng của gradient 74
Hình 2.29 - Bộ mô tả điểm khóa 75
Hình 2.30 – Kết quả thu được từ thuật toán Sift và kết hợp với nhiều điểm khóa 78
Hình 2.31 - Gán cho mỗi điểm khóa cho một nốt (cluster) 79
Hình 2.32 – Tách điểm khóa thành các cụm Agglomerative 79
Hình 2.33 - Cách nhóm các cụm lại với nhau [15] 80
Hình 2.34 – Kế quả thu được là hình bị giả mạo 83
Hình 2.35 – Kết quả thu được là hình bị nhân bản lên thành 3 đối tượng giống nhau [16] 83
Hình 3.1 - Sơ đồ chức năng phát hiện ảnh giả mạo [16] 86
Hình 3.2 - Ảnh minh họa để xem có giả mạo không 87
Hình 3.3 - Ảnh minh họa kết quả xác định hai đối tượng là giống nhau nên đây là ảnh giả mạo dạng cắt/dán 87
Hình 3.4 - Ảnh minh họa để xem có giả mạo không 88
Hình 3.5 - Ảnh minh họa kết quả xác định hai đối tượng là giống nhau nên đây là ảnh giả mạo dạng cắt/dán 88
Hình 3.6 – Hai hình giả mạo trong cuộc thi “Worth1000 Photoshop” Mỗi hình ảnh được cắt/dán cùng một người [16] 89
Trang 12DANH MỤC BẢNG BIỂU
Trang Bảng 1- So sánh ƣu, nhƣợc điểm của một số kỹ thuật phát hiện ảnh giả mạo 27
Trang 13PHẦN MỞ ĐẦU
Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật của khoa học công nghệ được ứng dụng vào thực tế và ảnh số chính là một trong những thành quả đó Ảnh số ngày càng dễ sửa chữa và hiệu chỉnh do sức mạnh của các phần mềm soạn thảo và xử lý ảnh mà điển hình là PhotoShop Ngày nay, các chương trình xử lý ảnh có thể thêm vào hoặc bỏ đi các đặc trưng của ảnh mà không để lại các dấu hiệu về sự giả mạo Điều đó
có nghĩa việc phát hiện ra ảnh giả mạo là vấn đề phải đặt ra ngày càng cấp bách và càng trở nên khó khăn
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã được công nhận bởi cộng đồng các nhà nghiên cứu, nhưng hiện nay rất ít tài liệu có giá trị về lĩnh vực này Nhất là trong điều kiện Việt Nam, chưa có nhiều những nghiên cứu này, trong khi thực tế đặt ra những nhu cầu, đòi hỏi
Xuất phát trong hoàn cảnh đó, luận văn lựa chọn đề tài “Phát hiện ảnh
kỹ thuật số giả mạo dạng cắt/dán” nhằm nghiên cứu một số kỹ thuật phát hiện ảnh kỹ thuật số giả mạo được tạo ra bởi việc sử dụng các chương trình xử lý ảnh thông dụng, thông qua việc cắt/dán từ chính một ảnh và có sự thay đổi về kích thước đối với các đối tượng bị cắt/dán Đây cũng chính là cách thường được các đối tượng sử dụng trong quá trình tạo ảnh số giả nhờ
kỹ thuật cắt/dán
* Nội dung chính của luận văn gồm:
- Phần mở đầu
- Chương 1: Khái quát về xử lý ảnh và ảnh giả mạo: Chương này đề
cập đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh và các khái niệm cơ bản về ảnh giả mạo
Trang 14- Chương 2: Một số kỹ thuật phát hiện ảnh giả mạo: Chương này
gồm các khái niệm cơ bản về các bài toán và một số phương pháp để phát
hiện ảnh kỹ thuật số giả mạo
Trên cơ sở các thuật toán đã tìm hiểu và áp dụng thuật toán để phát
hiện ảnh kỹ thuật số giả mạo dạng cắt/dán
- Chương 3: Xây dựng chương trình thực nghiệm: Tiến hành xây
dựng chương trình thực nghiệm để phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán
- Phần kết luận
Trang 15CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO
1.1 Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh
1.1.1 Xử lý ảnh là gì ?
Con người thu nhận thông tin qua các giác quan trong đó thị giác đóng vai trò quan trọng nhất vì 80% thông tin được thu nhận bằng mắt tức là ở dạng ảnh Mặt khác với sự phát triển mạnh mẽ của phần cứng máy tính, xử lý ảnh, đồ hoạ ngày càng có nhiều ứng dụng thực tiễn phục vụ cuộc sống Như vậy, xử lý ảnh đóng một vai trò rất quan trọng trong sự tương tác giữa người
và máy
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử lý ảnh số [2] bao gồm các phương pháp và kĩ thuật để biến đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên
1.1.2 Biểu diễn ảnh số
Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh được biểu diễn bằng một hàm cường độ sáng hai chiều f(X Y, ), trong đó X Y, là các giá trị toạ độ không gian và hàm giá trị của f tại một điểm ( , )X Y bất kỳ sẽ tỷ lệ với độ sáng hay mức xám của điểm ảnh tại điểm này [2,3]
Hình 1.1- Biểu diễn ảnh bằng hàm f(X Y, )
Trong một số trường hợp hàm ảnh còn được biểu diễn với một trục thứ 3
gọi là hàm cường độ sáng (với hình 1.1, trục thứ 3 bằng 0)
* P(X,Y)
Trang 16Một ảnh số là một ảnh f(X Y, ) được gián đoạn theo không gian và cường độ sáng Một ảnh số được xem như một ma trận với hàng và cột biểu diễn một điểm trong ảnh và giá trị điểm ma trận tương ứng với mức xám tại điểm đó Các phần tử của một dãy số như thế được gọi là các điểm ảnh
Ánh sáng có dạng năng lượng f(X Y, ) phải khác 0 và hữu hạn:
,
0 f(X Y) (1.1) Con người có khả năng nhận các hình ảnh từ ánh sáng phản xạ qua các vật thể Cơ sở của f(X Y, ) được đặc trưng qua hai thành phần:
- Số lượng ánh sáng nguồn rơi trên cảnh vật được nhìn thấy
- Số lượng ánh sáng nguồn phản xạ từ vật thể ( trong cảnh vật)
Chúng được gọi gần đúng là sự phát sáng và các thành phần phản xạ, và được biểu diễn tương ứng là i(X Y, ) và r(X Y, ) Bản chất của i(X Y, ) được xác định bằng nguồn sáng và của r(X Y, )được xác định bằng các đặc trưng của vật thể Hàm i(X Y, ) và r(X Y, ) kết hợp với nhau để cho hàm f(X Y, )
Với:
, ,
( ) ( ) ( ) (1.2)( 0 ( )
Trong lý thuyết, chỉ cần Lmin 0 và Lmaxhữu hạn Trong thực tế:
min min min max max max
Trang 17Khoảng Lmin,Lmax được gọi là thang xám Ta có thể dịch khoảng này đến 0, L , trong đó l0 là đen và lL là trắng trong thang xám Giá trị tức thời là các dạng mức xám thay đổi liên tục từ đen đến trắng
1.1.3 Một số khái niệm cơ sở trong xử lý ảnh
Để có thể xử lý bằng máy tính điện tử thì ảnh cần phải được số hóa Đó là quá trình biến đổi ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc lấy mẫu và lượng tử hóa Trong quá trình này người ta sử dụng khái niệm
“pixel” Mỗi pixel được đặc trưng bởi một cặp tọa độ (X Y, ) và màu sắc của nó.[4]
Ảnh: Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một
mảng hai chiều I( , )n p có n dòng và p cột, ảnh sẽ có n p(pixel) Ta ký hiệuI(X Y, )để chỉ điểm ảnh có toạ độ (X Y, )
Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element [20]) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa
độ (x,y)
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
Trang 18xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
Các điểm 4 láng giềng:
Giả sử (i,j) là một điểm ảnh, khi đó các điểm 4 - láng giềng là:
N4 = {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}
F: là điểm đen
F : là điểm trắng
Quan hệ K liên thông (K = 4, 8) là một quan hệ phản xạ, đối xứng, bắc cầu, là quan hệ tương đương Mỗi lớp tương đương của nó biểu diễn một thành phần K liên thông của ảnh Về sau ta gọi mỗi thành phần K liên thông của ảnh là một đối tượng ảnh
Kỹ thuật phóng to, thu nhỏ ảnh:
Khi ảnh quá lớn chúng ta muốn nhìn toàn bộ ảnh thì chúng ta phải thu nhỏ ảnh lại và ngược lại khi ta muốn xem chi tiết một bộ phận nào đó của ảnh thì ta phải phóng to nó lên
Trang 19+ Kỹ thuật phóng to ảnh:
Khi phóng to ảnh với một tỉ lệ k nào đó ta thu được ảnh mới to gấp k lần ảnh cũ (k là độ phóng của ảnh) như thế ảnh mới sẽ có kích thước là :
Height = Height * k Width = Width * k
Việc tính các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức:
xp=x/k yp=y/k
+ Kỹ thuật thu nhỏ ảnh:
Tương tự như phóng to ảnh, khi thu nhỏ ảnh ta thu được ảnh mới giống ảnh cũ nhưng có kích thước nhỏ hơn ảnh cũ Kích thước của ảnh mới là :
Height=Height/k Width=Width/k
Việc tính các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức:
xp = x*k
yp = y*k
Mức xám (Gray level): Đó là kết quả của việc mã hóa, cho tương ứng
một cường độ sáng của mỗi điểm ảnh với một giá trị số, có thể là
16, 32, 64 mức
Biểu diễn ảnh: Trong biểu diễn ảnh người ta thường sử dụng các phần
tử đặc trưng của ảnh là pixel Một hàm hai biến chứa các thông tin như một biểu diễn ảnh Một số mô hình thường dùng để biểu diễn ảnh là mô hình toán (biểu diễn ảnh nhờ các hàm cơ sở), mô hình thống kê (ảnh coi như một phần
tử của một tập hợp đặc trưng bởi kỳ vọng toán, hiệp biến, phương sai, moment…).[2]
Trang 20 Tăng cường ảnh: Đây là một bước quan trọng bao gồm các kỹ thuật
lọc độ tương phản, khử nhiễu, nổi màu…
Biến đổi ảnh: Thao tác chủ yếu trên một tập các ma trận và sử dụng
các kỹ thuật để biến đổi ảnh qua ma trận: Biến đổi Furie, Sin, Cosin, tích Kronecker
Phân tích ảnh: Liên quan tới việc xác định các độ đo định lượng của
một ảnh để đưa ra một mô tả đầy đủ về ảnh Có những kỹ thuật cơ bản để hỗ trợ phân tích ảnh: Dò biên, lọc vi phân, dò theo quy hoạch động, phân vùng ảnh [2]
Nhận dạng ảnh: Quá trình này liên quan đến các mô tả đối tượng mà
người ta muốn đặc tả nó Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặc trưng chủ yếu của đối tượng
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách mơ hồ (vaguely defined) và có thể gán cho
nó một tên gọi nào đó” Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu
đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào
Trang 21các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây:
- Thu nhận dữ liệu và tiền xử lý
- Biểu diễn dữ liệu
- Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
- Đối sánh mẫu dựa trên các đặc trưng được trích chọn
- Phân loại thống kê
- Đối sánh cấu trúc
- Phân loại dựa trên mạng nơ-ron nhân tạo
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lại (hybrid system) bao gồm nhiều mô hình kết hợp
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu
Trang 221.1.4 Các giai đoạn trong xử lý ảnh
Bài toán xử lý ảnh bao gồm các giai đoạn tổng quát như sau:
Hình 1.3 - Các bước cơ bản trong xử lý ảnh số
1.1.4.1 Thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh Để thực hiện điều này,
ta cần có bộ thu ảnh và khả năng số hoá những tín hiệu liên tục được sinh ra
bởi bộ thu ảnh đó Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu,
máy quét ảnh, Trong trường hợp bộ thu ảnh cung cấp chưa phải là dạng số
hoá ta còn phải chuyển đổi hay số hoá ảnh
Quá trình chuyển đổi ADC (Analog to Digital Converter) để thu nhận
dạng số hoá của ảnh Các thông số quan trọng ở bước này là độ phân giải,
chất lượng màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị
Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hưởng rất
nhiều đến công đoạn kế tiếp
1.1.4.2 Tiền xử lý
Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khử
bóng, khử độ lệch,v.v… với mục đích làm cho chất lượng ảnh trở nên tốt hơn
nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý
ảnh Quá trình này thường được thực hiện bởi các bộ lọc
Trang 23+ Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu
ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằng phương pháp nội suy, lọc trung vị và trung bình
+ Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh
+ Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay điện
tử có thể bị mờ, nhoè Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này
1.1.4.3 Phân đoạn ảnh
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này
Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về nhiều phần tử khác nhau cấu tạo lên ảnh thô Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào
đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu
Trang 241.1.4.5 Trích chọn đặc điểm
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt
ra những yêu cầu về tốc độ tính toán
Đặc điểm chung của tất cả ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau đây:
- Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v
- Đặc điểm biến đổi: các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v )
Trang 25- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử Gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing)
1.1.4.6 Nhận dạng
Nhận dạng ảnh là quá trình xác định nội dung ảnh
Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được lọc (hoặc lưu) từ trước
Đây là bước cuối cùng trong quá trình xử lý ảnh
Nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán nhãn cho các đối tượng trong ảnh Ví dụ như khi nhận dạng chữ viết, các đối tượng trong ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ
đó ra và tìm cách gán đúng các ký tự của bảng chữ cái tương ứng cho các mẫu chữ thu được trong ảnh Giải thích là công đoạn gán nghĩa cho một tập các đối tượng đã được nhận biết
Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý ảnh nào cũng bắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở trên, ví
dụ như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý
Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng
và giải thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán
tự động, được dùng để rút trích ra những thông tin quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v…
Để xử lý các quá trình trên thì cần một hệ thống xử lý ảnh bao gồm một
số thành phần cơ bản sau đây:
Trang 26Hình 1.4 - Các thành phần cơ bản của một hệ xử lý ảnh
Bộ xử lý tương tự thực hiện các chức năng:
- Chọn Camera thích hợp nếu có nhiều Camera
- Chọn màn hình hiển thị tín hiệu
- Thu nhận tín hiệu video bởi bộ số hóa Thực hiện lấy mẫu và mã hóa
- Tiền xử lý ảnh khi thu nhận
Bộ xử lý ảnh số bao gồm nhiều bộ xử lý chuyên dụng: Xử lý lọc, trích
chọn đặc trưng, nhị phân hóa ảnh
Máy chủ đóng vai trò điều khiển các thành phần khác
Bộ nhớ ngoài: Lưu trữ dữ liệu ảnh cũng như các kiểu dữ liệu khác để
có thể chuyển giao cho các quá trình có nhu cầu
1.1.5 Biên và các phương pháp dò biên
1.1.5.1 Biên và các kiểu biên cơ bản trong ảnh
Các đặc trưng của ảnh thường bao gồm các thành phần như: mật độ
xám, phân bố xác suất, phân bố không gian, biên ảnh [2] Biên là một vấn đề
chủ yếu và đặc biệt quan trọng trong phân tích ảnh vì các kĩ thuật phân đoạn
ảnh chủ yếu dựa vào biên
Trang 27Hiện nay có nhiều định nghĩa về biên ảnh [1] và mỗi định nghĩa được
sử dụng trong một số trường hợp nhất định Song nhìn chung, ta có thể hiểu là: một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám
Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh
Tập hợp các điểm biên tạo thành biên, hay còn gọi là đường bao của ảnh (boundary) Chẳng hạn, trong một ảnh nhị phân, một điểm có thể được gọi là biên nếu đây là một điểm đen và có ít nhất một điểm trắng nằm trong lân cận điểm đó
Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và được tính toán từ những điểm lân cận nó Đó là một biến Vector bao gồm hai thành phần:
- Độ lớn của Gadient
- Hướng φ được xoay đối với hướng Gradient ψ
1.1.5.2 Vai trò của biên trong nhận dạng
Một cách tổng quan có thể nói rằng bất kỳ một hệ thống xử lý ảnh nào cũng tuân theo một số giai đoạn sau:
Hình 1.5 - Sơ đồ phân tích ảnh Con người thường nhìn nhận sự vật theo hai cách hoặc là dựa vào biên hoặc là dựa vào xương của chúng Chẳng hạn, ta dựa vào biên khi quan sát các đối tượng như ao, hồ hoặc một cái xe ô tô Nhưng nếu để phân biệt một khúc sông với những đối tượng khác trên bản đồ địa hình thì ta lại dựa vào
Phân đoạn ảnh
Phân loại Ảnh đầu vào cho
quá trình tiền xử lý
Phân loại Phân tích
đặc trưng
Trang 28xương của nó Vì vậy, cùng với xương thì biên có một tầm quan trọng đặc biệt trong phân tích và nhận dạng hình ảnh
Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên Có thể thấy tầm quan trọng của biên khi ta theo dõi một kiến trúc sư làm việc Giả sử anh ta muốn thiết kế một phòng khách sang trọng, nét đầu tiên được phác họa chính là đường biên hay tường của căn phòng sau đó mới đến các chi tiết nội thất bên trong Như vậy, mới chỉ nhìn biên của sự vật ta cũng đã hình dung ít nhiều về nó và có thể phân biệt được nó với các sự vật khác
Nhìn chung về mặt toán học, có thể xem điểm biên của ảnh là một điểm
mà ở đó có sự thay đổi đột ngột về độ sáng Xuất phát từ cơ sở đó, người ta thường sử dụng hai phương pháp phát hiện biên sau:
Phương pháp phát hiện biên trực tiếp là làm nổi biên dựa vào sự biến thiên về độ sáng của ảnh Kỹ thuật chủ yếu được dùng là dựa vào đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient, nếu lấy đạo hàm bậc hai ta có phương pháp Laplace
Phương pháp phát hiện biên gián tiếp Nếu bằng một cách nào đó ta phân biệt được ảnh bằng các vùng thì đường phân ranh giới giữa các vùng đó chính là biên Hai kỹ thuật dò biên và phân vùng các đối tượng là hai bài toán đối ngẫu nhau Thật vậy, dò biên để phân lớp một đối tượng ảnh, nhưng nếu phân lớp xong thì có nghĩa là đã phân vùng được các đối tượng ảnh và ngược lại, khi đã phân vùng được các đối tượng ảnh thì cũng phân lớp được các đối tượng ảnh và ta có thể phát hiện biên
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự vật có sự biến đổi độ sáng không đột ngột phương pháp này tỏ ra rất kém hiệu quả
Trang 29Phương pháp dò biên gián tiếp tuy khó cài đặt nhưng lại áp dụng tốt cho những ảnh có sự biến thiên độ sáng ít
1.1.5.3 Các phương pháp dò biên trực tiếp
Phương pháp Gradient
Phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm Theo định nghĩa, Gradient là một vector biểu thị tốc độ thay đổi giá trị của điểm ảnh theo 2 hướng x và y Các thành phần của Gradient được tính bởi:
dx
y x f y dx x f x
y x f
y x f
f r
x x
f r
f x x
f f
r.f x sin + r.f y cos
Trong thực tế, khi ta nói lấy đạo hàm của ảnh thực ra chỉ là mô phỏng
và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập hay phép cuộn Do ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại
* Kỹ thuật PreWitt: Kỹ thuật này sử dụng 2 mặt nạ theo hai hướng x và
Trang 30Quá trình tính toán được thực hiện qua 2 bước:
2
2 2 2
y
f x
f x x
2
2
[f(x+1,y) - f(x,y)] - [f(x,y) - f(x-1,y)]
= f(x+1,y) – 2f(x,y) + f(x-1,y)
Tương tự:
2 2
y
f f(x,y+1) - 2f(x,y) + f(x,y-1)
Trang 311.1.5.4 Một số phương pháp dò biên
1.1.5.4.1 Phương pháp Canny
Phương pháp này do John Canny [6] ở phòng thí nghiệm MIT khởi xướng vào năm 1986 Canny đã đưa một tập hợp các ràng buộc mà một phương pháp phát hiện biên phải đạt được Ông đã trình bày một phương pháp tối ưu nhất để thực hiện được các ràng buộc đó Và phương pháp này được gọi là phương pháp Canny
* Ý tưởng của phương pháp này là định vị đúng vị trí bằng cách cực tiểu hoá phương sai δ2
của vị trí các điểm cắt "Zero" hoặc hạn chế số điểm cực trị cục bộ để chỉ tạo ra một đường bao
Các ràng buộc mà phương pháp phát hiện biên Canny đã thực hiện được đó là: mức lỗi, định vị và hiệu suất Trong đó:
+ Mức lỗi: có ý nghĩa là một phương pháp phát hiện biên chỉ và phải tìm tất cả các biên, không biên nào được tìm bị lỗi
+ Định vị: Điều này nói đến độ chênh lệch cấp xám giữa các điểm trên cùng một biên phải càng nhỏ càng tốt
+ Hiệu suất: là làm sao cho khi tách biên không được nhận ra nhiều biên trong khi chỉ có một biên tồn tại
Ràng buộc mức lỗi và định vị được dùng để đánh giá các phương pháp phát hiện biên Còn ràng buộc về hiệu suất thì tương đương với mức lỗi dương
Canny đã giả thiết rằng nhiễu trong ảnh tuân theo phân bố Gauss và đồng thời ông cũng cho rằng một phương pháp phát hiện biên thực chất là một bộ lọc nhân xoắn có khả năng làm mịn nhiễu và định vị được cạnh Vấn
đề là tìm một bộ lọc sao cho thoả mãn tối ưu nhất các ràng buộc ở trên
Đây là một thuật toán tương đối tốt, có khả năng đưa ra đường biên mảnh, và phát hiện chính xác điểm biên với điểm nhiễu
Trang 324 9 12 9 4
5 12 15 12 5
4 9 12 9 4
2 4 5 4 2
+ Bước 3: Tính gradient hướng tại mỗi điểm (i,j) của ảnh Hướng này sẽ
được nguyên hóa để nằm trong 8 hướng [0 7], tương đương với 8 lân cận của một điểm ảnh
+ Bước 4: Dùng ràng buộc “loại bỏ những điểm không phải là cực đại”
để xóa bỏ những điểm không là biên Xét (i,j), là gradient hướng tại (i,j) I1, I2 là hai điểm lân cận của (i,j) theo hướng Theo định nghĩa điểm biên cục
bộ thì (i,j) là biên nếu I(i,j) cực đại địa phương theo hướng gradient Nếu I(i,j) > I1 và I(i,j) > I2 thì mới giữ lại I(i,j), ngược lại xóa I(i,j) về
điểm ảnh nền
+ Bước 5: Phân ngưỡng Với các điểm được giữ lại, thực hiện lấy
ngưỡng gradient biên độ lần cuối để xác định các điểm biên thực sự
Trang 331.1.5.4.2 Phương pháp Shen – Castan
Shen và Castan [6] có cùng quan điểm với Canny về một mẫu chung trong việc tách các đường biên Đó là: nhân xoắn ảnh với một mặt nạ làm mịn, sau đó tìm ra điểm biên Tuy nhiên, trong những phân tích của họ lại tạo
ra một hàm khác để tối ưu, đó là việc đề xuất cực tiểu hoá hàm sau trong không gian một chiều:
Nói một cách khác, hàm mà làm cực tiểu ở trên là bộ lọc mịn tối ưu cho việc tách biên Tuy nhiên, Shen và Castan lại không đề cập đến việc thuật toán sẽ nhận ra được nhiều cạnh trong khi chỉ có một cạnh tồn tại
Để tìm điểm bất động, người ta thường dùng các phương pháp xác định
trước một khoảng [a,b] thỏa mãn tính chất nào đó mà chứa điểm x*, sau đó
dùng các phương pháp lặp (như Newton, Leibniz…) để tính gần đúng điểm bất động Sau một số bước, phép lặp sẽ hội tụ về điểm bất động
Điểm bất động trong xử lý ảnh
Trong xử lý ảnh, người ta cũng thường sử dụng ánh xạ f:AB, với A là
tập các điểm ảnh, hay nói cách khác f là phép biến đổi ảnh Các phép biến đổi
(1.11)
Trang 34ảnh thường thấy là phép biến đổi affine (phép quay, phép tỷ lệ, phép tịnh
tiến…), phép thay đổi cường độ sáng Ta gọi các phép biến đổi đó là f: II’, biến ảnh I thành ảnh I’
Bằng một cách nào đó, ta sẽ trích ra từ ảnh I các điểm đặc trưng (x,y) thỏa mãn tính chất H Nếu sau phép biến đổi A, ảnh II’, điểm (x,y) của ảnh
I trở thành (x’,y’) của ảnh I’, và điểm đó vẫn thỏa mãn tính chất H đối với ảnh I’ thì có thể coi điểm (x,y) đó là điểm bất động đối với phép biến đổi f
Đặc trưng bất biến ảnh được xây dựng dựa trên cở sở của điểm bất động Một tập các điểm bất động cùng với các đặc trưng bất biến được tạo ra từ nó
có thể được xem như là các đặc tính biểu diễn chất liệu ảnh hay đối tượng ảnh Như vậy, để tìm các đặc trưng bất biến ảnh: đầu tiên ta xác định các điểm bất động trong ảnh đối với phép biến đổi hình học nào đó, sau đó tính toán các mô tả dựa vào các điểm bất động đã tìm được, các mô tả này chính là các đặc trưng bất biến để biểu diễn ảnh
Có nhiều phương pháp trích chọn các đặc trưng bất biến, tùy thuộc vào từng ứng dụng cụ thể mà các đặc trưng phù hợp sẽ được trích chọn Bài báo này đề cập đến các đặc trưng bất biến tỷ lệ (scale) và bất biến quay (rotation) Trong [9] xác định các điểm bất động đối với phép biến đổi tỷ lệ (SIFT), các điểm này còn gọi là các điểm khóa (keypoint), các điểm khóa (keypoint) được tìm ra trên cơ sở xây dựng các pyramid Gaussian, nó chính là nghiệm của các
phương trình khai triển Taylor của DoG D(x,y,σ) trên không gian tỷ lệ, được
thay đổi sao cho gốc tọa độ trùng với điểm lấy mẫu (sample point):
X X
D X X X
D D X
T
2 2
2
1 )
Trang 35D(x,y,σ) = (G(x,y,kσ)-G(x,y,σ))*I(x,y)
= L(x,y,kσ) - L(x,y,σ)
2 2 2
2 ) (
2
1 ) , ,
y x G
D và các đạo hàm của nó được đánh giá tại một điểm trung tâm (giữa)
trên ảnh sau khi đã lấy mẫu bằng hàm Gauss
Giải phương trình D(X)=0 ta sẽ tìm được các nghiệm:
X
D X
D X
Sau bước này, ta xác định được vị trí của các điểm khóa (keypoint) đồng
thời tỉ lệ σ được chọn Các điểm điểm khóa (keypoint) này thực chất đã bất
biến tỉ lệ Bây giờ, xây dựng đặc trưng bất biến quay từ các điểm khóa (keypoint) này dựa trên việc tính toán độ lớn và hướng gradient ảnh quanh vị trí của các keypoint, các giá trị này thường được tính toán so với điểm láng giềng bên cạnh [9], chẳng hạn đối với đặc trưng khoảng cách ta có:
(1.13) Hay đặc trưng góc:
(1.14)
2 2
)) 1 , ( ) 1 , ( ( )) , 1 ( ) , 1 ( ( )
,
(x y L x y L x y L x y L x y
m
))) , 1 ( ) , 1 ( /(
)) 1 , ( ) 1 , ( ((
tan )
,
Trang 36L(x,y) chính là giá trị điểm ảnh của ảnh Pyramid có σ được chọn Hơn nữa, ở đây chúng tôi kí hiệu L(x,y) là vì thực chất việc tính công thức trên chỉ
là phép trừ ảnh chứ chúng tôi không tính toán từng L(x,y, σ) cụ thể
Với mỗi điểm khóa (keypoint) chúng tôi xây dựng đặc trưng hướng và
độ lớn gradient trên một lân cận kích thước (4x4) theo 8 hướng theo công
thức (1.13) và (1.14), cuối cùng sẽ thu được một vector đặc trưng 128 chiều
Việc so khớp các vùng ảnh được thực hiện sau đó trên cơ sở đối sánh hay so khớp các đặc trưng
1.1.6.2 So khớp đặc trưng
Phát hiện đối tượng hay vùng ảnh giống nhau, được thực hiện chủ yếu bằng việc so khớp mỗi đặc trưng một cách độc lập với nhau Việc so khớp được tiến hành dựa vào việc tính toán khoảng cách, một khoảng cách thường dùng là khoảng cách Euclid
Giả sử các đặc trưng được mô tả dưới dạng các vector trong không gian Euclid Rn thì khoảng cách Euclidean giữa hai đặc trưng P = (p1, p2, ., pn)
p q
p q
p Q
P
d
1
2 2
2 2 2 2 1
Trang 37Khoảng cách Mahalanobis từ một nhóm giá trị với giá trị trung bình = (1, 2, …, p)T và ma trận đồng biến cho một vector đa biến x= (x1,x2,…,
x y
1.2 Ảnh giả mạo và phát hiện ảnh giả mạo
1.2.1 Giới thiệu ảnh giả mạo
Ảnh giả mạo được xem là ảnh không có thật, việc có được ảnh là do sự ngụy tạo bởi các chương trình xử lý ảnh hoặc quá trình thu nhận Sức mạnh
Trang 38của các chương trình xử lý ảnh số như Photoshop giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ dàng Một trong những ví dụ
cho việc giả mạo này là Hình 1.7 Hình ảnh được tạo lập từ 3 bức ảnh: Nhà
trắng, Bill Clinton và Saddam Hussein Hình ảnh Bill Clinton và Saddam Hussein được cắt/dán vào bức ảnh Nhà trắng Các hiệu ứng về bóng và ánh sáng cũng được tạo ra làm cho bước ảnh có vẻ nhìn hoàn toàn như thật
Hình 1.7 - Minh họa về việc giả mạo ảnh [3]
Giả mạo ảnh nhằm vào nhiều mục đích trong đó có việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v Việc phát hiện và chống giả mạo ảnh là một chủ đề ngày càng được quan tâm bởi các nhóm nghiên cứu trên thế giới như: TS Chung-Sheng Li ở IBM T J Watson Research Center, TS Jessica Fridrich ở Department of Electrical and Computer Engineering, SUNY Binghamton, Binghamton, NY 13902-6000 hay TS David Rosenthal ở Odyssey Research Associates, Inc v.v
Trang 39Trong việc chống giả mạo ảnh, người ta đã nghiên cứu các kỹ thuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào bức ảnh trước khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện cho việc phát hiện sửa đổi hoặc cắt/dán sau này Theo cách tiếp cận này, các thiết bị máy ảnh số và camera ngày nay thường bổ sung các tính năng bản quyền ngay trong quá trình thu nhận ảnh Dựa vào đó, sau này ta có thể biết được nguồn gốc của bức ảnh Nhờ đó mà có thể biết được đó có phải là ảnh gốc hay không? Phát hiện ảnh giả mạo là một vấn đề khó hơn, ảnh giả mạo thường chia làm hai loại chính Ảnh giả nhưng thật, ở đây hiện trường được dựng thật
và sau đó việc thu nhận ảnh là thật Loại thứ hai là ảnh giả được tạo lập trên
cơ sở các phần của ảnh gốc thật như hình 1 hoặc được cắt/dán để thêm vào hay che đi các chi tiết trên ảnh
Trong báo cáo này chúng ta quan tâm đến một dạng của giả mạo thuộc loại thứ hai Phần tiếp theo của báo cáo được trình bày như sau: Phần 2 là các dạng ảnh giả mạo loại hai cơ bản Phần 3 là các cách tiếp cận chính trong việc phát hiện ảnh giả mạo loại hai và cuối cùng là kết luận về ảnh giả mạo và phát hiện ảnh giả mạo nói chung
Trang 401.2.2 Các dạng ảnh giả mạo cơ bản
Trong dạng ảnh giả mạo thứ hai có thể chia ra làm các loại: Ghép ảnh,
che phủ đối tượng, bổ sung thêm đối tượng Hình 1.8.a minh họa ảnh ghép từ
2 ảnh riêng rẽ với cùng tỷ lệ Rõ ràng là nếu chỉ ra đây là ảnh thật hay ảnh giả mạo thì cũng có nghĩa là chứng minh được mối quan hệ giữa họ
Hình 1.8.b là ảnh ghép từ hai ảnh có sự thay đổi tỷ lệ Hình ảnh này nếu
không chứng minh là giả tạo thì sẽ phải có cách nhìn khác về tiến hóa của loài người
a) Ảnh ghép từ hai ảnh riêng rẽ b) Ảnh ghép từ hai ảnh có thay đổi
tỷ lệ Hình 1.8 - Ghép ảnh từ 2 ảnh riêng rẽ [3]
Một dạng khác thường thấy nữa của ảnh giả mạo loại hai là việc bớt đi các đối tượng trong ảnh, việc bớt đi các đối tượng trong ảnh có thể được xem
như là che phủ đối tượng hoặc xóa đi đối tượng Hình 1.9.a là ảnh gốc với 2 chiếc ô tô, một xe con và một xe tải Hình 1.9.b là hình 1.9.a giả tạo với việc
che phủ chiếc xe tải bởi một cành cây cũng lấy từ chính trong ảnh Trong khi
hình 1.9.c là ảnh gốc với chiếc trực thăng nhỏ còn hình 1.9.d chính là ảnh gốc hình 1.9.a đã được bỏ đi đối tượng là trực thăng Trong cả hai trường hợp giả
mạo này đều được thực hiện từ một ảnh nên độ tương đồng về ánh sáng và bóng là như nhau Do đó, bằng mắt thường rất khó xác định