Phát hiện ảnh kỹ thuật số giả mạo dạng cắt dán luận văn thạc sĩ

DANH MỤC BẢNG BIỂU Trang Bảng 1- So sánh ƣu, nhƣợc điểm của một số kỹ thuật phát hiện ảnh giả mạo ..... PHẦN MỞ ĐẦU Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG

***

NGUYỄN HỮU NAM

PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO

DẠNG CẮT/DÁN

Luận văn Thạc sĩ Công nghệ Thông tin

ĐỒNG NAI, 2011

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG

***

NGUYỄN HỮU NAM

PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn thạc sĩ công nghệ thông tin: “Phát hiện ảnh

kỹ thuật số giả mạo dạng cắt/dán” là kết quả của quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc

Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên cứu đã được công bố, các website, …

Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý luận

và quá trình nghiên cứu tìm hiểu của tác giả

Đồng Nai, tháng 11 năm 2011

Tác giả

Nguyễn Hữu Nam

Trang 4

LỜI CẢM ƠN

Lời đầu tiên tôi xin gửi lời cảm ơn Thầy PGS TS Đỗ Năng Toàn đã tận tình giúp đỡ tôi trong suốt thời gian học tập vừa qua, đặc biệt là định hướng nghiên cứu và tận tình hướng dẫn cho tôi trong suốt quá trình làm luận văn Nếu không có sự giúp đỡ tận tình của thầy, tôi khó có thể hoàn thành luận văn này

Bên cạnh đó, tôi chân thành cám ơn các thầy cô Trung tâm Thông tin

Tư liệu, trường Đại Học Lạc Hồng, nơi tôi công tác và nghiên cứu đã tạo điều kiện và hỗ trợ tôi trong suốt thời gian qua

Tôi cũng xin chân thành cám ơn các thầy cô Khoa Công nghệ Thông tin đã tận tình giảng dạy, chỉ bảo và cung cấp cho tôi những kiến thức cần thiết trong suốt thời gian học và cũng xin gởi lời cám ơn chân thành đến những người thân, bạn bè và đồng nghiệp đã giúp đỡ và động viên tôi trong suốt thời gian học tập cũng như trong thời gian thực hiện luận văn

Chân thành cám ơn !

Biên Hòa, ngày 01 tháng 11 năm 2011

Nguyễn Hữu Nam

Trang 5

MỤC LỤC

Trang

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

MỤC LỤC iii

DANH MỤC CÁC TỪ VIẾT TẮT iv

DANH MỤC HÌNH v

DANH MỤC BẢNG BIỂU vi

PHẦNMỞĐẦU 1

CHƯƠNG1:KHÁIQUÁTVỀXỬLÝẢNHVÀẢNHGIẢMẠO 3

1.1 Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh 3

1.1.1 Xử lý ảnh là gì ? 3

1.1.2 Biểu diễn ảnh số 3

1.1.3 Một số khái niệm cơ sở trong xử lý ảnh 5

1.1.4 Các giai đoạn trong xử lý ảnh 10

1.1.4.1 Thu nhận ảnh 10

1.1.4.2 Tiền xử lý 10

1.1.4.3 Phân đoạn ảnh 11

1.1.4.4 Hệ quyết định 12

1.1.4.5 Trích chọn đặc điểm 12

1.1.4.6 Nhận dạng 13

1.1.5 Biên và các phương pháp dò biên 14

1.1.5.1 Biên và các kiểu biên cơ bản trong ảnh 14

1.1.5.2 Vai trò của biên trong nhận dạng 15

1.1.5.3 Các phương pháp dò biên trực tiếp 17

1.1.5.4 Một số phương pháp dò biên 19

1.1.5.4.1 Phương pháp Canny 19

Trang 6

1.1.5.4.2 Phương pháp Shen – Castan 21

1.1.6 Phát hiện và so khớp các đặc trưng bất biến 21

1.1.6.1 Điểm bất động và đặc trưng bất biến 21

1.1.6.2 So khớp đặc trưng 24

1.2 Ảnh giả mạo và phát hiện ảnh giả mạo 25

1.2.1 Giới thiệu ảnh giả mạo 25

1.2.2 Các dạng ảnh giả mạo cơ bản 28

1.2.3 Một số ảnh nổi tiếng đã được phát hiện là ảnh giả mạo [18] 30

1.2.4 Hướng tiếp cận bài toán phát hiện ảnh giả mạo 35

1.2.4.1 Dựa vào hình dạng 35

1.2.4.2 Dựa vào phân tích nguồn sáng 36

1.2.4.3 Dựa vào biến đổi màu sắc 36

1.2.4.4 Dựa vào cơ sở dữ liệu 36

1.2.4.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ 37

1.2.4.6 Dựa vào phân tích ánh sáng 37

CHƯƠNG2:MỘTSỐKỸTHUẬTPHÁTHIỆN ẢNHKỸTHUẬTSỐGIẢ MẠO 38

2.1 Phát hiện ảnh giả mạo dựa vào Thuật toán Exact Match [3] 38

2.2 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước [3] 40

2.3 Phát hiện ảnh giả mạo dựa trên sự khác biệt hướng nguồn sáng 42

2.3.1 Các dạng nguồn sáng 42

2.3.1.1 Nguồn sáng ở vô tận (3-D) 43

2.3.1.2 Nguồn sáng ở vô tận (2-D) 45

2.3.1.3 Nguồn sáng ở gần (bộ phận) (2-D) 46

2.3.1.4 Nhiều nguồn sáng 47

2.3.2 Phương pháp ước lượng hướng chiếu nguồn sáng 48

2.3.2.1 Ước lượng hướng chiếu của nguồn sáng 48

Trang 7

2.3.2.2 Tìm những đường có khả năng là biên khuất 49

2.3.2.3 Ước lượng hướng chiếu sáng cho từng đường biên tìm được 50

2.3.2.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất 50

2.3.3 Phương Pháp dựa trên sự khác biệt hướng nguồn sáng 50

2.3.4 Phương pháp xác định hướng ánh sáng theo đường biên 53

2.3.4.1 Loại bỏ các đối tượng nhỏ, nhiễu và làm mảnh biên 56

2.3.4.1.1 Loại bỏ các đối tượng nhỏ và nhiễu 56

2.3.4.1.2 Làm mảnh biên và nối nét đứt 56

2.3.4.2 Lựa chọn các đoạn biên liên thông của đối tượng dùng ước lượng hướng nguồn sáng 59

2.3.4.3 Xây dựng thuật toán xác định hướng ánh sáng trên mỗi đường biên 60

2.3.4.4 Kết quả thực nghiệm 61

2.4 Phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán dựa vào thuật toán SIFT 64

2.5 So sánh một số kỹ thuật phát hiện ảnh giả mạo 84

CHƯƠNG3:CHƯƠNGTRÌNHTHỰCNGHIỆM 85

3.1 Bài toán 85

3.2 Mô hình bài toán phát hiện ảnh giả mạo 86

3.3 Chương trình phát hiện ảnh kỹ thuật số giả mạo FImage 1.0 86

3.3.1 Cài đặt chương trình 86

3.3.2 Kết quả thực nghiệm 87

PHẦNKẾTLUẬN 90 TÀI LIỆU THAM KHẢO

Trang 8

CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT

2D 2 Dimensions (Không gian 2 chiều) 3D 3 Dimensions (Không gian 3 chiều) ADC Analog to Digital Converter

RANSAC RANdom Sample Consensus algorithm SIFT Scale Invarian Feature Tranorms

Trang 9

DANH MỤC HÌNH ẢNH

Trang

Hình 1.1- Biểu diễn ảnh bằng hàm f(X Y, ) 3

Hình 1.2 - Ma trận 8 láng giềng 6

Hình 1.3 - Các bước cơ bản trong xử lý ảnh số 10

Hình 1.4 - Các thành phần cơ bản của một hệ xử lý ảnh 14

Hình 1.5 - Sơ đồ phân tích ảnh 15

Hình 1.6 – Làm trơn ảnh 20

Hình 1.7 - Minh họa về việc giả mạo ảnh [3] 26

Hình 1.8 - Ghép ảnh từ 2 ảnh riêng rẽ [3] 28

Hình 1.9 - Ảnh che phủ và bỏ đi đối tượng [16] 29

Hình 1.10 - Ảnh bổ sung đối tượng [16] 29

Hình 1.11 - Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh [18] 30

Hình 1.12 - Ảnh giả của John Kerry và Jane Fonda được cắt/dán từ hai ảnh riêng lẻ [16] 31

Hình 1.13 - Ảnh giả mạo Tổng thống Bush đọc sách ngược [18] 31

Hình 1.14 - Dàn khoan dầu, bão và sét [18] 32

Hình 1.15 - Ảnh giả của Holmes với nam diễn viên Tom Cruise được cắt/dán từ tạp chí bao gồm hiển thị Kimo với nữ diễn viên Katie Holmes [16] 33

Hình 1.16 - Cá mập tấn công trực thăng [18] 33

Hình 1.17 - Con mèo trắng khổng lồ [18] 34

Hình 1.18 - Sóng Thần ở Thái Lan [18] 35

Hình 1.19 - Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu [3] 36

Hình 1.20 - Sự khác biệt của các hướng nguồn sáng khác nhau [8] 37

Trang 10

Hình 2.1 - Minh họa cho việc tìm kiếm khối bao của thuật toán Exact Match

38

Hình 2.2 - Mô hình ánh xạ các điểm ảnh từ ảnh gốc sang ảnh đích [3] 40

Hình 2.3 - Minh họa hướng nguồn sáng và pháp tuyến bề mặt của đối tượng 45

Hình 2.4 - Hai đối tượng được chiếu bởi 1 nguồn sáng ở gần [8] 47

Hình 2.5 – Quả cầu hiển thị 3 nguồn sáng khác nhau trong khoảng từ – 200 tới +200 48

Hình 2.6 – Hướng nguồn sang từ bên trái sang 50

Hình 2.7 - Ảnh ghép giữa căn nhà và cây thông có nguồn sáng khác nhau 51

Hình 2.8 - Sơ đồ chức năng phát hiện ảnh giả mạo 52

Hình 2.9 - Kết quả đạo hàm theo 2 hướng x và y 54

Hình 2.10 - Kết quả minh họa tính độ lớn biên 54

Hình 2.11 – Hướng pháp tuyến 55

Hình 2.12 - Minh họa các liên thông theo 4, 8, 6 láng giềng 56

Hình 2.13 - Minh họa các điểm được đánh dấu để xóa [2] 56

Hình 2.14 - Lân cận 8 của điểm p1 57

Hình 2.15 - Minh họa các điểm được đánh dấu để nối nét đứt [2] 58

Hình 2.16 - Ảnh minh họa để xem có giả mạo không 61

Hình 2.17 - Ảnh minh họa kết quả xác định hướng ánh sáng trên bức ảnh là khác nhau nên đây là ảnh giả mạo dạng cắt/dán 61

Hình 2.18 – Chỉ ra hướng nguồn sáng khác nhau bằng mũi trên 62

Hình 2.19 – Hình gốc chưa cắt/dán, chỉ có 1 nguồn sáng duy nhất 1250 62

Hình 2.20 – Hình gốc chưa cắt/dán, chỉ có 1 nguồn sáng duy nhất 800 63

Hình 2.21 - Minh họa kết quả xác định hướng ánh sáng trên bức ảnh giả mạo có sẵn [15] 63

Hình 2.22 - Xây dựng một không gian tỷ lệ [9] 65

Trang 11

Hình 2.23 - Các giá trị cực đại và cực tiểu của các ảnh DoG 66

Hình 2.24 – Hình ảnh ban đầu để xác định điểm khóa 70

Hình 2.25 - Minh họa mô tả 4099 điểm khóa tìm được 70

Hình 2.26 – Trước khi định vị điểm hấp dẫn 71

Hình 2.27 - Sau khi định vị điểm hấp dẫn 72

Hình 2.28 - Tính độ lớn và hướng của gradient 74

Hình 2.29 - Bộ mô tả điểm khóa 75

Hình 2.30 – Kết quả thu được từ thuật toán Sift và kết hợp với nhiều điểm khóa 78

Hình 2.31 - Gán cho mỗi điểm khóa cho một nốt (cluster) 79

Hình 2.32 – Tách điểm khóa thành các cụm Agglomerative 79

Hình 2.33 - Cách nhóm các cụm lại với nhau [15] 80

Hình 2.34 – Kế quả thu được là hình bị giả mạo 83

Hình 2.35 – Kết quả thu được là hình bị nhân bản lên thành 3 đối tượng giống nhau [16] 83

Hình 3.1 - Sơ đồ chức năng phát hiện ảnh giả mạo [16] 86

Hình 3.3 - Ảnh minh họa kết quả xác định hai đối tượng là giống nhau nên đây là ảnh giả mạo dạng cắt/dán 87

Hình 3.5 - Ảnh minh họa kết quả xác định hai đối tượng là giống nhau nên đây là ảnh giả mạo dạng cắt/dán 88

Hình 3.6 – Hai hình giả mạo trong cuộc thi “Worth1000 Photoshop” Mỗi hình ảnh được cắt/dán cùng một người [16] 89

Trang 12

DANH MỤC BẢNG BIỂU

Trang Bảng 1- So sánh ƣu, nhƣợc điểm của một số kỹ thuật phát hiện ảnh giả mạo 27

Trang 13

PHẦN MỞ ĐẦU

Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật của khoa học công nghệ được ứng dụng vào thực tế và ảnh số chính là một trong những thành quả đó Ảnh số ngày càng dễ sửa chữa và hiệu chỉnh do sức mạnh của các phần mềm soạn thảo và xử lý ảnh mà điển hình là PhotoShop Ngày nay, các chương trình xử lý ảnh có thể thêm vào hoặc bỏ đi các đặc trưng của ảnh mà không để lại các dấu hiệu về sự giả mạo Điều đó

có nghĩa việc phát hiện ra ảnh giả mạo là vấn đề phải đặt ra ngày càng cấp bách và càng trở nên khó khăn

Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã được công nhận bởi cộng đồng các nhà nghiên cứu, nhưng hiện nay rất ít tài liệu có giá trị về lĩnh vực này Nhất là trong điều kiện Việt Nam, chưa có nhiều những nghiên cứu này, trong khi thực tế đặt ra những nhu cầu, đòi hỏi

Xuất phát trong hoàn cảnh đó, luận văn lựa chọn đề tài “Phát hiện ảnh

kỹ thuật số giả mạo dạng cắt/dán” nhằm nghiên cứu một số kỹ thuật phát hiện ảnh kỹ thuật số giả mạo được tạo ra bởi việc sử dụng các chương trình xử lý ảnh thông dụng, thông qua việc cắt/dán từ chính một ảnh và có sự thay đổi về kích thước đối với các đối tượng bị cắt/dán Đây cũng chính là cách thường được các đối tượng sử dụng trong quá trình tạo ảnh số giả nhờ

kỹ thuật cắt/dán

* Nội dung chính của luận văn gồm:

- Phần mở đầu

- Chương 1: Khái quát về xử lý ảnh và ảnh giả mạo: Chương này đề

cập đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh và các khái niệm cơ bản về ảnh giả mạo

Trang 14

- Chương 2: Một số kỹ thuật phát hiện ảnh giả mạo: Chương này

gồm các khái niệm cơ bản về các bài toán và một số phương pháp để phát

hiện ảnh kỹ thuật số giả mạo

Trên cơ sở các thuật toán đã tìm hiểu và áp dụng thuật toán để phát

hiện ảnh kỹ thuật số giả mạo dạng cắt/dán

- Chương 3: Xây dựng chương trình thực nghiệm: Tiến hành xây

dựng chương trình thực nghiệm để phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán

- Phần kết luận

Trang 15

CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO

1.1 Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh

1.1.1 Xử lý ảnh là gì ?

Con người thu nhận thông tin qua các giác quan trong đó thị giác đóng vai trò quan trọng nhất vì 80% thông tin được thu nhận bằng mắt tức là ở dạng ảnh Mặt khác với sự phát triển mạnh mẽ của phần cứng máy tính, xử lý ảnh, đồ hoạ ngày càng có nhiều ứng dụng thực tiễn phục vụ cuộc sống Như vậy, xử lý ảnh đóng một vai trò rất quan trọng trong sự tương tác giữa người

và máy

Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử lý ảnh số [2] bao gồm các phương pháp và kĩ thuật để biến đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên

1.1.2 Biểu diễn ảnh số

Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh được biểu diễn bằng một hàm cường độ sáng hai chiều f(X Y, ), trong đó X Y, là các giá trị toạ độ không gian và hàm giá trị của f tại một điểm ( , )X Y bất kỳ sẽ tỷ lệ với độ sáng hay mức xám của điểm ảnh tại điểm này [2,3]

Hình 1.1- Biểu diễn ảnh bằng hàm f(X Y, )

Trong một số trường hợp hàm ảnh còn được biểu diễn với một trục thứ 3

gọi là hàm cường độ sáng (với hình 1.1, trục thứ 3 bằng 0)

* P(X,Y)

Trang 16

Một ảnh số là một ảnh f(X Y, ) được gián đoạn theo không gian và cường độ sáng Một ảnh số được xem như một ma trận với hàng và cột biểu diễn một điểm trong ảnh và giá trị điểm ma trận tương ứng với mức xám tại điểm đó Các phần tử của một dãy số như thế được gọi là các điểm ảnh

Ánh sáng có dạng năng lượng f(X Y, ) phải khác 0 và hữu hạn:

,

0 f(X Y)  (1.1) Con người có khả năng nhận các hình ảnh từ ánh sáng phản xạ qua các vật thể Cơ sở của f(X Y, ) được đặc trưng qua hai thành phần:

- Số lượng ánh sáng nguồn rơi trên cảnh vật được nhìn thấy

- Số lượng ánh sáng nguồn phản xạ từ vật thể ( trong cảnh vật)

Chúng được gọi gần đúng là sự phát sáng và các thành phần phản xạ, và được biểu diễn tương ứng là i(X Y, ) và r(X Y, ) Bản chất của i(X Y, ) được xác định bằng nguồn sáng và của r(X Y, )được xác định bằng các đặc trưng của vật thể Hàm i(X Y, ) và r(X Y, ) kết hợp với nhau để cho hàm f(X Y, )

Với:

, ,

( ) ( ) ( ) (1.2)( 0 ( )

Trong lý thuyết, chỉ cần Lmin 0 và Lmaxhữu hạn Trong thực tế:

min min min max max max

Trang 17

Khoảng Lmin,Lmax được gọi là thang xám Ta có thể dịch khoảng này đến  0, L , trong đó l0 là đen và lL là trắng trong thang xám Giá trị tức thời là các dạng mức xám thay đổi liên tục từ đen đến trắng

1.1.3 Một số khái niệm cơ sở trong xử lý ảnh

Để có thể xử lý bằng máy tính điện tử thì ảnh cần phải được số hóa Đó là quá trình biến đổi ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc lấy mẫu và lượng tử hóa Trong quá trình này người ta sử dụng khái niệm

“pixel” Mỗi pixel được đặc trưng bởi một cặp tọa độ (X Y, ) và màu sắc của nó.[4]

 Ảnh: Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một

mảng hai chiều I( , )n p có n dòng và p cột, ảnh sẽ có n p(pixel) Ta ký hiệuI(X Y, )để chỉ điểm ảnh có toạ độ (X Y, )

Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element [20]) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa

độ (x,y)

Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức

Trang 18

xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

 Các điểm 4 láng giềng:

Giả sử (i,j) là một điểm ảnh, khi đó các điểm 4 - láng giềng là:

N4 = {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}

F: là điểm đen

F : là điểm trắng

Quan hệ K liên thông (K = 4, 8) là một quan hệ phản xạ, đối xứng, bắc cầu, là quan hệ tương đương Mỗi lớp tương đương của nó biểu diễn một thành phần K liên thông của ảnh Về sau ta gọi mỗi thành phần K liên thông của ảnh là một đối tượng ảnh

 Kỹ thuật phóng to, thu nhỏ ảnh:

Khi ảnh quá lớn chúng ta muốn nhìn toàn bộ ảnh thì chúng ta phải thu nhỏ ảnh lại và ngược lại khi ta muốn xem chi tiết một bộ phận nào đó của ảnh thì ta phải phóng to nó lên

Trang 19

+ Kỹ thuật phóng to ảnh:

Khi phóng to ảnh với một tỉ lệ k nào đó ta thu được ảnh mới to gấp k lần ảnh cũ (k là độ phóng của ảnh) như thế ảnh mới sẽ có kích thước là :

Height = Height * k Width = Width * k

Việc tính các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức:

xp=x/k yp=y/k

+ Kỹ thuật thu nhỏ ảnh:

Tương tự như phóng to ảnh, khi thu nhỏ ảnh ta thu được ảnh mới giống ảnh cũ nhưng có kích thước nhỏ hơn ảnh cũ Kích thước của ảnh mới là :

Height=Height/k Width=Width/k

Việc tính các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức:

xp = x*k

yp = y*k

 Mức xám (Gray level): Đó là kết quả của việc mã hóa, cho tương ứng

một cường độ sáng của mỗi điểm ảnh với một giá trị số, có thể là

16, 32, 64 mức

 Biểu diễn ảnh: Trong biểu diễn ảnh người ta thường sử dụng các phần

tử đặc trưng của ảnh là pixel Một hàm hai biến chứa các thông tin như một biểu diễn ảnh Một số mô hình thường dùng để biểu diễn ảnh là mô hình toán (biểu diễn ảnh nhờ các hàm cơ sở), mô hình thống kê (ảnh coi như một phần

tử của một tập hợp đặc trưng bởi kỳ vọng toán, hiệp biến, phương sai, moment…).[2]

Trang 20

 Tăng cường ảnh: Đây là một bước quan trọng bao gồm các kỹ thuật

lọc độ tương phản, khử nhiễu, nổi màu…

 Biến đổi ảnh: Thao tác chủ yếu trên một tập các ma trận và sử dụng

các kỹ thuật để biến đổi ảnh qua ma trận: Biến đổi Furie, Sin, Cosin, tích Kronecker

 Phân tích ảnh: Liên quan tới việc xác định các độ đo định lượng của

một ảnh để đưa ra một mô tả đầy đủ về ảnh Có những kỹ thuật cơ bản để hỗ trợ phân tích ảnh: Dò biên, lọc vi phân, dò theo quy hoạch động, phân vùng ảnh [2]

 Nhận dạng ảnh: Quá trình này liên quan đến các mô tả đối tượng mà

người ta muốn đặc tả nó Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặc trưng chủ yếu của đối tượng

Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách mơ hồ (vaguely defined) và có thể gán cho

nó một tên gọi nào đó” Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu

đó có thể:

Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào

Trang 21

các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh

Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây:

- Thu nhận dữ liệu và tiền xử lý

- Biểu diễn dữ liệu

- Nhận dạng, ra quyết định

Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:

- Đối sánh mẫu dựa trên các đặc trưng được trích chọn

- Phân loại thống kê

- Đối sánh cấu trúc

- Phân loại dựa trên mạng nơ-ron nhân tạo

Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lại (hybrid system) bao gồm nhiều mô hình kết hợp

Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu

Trang 22

1.1.4 Các giai đoạn trong xử lý ảnh

Bài toán xử lý ảnh bao gồm các giai đoạn tổng quát như sau:

Hình 1.3 - Các bước cơ bản trong xử lý ảnh số

1.1.4.1 Thu nhận ảnh

Đây là bước đầu tiên trong quá trình xử lý ảnh Để thực hiện điều này,

ta cần có bộ thu ảnh và khả năng số hoá những tín hiệu liên tục được sinh ra

bởi bộ thu ảnh đó Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu,

máy quét ảnh, Trong trường hợp bộ thu ảnh cung cấp chưa phải là dạng số

hoá ta còn phải chuyển đổi hay số hoá ảnh

Quá trình chuyển đổi ADC (Analog to Digital Converter) để thu nhận

dạng số hoá của ảnh Các thông số quan trọng ở bước này là độ phân giải,

chất lượng màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị

Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hưởng rất

nhiều đến công đoạn kế tiếp

1.1.4.2 Tiền xử lý

Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khử

bóng, khử độ lệch,v.v… với mục đích làm cho chất lượng ảnh trở nên tốt hơn

nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý

ảnh Quá trình này thường được thực hiện bởi các bộ lọc

Trang 23

+ Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu

ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằng phương pháp nội suy, lọc trung vị và trung bình

+ Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh

+ Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay điện

tử có thể bị mờ, nhoè Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này

1.1.4.3 Phân đoạn ảnh

Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng

Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này

Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về nhiều phần tử khác nhau cấu tạo lên ảnh thô Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào

đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu

Trang 24

1.1.4.5 Trích chọn đặc điểm

Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt

ra những yêu cầu về tốc độ tính toán

Đặc điểm chung của tất cả ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu

Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống

Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau đây:

- Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v

- Đặc điểm biến đổi: các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v )

Trang 25

- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử Gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing)

1.1.4.6 Nhận dạng

Nhận dạng ảnh là quá trình xác định nội dung ảnh

Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được lọc (hoặc lưu) từ trước

Đây là bước cuối cùng trong quá trình xử lý ảnh

Nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán nhãn cho các đối tượng trong ảnh Ví dụ như khi nhận dạng chữ viết, các đối tượng trong ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ

đó ra và tìm cách gán đúng các ký tự của bảng chữ cái tương ứng cho các mẫu chữ thu được trong ảnh Giải thích là công đoạn gán nghĩa cho một tập các đối tượng đã được nhận biết

Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý ảnh nào cũng bắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở trên, ví

dụ như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý

Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng

và giải thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán

tự động, được dùng để rút trích ra những thông tin quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v…

Để xử lý các quá trình trên thì cần một hệ thống xử lý ảnh bao gồm một

số thành phần cơ bản sau đây:

Trang 26

Hình 1.4 - Các thành phần cơ bản của một hệ xử lý ảnh

 Bộ xử lý tương tự thực hiện các chức năng:

- Chọn Camera thích hợp nếu có nhiều Camera

- Chọn màn hình hiển thị tín hiệu

- Thu nhận tín hiệu video bởi bộ số hóa Thực hiện lấy mẫu và mã hóa

- Tiền xử lý ảnh khi thu nhận

 Bộ xử lý ảnh số bao gồm nhiều bộ xử lý chuyên dụng: Xử lý lọc, trích

chọn đặc trưng, nhị phân hóa ảnh

 Máy chủ đóng vai trò điều khiển các thành phần khác

 Bộ nhớ ngoài: Lưu trữ dữ liệu ảnh cũng như các kiểu dữ liệu khác để

có thể chuyển giao cho các quá trình có nhu cầu

1.1.5 Biên và các phương pháp dò biên

1.1.5.1 Biên và các kiểu biên cơ bản trong ảnh

Các đặc trưng của ảnh thường bao gồm các thành phần như: mật độ

xám, phân bố xác suất, phân bố không gian, biên ảnh [2] Biên là một vấn đề

chủ yếu và đặc biệt quan trọng trong phân tích ảnh vì các kĩ thuật phân đoạn

ảnh chủ yếu dựa vào biên

Trang 27

Hiện nay có nhiều định nghĩa về biên ảnh [1] và mỗi định nghĩa được

sử dụng trong một số trường hợp nhất định Song nhìn chung, ta có thể hiểu là: một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám

Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh

Tập hợp các điểm biên tạo thành biên, hay còn gọi là đường bao của ảnh (boundary) Chẳng hạn, trong một ảnh nhị phân, một điểm có thể được gọi là biên nếu đây là một điểm đen và có ít nhất một điểm trắng nằm trong lân cận điểm đó

Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và được tính toán từ những điểm lân cận nó Đó là một biến Vector bao gồm hai thành phần:

- Độ lớn của Gadient

- Hướng φ được xoay đối với hướng Gradient ψ

1.1.5.2 Vai trò của biên trong nhận dạng

Một cách tổng quan có thể nói rằng bất kỳ một hệ thống xử lý ảnh nào cũng tuân theo một số giai đoạn sau:

Hình 1.5 - Sơ đồ phân tích ảnh Con người thường nhìn nhận sự vật theo hai cách hoặc là dựa vào biên hoặc là dựa vào xương của chúng Chẳng hạn, ta dựa vào biên khi quan sát các đối tượng như ao, hồ hoặc một cái xe ô tô Nhưng nếu để phân biệt một khúc sông với những đối tượng khác trên bản đồ địa hình thì ta lại dựa vào

Phân đoạn ảnh

Phân loại Ảnh đầu vào cho

quá trình tiền xử lý

Phân loại Phân tích

đặc trưng

Trang 28

xương của nó Vì vậy, cùng với xương thì biên có một tầm quan trọng đặc biệt trong phân tích và nhận dạng hình ảnh

Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên Có thể thấy tầm quan trọng của biên khi ta theo dõi một kiến trúc sư làm việc Giả sử anh ta muốn thiết kế một phòng khách sang trọng, nét đầu tiên được phác họa chính là đường biên hay tường của căn phòng sau đó mới đến các chi tiết nội thất bên trong Như vậy, mới chỉ nhìn biên của sự vật ta cũng đã hình dung ít nhiều về nó và có thể phân biệt được nó với các sự vật khác

Nhìn chung về mặt toán học, có thể xem điểm biên của ảnh là một điểm

mà ở đó có sự thay đổi đột ngột về độ sáng Xuất phát từ cơ sở đó, người ta thường sử dụng hai phương pháp phát hiện biên sau:

Phương pháp phát hiện biên trực tiếp là làm nổi biên dựa vào sự biến thiên về độ sáng của ảnh Kỹ thuật chủ yếu được dùng là dựa vào đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient, nếu lấy đạo hàm bậc hai ta có phương pháp Laplace

Phương pháp phát hiện biên gián tiếp Nếu bằng một cách nào đó ta phân biệt được ảnh bằng các vùng thì đường phân ranh giới giữa các vùng đó chính là biên Hai kỹ thuật dò biên và phân vùng các đối tượng là hai bài toán đối ngẫu nhau Thật vậy, dò biên để phân lớp một đối tượng ảnh, nhưng nếu phân lớp xong thì có nghĩa là đã phân vùng được các đối tượng ảnh và ngược lại, khi đã phân vùng được các đối tượng ảnh thì cũng phân lớp được các đối tượng ảnh và ta có thể phát hiện biên

Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự vật có sự biến đổi độ sáng không đột ngột phương pháp này tỏ ra rất kém hiệu quả

Trang 29

Phương pháp dò biên gián tiếp tuy khó cài đặt nhưng lại áp dụng tốt cho những ảnh có sự biến thiên độ sáng ít

1.1.5.3 Các phương pháp dò biên trực tiếp

Phương pháp Gradient

Phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm Theo định nghĩa, Gradient là một vector biểu thị tốc độ thay đổi giá trị của điểm ảnh theo 2 hướng x và y Các thành phần của Gradient được tính bởi:

dx

y x f y dx x f x

y x f

f r

x x

f r

f x x

f f

r.f x sin + r.f y cos

Trong thực tế, khi ta nói lấy đạo hàm của ảnh thực ra chỉ là mô phỏng

và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập hay phép cuộn Do ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại

* Kỹ thuật PreWitt: Kỹ thuật này sử dụng 2 mặt nạ theo hai hướng x và

Trang 30

Quá trình tính toán được thực hiện qua 2 bước:

2

2 2 2

y

f x

f x x

2

 [f(x+1,y) - f(x,y)] - [f(x,y) - f(x-1,y)]

= f(x+1,y) – 2f(x,y) + f(x-1,y)

Tương tự: 



2 2

y

f f(x,y+1) - 2f(x,y) + f(x,y-1)

Trang 31

1.1.5.4 Một số phương pháp dò biên

1.1.5.4.1 Phương pháp Canny

Phương pháp này do John Canny [6] ở phòng thí nghiệm MIT khởi xướng vào năm 1986 Canny đã đưa một tập hợp các ràng buộc mà một phương pháp phát hiện biên phải đạt được Ông đã trình bày một phương pháp tối ưu nhất để thực hiện được các ràng buộc đó Và phương pháp này được gọi là phương pháp Canny

* Ý tưởng của phương pháp này là định vị đúng vị trí bằng cách cực tiểu hoá phương sai δ2

của vị trí các điểm cắt "Zero" hoặc hạn chế số điểm cực trị cục bộ để chỉ tạo ra một đường bao

Các ràng buộc mà phương pháp phát hiện biên Canny đã thực hiện được đó là: mức lỗi, định vị và hiệu suất Trong đó:

+ Mức lỗi: có ý nghĩa là một phương pháp phát hiện biên chỉ và phải tìm tất cả các biên, không biên nào được tìm bị lỗi

+ Định vị: Điều này nói đến độ chênh lệch cấp xám giữa các điểm trên cùng một biên phải càng nhỏ càng tốt

+ Hiệu suất: là làm sao cho khi tách biên không được nhận ra nhiều biên trong khi chỉ có một biên tồn tại

Ràng buộc mức lỗi và định vị được dùng để đánh giá các phương pháp phát hiện biên Còn ràng buộc về hiệu suất thì tương đương với mức lỗi dương

Canny đã giả thiết rằng nhiễu trong ảnh tuân theo phân bố Gauss và đồng thời ông cũng cho rằng một phương pháp phát hiện biên thực chất là một bộ lọc nhân xoắn có khả năng làm mịn nhiễu và định vị được cạnh Vấn

đề là tìm một bộ lọc sao cho thoả mãn tối ưu nhất các ràng buộc ở trên

Đây là một thuật toán tương đối tốt, có khả năng đưa ra đường biên mảnh, và phát hiện chính xác điểm biên với điểm nhiễu

Trang 32

4 9 12 9 4

5 12 15 12 5

4 9 12 9 4

2 4 5 4 2

+ Bước 3: Tính gradient hướng tại mỗi điểm (i,j) của ảnh Hướng này sẽ

được nguyên hóa để nằm trong 8 hướng [0 7], tương đương với 8 lân cận của một điểm ảnh

+ Bước 4: Dùng ràng buộc “loại bỏ những điểm không phải là cực đại”

để xóa bỏ những điểm không là biên Xét (i,j),  là gradient hướng tại (i,j) I1, I2 là hai điểm lân cận của (i,j) theo hướng  Theo định nghĩa điểm biên cục

bộ thì (i,j) là biên nếu I(i,j) cực đại địa phương theo hướng gradient  Nếu I(i,j) > I1 và I(i,j) > I2 thì mới giữ lại I(i,j), ngược lại xóa I(i,j) về

điểm ảnh nền

+ Bước 5: Phân ngưỡng Với các điểm được giữ lại, thực hiện lấy

ngưỡng gradient biên độ lần cuối để xác định các điểm biên thực sự

Trang 33

1.1.5.4.2 Phương pháp Shen – Castan

Shen và Castan [6] có cùng quan điểm với Canny về một mẫu chung trong việc tách các đường biên Đó là: nhân xoắn ảnh với một mặt nạ làm mịn, sau đó tìm ra điểm biên Tuy nhiên, trong những phân tích của họ lại tạo

ra một hàm khác để tối ưu, đó là việc đề xuất cực tiểu hoá hàm sau trong không gian một chiều:

Nói một cách khác, hàm mà làm cực tiểu ở trên là bộ lọc mịn tối ưu cho việc tách biên Tuy nhiên, Shen và Castan lại không đề cập đến việc thuật toán sẽ nhận ra được nhiều cạnh trong khi chỉ có một cạnh tồn tại

Để tìm điểm bất động, người ta thường dùng các phương pháp xác định

trước một khoảng [a,b] thỏa mãn tính chất nào đó mà chứa điểm x*, sau đó

dùng các phương pháp lặp (như Newton, Leibniz…) để tính gần đúng điểm bất động Sau một số bước, phép lặp sẽ hội tụ về điểm bất động

Điểm bất động trong xử lý ảnh

Trong xử lý ảnh, người ta cũng thường sử dụng ánh xạ f:AB, với A là

tập các điểm ảnh, hay nói cách khác f là phép biến đổi ảnh Các phép biến đổi

(1.11)

Trang 34

ảnh thường thấy là phép biến đổi affine (phép quay, phép tỷ lệ, phép tịnh

tiến…), phép thay đổi cường độ sáng Ta gọi các phép biến đổi đó là f: II’, biến ảnh I thành ảnh I’

Bằng một cách nào đó, ta sẽ trích ra từ ảnh I các điểm đặc trưng (x,y) thỏa mãn tính chất H Nếu sau phép biến đổi A, ảnh II’, điểm (x,y) của ảnh

I trở thành (x’,y’) của ảnh I’, và điểm đó vẫn thỏa mãn tính chất H đối với ảnh I’ thì có thể coi điểm (x,y) đó là điểm bất động đối với phép biến đổi f

Đặc trưng bất biến ảnh được xây dựng dựa trên cở sở của điểm bất động Một tập các điểm bất động cùng với các đặc trưng bất biến được tạo ra từ nó

có thể được xem như là các đặc tính biểu diễn chất liệu ảnh hay đối tượng ảnh Như vậy, để tìm các đặc trưng bất biến ảnh: đầu tiên ta xác định các điểm bất động trong ảnh đối với phép biến đổi hình học nào đó, sau đó tính toán các mô tả dựa vào các điểm bất động đã tìm được, các mô tả này chính là các đặc trưng bất biến để biểu diễn ảnh

Có nhiều phương pháp trích chọn các đặc trưng bất biến, tùy thuộc vào từng ứng dụng cụ thể mà các đặc trưng phù hợp sẽ được trích chọn Bài báo này đề cập đến các đặc trưng bất biến tỷ lệ (scale) và bất biến quay (rotation) Trong [9] xác định các điểm bất động đối với phép biến đổi tỷ lệ (SIFT), các điểm này còn gọi là các điểm khóa (keypoint), các điểm khóa (keypoint) được tìm ra trên cơ sở xây dựng các pyramid Gaussian, nó chính là nghiệm của các

phương trình khai triển Taylor của DoG D(x,y,σ) trên không gian tỷ lệ, được

thay đổi sao cho gốc tọa độ trùng với điểm lấy mẫu (sample point):

X X

D X X X

D D X

T

2 2

2

1 )

Trang 35

D(x,y,σ) = (G(x,y,kσ)-G(x,y,σ))*I(x,y)

= L(x,y,kσ) - L(x,y,σ)

2 2 2

2 ) (

2

1 ) , ,



y x G

D và các đạo hàm của nó được đánh giá tại một điểm trung tâm (giữa)

trên ảnh sau khi đã lấy mẫu bằng hàm Gauss

Giải phương trình D(X)=0 ta sẽ tìm được các nghiệm:

X

D X

Sau bước này, ta xác định được vị trí của các điểm khóa (keypoint) đồng

thời tỉ lệ σ được chọn Các điểm điểm khóa (keypoint) này thực chất đã bất

biến tỉ lệ Bây giờ, xây dựng đặc trưng bất biến quay từ các điểm khóa (keypoint) này dựa trên việc tính toán độ lớn và hướng gradient ảnh quanh vị trí của các keypoint, các giá trị này thường được tính toán so với điểm láng giềng bên cạnh [9], chẳng hạn đối với đặc trưng khoảng cách ta có:

(1.13) Hay đặc trưng góc:

(1.14)

2 2

)) 1 , ( ) 1 , ( ( )) , 1 ( ) , 1 ( ( )

,

(x y  L x y L x y  L x y L x y

m

))) , 1 ( ) , 1 ( /(

)) 1 , ( ) 1 , ( ((

tan )

,



Trang 36

L(x,y) chính là giá trị điểm ảnh của ảnh Pyramid có σ được chọn Hơn nữa, ở đây chúng tôi kí hiệu L(x,y) là vì thực chất việc tính công thức trên chỉ

là phép trừ ảnh chứ chúng tôi không tính toán từng L(x,y, σ) cụ thể

Với mỗi điểm khóa (keypoint) chúng tôi xây dựng đặc trưng hướng và

độ lớn gradient trên một lân cận kích thước (4x4) theo 8 hướng theo công

thức (1.13) và (1.14), cuối cùng sẽ thu được một vector đặc trưng 128 chiều

Việc so khớp các vùng ảnh được thực hiện sau đó trên cơ sở đối sánh hay so khớp các đặc trưng

1.1.6.2 So khớp đặc trưng

Phát hiện đối tượng hay vùng ảnh giống nhau, được thực hiện chủ yếu bằng việc so khớp mỗi đặc trưng một cách độc lập với nhau Việc so khớp được tiến hành dựa vào việc tính toán khoảng cách, một khoảng cách thường dùng là khoảng cách Euclid

Giả sử các đặc trưng được mô tả dưới dạng các vector trong không gian Euclid Rn thì khoảng cách Euclidean giữa hai đặc trưng P = (p1, p2, ., pn)

p q

p Q

P

d

1

2 2

2 2 2 2 1

Trang 37

Khoảng cách Mahalanobis từ một nhóm giá trị với giá trị trung bình = (1, 2, …, p)T và ma trận đồng biến  cho một vector đa biến x= (x1,x2,…,

x y

1.2 Ảnh giả mạo và phát hiện ảnh giả mạo

1.2.1 Giới thiệu ảnh giả mạo

Ảnh giả mạo được xem là ảnh không có thật, việc có được ảnh là do sự ngụy tạo bởi các chương trình xử lý ảnh hoặc quá trình thu nhận Sức mạnh

Trang 38

của các chương trình xử lý ảnh số như Photoshop giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ dàng Một trong những ví dụ

cho việc giả mạo này là Hình 1.7 Hình ảnh được tạo lập từ 3 bức ảnh: Nhà

trắng, Bill Clinton và Saddam Hussein Hình ảnh Bill Clinton và Saddam Hussein được cắt/dán vào bức ảnh Nhà trắng Các hiệu ứng về bóng và ánh sáng cũng được tạo ra làm cho bước ảnh có vẻ nhìn hoàn toàn như thật

Hình 1.7 - Minh họa về việc giả mạo ảnh [3]

Giả mạo ảnh nhằm vào nhiều mục đích trong đó có việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v Việc phát hiện và chống giả mạo ảnh là một chủ đề ngày càng được quan tâm bởi các nhóm nghiên cứu trên thế giới như: TS Chung-Sheng Li ở IBM T J Watson Research Center, TS Jessica Fridrich ở Department of Electrical and Computer Engineering, SUNY Binghamton, Binghamton, NY 13902-6000 hay TS David Rosenthal ở Odyssey Research Associates, Inc v.v

Trang 39

Trong việc chống giả mạo ảnh, người ta đã nghiên cứu các kỹ thuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào bức ảnh trước khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện cho việc phát hiện sửa đổi hoặc cắt/dán sau này Theo cách tiếp cận này, các thiết bị máy ảnh số và camera ngày nay thường bổ sung các tính năng bản quyền ngay trong quá trình thu nhận ảnh Dựa vào đó, sau này ta có thể biết được nguồn gốc của bức ảnh Nhờ đó mà có thể biết được đó có phải là ảnh gốc hay không? Phát hiện ảnh giả mạo là một vấn đề khó hơn, ảnh giả mạo thường chia làm hai loại chính Ảnh giả nhưng thật, ở đây hiện trường được dựng thật

và sau đó việc thu nhận ảnh là thật Loại thứ hai là ảnh giả được tạo lập trên

cơ sở các phần của ảnh gốc thật như hình 1 hoặc được cắt/dán để thêm vào hay che đi các chi tiết trên ảnh

Trong báo cáo này chúng ta quan tâm đến một dạng của giả mạo thuộc loại thứ hai Phần tiếp theo của báo cáo được trình bày như sau: Phần 2 là các dạng ảnh giả mạo loại hai cơ bản Phần 3 là các cách tiếp cận chính trong việc phát hiện ảnh giả mạo loại hai và cuối cùng là kết luận về ảnh giả mạo và phát hiện ảnh giả mạo nói chung

Trang 40

1.2.2 Các dạng ảnh giả mạo cơ bản

Trong dạng ảnh giả mạo thứ hai có thể chia ra làm các loại: Ghép ảnh,

che phủ đối tượng, bổ sung thêm đối tượng Hình 1.8.a minh họa ảnh ghép từ

2 ảnh riêng rẽ với cùng tỷ lệ Rõ ràng là nếu chỉ ra đây là ảnh thật hay ảnh giả mạo thì cũng có nghĩa là chứng minh được mối quan hệ giữa họ

Hình 1.8.b là ảnh ghép từ hai ảnh có sự thay đổi tỷ lệ Hình ảnh này nếu

không chứng minh là giả tạo thì sẽ phải có cách nhìn khác về tiến hóa của loài người

a) Ảnh ghép từ hai ảnh riêng rẽ b) Ảnh ghép từ hai ảnh có thay đổi

tỷ lệ Hình 1.8 - Ghép ảnh từ 2 ảnh riêng rẽ [3]

Một dạng khác thường thấy nữa của ảnh giả mạo loại hai là việc bớt đi các đối tượng trong ảnh, việc bớt đi các đối tượng trong ảnh có thể được xem

như là che phủ đối tượng hoặc xóa đi đối tượng Hình 1.9.a là ảnh gốc với 2 chiếc ô tô, một xe con và một xe tải Hình 1.9.b là hình 1.9.a giả tạo với việc

che phủ chiếc xe tải bởi một cành cây cũng lấy từ chính trong ảnh Trong khi

hình 1.9.c là ảnh gốc với chiếc trực thăng nhỏ còn hình 1.9.d chính là ảnh gốc hình 1.9.a đã được bỏ đi đối tượng là trực thăng Trong cả hai trường hợp giả

mạo này đều được thực hiện từ một ảnh nên độ tương đồng về ánh sáng và bóng là như nhau Do đó, bằng mắt thường rất khó xác định

Tiêu đề	Phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán
Tác giả	Nguyễn Hữu Nam
Người hướng dẫn	PGS. TS Đỗ Năng Toàn
Trường học	Trường Đại Học Lạc Hồng
Chuyên ngành	Công nghệ Thông tin
Thể loại	Luận văn
Năm xuất bản	2011
Thành phố	Đồng Nai

Định dạng
Số trang	104
Dung lượng	4,38 MB