ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM THỊ CÚC PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN MẪU NHIỄU CẢM BIẾN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - Năm 2014... TRƯỜNG ĐẠI H
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM THỊ CÚC
PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN MẪU NHIỄU CẢM BIẾN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội - Năm 2014
Trang 2TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM THỊ CÚC
PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN MẪU NHIỄU CẢM BIẾN
Chuyên ngành : Hệ thống thông tin
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS ĐỖ NĂNG TOÀN
Hà Nội - Năm 2014
Trang 3LỜI CẢM ƠN
Trước tiên, tôi xin gửi lời cảm ơn Thầy PGS.TS Đỗ Năng Toàn là người
đã định hướng nghiên cứu và tận tình hướng dẫn cho tôi trong suốt quá trình làm luận văn Nếu không có sự giúp đỡ tận tình của thầy, tôi khó có thể hoàn thành luận văn này
Đồng thời tôi cũng xin chân thành cảm ơn các thầy cô Khoa Công nghệ thông tin – Trường Đại học Công nghệ đã tận tình giảng dạy và cung cấp cho tôi những kiến thức cần thiết trong suốt thời gian học tập tại trường
đồng nghiệp đã tạo điều kiện, giúp đỡ và động viên tôi trong suốt thời gian học tập cũng như trong thời gian nghiên cứu luận văn
Tuy có nhiều cố gắng nhưng do thời gian và kiến thức của bản thân còn nhiều hạn chế nên trong luận văn không tránh khỏi những thiếu sót Kính mong nhận được sự góp ý của thầy cô và các bạn để luận văn được hoàn thiện hơn Tôi xin chân thành cảm ơn !
Phạm Thị Cúc
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan: Bản luận văn tốt nghiệp này là kết quả nghiên cứu thực sự của cá nhân, được thực hiện trên cơ sở nghiên cứu lý thuyết, cài đặt thực nghiệm chương trình Kết quả của luận văn là cả một quá trình nghiên cứu nghiêm túc các kiến thức được học ở trường và dưới sự hướng dẫn khoa học của PGS.TS Đỗ Năng Toàn
dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên cứu đã được công bố, các website,… Dữ liệu để thực nghiệm có nguồn gốc rõ ràng và không mang tính chất thương mại
Học viên
Phạm Thị Cúc
Trang 5MỤC LỤC
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2
DANH MỤC CÁC HÌNH 5
DANH MỤC CÁC TỪ VIẾT TẮT 6
LỜI NÓI ĐẦU 7
CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO 9
1.1 Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh 9
1.1.1 Một số khái niệm cơ bản 9
1.1.2 Một số vấn đề cơ bản trong xử lý ảnh 10
1.1.3 Các giai đoạn trong xử lý ảnh 15
1.1.3.1 Thu nhận ảnh 15
1.1.3.2 Tiền xử lý 15
1.1.3.3 Phân đoạn ảnh 16
1.1.3.4 Biểu diễn và mô tả 17
1.1.3.5 Cơ sở trí thức 17
1.1.3.6 Nhận dạng và nội suy ảnh 18
1.1.3.7 Trích chọn đặc trưng 18
1.2 Ảnh giả mạo và các dạng giả mạo ảnh cơ bản 20
1.2.1 Ảnh giả mạo 20
1.2.2 Các loại ảnh giả mạo cơ bản 22
1.2.2.1 Ghép ảnh 22
1.2.2.2 Tăng cường ảnh 22
1.2.2.3 Sao chép và dịch chuyển vùng trên ảnh 23
CHƯƠNG 2: CÁC KỸ THUẬT PHÁT HIỆN ẢNH SỐ GIẢ MẠO 25
2.1 Dựa trên đặc trưng điểm ảnh (Pixel Based) 25
2.1.1 Nhân bản (Cloning) 25
2.1.2 Lấy mẫu lại (Re-sampling) 26
2.1.3 Ghép (Splicing) 26
2.2 Dựa trên định dạng ảnh (Format Based) 27
2.2.1 Lượng tử hóa JPEG (JPEG quantization) 27
2.2.2 Phần đầu ảnh JPEG (JPEG Header) 28
2.2.3 Nén kép (Double JPEG) 30
2.2.4 Hiệu ứng khối JPEG (JPEG Blocking) 30
2.3 Dựa trên đặc điểm máy ảnh (Máy ảnh-Based) 31
2.3.1 Quang sai màu (Chromatic Aberration) 31
2.3.2 Mảng lọc màu (Color Filter Array) 33
2.3.3 Đáp ứng của máy ảnh (Máy ảnh Response) 33
2.3.4 Mẫu nhiễu cảm biến (Sensor Pattern Noise) 34
2.4 Một số phương pháp trực quan khác 34
2.4 1 Nguồn sáng 35
2.4.2 Hướng mắt nhìn và vị trí 36
2.4.3 Hình học 36
Trang 6CHƯƠNG 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA VÀO MẪU NHIỄU CẢM BIẾN 37
3.1 Giới thiệu 37
3.2 Mẫu nhiễu và các phương thức biểu diễn 38
3.2.1 Xử lý tín hiệu trong máy ảnh kỹ thuật số 38
3.2.2 Mẫu nhiễu cảm biến 39
3.2.3 Dò tìm mẫu nhiễu 41
3.3 Thuật toán phát hiện ảnh giả mạo dựa vào mẫu nhiễu cảm biến 43
3.3.1 Tạo các mẫu tham chiếu của máy ảnh 43
3.3.2 Thuật toán nhận dạng ảnh giả 45
3.4 Chương trình thực nghiệm 47
3.4.1 Bài toán 47
3.4.2 Công cụ và dữ liệu thử nghiệm 47
3.4.3 Kết quả thử nghiệm 48
KẾT LUẬN 52
TÀI LIỆU THAM KHẢO 53
Trang 7DANH MỤC CÁC HÌNH
Hình 1.1 Quá trình xử lý ảnh 10
Hình 1.2 Biểu diễn ảnh bằng hàm f (X Y, ) 10
Hình 1.3 Ảnh thu nhận và ảnh mong muốn 12
Hình 1.4 Các bước cơ bản trong xử lý ảnh số 15
Hình 1.5 Các thành phần cơ bản của một hệ xử lý ảnh 19
Hình 1.6 Minh họa về việc giả mạo ảnh 20
Hình 1.7 Ảnh giả của John Kerry và Jane Fonda được cắt ghép từ hai ảnh riêng lẻ 21
Hình 1.8 Ghép ảnh từ hai ảnh riêng rẽ 22
Hình 1.9 Ví dụ về tăng cường ảnh 23
Hình 1.10 Ảnh che phủ và bỏ đi đối tượng 24
Hình 1.11 Ảnh bổ sung đối tượng 24
Hình 2.1 Mô phỏng sử dụng quang sai để phát hiện ảnh giả 32
Hình 2.2 Mô phỏng hướng nguồn sáng tới bề mặt một quả cầu 35
Hình 2.3 Mô phỏng việc phân tích nguồn sáng để phát hiện ảnh giả 35
Hình 3.1 Quy trình xử lý tín hiệu của máy ảnh kỹ thuật số 38
Hình 3.2 Mô hình mẫu nhiễu 39
Hình 3.3 Minh họa vùng Rđược chọn và mẫu nhiễu tham chiếu tương ứng của nó 42
Hình 3.4 Hình ảnh minh họa chọn các vùng Q và mẫu tham chiếu i 42
Hình 3.5 Mô hình tạo mẫu tham chiếu của máy ảnh 44
Hình 3.6 Sơ đồ bài toán phát hiện ảnh giả mạo 47
Hình 3.7 Ảnh giả mạo bằng cách cắt ghép và lấy mẫu lại 49
Hình 3.8 Các hình gốc dùng để tạo ảnh giả 49
Hình 3.9 Minh họa kết quả chương trình với ảnh giả mạo định dạng TIFF 50
Hình 3.10 Minh họa kết quả chương trình với ảnh giả mạo dạng nén JPEG 50
Hình 3.11.Minh họa kết quả chương trình với ảnh giả cắt/ghép từ hai ảnh được chụp bởi cùng loại máy ảnh 51
Trang 8DANH MỤC CÁC TỪ VIẾT TẮT
BAM Blocking Artifact Matrix - Ma trận các khối dấu hiệu
EXIF Exchange able Image Tệp format -Tiêu chuẩn xác định định dạng ảnh
hiệu quả
MAP Maximum A Posteriori Estimation - Ước lượng hậu cực đại
của nhiễu tới điểm ảnh
Trang 9
LỜI NÓI ĐẦU
Ngày nay, ảnh số là phương tiện truyền thông được sử dụng phổ biến và rộng rãi, nó chứa đựng nhiều thông tin, cũng là cách để biểu diễn thế giới xung quanh ta một cách dễ dàng và cô đọng
Một câu hỏi đặt ra là ảnh này có độ tin cậy bao nhiêu? Rõ ràng, thông tin hình ảnh có tác động quan trọng đến xã hội chúng ta, chúng đóng vai trò cốt yếu trong đời sống con người
Việc xác thực ảnh là bài toán quan trọng trong nhiều lĩnh vực xã hội, chẳng hạn trong phòng xử án, tính thật của một bức ảnh đóng vai trò cốt yếu vì nó chính là một bằng chứng Mặt khác, hằng ngày các bài báo hay tạp chí đều chứa nhiều hình ảnh, trong vật lý và y học thì có nhiều quyết định đều phải dựa vào các ảnh số,…
Hơn nữa, hiện nay do sự tiến bộ của các máy tính hiệu năng cao, giá thành thấp, giao diện người máy thân thiện hơn, cũng như các phần mềm điều khiển và thao tác trên ảnh số là khá mạnh và đơn giản Sức mạnh của các chương trình xử
lý ảnh số như PhotoShop giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ dàng
Điều đó, đồng nghĩa với việc phát hiện ảnh giả mạo là bài toán khó khăn và ngày càng trở nên cấp thiết hơn
Từ yêu cầu thực tế đó, tôi lựa chọn đề tài “Phát hiện ảnh giả mạo dựa trên
mẫu nhiễu cảm biến” nhằm nghiên cứu kỹ thuật phát hiện ảnh kỹ thuật số giả
mạo dựa trên cơ sở dò tìm các mẫu nhiễu tạo ra bởi máy ảnh
Bố cục của luận văn được trình bày như sau:
Phần mở đầu
Chương 1: Khái quát về xử lý ảnh và ảnh giả mạo: Chương này đề cập
đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh Khái quát một
số phương pháp giả mạo ảnh số thường gặp, để từ đó giúp người đọc có cái nhìn tổng quan về lĩnh vực ảnh số giả mạo
Chương 2: Các kỹ thuật phát hiện ảnh số giả mạo: Chương này trình
bày các kỹ thuật phát hiện ảnh giả mạo đã được các nhóm nghiên cứu và giới thiệu
Chương 3: Phát hiện ảnh giả mạo dựa trên mẫu nhiễu cảm biến:
Chương này nghiên cứu về mẫu nhiễu cảm biến của máy ảnh, từ đó đưa ra
Trang 10phương pháp phát hiện ảnh giả mạo dựa vào mẫu nhiễu cảm biến bao gồm ý tưởng, thuật toán và chương trình thử nghiệm
Phần kết luận
Trang 11TÀI LIỆU THAM KHẢO Tiếng Việt
nghệ thông tin - Đại học Thái Nguyên
dựa trên mẫu nhiễu cảm biến” Kỷ yếu Hội Thảo Quốc gia về “Các vấn đề chọn lọc của CNTT”, Đại Lải 14-15/09/2007, tr566-577
phát hiện sự giả mạo trong ảnh số, Đề tài khoa học, Trường Đại học Sư phạm
Hà Nội
Tiếng Anh
Processing Magazine, vol 2, no 26, pp 16–25, Mar
Identification from Sensor Pattern Noise”, submitted to IEEE Transactions on
Information Forensics and Security,2005
Image Forgeries Using Sensor Pattern Noise” Department of Electrical and
Computer Engineering SUNY Binghamton, Binghamton, NY 13902-6000
Forgery in Digital Images”, Proc Digital ForensicResearch Workshop,
Cleveland, OH, August 2003
Inconsistencies in Lighting”, Proc ACM Multimedia and Security Workshop,
New York, pp 1–9, 2005
using Higher Order Statistics”, ADVENT Technical Report #201-2004-1,
Columbia University, June 2004
10 Popescu A.C and Farid H.: “Exposing Digital Forgeries by Detecting
Traces of Resampling”, IEEE Transactions on Signal Processing, vol 53(2),
pp 758–767, 2005
Trang 1211 Popescu A.C and Farid H.: “Exposing Digital Forgeries in Color Filter
Array Interpolated Images”, IEEE Transactions on Signal Processing, vol
53(10), pp 3948–3959, 2005
12 Popescu A.C and Farid, H.: “Exposing Digital Forgeries by Detecting
Duplicated Image Regions”, Technical Report, TR2004-515, Dartmouth
College, Computer Science 2004