Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương nộidung được tổ chức như sau:Chương 1: Tổng quan về xử lý ảnh và giả mạo ảnh Chương này trình bày tổng quan về một hệ
Trang 3DANH MỤC CÁC HÌNH
Hình 1.1 Các giai đoạn chính trong xử lý ảnh 6
Hình 1.2 Các thành phần chính trong hệ thống xử lý ảnh 6
Hình 1.3 Minh họa về việc giả mạo ảnh 10
Hình 1.4 Minh họa cho loại giả mạo ghép ảnh 11
Hình 1.5 Minh họa cho loại giả mạo tăng cường ảnh 12
Hình 1.6 Ảnh che phủ và bỏ đi đối tượng 13
Hình 1.7 Ảnh bổ sung đối tượng 14
Hình 1.8 Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu 15
Hình 2.1 Minh họa các loại nguồn sáng 21
Hình 2.2 Kết quả áp dụng thuật toán so khớp bền vững cho hình 1.7b 29
Hình 2.3 Kết quả của thuật toán phát hiện dựa trên PCA 33
Hình 2.4 Lấy mẫu lại một tín hiệu với tỷ lệ 4/3 35
Hình 2.5 Kết quả thực hiện thuật toán EM cho các tín hiệu ở hình 2.4 40
Hình 2.6 Ví dụ về lấy mẫu lại ảnh 42
Hình 2.7 Kết quả của thuật toán EM áp dụng để ước lượng xác suất 43
Hình 2.8 Ví dụ cho thuật toán phát hiện việc lấy mẫu lại 44
Hình 2.9 Minh họa biểu đồ xác suất nhân tạo 47
Hình 2.10 Độ chính xác của thuật toán phát hiện với các tham số lấy mẫu lại khác nhau 49
Hình 3.1 Ảnh giả được tạo ra bằng việc copy một vùng khói và dán vào ảnh nhiều lần 50
Hình 3.2 Ảnh bổ sung đối tượng 51
Hình 3.3 Ảnh giả được tạo ra từ 2 ảnh ở hình 3.4 52
Hình 3.4 Hai ảnh gốc để tạo ra ảnh giả ở hình 3.3 52
Hình 3.5 Kết quả của thuật toán ước lượng hướng nguồn sáng cho 2 đối tượng trong ảnh 53
Hình 3.6 Giao diện chương trình 55
Hình 3.7 (a) ảnh gốc; (b) ảnh giả mạo; (c) Kết quả thực hiện thuật toán 56
Hình 3.8 Kết quả của thuật toán phát hiện với các kích thước khối khác nhau57 Hình 3.9 Kết quả của thuật toán phát hiện ảnh giả mạo ở hình 3.2b 57
Trang 4MỞ ĐẦU
Ngày nay, với sự phát triển mạnh mẽ của ngành Khoa học máy tính cũngnhư sự bùng nổ của lĩnh vực Công nghệ thông tin đã đẩy nhanh sự phát triển củanhiều lĩnh vực như quân sự, y học, giáo dục, kinh tế, giải trí v.v Sự phát triểncủa phần cứng cả về phương diện thu nhận, hiển thị, cùng với tốc độ xử lý đã
mở ra nhiều hướng mới cho sự phát triển phần mềm, đặc biệt là Công nghệ xử
lý ảnh đã ra đời và phát triển nhanh Sức mạnh của các phần mềm soạn thảo và
xử lý ảnh như Photoshop đã giúp cho việc tạo ra ảnh giả mạo ngày càng dễ dànghơn Các chương trình xử lý ảnh này có thể thêm vào hoặc bỏ đi các đặc trưngcủa ảnh mà ít để lại các dấu hiệu về sự giả mạo v.v Người ta tạo ra các ảnh giảmạo thường nhằm vào các mục đích như vu cáo, tạo ra các tin giật gân, đánhlừa đối thủ, làm sai lệch chứng cứ phạm tội v.v Do vậy, việc phát hiện ra ảnhgiả mạo là vấn đề phải đặt ra ngày càng cấp bách và càng trở nên khó khăn.Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã được công nhậnbởi cộng đồng các nhà nghiên cứu, nhưng hiện nay rất ít tài liệu có giá trị vềlĩnh vực này Trong việc chống giả mạo ảnh, người ta đã nghiên cứu các kỹthuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào bức ảnhtrước khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện choviệc phát hiện các sửa đổi hoặc cắt ghép sau này Theo cách tiếp cận này, cácthiết bị máy ảnh số và camera ngày nay thường bổ sung các tính năng bản quyềnngay trong quá trình thu nhận ảnh Dựa vào đó sau này ta có thể biết đượcnguồn gốc của bức ảnh Nhờ đó mà có thể biết được đó có phải là ảnh gốc haykhông? Cách tiếp cận này dựa vào giả thiết rằng việc giả mạo ảnh sẽ làm thayđổi thông tin bản quyền Tuy nhiên, hạn chế của cách tiếp cận này là thông tinbản quyền phải được chèn vào tại thời gian thu nhận ảnh nên chỉ giới hạn vớicác camera số được trang bị đặc biệt
Trên đây đã điểm qua tầm quan trọng của vấn đề phát hiện ảnh giả mạo vàđiều đó cho ta thấy rõ tính cần thiết cũng như tính thời sự đồng thời là ý nghĩakhoa học và thực tiễn của vấn đề Nhận thức được điều này, tôi đã chọn đề tài:
“Phát hiện ảnh giả mạo” cho luận văn của mình.
Trang 5Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương nộidung được tổ chức như sau:
Chương 1: Tổng quan về xử lý ảnh và giả mạo ảnh
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơbản trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiệnảnh giả mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng các cách tiếp cận chính
để phát hiện ảnh giả mạo
Chương 2: Một số phương pháp phát hiện ảnh giả mạo
Chương này trình bày một số kỹ thuật phát hiện ảnh giả mạo như: Kỹ thuậtphát hiện dựa vào phân tích nguồn sáng, kỹ thuật phát hiện dựa vào việc tìm radấu vết của việc lấy mẫu lại và các kỹ thuật phát hiện dựa vào việc tìm ra cácvùng lặp trong ảnh
Chương 3: Ứng dụng
Trình bày các ứng dụng của các kỹ thuật phát hiện ảnh giả mạo và sử dụngVisual C++ cài đặt kỹ thuật phát hiện các vùng lặp trong ảnh để phát hiện loạiảnh giả mạo sinh bởi thao tác copy và dịch chuyển vùng trên ảnh
Trang 6Chương 1 – TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ GIẢ MẠO ẢNH
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiện ảnh giả mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng với các cách tiếp cận chính để phát hiện ảnh giả mạo.
1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh
1.1.1 Xử lý ảnh là gì?
Xử lý ảnh là một khoa học tương đối mới mẻ so với nhiều ngành khoa họckhác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuấthiện những máy tính chuyên dụng Để có thể hình dung cấu hình một hệ thống
xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đàotạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh Ảnh có thể thu nhận qua camera.Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểuCCIR), nhưng cũng có thể là tín hiệu số hóa (loại CCD-Change CoupledDevice)
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,tranh được quét trên scanner Tiếp theo là quá trình số hóa để biến đổi tín hiệuliên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khichuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại
Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ Trước hết là côngviệc tăng cường ảnh để nâng cao chất lượng ảnh Do những nguyên nhân khácnhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu,ảnh có thể bị suy biến Do vậy cần phải tăng cường và khôi phục lại ảnh để làmnổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạngthái gốc – trạng thái trước khi ảnh bị biến dạng Giai đoạn tiếp theo là phát hiệncác đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính, v.v
Trang 7Cuối cùng, tùy theo mục đích của người sử dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác Các giai đoạn chính trong quá trình xử lý ảnh
được mô tả qua hình 1.1[1]
Thu nhận (Camera, scanner, sensor, )
Lưu trữ
Hậu xử lý (Chính xác hóa, rút Kết luận gọn, )
Hệ quyết định
Hình 1.1 Các giai đoạn chính trong xử lý ảnh
Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối thiểu
Trang 8Hình 1.2 Các thành phần chính trong hệ thống xử lý ảnh
Trang 9 Đối với một hệ thống xử lý ảnh thu nhận qua camera - camera như là conmắt của hệ thống Có 2 loại camera: camera ống loại CCIR và camera CCD.Loại camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm
625 dòng Loại CCD gồm các photo điốt và làm tương ứng một cường độsáng tại một điểm ảnh với một phần tử ảnh (pixel) Như vậy, ảnh là tập hợpcác điểm ảnh Số pixel tạo nên một ảnh gọi là độ phân giải
đường bao, nhị phân hóa ảnh
cho các quá trình khác, nó cần được lưu trữ
Các khái niệm cơ bản trong xử lý ảnh
Điểm ảnh (pixel): Biểu diễn cường độ sáng hay một dấu hiệu nào đó tại
một tọa độ nào đó của đối tượng trong không gian Điểm ảnh là một hàm nhiều
Ảnh: là một tập hợp các điểm ảnh, thông thường được biểu diễn dưới dạng
ma trận các điểm ảnh
Mức xám: là kết quả của sự mã hóa tương ứng một cường độ sáng của một
điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa Cách mã hóa kinhđiển thường dùng 16, 32 hay 64 mức
Biểu đồ tần suất: Biều đồ tần suất của một mức xám g của ảnh I là số điểm
ảnh của I có mức xám g
Trang 10và giảm thời gian xử lý.
Ảnh được lưu trữ trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in
ấn và xử lý Ảnh là tập hợp các điểm ảnh có cùng kích thước do đó nếu sử dụngcàng nhiều điểm ảnh thì ảnh càng mịn càng đẹp và càng thể hiện rõ hơn chi tiếtcủa ảnh, người ta gọi đặc điểm này là độ phân giải Việc lựa chọn độ phân giảiphụ thuộc vào nhu cầu sử dụng và đặc trưng của từng loại ảnh cụ thể Chẳnghạn, ảnh dùng trong văn bản thường thể hiện dưới dạng đen trắng có độ phângiải 300 DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI
Trên cơ sở đó, các ảnh được biểu diễn theo 2 mô hình cơ bản là RASTER
và VECTOR
Mô hình RASTER:
Theo mô hình này, ảnh được biểu diễn dưới dạng ma trận các điểm ảnh.Tùy theo yêu cầu thực tế mà mỗi điểm ảnh được biểu diễn bằng một hoặc nhiềubít
Ngày nay thiết bị phần cứng phát triển nhưng chủ yếu là theo định hướng Raster cho cả thiết bị đầu vào cũng như đầu ra Ví dụ: máy in, máy quét v.v Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật nénảnh, chia ra 2 khuynh hướng là nén bảo toàn và nén không bảo toàn thông tin.Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban đầu Nénkhông bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu nhưng với sai
số chấp nhận được Trên cơ sở đó người ta đã xây dựng được nhiều khuôn dạngảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v
Mô hình VECTOR:
Ảnh lưu trữ trên máy tính ngoài yêu cầu về giảm không gian lưu trữ, thờigian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong lựachọn, sao chép, di chuyển và tìm kiếm Theo những yêu cầu này, kỹ thuật biểudiễn Vector tỏ ra ưu việt hơn
Trang 11Trong mô hình Vector, ảnh được biểu diễn bởi các điểm ảnh và các đườngthể hiện hướng của một điểm Ảnh dạng Vector được thu nhận từ các thiết bịnhư sensor, digitalier, v.v
Ngày nay, các thiết bị phần cứng phát triển mạnh theo hướng Raster cho cảđầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô hình Vector
là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector
nguồn sáng ngoại lai Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phụcbằng các phép biến đổi
thường khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục Thông thường
sử dụng các phép lọc
1.1.2.4 Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người tamuốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặctính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng:
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công vớinhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,chữ số, chữ có dấu)
Trang 12Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trìnhđọc tài liệu, tăng nhanh tốc độ và chất lƣợng thu nhận thông tin từ máy tính.Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểuchữ, v.v ) phục vụ cho nhiều lĩnh vực
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơron đang đƣợc áp dụng và cho kết quả khả quan.
1.2 Ảnh giả mạo và phát hiện ảnh giả mạo
Hình 1.3 Minh họa về việc giả mạo ảnh
Trang 131.2.2 Các loại ảnh giả mạo cơ bản
Ảnh giả mạo thường chia làm hai loại chính [2] Ảnh giả nhưng thật, tức làhiện trường được dựng thật và việc thu nhận ảnh là thật Loại thứ hai là ảnh giảđược tạo lập trên cơ sở các phần của ảnh gốc thật như hình 1.3 hoặc được cắtdán để thêm vào hay che đi các chi tiết trên ảnh
Trong luận văn này tôi quan tâm đến một số dạng giả mạo thuộc loại thứhai Trong dạng ảnh giả mạo thứ hai có thể chia ra làm 3 loại chính: Ghép ảnh,tăng cường ảnh và copy/di chuyển vùng trên ảnh
1.2.2.1 Ghép ảnh
Ghép ảnh là dạng giả mạo ảnh số phổ biến nhất, trong đó hai hay nhiều ảnh
số được ghép lại với nhau để tạo ra một ảnh số hoàn chỉnh Một ví dụ cho ghépảnh là hình 1.4a Ảnh này được ghép từ 2 ảnh có cùng tỷ lệ Rõ ràng nếu chỉ rađây là ảnh thật hay ảnh giả mạo thì cũng có nghĩa là chứng minh được mối quan
hệ giữa họ
(a) Ghép ảnh từ các ảnh riêng rẽ (b) Ghép ảnh từ các ảnh thay đổi tỷ lệ Hình 1.4
Minh họa cho loại giả mạo ghép ảnh
Một ví dụ khác của dạng giả mạo loại này là hình 1.4b Hình này là ảnhghép từ hai ảnh có sự thay đổi tỷ lệ Nếu không chứng minh được ảnh này là giảthì sẽ phải có cách nhìn khác về sự tiến hóa của loài người?
Độ tin cậy của sự giả mạo loại này phụ thuộc vào mức độ phù hợp giữa cácthành phần trong ảnh về mặt kích thước, tư thế, màu sắc, chất lượng và ánhsáng Nếu có một cặp ảnh tương thích tốt, được thực hiện bởi một chuyên giagiàu kinh nghiệm thì việc giả mạo hoàn toàn như thật
Trang 141.2.2.2 Tăng cường ảnh
Hình 1.5 Minh họa cho loại giả mạo tăng cường ảnh : (a) ảnh gốc, (b) ảnh được thay đổi
màu sắc, (c) ảnh tăng độ tương phản, (d) ảnh được làm mờ nền
Hình 1.5 gồm một ảnh gốc (hình 1.5a), và 3 ví dụ cho loại giả mạo tăngcường ảnh: (1) Xe mô tô màu xanh được chuyển thành màu lục lam và xe tảimàu đỏ trong nền được chuyển thành màu vàng (hình 1.5b); (2) Tăng độ tươngphản của toàn cảnh làm cho ảnh này giống như được chụp vào một ngày trờinắng (hình 1.5c); (3) Các xe ôtô đỗ trong ảnh này bị làm mờ khiến cho chiều sâu
Trang 15của khung cảnh trở nên hẹp hơn (hình 1.5d) v.v Không giống như ghép ảnh,trong Photoshop loại thao tác này thường sử dụng ít click chuột hơn.
Mặc dù loại giả mạo này không thể thay đổi cơ bản hình dạng hay ý nghĩacủa ảnh gốc như loại ghép ảnh, nhưng nó vẫn có tác động khéo léo lên cáchhiểu ảnh Ví dụ, có thể sửa đổi thời tiết và thời gian trong ngày hay có thể làm
mờ đi vài chi tiết để thổi phồng các chi tiết khác trong ảnh, v.v
1.2.2.3 Copy và dịch chuyển vùng trên ảnh
a) Ảnh gốc b) Ảnh đã che phủ đối tượng
c) Ảnh gốc d) Ảnh bỏ đi đối tượng
Hình 1.6 Ảnh che phủ và bỏ đi đối tượng
Trang 16Hình 1.7 thể hiện một dạng khác thường thấy của giả mạo sinh ra bởi thaotác copy và dịch chuyển vùng trên ảnh là việc bổ sung thêm đối tượng Hình1.7a là ảnh gốc chỉ có một chiếc máy bay trực thăng, nhưng hình 1.7b đã được
bổ sung thêm thành 3 chiếc trực thăng ở các vị trí khác nhau Các trực thăng nàychính là được copy từ trực thăng gốc nên góc độ và hướng là giống nhau, do đókhó cho việc xác định
1.2.3 Các cách tiếp cận chính trong phát hiện ảnh giả mạo
1.2.3.1 Dựa vào hình dạng
Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc cắtdán và ghép ảnh thường được thực hiện dựa theo các đường biên, nơi có sựthay đổi không liên tục của cường độ sáng của các điểm ảnh
Trang 171.2.3.2 Dựa vào phân tích nguồn sáng
Việc ghép các ảnh khác nhau hoặc bổ sung thêm đối tượng không phải thựchiện thao tác copy có thể được thực hiện bằng việc phân tích nguồn sáng đối vớitừng đối tượng, các đối tượng được ghép thường có hướng của nguồn sángkhông cùng với các đối tượng trong ảnh gốc
1.2.3.3 Dựa vào biến đổi màu sắc
Ảnh gốc thu nhận thường được thực hiện bởi một thiết bị Do tính chất biếnđổi của ống kính bao gồm góc độ chụp, độ mở v.v nên ảnh thu được thường bịbiến dạng theo các tính chất đặc trưng của các nhà sản xuất Phần ảnh được ghépvào hay bổ sung thường không có sự biến đổi tương đồng về độ sáng
1.2.3.4 Dựa vào cơ sở dữ liệu
Hình 1.8 Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu
Việc giả mạo ảnh thường dựa vào các ảnh đã có, tức là các ảnh đã đượcxuất bản bởi một nơi nào đó như: báo chí, trang Web, tạp chí v.v Các ảnh này
Trang 18đã được lưu trữ nên khi xuất hiện một ảnh nghi là giả mạo người ta có thể tìmảnh này với các phần trong nguồn ảnh nằm trong cơ sở dữ liệu ảnh Trongtrường hợp tốt nhất là các ảnh trong cơ sở dữ liệu đều đã được ẩn giấu mộtthông tin về bản quyền nào đó Hình 1.8 là sơ đồ tổng quát cho một hệ thốngphát hiện giả mạo thuộc loại này
Cách tiếp cận này cũng thường được áp dụng với trường hợp xóa bớt hoặc
bổ sung thêm đối tượng từ chính ảnh gốc Trường hợp mà việc phân tích nguồnsáng hay sự biến đổi về màu sắc không có tác dụng Cơ sở dữ liệu trong trườnghợp này có thể xem là các phần có thể của ảnh gốc
Trang 19Chương 2 – MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN ẢNH GIẢ MẠO
Chương này trình bày một số kỹ thuật phát hiện ảnh giả mạo như: Kỹ thuật phát hiện dựa vào phân tích các mâu thuẫn trong hướng chiếu sáng, kỹ thuật phát hiện dựa vào việc tìm ra dấu vết của việc lấy mẫu lại và các kỹ thuật phát hiện ra sự giả mạo dựa vào việc tìm ra các vùng lặp trong ảnh.
2.1 Phát hiện dựa vào phân tích nguồn sáng
Khi tạo ra một ảnh giả mạo bằng việc ghép các đối tượng từ các ảnh khácnhau thường khó tương thích về các điều kiện ánh sáng Hầu như các đối tượngđược ghép vào có hướng nguồn sáng không cùng với các đối tượng trong ảnhgốc Do vậy, các khác nhau về hướng nguồn sáng này có thể là một gợi ý tốt để
ta phát hiện ảnh giả mạo
Từ gợi ý đó người ta đã tìm ra một cách phát hiện ảnh giả mạo dựa vào mâuthuẫn trong nguồn sáng Chúng ta biết rằng mỗi đối tượng trong ảnh đều đượcchiếu sáng bởi các nguồn sáng và nếu một ảnh không phải là ảnh giả mạo thì cácđối tượng trong ảnh đó phải được chiếu sáng cùng nguồn sáng tại cùng thời gian.Còn nếu một ảnh là ảnh giả được tạo thành bằng việc ghép các đối tượng từ cácbức ảnh khác nhau thì nguồn sáng của chúng thường khác nhau Do đó từ các đốitượng này ta tìm hướng chiếu của nguồn sáng đến từng đối tượng và đem so sánhvới nhau, nếu chênh lệch nhiều thì kết luận đó là ảnh giả mạo
Trong phần này, trước hết tôi trình bày sơ lược về các loại nguồn sáng,sau đó trình bày một số phương pháp ước lượng hướng các nguồn sáng để dựavào đó ta có thể phát hiện ra ảnh giả mạo
2.1.1 Các loại nguồn sáng
Nguồn sáng có thể chia thành hai loại là nguồn sáng đơn (một nguồn sáng) và đa nguồn sáng (nhiều nguồn sáng) Nếu các đối tượng của một ảnh được chiếu sáng bởi duy nhất một nguồn sáng thì ta gọi ảnh đó được chiếu sáng bởi nguồn sáng đơn,
Trang 20là nguồn sáng gần Trên thực tế chỉ có các nguồn sáng tự nhiên (mặt trời, mặttrăng, v.v ) được xem là nguồn sáng xa.
Đối với trường hợp nguồn sáng ở xa vô hạn, việc ước lượng hướng chiếusáng là đơn giản nhất Do khoảng cách từ đối tượng đến nguồn sáng là quá lớnnên có thể xem hướng chiếu sáng từ nguồn sáng đến mọi điểm trên đối tượngđều trùng nhau Và vì vậy với mỗi đối tượng ta chỉ cần tìm ra một hướng chiếusáng Trường hợp nguồn sáng cục bộ thì khó hơn nhiều Vì nguồn sáng ở gầnđối tượng nên hướng chiếu sáng từ nguồn sáng đến các điểm trên đối tượng sẽkhác nhau và đồng quy tại một điểm Điểm đó chính là vị trí của nguồn sáng.Ánh sáng có một đặc tính tuyệt vời là cộng tuyến Do vậy, trong trườnghợp nhiều nguồn sáng, hướng nguồn sáng được xác định bằng cách cộng cáchướng nguồn sáng thành phần và xem như chỉ có một nguồn sáng (ảo) chiếuvào đối tượng
2.1.2 Các phương pháp ước lượng hướng nguồn sáng
Thuật toán ước lượng hướng nguồn sáng không thể áp dụng chung chomọi loại nguồn sáng mà mỗi loại có một cách ước lượng riêng Trong phần này,tôi trình bày các phương pháp ước lượng hướng chiếu sáng của nguồn sáng xa,nguồn sáng cục bộ và nhiều nguồn sáng để sử dụng cho việc phát hiện ảnh giảmạo [11]
2.1.2.1 Nguồn sáng xa (3-D)
Các cách tiếp cận chuẩn cho việc ước lượng hướng nguồn sáng bắt đầubằng một số giả định đơn giản sau:
bằng nhau theo mọi hướng);
Trang 21(3) Bề mặt đối tượng được chiếu sáng bằng một nguồn sáng điểm vô cùng xa;
Với các giả định này, cường độ ảnh được biểu diễn như sau:
I ( x, y ) = R( N ( x, y ).L) + A
Trong đó R là giá trị hệ số phản chiếu cố định của bề mặt,
của bề mặt tại điểm (x,y), và A là hệ số phản chiếu của môi trường, hình 2.1(a).
Nếu chúng ta chỉ quan tâm đến hướng của nguồn sáng thì hệ số phản chiếu, R,
Trang 22= ( M T M v
2.1.2.2 Nguồn sáng xa (2-D)
Phần này trình bày một giải pháp thông minh hơn để ước lượng 2 thành
cung cấp ít thông tin về hướng nguồn sáng, làm cho vấn đề dễ kiểm soát hơn
Tại các điểm trên đường biên khuất, thành phần z của pháp tuyến bề mặt bằng 0,
Như phần trước, hàm lỗi này được cực tiểu hóa sử dụng bình phương tối
thiểu chuẩn và cho kết quả giống như (2.4), nhưng ma trận M có dạng như
(2.6) Trong trường hợp này, giải pháp yêu cầu biết các pháp tuyến bề mặt 2-D
từ ít nhất 3 điểm (p ≥ 3) trên một bề mặt có cùng hệ số phản chiếu
trực tiếp từ ảnh Tuy nhiên, thay vào đó ta sẽ lấy cường độ sáng tại các điểm ở
gần đường biên khuất
Để tính véctơ pháp tuyến tại (x,y) trên biên khuất ta lấy hai điểm A, B trên
biên khuất gần với (x,y) nhất, từ đó tính véctơ pháp tuyến của AB và có thể lấy
Trang 23 Làm giảm giả định hệ số phản chiếu cố định
Trong phần trên ta giả sử hệ số phản chiếu trên toàn bộ bề mặt của đốitượng là giống nhau Ta sẽ làm giảm giả định này bằng việc giả sử rằng hệ sốphản chiếu trên mỗi phần của bề mặt là cố định Việc này đòi hỏi chúng ta đánh
, cho mỗi phần dọc theo bề mặt Trongtrường hợp nguồn sáng xa, hướng của các véctơ này sẽ không thay đổi, nhưng
độ lớn của chúng thì có thể khác nhau do nó phụ thuộc vào R
Hình 2.1 Minh họa các loại nguồn sáng (a) nguồn sáng xa (3-D); (b) nguồn sáng xa (2-D); và (c) nguồn sáng cục bộ (2-D).
Xét một bề mặt được chia thành n phần, và giả sử mỗi phần có p điểm Khi
đó, hàm sai số là:
E (L1, , L n
Trong đó, ma trận M như sau:
Trang 25Mặc dù các ước lượng cục bộ này cho phép chúng ta giảm nhẹ giả định hệ
số phản xạ bất biến, nhưng có khả năng cho kết quả ít ổn định hơn Lưu ý rằngđối với nguồn sáng điểm xa, hướng của n véctơ này phải giống nhau, chúng chỉkhác nhau về độ lớn Với giả định thêm vào rằng sự khác nhau giữa hai hệ sốphản chiếu của hai phần gần nhau là rất nhỏ, chúng ta có thêm một hàm sai sốdạng toàn phương khác:
Hàm sai số trên vẫn có thể được cực tiểu hóa sử dụng phương pháp bình
Trang 26Trong đó, ma trận C kích thước 2n-1 x 2n+1 có dạng:
Trang 27n
Trang 28cộng của n véctơ đã ước lượng được L , , L
2.1.2.3 Nguồn sáng cục bộ (2-D)
Trong hai phần trên ta xét nguồn sáng là nguồn sáng xa, tức làkhông
phụ thuộc vào tọa độ điểm ảnh Với một nguồn sáng ở gần, điều nàykhông còn hợp lý, tức là hướng chiếu sáng phụ thuộc vào các điểmảnh, hình 2.1(c) Mô hình cho một nguồn sáng xa, phương trình(2.1), có thể được viết lại để thích hợp với nguồn sáng cục bộ nhưsau:
I ( x, y) = R( N ( x, y).L( x, y)) + A
Lúc này hướng của nguồn sáng là một hàm các tọa độ ảnh
Chúng ta bắt đầu bằng việc thừa nhận hướng chiếu của nguồnsáng lên mỗi phần của bề mặt cục bộ là không đổi và được ước lượng
sử dụng phương trình (2.7) Trong phần trước, phương trình (2.9)khuyến khích các ước lượng lân cận
Trang 29bằng nhau Trong trường hợp nguồn sáng cục bộ, chúng ta mong muốn hướng
của các véctơ ước lượng được sẽ hội tụ đến một điểm đơn ở gần Một công
thức tương tự như (2.9) được đưa ra để thực hiện điều này:
E2 (L1, , L n ) =∑
Xét các ước lượng hướng chiếu sáng của nguồn sáng cục bộ trên một cặp đối
tượng (hoặc một cặp đường biên trên một đối tượng hay một cặp các phần cục bộ
của một đường biên) được ước lượng bằng việc cực tiểu hóa hàm lỗi bình
phương như phương trình (2.7) Ký hiệu các ước lượng này là L1 và L2 , và ký
tượng Giả sử rằng các ước lượng này không song song với nhau, khi đó điểm
giao nhau của chúng được xác định bằng phương trình:
hạng chính quy hóa phạt mỗi ước lượng
hướng này Cụ thể, hình phạt tương ứng với độ chênh lệch giữa ước lượng ban
Trang 30(2.20)
i
Hình phạt cho L
trận Ci được ước lượng trên mỗi lần lặp của quá trình cực tiểu gradient liên hợp
sai số cuối cùng là:
E(L1, , L n
Trong đó, E1(.) được xác định từ phương trình (2.7), và λ là hệ số tỷ lệ Tuynhiên hàm lỗi này không thể được cực tiểu hóa theo phép phân tích mà được cựctiểu hóa dùng gradient liên hợp lặp, xem phụ lục A Mặc dù hàm lỗi này có dạngtương tự với dạng hàm lỗi trong phần trước nhưng các ma trận Ci phụ thuộc vào
Ánh sáng có một đặc tính tuyệt vời là tuyến tính Ví dụ, một cảnh đượcchiếu sáng bởi 2 nguồn sáng xa thì cường độ sáng tại một điểm (x,y) có dạng:
I ( x, y ) = R (( N ( x, y ).L1 ) + ( N ( x, y ).L 2 )) + A
= R (N (x, y ).(L1
Trang 31Trong đó, L+ là véctơ tổng của hai véctơ riêng lẻ L1
hình này có dạng giống như nguồn sáng đơn, phương trình (2.1) Vì vậy, sửdụng cùng cách tiếp cận như trong các phần trước, sẽ cho kết quả là một ướclượng về nguồn sáng ảo - véctơ tổng của các nguồn sáng riêng lẻ Theo cách nàychúng ta có thể mở rộng cho trường hợp có 3 hay nhiều nguồn sáng
Mặc dù không phổ biến lắm, nhưng có khả năng là tổ hợp các nguồn sángkhác nhau sẽ có tổng nguồn sáng ảo giống nhau, nên cách tiếp cận này có thểkhông phát hiện được mâu thuẫn trong nguồn sáng
Trang 322.2 Các kỹ thuật phát hiện ảnh giả mạo sinh bởi thao tác copy và dịch chuyển vùng trên ảnh
Đối với loại giả mạo này, ảnh giả mạo được tạo ra từ các phần được copy
tính quan trọng khác sẽ tương thích với phần còn lại của ảnh và do vậy ta khôngthể sử dụng các phương pháp tìm kiếm tính không tương thích trong các khíacạnh trên để phát hiện ra sự giả mạo Phương pháp phát hiện mâu thuẫn tronghướng chiếu sáng đã trình bày cũng thất bại trong việc phát hiện loại ảnh giảmạo này Tuy nhiên, bất kỳ sự giả mạo do thao tác copy và dịch chuyển nàocũng có một sự tương quan giữa phần ảnh gốc và phần ảnh dán vào Sự tươngquan đó có thể được sử dụng như một cơ sở cho việc phát hiện thành công ảnhgiả mạo loại này Phần này sẽ trình bày một số phương pháp phát hiện ảnh giảmạo sinh bởi thao tác copy và dịch chuyển vùng trên ảnh thông qua việc pháthiện các vùng lặp [4,8]
2.2.1 So khớp chính xác
Thuật toán so khớp chính xác tìm ra các vùng trong ảnh tương thích chínhxác với nhau Mặc dù tính ứng dụng của công cụ này hạn chế nhưng nó vẫn giúpích cho việc phân tích theo pháp lý Nó cũng hình thành nền tảng cho thuật toán
so khớp bền vững được trình bày chi tiết trong phần tiếp theo
Giả sử có một ảnh cấp xám kích thước MxN điểm ảnh Đầu tiên, người sửdụng chọn kích thước cho đoạn dùng để so khớp Giả sử đoạn này là hình vuông
có kích thước BxB điểm ảnh Hình vuông này được trượt đi từng điểm ảnh dọctheo ảnh từ góc trái trên đến góc phải dưới Với mỗi vị trí của khối, các giá trịđiểm ảnh của khối này được trích ra theo các cột và lưu thành một dòng trong
tương ứng với một vị trí của khối trượt
Hai dòng đồng nhất trong ma trận A tương ứng với 2 khối đồng nhất cókích thước BxB điểm ảnh Để xác định các dòng đồng nhất, ta sắp xếp các dòng
bước Các dòng khớp nhau được tìm ra dễ dàng bằng việc duyệt qua tất cả MNdòng của ma trận A đã sắp xếp và tìm ra 2 dòng liên tiếp giống nhau
Hạn chế của cách tiếp cận này là nếu ảnh giả mạo được lưu với định dạng
Trang 33JPEG thì phần lớn các khối đồng nhất bị mất và thuật toán sẽ phát hiện sai Các thuật toán trình bày trong các phần tiếp theo khắc phục hạn chế này.
2.2.2 So khớp bền vững
tự như so khớp chính xác, chỉ khác là thuật toán so khớp bền vững không sosánh và sắp thứ tự dựa trên giá trị điểm ảnh trong khối mà dựa trên các hệ sốDCT (Discrete Cosine Transform – biến đổi Cosin rời rạc) Các bước lượng tửhóa được tính toán dựa vào một tham số Q do người sử dụng xác định Tham sốnày tương đương với nhân tố chất lượng trong nén JPEG, tức là tham số Q xácđịnh các bước lượng tử hóa cho các hệ số biến đổi DCT Bởi vì giá trị của tham
số Q càng cao dẫn đến sự lượng tử càng tốt, nên các khối phải tương thích chínhxác hơn để được nhận dạng giống nhau Các giá trị thừa số Q càng thấp cho racàng nhiều khối tương thích, có thể có một số khối tương thích sai
Việc phát hiện bắt đầu giống như thuật toán so khớp chính xác Bức ảnhđược quét từ góc trái trên xuống góc phải dưới bằng một khối kích thước BxBđiểm ảnh Với mỗi khối, biến đổi DCT được tính, các hệ số DCT được lượng tửhóa và lưu thành một dòng của ma trận A Ma trận này sẽ có (M-B+1)(N-B+1)dòng và BxB cột như trường hợp so khớp chính xác
Các dòng của ma trận A cũng được sắp xếp theo từ điển như trước Tuynhiên, phần còn lại của thủ tục thì khác Vì lúc này các giá trị của các hệ số DCTlượng tử hóa được so sánh thay vì biểu diễn điểm ảnh nên thuật toán có thể tìm
ra quá nhiều khối khớp (các khối khớp sai) Do vậy, thuật toán này hướng về các
vị trí chung của mỗi cặp khối tương thích và chỉ chọn ra một cặp khối cụ thể nếu
và chỉ nếu có nhiều cặp tương thích khác cùng vị trí như thế (chúng có chungvéctơ dịch chuyển) Hướng tới mục tiêu này, nếu tìm thấy 2 dòng liên tiếp nhaucủa ma trận sắp xếp A giống nhau thì thuật toán này lưu các vị trí của các khốitương thích trong một danh sách riêng (ví dụ, lưu tọa độ điểm ảnh ở góc trên
tương thích này được tính như sau:
s=(s 1 ,s 2 )=(i 1 -j 1 ,i 2 -j 2 )
Trang 34khớp nhau đóng góp vào mỗi véctơ dịch chuyển này được tô màu giống nhau vàđược xem như các khối lặp.
Giá trị ngưỡng T liên quan đến kích thước của đoạn nhỏ nhất được chọn đểnhận dạng bằng thuật toán này Các giá trị T lớn có thể làm cho thuật toán bỏ lỡmột số khối tương thích, còn giá trị T quá nhỏ có thể cho ra quá nhiều khốitương thích sai
Với so khớp bền vững, chúng ta sử dụng kích thước khối lớn hơn, B=16, đểtránh trường hợp có quá nhiều khối tương thích sai (các khối càng lớn thì sựbiến thiên trong các hệ số DCT càng lớn) Tuy nhiên, nếu ta sử dụng kích thướckhối B=16 thì ta phải sử dụng một ma trận lượng tử hóa kích thước 16x16 thay
vì sử dụng ma trận lượng tử hóa chuẩn trong nén JPEG Từ các thí nghiệm,chúng tôi nhận thấy rằng tất cả các hệ số AC DCT trong trường hợp các khốikích thước 16x16 trung bình lớn hơn 2.5 lần so với các khối kích thước 8x8 và
số hạng DC lớn hơn 2 lần Do vậy, ma trận lượng tử hóa được sử dụng cho việclượng tử các hệ số DCT trong mỗi khối kích thước 16x16 có dạng như sau:
Trang 35và I là một ma trận đơn vị 8x8 (tất cả các phần tử đều bằng 1).
Lưu ý rằng cả so khớp bền vững và so khớp chính xác, nếu ảnh được phântích là một ảnh màu, thì ảnh đó được chuyển đổi thành một ảnh cấp xám sửdụng công thức chuẩn I = 0.299 R + 0.587 G + 0.114 B trước khi phân tích tiếp
Hình 2.2 Kết quả áp dụng thuật toán so khớp bền vững cho hình 1.7b
2.2.3 Phát hiện các vùng lặp dựa vào phép phân tích thành phần chính
Phần này trình bày một kỹ thuật có thể phát hiện và định vị một cách hiệuquả các vùng giống nhau trong ảnh Kỹ thuật này trước tiên hoạt động bằng việc
áp dụng phép phân tích thành phần chính trên các khối ảnh nhỏ có kích thước cốđịnh để đưa ra một biểu diễn có số chiều giảm Biểu diễn này mạnh đối với cácthay đổi nhỏ trong ảnh do tạp nhiễu hay nén mất thông tin Các vùng lặp cũngđược phát hiện bằng việc sắp xếp các khối ảnh theo thứ tự từ điển Trong phầntrước chúng ta đã trình bày một phương pháp tương tự để phát hiện các vùnglặp dựa trên việc sắp xếp các hệ số khối DCT Mặc dù cả 2 phương pháp nàyđều sử dụng cùng cách tiếp cận nhưng nền tảng của PCA là dựa trên dữ liệu nên
có thể bắt giữ tốt hơn các đặc trưng có ý nghĩa
Xét một ảnh cấp xám có N điểm ảnh Giả sử một ảnh được lợp bằng việc
nhiều so với kích thước của các vùng giống nhau được phát hiện Gọi x i , i=1,…,N b là các khối này ở dạng vectơ, với N b = ( N − b +1)2 Bây giờ, chúng ta xem một biểu diễn khác của các khối ảnh này dựa trên phép phân tích
Trang 36định nghĩa các thành phần chính, trong đó j = 1,…, b và λ 1 ≥ λ 2 ≥ … ≥ λ b Các véctơ
xi =
T
Số chiều của biểu diễn này có thể được giảm đơn giản bằng cách bỏ bớt tổng
trong phương trình (2.25) và chỉ giữ lại Nt số hạng đầu tiên Lưu ý rằng phép chiếu
trên Nt véctơ riêng đầu tiên của cơ sở PCA cho ra một sự xấp xỉ Nt chiều tốt nhất
theo nghĩa các bình phương tối thiểu (nếu phân bố của là phân bố Gaussian đa
hướng) Vì vậy, biểu diễn số chiều giảm cung cấp một không gian thuận lợi để
nhận ra các khối giống nhau khi có mặt của tạp nhiễu, do việc giảm số chiều này
sẽ bỏ đi các biến đổi cường độ nhỏ
Thuật toán phát hiện tiến hành như sau Đầu tiên, làm giảm các biến đổi
lượng tử hóa,
hệ số lượng tử này Gọi S là ma trận thể hiện kết quả của việc sắp xếp các dòng
x i s
Trang 37nó, |i-j|, nhỏ hơn một ngưỡng cho trước Trong ảnh, offset của tất cả các cặpnhư thế được cho bởi:
Trang 38(xi - xj, yi - yj) nếu xi – xj > 0
(xj – xi, yi - yj) nếu xi – xj < 0
Từ danh sách các offset này, các vùng lặp trong ảnh được phát hiện bằng
việc nhận ra các offset xuất hiện nhiều lần Ví dụ một vùng lặp lớn sẽ chứa nhiều
khối nhỏ hơn, và mỗi khối xuất hiện rất gần với khối khác trong ma trận được
sắp xếp và sẽ có cùng offset Để tránh việc cho kết quả sai do các vùng đồng
nhất, ta bỏ qua độ lớn offset của cặp nào thấp hơn ngưỡng cho trước Chi tiết
từng bước của thuật toán như sau:
N f : ngưỡng tần số xuất hiện tối thiểu.
3 Sử dụng PCA, tính biểu diễn mới N t-chiều, a i , i = 1,… , N b, cho mỗi khối
ảnh b điểm ảnh (đối với các ảnh màu: (1) phân tích mỗi kênh màu riêng biệt; hoặc
(2) xây dựng một khối màu đơn với kích thước 3b điểm ảnh) Chọn giá trị
4 Xây dựng một ma trận N b× b sao cho các dòng của nó là các tọa độ được
lượng tử hóa theo từng thành phần: a i / Q
Trang 39ảnh zero có cùng kích thước với ảnh gốc, và tô màu tất cả các điểm ảnh trongvùng lặp với cùng một giá trị cường độ xám.
Độ phức tạp của thuật toán này bị chi phối bởi thuật toán sắp xếp theo thứ
và N là tổng số điểm ảnh của ảnh
Có ít nhất 2 cách để mở rộng thuật toán này cho các ảnh màu Cách tiếp cậnđơn giản nhất là xử lý độc lập mỗi kênh màu (ví dụ: RGB) để tạo ra 3 biểu đồlặp Cách tiếp cận thứ 2 là áp dụng PCA cho các khối màu kích thước 3b và tiếnhành theo cách đã miêu tả ở trên
Hình 2.3 là ảnh gốc và ảnh giả mạo Sự giả mạo bao gồm việc copy mộtvùng trong ảnh và dán vào một vùng khác của ảnh để che giấu một đối tượng.Hình bên dưới là kết quả của thuật toán phát hiện được áp dụng cho ảnh giảmạo lưu với các hệ số chất lượng nén JPEG trong khoảng từ 50 đến 100 Ở mỗibiểu đồ, 2 vùng lặp được chỉ ra với các giá trị cấp xám khác nhau Trong ví dụ
dung, biểu đồ lặp được (1) giãn rồi co để khử các lỗ trống trong các vùng lặp, và(2) co rồi giãn để khử các cặp khối lặp sai