Mở đầu Kĩ thuật Watermarking thủy vân là kỹ thuật đáp ứng yêu cầu cao trong thời giangần đây cho việc bảo vệ các dữ liệu đa phương tiện trong môi trường mạng trước sự saochép dữ liệu trá
Trang 1
BÁO CÁO CHUYÊN ĐỀ
(Kĩ thuật thủy vân trên ảnh nén)
Trưởng nhóm: Nguyễn Hữu Thắng Lớp D12VT5
Giáo viên hướng dẫn: TS HOÀNG TRỌNG MINH
Trang 2
Mở đầu
Kĩ thuật Watermarking (thủy vân) là kỹ thuật đáp ứng yêu cầu cao trong thời giangần đây cho việc bảo vệ các dữ liệu đa phương tiện trong môi trường mạng trước sự saochép dữ liệu trái phép, sự vi phạm quyền sao chép, các chứng thực khác (Hartung andKutter,1999), trong khi việc nén các tín hiệu đa phương tiện là cần thiết trong không gianlưu trữ và truyền dẫn.Vì thế, là cần thiết khi đề cập đến sự quan trọng của giấu tin trongquá trính nén dữ liệu.Tuy nhiên, các nguyên tắc làm việc của kĩ thuật thủy vân và nénđược xem là khó khăn hơn so với dữ liệu đã được mã hóa dư thừa vốn có trong quá trìnhnén Ở 1 khía cạnh khác,kĩ thuật thủy vân sử dụng không gian dự phòng làm cho dữ liệu
ẩn đi không hiện lên Một vấn đề khác xảy ra,kĩ thuật nhúng thủy vân trên dữ liệu nén trởnên khó khăn hơn và nhiều phương án khác nhau được đưa ra nhằm tối ưu hóa vấn đềdưới hình thức của kĩ thuật thủy vân và nén (JWC) Hơn nữa, các yêu cầu khác đưa racho kĩ thuật này là quá trình này không làm tăng tỉ lệ bit cho các dữ liệu nén đến một mức
độ lớn, trong khi đáp ứng giá trị cao về tỉ lệ thông tin được giấu đi (DWR) và độ tin cậygiải thuật Người ta mong muốn thuật toán thủy vân phải phù hợp và dễ dàng tích hợpcho các kĩ thuật nén hiện có như là JPEG và JPEG2000 chuyên dùng nén hình ảnh kỹthuật số
Mục tiêu của bài báo cáo là cung cấp cái nhìn về các vấn đề cơ bản trong kĩ thuậtthủy vân trên dữ liệu nén được thiết kế theo các thuật toán mạnh mẽ và hiệu quả Ngườiđọc sẽ hiểu về kĩ thuật này theo từng bước với sự lựa chọn của các công cụ và kỹ thuậtkhác nhau để phát triển một thuật toán tích hợp nhằm đáp ứng một số mục tiêu đã xácđịnh rõ Một trong những mục tiêu được xem xét ở đây là phát triển DWR cao và tỷ lệ lỗibit thấp (BER), hệ thống thủy vân với tải trọng vừa phải và không tăng kích thước của tậptin đã sử dụng kĩ thuật này lên quá nhiều Điều này có thể thực hiện bằng cách sử dụng
mã sửa lỗi (ECC) thông minh thông qua việc tạo ra các không gian dự phòng ảo Nói theocách khác, sự linh hoạt cho các dữ liệu được nhúng bị mất đi do hoạt động lượng tử cóthể được tái tạo bằng cách áp dụng mã hóa kênh chương trình trực tiếp trên dữ liệu máychủ nén, thay vì áp dụng nó vào tín hiệu giấu đi như thực hiện trong hệ thống giấu tinthông thường Nó cũng cần được xem xét cái gọi là dư thừa tạo ra, không nên tăng nhiềukích thước của tập tin dữ liệu nén,đó là mục tiêu chính của hoạt động nén
Trang 3
MỤC LỤC
Mở đầu 2
Mục Lục 3
DANH MỤC CÁC THUẬT NGỮ 5
Chương I: Tổng quan về kĩ thuật Watermarking (Thủy vân) 6
1.1: Khái niệm thuỷ vân 6
1.2 Một số vấn đề có liên quan đến thuỷ vân 7
1.3 Khái niệm thuỷ vân cơ sở dữ liệu 8
1.4 Một số ứng dụng của thuỷ vân 8
1.4.1 Bảo vệ bản quyền tác giả (copyright protection) 8
1.4.2 Phát hiện xuyên tạc thông tin (authentication and tamper detection) 8
1.4.3 Lấy dấu vân tay hay dán nhãn (fingerprinting and labeling) 9
1.4.4 Điều khiển thiết bị (Device control) 9
1.4.5 Theo dõi quá trình sử dụng (Tracking) 9
1.4.6 Theo dõi truyền thông (Broadcast Monitoring) 9
1.4.7 Truyền tin bí mật (Concealed Communication) 9
1.5 Giải thuật di truyền 9
Chương II: Chuẩn nén ản JPEG , JPEG 2000 11
2.1 Khái niệm nén ảnh 11
2.2: Chuẩn JPEG 11
2.2.1 Khái niệm 11
Trang 4
2.2.2 Chuẩn JPEG và ứng dụng 12
2.3 Sự ra đời của JPEG2000 13
2.4 Các tính năng của JPEG2000 13
2.5 Các bước thực hiện nén ảnh theo chuẩn JPEG2000 14
2.5.1 Xử lí trước khi biến đổi 14
2.5.2 Biến đổi liên thành phần 14
2.5.3: Biến đổi riêng thành phần (biến đổi Wavelet) 15
2.5.4: Lượng tử hóa, giải lượng tử hóa 16
2.5.5 Mã hóa và kết hợp dòng dữ liệu sau mã hóa 17
2.5.6 So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác 17
Chương III: Kĩ thuật watermarking trong nén ảnh 22
3.1 Các vấn đề liên quan, hạn chế và phạm vi ứng dụng 22
3.1.1 Các vấn đề liên quan và hạn chế: 22
3.1.2 Phạm vi ứng dụng: 24
3.2 Phương pháp watermarking đề xuất trên dữ liệu nén 24
3.3 Quá trình giải mã Watermark 27
3.4 Ảnh hưởng của các kỹ thuật nén ảnh đến thủy vân 28
3.5 Hiệu suất 29
KẾT LUẬN 35
TÀI LIỆU THAM KHẢO 36
Trang 5
DANH MỤC CÁC THUẬT NGỮ BER (Bit Error Rate) : Tỷ lệ lỗi bit
DCT (Discrete Cosine Transform): Biến đổi Côsin rời rạc
DWT (Discrete Wavelet Transform): Biến đổi Wavelet rời rạc
ECC (Error Correction Code): mã sửa lỗi
JPEG/ JPEG 2000 (Joint Photographer Experts Group): Hiệp hội
chuyên gia nhiếp ảnh
JWC (Joint Wartermarking and Compression): Kĩ thuật thủy vân và nén
ảnh chung
GA (Genetic Algorithms): Giải thuật di truyền
IWT (Integer Wavelet Transform): Số nguyên biến đổi Wavelet
IIWT (Inverse Integer Wavelet Transform): Số nguyên biến đổi nghịch
đảo Wavelet
LBS (Least Significant Bit): Bit ít ý nghĩa nhất
MSB (Most Significant Bit): Bit ý nghĩa nhất
QIM (Quantization Index modulation ): Điều chế chỉ số lượng tử hóa
Trang 6
Chương I: Tổng quan về kĩ thuật Watermarking
(Thủy vân)
1.1: Khái niệm thuỷ vân
Thuỷ vân số (digital watermarking) là quá trình chèn thông tin vào dữ liệu số đảmbảo không thể cảm nhận được bằng các giác quan của con người nhưng lại dễ dàng pháthiện bởi các thuật toán của máy tính Một dấu thuỷ vân (watermark) mà một mẫu thôngtin trong suốt và không thể nhìn thấy được bằng các giác quan được chèn vào một vị tríthích hợp trong dữ liệu số bằng cách sử dụng một thuật toán đặc biệt Tuỳ thuộc vào mụcđích và ứng dụng mà các yêu cầu của hệ thống watermarking được đặt ra Với các hệthống thực tế, hệ thống thuỷ vân đòi hỏi các yêu cầu sau:
Tính không nhận thấy được (Imperceptibility): Các điều chỉnh gây ra do nhúngwatermark phải thấp hơn ngưỡng cảm thụ của con người, nghĩa là các mẫu dùngtrong nhúng watermark chỉ được phép thay đổi rất nhỏ trong giới hạn cho phép
Tính bền vững (Robustness): Đây là một yêu cầu nòng cốt của watermarking Tùyvào từng loại ứng dụng mà tính bền vững này bằng được nhìn nhận dưới nhiềuquan điểm khác nhau, nếu như đối với các ứng dụng dùng để bảo vệ quyền sở hữuthì watermark cần phải bền vững qua một số các hành động cập nhật nội dung của
dữ liệu Nếu như đối với ứng dụng để chống làm giả hoặc chống lại sự thay đổitrên dữ liệu thì đòi hỏi watermark phải huỷ bỏ khi có các tác vụ này xảy ra
Tính không chia tách được (Inseparability): Sau khi dữ liệu được nhúngwatermark thì yêu cầu là phải rất khó hoặc không thể tách thành 2 phần riêng biệtnhư lúc đầu
Bảo mật (Security): Sau khi đã nhúng watermark vào dữ liệu, thì yêu cầu là chỉcho phép những user có quyền mới chỉnh sửa và phát hiện được watermark điều
Trang 71.2 Một số vấn đề có liên quan đến thuỷ vân
Visible watermarks – thủy vân hiện, giống như tên gọi, nó là những mẫu thông tin,tương tự như những logo được chèn vào ảnh hoặc video Kỹ thuật này chủ yếu áp dụngcho ảnh để đánh dấu các ảnh trong cơ sở dữ liệu ảnh hoặc ngăn chặn sự mua bán trênweb có sử dụng những ảnh này Kỹ thuật kết hợp thuỷ vân với ảnh gốc dùng cách thayđổi độ sáng của ảnh gốc bằng cách dùng một hàm thuỷ vân với một khoá bí mật Khoá bímật này xác định giá trị giả ngẫu nhiên dùng cho việc điều chỉnh độ sáng, mục đích là đểgây khó khăn hơn cho các tấn công xoá bỏ dấu nổi này
Watermarking – Thuỷ vân, ngược lại với steganography, nó có thêm khái niệm là bền vững với các tấn công Ngay cả nếu sự tồn tại của thông tin ẩn là bị lộ thì kỹ thuật này cũng sẽ gây ra sự khó khăn cho kẻ tấn công nếu không biết được khoá bí mật Lý do của sự bền vững này đó là phương thức thuỷ vân có thể nhúng nhiều lần các thông tin nhỏ và dữ liệu cần bảo vệ hơn là phương thức steganographic Trên thực tế thì
steganographic và watermarking không phải là hai phương thức riêng mà chúng có phần
bổ sung cho nhau nhiều hơn là đối lập nhau
Fingerprinting và Labeling (lấy dấu vân tay và gán nhãn) là các thuật ngữ biểu thịcác ứng dụng đặc biệt của thuỷ vân, chúng giống như những thông tin của tạo hoá hoặcnhững đặc trưng được nhúng vào các đối tượng Fingerprinting có nghĩa là quá trình thuỷvân với các thông tin được nhúng hoặc là mã duy nhất xác định tác giả hoặc xác định dữliệu gốc hoặc mã duy nhất bên cạnh các chuỗi mã có chứa các đặc trưng dữ liệu
Bitstream watermarking (thủy vân dòng bit) đôi khi được sử dụng cho nén dữ liệuthuỷ vân ví dụ như video Thuật ngữ nhúng các kỹ hiệu thay thế cho watermarking đượccác ấn phẩm trước đây sử dụng, nhưng nó không được tiếp tục sử dụng nữa, và từ đó dẫn
Trang 8Fragile watermarks (Thuỷ vân dễ vỡ) là các thuỷ vân có sự rất hạn chế về mặt bềnvững đối với dữ liệu Chúng được áp dụng để nhận dạng các thay đổi của dữ liệu đã thuỷvân hơn là gìn giữ thông tin, nếu có các tấn công nhằm xoá bỏ thuỷ vân thì việc này cũng
sẽ phá huỷ luôn cả dữ liệu gốc
1.3 Khái niệm thuỷ vân cơ sở dữ liệu
Thuỷ vân cơ sở dữ liệu là kỹ thuật cho phép người chủ dữ liệu có thể nhúng mộtthuỷ vân ẩn vào dữ liệu Một thuỷ vân thường mô tả những thông tin có thể được dùng đểchứng minh quyền sở hữu dữ liệu, chẳng hạn như là tên chủ sở hữu, nguồn gốc, hoặcngười tiếp nhận nội dung này Việc nhúng thông tin an toàn đòi hỏi thuỷ vân được nhúngtrong dữ liệu không thể bị làm giả mạo hoặc bị tẩy xoá một cách dễ dàng Nhúng ẩn cónghĩa là thuỷ vân không thể nhìn thấy được trong dữ liệu Hơn thế nữa, việc phát hiệnthuỷ vân được thực hiện theo phương pháp “mù”, tức là không đòi hỏi dữ liệu gốc cũngnhư thuỷ vân gốc Đồng thời, khi nhúng thuỷ vân vào dữ liệu cần phải đảm bảo các thayđổi trên dữ liệu là trong giới hạn cho phép của từng ứng dụng cụ thể
1.4 Một số ứng dụng của thuỷ vân
1.4.1 Bảo vệ bản quyền tác giả (copyright protection)
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số Một thông tin nào đó mang
ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - watermark) sẽ được nhúngvào trong các sản phẩm, thuỷ vân đó chỉ một mình người chủ sở hữu hợp pháp các sảnphẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm Giả sử có một thànhphẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video cần được lưu thông trênmạng Để bảo vệ các sản phẩm chống lại hành vi lấy cắp hoặc làm nhái cần phải có một
kỹ thuật để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việcnhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhậnsản phẩm Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng
Trang 9
với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉcòn cách là phá huỷ sản phẩm
1.4.2 Phát hiện xuyên tạc thông tin (authentication and tamper detection)
Một tập thông tin sẽ được giấu trong phương tiện chứa, sau đó được sử dụng đểnhận biết xem dữ liệu trên phương tiện gốc có bị thay đổi hay không Các thuỷ vân nênđược ẩn để tránh sự tò mò của đối phương, hơn nữa việc làm giả các thuỷ vân hợp lệ hayxuyên tạc thông tin nguồn cũng cần xem xét Trong các ứng dụng thực tế, người ta mongmuốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phânbiệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nộidung hay là chỉ bị nén mất dữ liệu) Yêu cầu chung đối với ứng dụng này là khả nănggiấu thông tin cao và thuỷ vân không cần bền vững
1.4.3 Lấy dấu vân tay hay dán nhãn (fingerprinting and labeling)
Thuỷ vân trong những ứng dụng này được sử dụng để nhận diện người gửi hayngười nhận một thông tin nào đó Ví dụ như các vân khác nhau sẽ được nhúng vào cácbản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứngdụng này thì yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân, tránh khả năng xoá dấuvết trong khi phân phối
1.4.4 Điều khiển thiết bị (Device control)
Các thiết bị phát hiện thuỷ vân (ở đây sử dụng phương pháp phát hiện thuỷ vân đãgiấu mà không cần thông tin gốc) được gắn sẵn vào trong các hệ thống đọc ghi, tùy thuộcvào việc có thủy vân hay không để điều khiển (cho phép/cấm) truy cập Ví dụ như hệthống quản lí sao chép DVD đã được ứng dụng ở Nhật Nhà sản xuất sẽ trang bị cho cácphương tiện dùng để nhân bản (như CD writer…) khả năng phát hiện xem digital media
có chứa watermarks hay không, nếu có thì sẽ từ chối không nhân bản
1.4.5 Theo dõi quá trình sử dụng (Tracking)
Digital watermarking có thể được dùng để theo dõi quá trình sử dựng của cácdigital media Mỗi bản sao của sản phẩm được chứa bằng một watermark duy nhất dùng
để xác định user là ai Nếu có sự nhân bản bất hợp pháp, ta có thể truy ra người vi phạmnhờ vào watermark được chứa bên trong các phương tiện này
Trang 10
1.4.6 Theo dõi truyền thông (Broadcast Monitoring)
Các công ty truyền thông và quảng cáo có thể dùng kỹ thuật digital watermarking
để quản lý xem có bao nhiêu khách hàng đã dùng dịch vụ mà họ cung cấp
1.4.7 Truyền tin bí mật (Concealed Communication)
Bởi vì digital watermarking là một dạng đặc biệt của việc che dấu dữ liệu(steganography) nên người ta có thể dùng để truyền các thông tin bí mật
1.5 Giải thuật di truyền
Giải thuật di truyền (GA - Genetic Algorithms) là kỹ thuật giúp giải quyết bài toánbằng cách mô phỏng theo sự tiến hoá của con người hay của sinh vật nói chung (dựa trênthuyết tiến hoá muôn loài của Darwin) trong điều kiện luôn thay đổi của môi trườngsống Thuật toán di truyền là một hướng tiếp cận tính toán gần đúng, nghĩa là mục tiêucủa thuật toán di truyền không nhằm đưa ra lời giải chính xác tối ưu mà là đưa ra lời giảitương đối tối ưu
Giải thuật di truyền là một kỹ thuật của khoa học máy tính nhằm tìm kiếm giảipháp thích hợp cho các bài toán tối ưu tổ hợp (combinatorial optimization) Giải thuật ditruyền là một phân ngành của giải thuật tiến hoá vận dụng các nguyên lý của tiến hoá như
di truyền, đột biến, chọn lọc tự nhiên, và lai ghép Giải thuật di truyền thường được ứngdụng nhằm sử dụng ngôn ngữ máy tính để mô phỏng quá trình tiến hoá của một tập hợpnhững đại diện trừu tượng (gọi là những nhiễm sắc thể) của các giải pháp có thể chấpnhận được (gọi là những cá thể) cho bài toán tối ưu hoá Tập hợp này sẽ tiến triển theohướng chọn lọc những giải pháp tốt hơn Tìm kiếm giả thuyết thích hợp bắt đầu với mộtquần thể, hay một tập hợp có chọn lọc ban đầu của các giả thuyết Các cá thể của quầnthể hiện tại khởi nguồn cho quần thể thế hệ kế tiếp bằng các hoạt động lai ghép và độtbiến ngẫu nhiên – được lấy mẫu sau các quá trình tiến hoá giống như tiến hoá sinh học Ởmỗi bước, các giả thuyết trong quần thể hiện tại được ước lượng liên hệ với đại lượngthích nghi đã cho, với các giả thuyết phù hợp nhất được chọn theo xác suất là các hạtgiống cho việc sản sinh thế hệ kế tiếp Thuật giải di truyền đã được ứng dụng một cáchthành công và được phát triển rộng rãi trong nhiều lĩnh vực
Giải thuật di truyền (GA) cung cấp một phương pháp học được thúc đẩy bởi sựtương tự với sự tiến hoá sinh học Thay vì tìm kiếm các giả thuyết từ tổng quát đến cụ thểhoặc từ đơn giản đến phức tạp, GA tạo ra các giả thuyết kế tiếp bằng cách lặp việc độtbiến và việc tái hợp các phần của giả thuyết được biết hiện tại là tốt nhất ở mỗi bước, một
Trang 11
tập các giả thuyết được gọi là quần thể hiện tại được cập nhật bằng cách thay thế vài phầnnhỏ quần thể bởi cá thể con của các giả thuyết tốt nhất ở thời điểm hiện tại Sự phổ biếncủa GA được thúc đẩy bởi các yếu tố sau:
Tiến hoá là một phương pháp mạnh, thành công cho sự thích nghi bên trongcác hệ thống sinh học
GA có thể tìm kiếm trên các không gian giả thuyết có các phần tương tácphức tạp, ở đó ảnh hưởng của mỗi phần lên toàn thể độ thích nghi giảthuyết khó có thể mô hình hoá
GA có thể được thực hiện song song và có thể tận dụng thành tựu của phầncứng máy tính mạnh
Chương II: Chuẩn nén ản JPEG , JPEG 2000
2.1 Khái niệm nén ảnh
- Nén là quá trình làm giảm thông tin dư thừa trong dữ liệu gốc
Hình 2.1 ảnh ban đầu(a) và ảnh sau khi nén(b)
- Như vậy, nén ảnh có thể giảm nhỏ kích thước ảnh, giảm thời gian truyền và làm giảmchi phí xử lý ảnh trong khi chất lượng ảnh là tốt hơn
Trang 12JPEG sử dụng khá nhiều định dạng ảnh nhưng JPEG/Exif là phổ dụng nhất Địnhdạng này được dùng trong các máy ảnh kỹ thuật số và các thiết bị tương tự khác.JPEG/Exif cũng là định dạng đưuọc dùng nhiều nhất trên mạng Internet ngày nay Cácđịnh dạng tuy có tên khác nhau nhưng sự khác biệt là không nhiều Và để đơn giản ta sẽgọi chung là JPEG.
2.2.2 Chuẩn JPEG và ứng dụng
JPEG hay Joint Photographic Experts Group, là chuẩn chỉ ra cách mà hình ảnh sẽđược nén (codec) thành một chuỗi các byte và có thể giải ngược trở lại thành hình ảnhban đầu Hai chuẩn Exif và JFIF là hai chuẩn thông thường được dùng trong nén ảnhJPEG và có thể thay thế cho nhau
Như đã đề cập ở phần trên, phương thức nén trong ảnh JPEG là nén mất thông tin(lossy), nghĩa là một số thông tin trong ảnh gốc sẽ mất đi (với mục đích làm giảm dunglượng lưu trữ) và sẽ không thể phục hồi lại được Tuy nhiên chuẩn JPEG vẫn hỗ trợlossless nhưng không được rộng rãi như lossy compression
Một phương pháp nén ảnh đặc biệt là Progressive JPEG, trong đó dữ liệu được nénqua nhiều mức khác nhau Phương pháp này dựa trên ý tưởng dành cho các ảnh cỡ lớntruyền trên web với tốc độ chậm, cho phép hiển thị một phần hình ảnh khi được tải về Tuy nhiên chuẩn này vẫn chưa được hỗ trợ rộng rãi, kể cả một số phần mềm (như một sốphiên bản của Internet Explorer) chỉ hiển thị ảnh khi nó đã hoàn toàn tải hết về máy trạm.Chúng ta có thể chuyển đổi dễ dàng giữa 2 dạng baseline và progressive mà không sợ
Trang 13
thay đổi chất lượng của ảnh được chuyển đổi, vì sự khác biệt giữa 2 dạng này chỉ ở chỗ
sự xếp đặt các thành phần (coefficents) của chúng trong trong file nén
Thuật toán nén JPEG được dùng nhiều với ảnh, tranh vẽ thực tế Đối với việc sửdụng trên web, JPEG là chuẩn hữu hiệu nhất vì nó giúp chúng ta giải quyết được vấn đềbăng thông Tuy nhiên, JPEG vẫn không thể phù hợp với các ảnh vẽ đường, mặt, fontnghệ thuật hoặc các biểu tượng đồ họa chuyên nghiệp bởi vì những loại ảnh này đòi hỏi
sự tương phản và sắc nét cao Chúng chỉ có thể lưu dưới dạng nén không mất dữ liệu(lossless graphics fomat) như là TIFF, GIF, PNG hoặc các ảnh dạng thô
Do đặc tính mất thông tin của kỹ thuật nén JPEG, nên nó không thích hợp cho cáchình ảnh được dùng với mục đích sửa đổi thường xuyên, vì mỗi lần sửa đổi thì chất lượngảnh lại tiếp tục mất đi (do quá trình giải nén và nén thực hiện nhiều lần, đặc biệt khi ảnh
bị cắt hoặc chuyển vị hoặc các tham số bị thay đổi) Để tránh điều này chúng ta cần lưulại ảnh gốc dưới dạng nén không mất thông tin (chẳng hạn như PNG), sau đó khi muốnchỉnh sửa ta copy ảnh gốc trên để thực hiện và export kết quả ra dạng JPEG cho mục đíchcủa mình
Trong các lĩnh vực đòi hỏi sự chính xác và trung thực nhất thì sẽ không có chỗ choJPEG như trong y học, thiên văn, vũ trụ … Thay vào đó người ta thường dùng nhất làchuẩn lossless như PNG để đảm bảo được yêu cầu này
Các phần mở rộng của tên file ảnh JPEG được sử dụng khá phổ biến là jpg
và jpeg; tuy nhiên jpe, jfif và jif cũng có thể được sử dụng Dữ liệu ảnh JPEG cũng cóthể dùng để nhúng vào các loại file khác như TIFF file thường nhúng ảnh JPEG vào nhưmột thumbnail của ảnh chính của nó
2.3 Sự ra đời của JPEG2000
Để việc nén ảnh có hiệu quả hơn, tháng 12/1999 một bản phác thảo tiêu chuẩn nénhình ảnh theo công nghệ mới JPEG2000 thay thế cho chuẩn nén ảnh tĩnh JPEG
Tháng 8/2000, bản phác thảo về tiêu chuẩn JPEG2000 đã được lưu hành trong giớichuyên gia hình ảnh
Tháng 12/2000 được ISO hợp thức hóa để cho phép ứng dụng vào các hệ xử lý,phân phối
JPEG-2000 sử dụng kỹ thuật mã hóa dạng sóng rời rạc (DWT – Descrete WaveletTransform) dùng mã số học
Trang 14
2.4 Các tính năng của JPEG2000
JPEG2000 nhiều chức năng đặc biệt hơn mọi chuẩn nén ảnh tĩnh khác như JPEGhay GIF Dưới đây là các chức năng ưu việt của JPEG2000 so với các chuẩn nén ảnh tĩnhkhác :
Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất
Sử dụng được với truyền dẫn và hiển thị lũy tiến về chất lượng, độ phân giải, cácthành phần màu và có tính định vị không gian
Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén
Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu
Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh
Có khả năng mã hóa với tỷ lệ nén theo từng vùng khác nhau
Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng tùy theo yêu cầu củangười sử dụng.
2.5 Các bước thực hiện nén ảnh theo chuẩn JPEG2000
Trang 15dữ liệu ảnh.
2.5.2 Biến đổi liên thành phần
Giai đoạn này sẽ loại bỏ tính tương quan giữa các thành phần của ảnh JPEG2000
sử dụng hai loại biến đổi liên thành phần là biến đổi thuận nghịch (Reversible ColorTransform - RCT) và biến đổi màu không thuận nghịch (Irrersible Color Transform -ICT) trong đó biến đổi thuận nghịch làm việc với các giá trị nguyên, còn biến đổi khôngthuận nghịch làm việc với các giá trị thực ICT và RCT chuyển dữ liệu ảnh từ không gianmàu RGB sang YCrCb RCT được áp dụng cho nén có tổn thất Việc áp dụng các biếnđổi màu trước khi nén ảnh không nằm ngoài mục đích làm tăng hiệu quả nén Các thànhphần Cr, Cb có ảnh hưởng rất ít tới sự cảm nhận hình ảnh của mắt trong khi thành phần
độ chói Y có ảnh hưởng rất lớn tới ảnh Chúng ta có thể thấy rõ điều này trên hình 2.3.
Trang 16Sơ đồ của phương pháp Lifting ID áp dụng trong JPEG2000 trên hình 2.4.
Việc tính toán biến đổi Wavelet ID 2D suy ra từ biến đổi Wavelet ID theo các phươngpháp phân giải ảnh tùy chọn Trong JPEG2000 có 3 phương pháp giải ảnh nhưng phương
pháp được sử dụng nhiều nhất là phương pháp kim tự tháp.
Trang 17
Hình 2.4 Phương pháp Lifting 1D dùng tính toán biến đổi Wavelet
Do biến đổi Wavelet 5/3 là biến đổi thuận nghịch nên có thể áp dụng cho nén ảnhtheo cả 2 phương pháp, có tổn thất và không tổn thất trong khi biến đổi 9/7 chỉ áp dụngcho phương pháp có tổn thất thông tin
2.5.4: Lượng tử hóa, giải lượng tử hóa.
Các hệ số của phép biến đổi sẽ được tiến hành lượng tử hóa Quá trìnhlượng tử hóa cho phép đạt tỉ lệ nén cao hơn bằng cách thể hiện các giá trị biếnđổi với độ chính xác tương ứng cần thiết với các mức chi tiết của ảnh cần nén.Các hệ số biến đổi sẽ đƣợc lượng tử hóa theo phép lượng tử hóa vô hướng Cáchàm lượng tử hóa khác nhau sẽ được áp dụng cho các băng con khác nhau vàđược thực hiện theo biểu thức :
Với ∆ là bước lượng tử, U(x, y) là giá trị băng con đầu vào; V(x, y) là giátrị sau lượng tử hóa Trong dạng biến đổi nguyên, đặt bước lượng tử bằng 1 Vớidạng biến đổi thực thì bước lượng tử sẽ được chọn tương ứng cho từng băng conriêng rẽ Bước lượng tử của mỗi băng do đó phải có ở trong dòng bit truyền đi
để phía thu có thể giải lượng tử cho ảnh
Trang 182.5.5 Mã hóa và kết hợp dòng dữ liệu sau mã hóa
JPEG2000 theo khuyến nghị của ủy ban JPEG quốc tế có thể sử dụng nhiềuphương pháp mã hóa khác nhau cũng như nhiều cách biến đổi Wavelet khácnhau để có thể thu được chất lượng ảnh tương ứng với ứng dụng cần xử lý Điềunày giúp cho JPEG2000 mềm dẻo hơn nhiều so với JPEG Việc áp dụng cácphương pháp mã hóa khác nhau cũng được mở rộng sang lĩnh vực nén ảnh độngbằng biến đổi Wavelet Trong thực tế các phương pháp mã hóa ảnh được ápdụng khi nén ảnh bằng biến đổi Wavelet cũng như JPEG2000 thì có phươngpháp được coi là cơ sở và được áp dụng nhiều nhất: phương pháp SPIHT vàphương pháp EZW Hiện này JPEG2000 vẫn được áp dụng mã hóa bằng 2phương pháp này và một phương pháp phát triển từ 2 phương pháp này làphương pháp mã hóa mặt phẳng bit Vì thế ở đây chúng ta sẽ xem xét haiphương pháp này Việc kết hợp dòng dữ liệu sau mã hóa của JPEG2000 thựcchất là để thực hiện các tính năng đặc biệt của JPEG2000 như tính năng ROI vv
2.5.6 So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác
Một tính năng quan trọng và là ưu điểm rõ nét nhất của JPEG2000 so vớiJPEG cũng như các chuẩn nén ảnh khác như MPEG 4 VTC hay JPEG – LSv.v… là JPEG2000 đưa ra cả 2 kỹ thuật nén có tổn thất và không tổn thất theocùng một cơ chế mã hóa nghĩa là JPEG2000 thực hiện tất cả các dạng thức củaJPEG chỉ bằng một cơ chế mã hóa duy nhất Nếu xét về sự tồn tại của 2 kỹ thuậtnày thì JPEG cũng có khả năng nén ảnh có tổn thất và không tổn thất thông tin.Tuy nhiên với JPEG thì cơ chế mã hóa với hai dạng này là khác nhau và rất khó
để sử dụng cả hai dạng này cùng lúc cho cùng một ứng dụng Do đó, có thể thấy 13
Trang 19
rằng JPEG có tính mềm dẻo hơn bất kì chuẩn nén ảnh tĩnh nào trước đây Hơnthế, những thống kê về thực tế cho thấy với cùng một tỉ lệ nén và một loại ảnhthì ảnh được nén bởi JPEG2000 luôn có chất lượng tốt hơn so với JPEG Chúng
ta xem xét hai ảnh trên hình 2.5 để thấy rõ điều này, ảnh bên trái được nén theo
JPEG còn ảnh bên phải đƣợc nén theo JPEG2000
Trang 20
Với 2 ảnh ở hình 2.5, sự so sánh về tham số PSNR cho trên bảng 2.1 Để
có thể so sánh dễ dàng hơn, ta xét ảnh đƣợc nén với các tỉ lệ khác nhau (đolường bởi hệ số bit/pixel hay bpp), Tất cả các số liệu trên bảng đều cho thấyJPEG2000 nén ảnh tốt hơn là JPEG: hơn thế hệ số PSNR mà chúng ta xét trongbảng được đo trong hệ đơn vị logarit
Bảng 2.1 So sánh JPEG và JPEG2000
Tính năng ưu việt thứ 3 của JPEG2000 so với JPEG là chuẩn nén ảnh này
có thể hiển thị đƣợc các ảnh với độ phân giải và kích thước khác nhau từ cùngmột ảnh nén Với JPEG thì điều này là không thể thực hiện Sở dĩ có điều này là
do JPEG2000 sử dụng kỹ thuật phân giải ảnh và mã hóa đính kèm mà chúng ta
đã nói tới ở phần mã hóa ảnh theo JPEG2000 Tính năng này là một lợi thế đặcbiệt quan trọng của JPEG2000, trong khi JPEG cũng nhƣ các chuẩn nén ảnh tĩnhtrước đây phải nén nhiều lần để thu được chất lượng với từng lần nén khác nhauthì với JPEG2000 ta chỉ cần nén một lần còn chất lƣợng ảnh thì sẽ được quyết