Tìm hiểu phương pháp nén ảnh trên miền tần số sử dụng phép biến đổi dct và dwt

Xử lý ảnh đã được nghiên cứu mạnh mẽ và đã có nhiều ứng dụng trong thực tế: như trong y học; trong cuộc sống gia đình; và cả trong các lĩnh vực như quân sự… Trong đó “Nén ảnh” là một phầ

Trang 1

TRƯỜNG ĐẠI HỌC VINH

VIỆN KỸ THUẬT VÀ CÔNG NGHỆ

Trang 2

TRƯỜNG ĐẠI HỌC VINH

VIỆN KỸ THUẬT VÀ CÔNG NGHỆ

Nghệ An, tháng 05 năm 2017

Trang 3

LỜI CẢM ƠN

Trong thời đại Công nghệ Thông tin ngày nay, việc ứng dụng Công nghệ Thông tin vào cuộc sống cũng như các ngành khoa học ngày càng trở nên quan trọng Quá trình làm đề tài Đồ án tốt nghiệp này là bước đầu tiên đi vào thực tiễn và cũng chính là bước đầu thực hành và đúc rút chứng minh cho những môn học trên ghế nhà trường nói chung

và môn học chuyên ngành nói riêng Đây cũng chính là quá trình nhận xét đánh giá và rút

ra ưu, nhược điểm, để từ đó tìm ra phương án tối ưu nhất cho việc học và đi ra thực tế sau này của bản thân

Em xin chân thành cảm ơn sự hướng dẫn của các thầy giáo, cô giáo trong Khoa Công nghệ Thông tin – Trường Đại học Vinh Đặc biệt, em bày tỏ lòng biết thầy giáo

ThS Nguyễn Bùi Hậu đã tạo mọi điều kiện và luôn giúp đỡ, hướng dẫn em tận tình để

em hoàn thành đề tài Đồ án tốt nghiệp này Em chân thành cảm ơn các thầy cô luôn sẵn sàng giúp đỡ và tạo mọi điều kiện tốt nhất cho em Cảm ơn gia đình, bạn bè luôn quan tâm động viên giúp đỡ để em có được như ngày hôm nay

Mặc dù có nhiều cố gắng bằng toàn bộ kiến thức để hoàn thành công việc, song thời gian và kinh nghiệm của bản thân chưa được trau dồi nhiều nên việc trình bày, phân tích, xây dựng chương trình còn nhiều thiếu sót cần được bổ sung Vì vậy, em rất mong nhận được ý kiến đóng góp của thầy cô để sản phẩm này có thể hoàn thiện, được ứng dụng vào thực tiễn

Em xin chân thành cảm ơn!

Nghệ An, ngày 17 tháng 05 năm 2017

Sinh viên thực hiện

Trang 4

Lê Thị Huyền

MỤC LỤC

MỞ ĐẦU 6

1 Lý do chọn đề tài 6

2 Mục tiêu và nhiệm vụ 8

2.1 Mục tiêu 8

2.2 Nhiệm vụ 8

3 Đối tượng và phạm vi nghiên cứu 8

3.1 Đối tượng 8

3.2 Phạm vi 8

4 Nội dung nghiên cứu 8

5 Kết cấu đồ án 9

CHƯƠNG 1: TỔNG QUAN VỀ ẢNH SỐ VÀ NÉN DỮ LIỆU ẢNH SỐ 10

1 Tổng quan về ảnh số 10

1.1 Ảnh số và phân loại ảnh số 10

1.2 Biểu diễn ảnh số 15

2 Kiến thức cơ bản về nén ảnh số 17

2.1 Giới thiệu chung về nén ảnh số 17

2.2 Các kiến thức cơ bản về nén ảnh số 18

2.3 Phân loại phương pháp nén 21

3 Quá trình nén và giải nén 22

4 Các phép biến đổi trên miền tần số 22

4.1 Biến đổi Cosin rời rạc (DCT-Discrete Cosine Transform) 22

4.2 Biến đổi Wavelet rời rạc (DWT – Discrete Wavelet Transform) 24

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP NÉN ẢNH 26

1 Nén ảnh không mất thông tin 26

1.1 Phương pháp mã hóa loạt dài 26

1.2 Phương pháp mã hóa Huffman 26

1.3 Phương pháp LZW 28

2 Các phương pháp nén trên miền tần số 30

2.1 Phương pháp nén ảnh BMP dựa vào phép biến đổi DCT 30

2.2 Phương pháp nén ảnh BMP dựa vào phép biến đổi DWT 37

Trang 5

CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM PHÂN TÍCH ĐÁNH GIÁ KẾT QUẢ THỬ

NGHIỆM 43

1 Tìm hiểu cơ bản về matlab 43

1.1 Giới thiệu: 43

1.2 Các bước khởi động và tạo ứng dụng trong matlab 43

2 Chương trình 53

2.1 Phương pháp nén ảnh BMP dựa vào phép biến đổi DCT 53

2.2 Phương pháp nén ảnh BMP dựa vào phép biến đổi DWT 60

2.3 Đánh giá chung về 2 phương pháp nén 64

KẾT LUẬN 65

TÀI LIỆU THAM KHẢO 66

Trang 6

MỞ ĐẦU

1 Lý do chọn đề tài

Trong những năm gần đây, cùng với sự phát triển vượt bậc của khoa học máy tính, thì xử lý ảnh là một trong những lĩnh vực đang được quan tâm Nó là một nghành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác, nó cũng là đối tượng nghiên cứu lĩnh vực thị giác máy tính, là quá trình biến đổi ảnh từ một ảnh ban đầu sang một ảnh mới Nhờ công nghệ số hóa hiện đại, ngày nay con người đã có thể xử lý tín hiệu nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số đơn giản cho đến những mạch số song song cao cấp Xử lý ảnh đã được nghiên cứu mạnh mẽ và đã có nhiều ứng dụng trong thực tế: như trong y học; trong cuộc sống gia đình; và cả trong các lĩnh vực như quân sự…

Trong đó “Nén ảnh” là một phần của xử lý ảnh có ứng dụng to lớn trong truyền thông và trong lưu trữ, đã có rất nhiều phương pháp nén ảnh được ra đời và không ngừng được cải tiến để ngày càng hoàn thiện đem lại hiệu quả nén cao và cho chất lượng ảnh tốt nhất Nén ảnh là một kỹ thuật mã hoá các ảnh số hoá nhằm giảm số lượng các bit dữ liệu cần thiết để biểu diễn ảnh Mục đích là giảm đi những chi phí trong việc lưu trữ ảnh và chi phí thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn đảm bảo được chất lượng của ảnh Nén ảnh thực hiện được là do một thực tế: thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, tổ chức Vì thế nếu bóc tách được tính trật tự, cấu trúc

đó thì sẽ biết phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền đi với số lượng ít bit hơn so với ảnh gốc mà vẫn đảm bảo tính đầy đủ của thông tin Ở bên nhận quá trình giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn thỏa mãn chất lượng yêu cầu

Thực tế cho thấy có nhiều vấn đề trong việc lưu trữ và truyền tải ảnh số hoá Nén ảnh thực sự có nhiều ứng dụng trong thực tế như: truyền các văn bản đồ hoạ qua đường điện thoại, nén ảnh trong y tế và truyền hình cáp,

Trang 7

Do tính chất hấp dẫn và ý nghĩa quan trọng của nó, nén ảnh thu hút được nhiều mối quan tâm của các kỹ sư, chuyên gia làm việc trong lĩnh vực công nghệ thông tin trong nước và trên thế giới Khi làm việc với các phương pháp nén ảnh, người ta nhận thấy rằng có phương nén không thể áp dụng nén nhiều loại tập tin, lại có phương pháp có

hệ số nén tương đối cao, nhưng tốn nhiều bộ nhớ, khó thực hiện trên các ảnh có kích thước bé, cũng có phương pháp có hệ số nén tương đối cao, phương pháp thực hiện lại tương đối đơn giản, đòi hỏi ít bộ nhớ, có thể xây dựng dựa trên các ảnh có kích thước bé Ngoài ra một số phương pháp nén ảnh xử lý trên miền tần số ảnh lại cho kết quả nén tốt hơn khi xử lý nén trên miền không gian ảnh Do vậy, việc nghiên cứu các phương pháp nén ảnh để chọn phương pháp nén trong các trường hợp cụ thể có ý nghĩa vô cũng quan trọng trong lưu trữ và truyền tải dữ liệu ảnh số

Có nhiều cách phân loại các phương pháp nén: cách thứ nhất dựa vào nguyên lý nén Cách này phân các phương pháp nén thành hai họ lớn: Nén chính xác hay nén không mất thông tin: họ này bao gồm các phương pháp nén mà sau khi giải nén ta thu được chính xác dữ liệu gốc; Nén có mất thông tin: họ này bao gồm các phương pháp

mà sau khi giải nén ta không thu được dữ liệu như bản gốc

Cách phân loại thứ hai dựa vào cách thức thực hiện nén Theo cách này, người ta cũng phân thành hai họ: Phương pháp không gian (Spatial Data Compression): Các phương pháp thuộc họ này thực hiện nén bằng các tác động trực tiếp lên việc lấy mẫu của ảnh trong miền không gian; Phương pháp sử dụng biến đổi (Transform Coding): gồm các phương pháp tác động lên sự biến đổi của ảnh gốc mà không tác động trực tiếp như họ trên

Xuất phát từ yêu cầu của thực tế, nhằm mục đích hướng tới một phần nhiệm vụ xử

lý dữ liệu ảnh số, Đồ án tốt nghiệp “TÌM HIỂU PHƯƠNG PHÁP NÉN ẢNH TRÊN MIỀN TẦN SỐ SỬ DỤNG PHÉP BIỂN ĐỔI DCT VÀ DWT” đi sâu nghiên cứu một

số phương pháp nén ảnh, đồng thời tiến hành phân tích phương pháp nén ảnh BMP đem lại hiệu quả nén cao cho ảnh nén chất lượng tốt và nhiều ưu điểm

Trang 8

Nghiên cứu tổng quan về nén ảnh, các phép biến đổi sử dụng trong nén ảnh

Nghiên cứu các thuật toán nén ảnh hiện có: Ý tưởng và thuật toán

Tiến hành cài đặt các thuật toán nén ảnh, tiến hành phân tích, đánh giá so sánh chất lượng của các thuật toán, đề xuất được lựa chọn phù hợp trong các trường hợp khác

nhau

3 Đối tượng và phạm vi nghiên cứu

3.1 Đối tượng

Nghiên cứu lý thuyết

Nghiên cứu các tài liệu về nén ảnh đã công bố ở trong và ngoài nước; các kết quả khảo sát có tính chất đánh giá của các nghiên cứu đi trước, các tài liệu lập trình để cài đặt thuật toán

Nghiên cứu thực nghiệm

Nghiên cứu ngôn lập trình Matlab và cài đặt một số thuật toán nén ảnh, so sánh,

đánh giá hiệu quả nén ảnh cho các thuật toán

3.2 Phạm vi

Đồ án tập trung nghiên cứu các kỹ thuật nén ảnh số Ứng dụng mà đồ án xây dựng

là chương trình nén ảnh số

4 Nội dung nghiên cứu

Nghiên cứu tổng quan về nén ảnh, các phép biến đổi sử dụng trong nén ảnh

Khảo sát và đánh giá về các thuật toán nén ảnh nhằm xác định ưu điểm và hạn chế của các thuật toán

Trang 9

Nghiên cứu ngôn ngữ lập trình Matlab để cài đặt mô phỏng các thuật toán trên máy tính

Tiến hành phân tích, đánh giá, so sánh chất lượng các thuật toán

5 Kết cấu đồ án

Đồ án được chia làm 3 chương

CHƯƠNG 1 TỔNG QUAN VỀ ẢNH SỐ VÀ NÉN DỮ LIỆU ẢNH SỐ

Trong chương 1 sẽ trình bày những khái niệm cơ bản về ảnh số, các khái niệm liên quan đến nén ảnh, cách phân loại nén ảnh và trình bày các phép biến đổi sử dụng trong

xử lý ảnh nói chung và nén ảnh nói riêng

CHƯƠNG 2 MỘT SỐ PHƯƠNG PHÁP NÉN ẢNH SỐ

Chương này trình bày cách phân loại các phương pháp nén ảnh, một số phương pháp nén ảnh số: Phương pháp mã hoá độ dài loạt RLE; Phương pháp mã hoá Huffman; Phương pháp LZW; Phương pháp nén ảnh BMP dựa vào phép biến đổi DCT; Phương pháp nén ảnh BMP dựa vào phép biến đổi DWT Nội dung chương 2 sẽ là cơ sở quan trọng để tiến hành thử nghiệm trong chương 3

CHƯƠNG 3 CHƯƠNG TRÌNH THỬ NGHIỆM PHÂN TÍCH ĐÁNH GIÁ KẾT QUẢ THỬ NGHIỆM

Chương này sẽ tiến hành cài đặt các thuật toán nén ảnh nén ảnh BMP dựa vào phép biến đổi DCT; Phương pháp nén ảnh BMP dựa vào phép biến đổi DWT Đưa ra các đánh giá, so sánh chất lượng của các thuật toán này Từ đó đề xuất các lựa chọn nén ảnh trong các trường hợp cụ thể

Trang 10

CHƯƠNG 1: TỔNG QUAN VỀ ẢNH SỐ VÀ NÉN DỮ LIỆU ẢNH SỐ

Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh khác là Windows bitmap, là một định dạng tập tin hình ảnh khá phổ biến Các tập tin đồ họa lưu dưới dạng BMP thường có đuôi là BMP hoặc DIB (Device Independent Bitmap)

Các thuộc tính tiêu biểu của một tập tin ảnh BMP (cũng như file ảnh nói chung) là:

số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n Một ảnh BMP n-bit

có 2^n màu Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng rõ nét hơn Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh 256 màu), 16 (ảnh 65536 màu) và

24 (ảnh 16 triệu màu) Ảnh BMP 24-bit có chất lượng hình ảnh trung thực nhất

- chiều cao của ảnh (height), cho bởi điểm ảnh (pixel)

- chiều rộng của ảnh (width), cho bởi điểm ảnh

- Cấu trúc tập tin ảnh BMP bao gồm 4 phần

- Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap

- Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển thị ảnh

Trang 11

- Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ được sử dụng trong ảnh

- Bitmap Data: lưu dữ liệu ảnh

Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường không được nén bằng bất kỳ thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin – một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh Do

đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG hay PNG)

Định dạng BMP được hỗ trợ bởi hầu hết các phần mềm đồ họa chạy trên Windows, và cả một số ứng dụng chạy trên MS-DOS Ngay từ Windows 3.1, Microsoft

đã cho ra đời phần mềm PaintBrush, một phần mềm hỗ trợ vẽ hình ảnh đơn giản và lưu hình ảnh được vẽ dưới dạng BMP 16 hay 256 màu Tuy nhiên, do kích thước tập tin ảnh BMP quá lớn, định dạng BMP không phù hợp để trao đổi hình ảnh qua mạng Internet (do hạn chế về tốc độ truyền dữ liệu)

1.1.2 Phân loại ảnh

- Ảnh đen trắng

Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau Người ta phân mức đen trắng đó thành L mức Nếu sử dụng số bit B=8 bit để mã hóa mức đen trắng (hay mức xám) thì L được xác định : L=2B (trong ví dụ của ta L=28= 256 mức)

Nếu L bằng 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị phân Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối Nếu L lớn hơn 2 ta có ảnh đa cấp xám Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit Như vậy, với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến

Trang 12

255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường

độ sáng nhất

Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác

Ví dụ về ảnh đen trắng:

- Ảnh xám (ảnh đơn sắc)

Là ảnh mà tại mỗi điểm ảnh có một giá trị mức xám

Ảnh 8 mức xám sẽ có giá trị mỗi điểm ảnh nằm trong đoạn [0, 7]

Ảnh 256 mức xám sẽ có giá trị mỗi điểm ảnh nằm trong đoạn [0, 255]

Giá trị điểm ảnh = 0 nghĩa là điểm ảnh đó tối (đen), giá trị điểm ảnh lớn nhất nghĩa

là điểm ảnh đó trắng Nói cách khác giá trị mỗi điểm ảnh càng lớn thì điểm ảnh đó càng sáng

Trang 13

Cường độ sáng được tính theo công thức (chuyển đổi từ RGB sang grayscale): Độ

Kích thước của một bộ phim full HD dài 1 tiếng rưỡi được tính như sau:

Độ phân giải màn hình full HD là 190 x 1080 = 2.073.600 pixel, tức hơn 2 triệu điểm ảnh, hay còn gọi là 2 megapixel.Tốc độ ghi hình của camera thường là 30 FPS (frames/s – khung hình/giây) Kích thước bộ phim được tính như sau: 1.5 giờ x 3600 giây

x 30 frame x 2 triệu điểm ảnh x 3 byte = 1.007.769.600.000 byte ≈ 938 GB

Trang 14

Do đó, không gian nhớ dành cho một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ

P(x, y) = (R, G, B)

Hệ màu CMY: là phần bù của hệ màu RGB (C, M, Y)=(1, 1, 1)-(R, G, B)

=> Hệ màu này thường được dùng trong máy in

Hệ màu CMYK: trong đó K là độ đậm nhạt của màu K= min (C, M, Y)

Trang 15

1.2 Biểu diễn ảnh số

1.2.1 Điểm ảnh (Picture Element)

Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y)

Hình minh họa của pixel

1 pixel

Trang 16

Định nghĩa: Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x, y) với độ

xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh được chọn thích hợp sao cho mắt người cảm nhận về sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

1.2.2 Độ phân giải ảnh

Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định

trên một ảnh số được hiển thị Khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lực chọn khoảng cách thích hợp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều

Có ba cách để biểu thị độ phân giải của ảnh:

Biểu thị bằng số lượng điểm ảnh theo chiều dọc và theo chiều ngang của ảnh (ví dụ: 1024×768)

Biểu thị bằng tổng số điểm ảnh trên một tấm ảnh (ví dụ: 960.000 pixel)

Biểu thị bằng số lượng điểm ảnh có trên 1 inch (ppi) hoặc số chấm (dot) có trên 1 inch (dpi)

1.2.3 Mức xám của ảnh:

Một điểm ảnh (Pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và mức xám của nó Chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh:

Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị

số tại điểm đó

Trang 17

Hình biểu diễn mức xám của ảnh số

Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (mức 256 là mức phổ dụng) Lý do từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám Mức xám dùng 1 byte biểu diễn: 28= 256 mức (tức là từ 0 đến 255)

Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám

ở các điểm ảnh có thể khác nhau

Ảnh nhị phân: Ảnh chỉ có 2 mức đen, trắng phân biệt tức dùng 1 bit mô tả 21 mức

khác nhau Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc1

Ảnh màu: Trong hệ màu RGB (Red, Green, Blue) để tạo nên thế giới màu, người

ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈16,7 triệu màu

2 Kiến thức cơ bản về nén ảnh số

2.1 Giới thiệu chung về nén ảnh số

- Nén ảnh là một kỹ thuật mã hóa các ảnh số hóa nhằm mục đích giảm số lượng các bit dữ liệu cần thiết để biểu diễn ảnh

- Mục đích là làm giảm đi những chi phí trong việc lưu trữ ảnh và thời gian để truyền ảnh đi xa, nhanh trong truyền thông nhưng vẫn đảm bảo được chất lượng của hình ảnh

Trang 18

- Nén ảnh thực hiện được do thông tin trong bức ảnh không phải xuất hiện ngẫu nhiên mà có trật tự, có tổ chức vì thế khi phân tách được tính trật tự, tính tổ chức đó thì sẽ biết phân biệt được phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền đi với số lượng ít bit hơn so với ảnh gốc Còn ở bên nhận là quá trình ngược lại nó

sẽ giải mã, tổ chức, sắp xếp lại cho ra bức ảnh xấp xỉ chính xác gần với ảnh gốc nhưng vẫn thỏa mãn yêu cầu về chất lượng

- Phương pháp nén hiệu quả nhất thông thường sử dụng các biến đổi toán học để biến ma trận các điểm ảnh từ không gian hai chiều này sang một không gian hai chiều khác, nơi mức độ tương quan giữa các hệ số biến đổi mới nhỏ hơn

- Nén ảnh có rất nhiều ứng dụng trong thực tế như: truyền các văn bản đồ họa qua đường điện thoại (Fax), nén ảnh trong y tế và truyền hình cáp, nén ảnh để giảm không gian lưu trữ, tăng tốc độ truyền tải… Chính vì khả năng ứng dụng trong nhiều lĩnh vực cùng với sự tiến bộ của lĩnh vực vi điện tử dẫn đến sự ra đời của các tiêu chuẩn nén ảnh

- Các kỹ thuật nén ảnh ra đời hướng tới giải quyết bài toán làm giảm thiểu khối lượng thông tin mô tả ảnh số mà chất lượng vẫn tốt, nền tảng của quá trình nén là loại bỏ

dư thừa có trong tín hiệu Độ dư thừa trong tín hiệu ảnh số phụ thuộc vào mức độ tương quan giữa các điểm ảnh, độ tương quan lớn thì độ dư thừa cũng lớn

- Các loại dư thừa:

· Dư thừa thông tin về không gian: trong một bức ảnh luôn tồn tại sự tương quan giữa các điểm ảnh cạnh nhau

· Dư thừa thông tin về cấp xám: là dư thừa dựa vào sự tương quan giữa các màu sắc cạnh nhau

· Dư thừa thông tin về thời gian: trong một chuỗi ảnh video, tồn tại sự tương quan giữa các điểm ảnh của các frame khác nhau

2.2 Các kiến thức cơ bản về nén ảnh số

2.2.1 Nén dữ liệu (Data Compression)

Nén dữ liệu nhằm làm giảm lượng thông tin “dư thừa” trong dữ liệu gốc và do

vậy, lượng thông tin thu được sau khi nén thường nhỏ hơn dữ liệu gốc rất nhiều Với dữ

Trang 19

liệu ảnh, kết quả thường là 10:1 Một số phương pháp còn cho kết quả cao hơn Theo kết quả nghiên cứu được công bố gần đây tại Viện Kỹ thuật Georfie, kỹ thuật nén fratal cho

tỉ số nén là 30 trên 1 Ngoài thuật ngữ “Nén dữ liệu”, do bản chất của kỹ thuật này nó còn

có một số tên gọi khác như : giảm độ dư thừa, mã hóa ảnh gốc

2.2.2 Tỷ lệ nén (Compression Rate)

Tỷ lệ nén là một trong các đặc trưng quan trọng nhất của mọi phương pháp nén Tuy nhiên, về cách đánh giá và các kết quả công bố trong các tài liệu cũng cần được quan tâm xem xét Nhìn chung, người ta định nghĩa tỷ lệ nén như sau:

Tỷ lệ nén = 1

r x % Với r: là tỷ số nén được định nghĩa: r = kích thước dữ liệu gốc/ kích thước dữ liệu thu được sau nén Như vậy hiệu suất của nén là: (1-tỷ lệ nén) x %

Khi nói đến kết quả nén, chúng ta dùng tỷ số nén, thí dụ như 10 trên 1 có nghĩa là

dữ liệu gốc là 10 phần sau khi nén chỉ có 1 phần

Tuy nhiên, cũng phải thấy rằng những số đo của một phương pháp nén chỉ có giá trị với chính sự nén đó, vì rằng hiệu quả của nén còn phụ thuộc vào kiểu dữ liệu định nén

Tỷ lệ nén cũng chỉ là một trong các đặc trưng cơ bản của phương pháp nén Nhiều khi tỷ

lệ nén cao cũng chưa thể nói rằng phương pháp đó là hiệu quả hơn các phương pháp khác, vì còn các chi phí khác như thời gian, không gian và thậm chí cả độ phức tạp tính toán nữa Thí dụ như nén phục vụ trong truyền dữ liệu: vấn đề đặt ra là hiệu quả nén có tương hợp với đường truyền không

Cũng cần phân biệt nén dữ liệu với nén băng truyền Mục đích chính của nén là giảm lượng thông tin dư thừa và dẫn tới giảm kích thước dữ liệu Tuy vậy, đôi khi quá trình nén cũng làm giảm băng truyền tín hiệu số hoá thấp hơn so với truyền tín hiệu tương tự

Trang 20

2.2.3 Các loại dư thừa dữ liệu

Như trên đã nói, nén nhằm mục đích giảm kích thước dữ liệu bằng cách loại bỏ dư thừa dữ liệu Việc xác định bản chất các kiểu dư thừa dữ liệu rất có ích cho việc xây dựng các phương pháp nén dữ liệu khác nhau Nói một cách khác, các phương pháp nén dữ liệu khác nhau là do sử dụng các kiểu dư thừa khác nhau Người ta coi có 4 kiểu dư thừa chính :

- Sự phân bố ký tự :

Trong một dãy ký tự, có một số ký tự có tần suất xuất hiện nhiều hơn so với các dãy khác Do vậy, ta có thể mã hóa dữ liệu một cách cô đọng hơn Các dãy ký tự có tần

suất cao được thay bởi một từ mã nhị phân với số bít nhỏ, ngược lại các dãy có tần suất

xuất hiện thấp sẽ được mã hóa bởi từ mã có nhiều bít hơn Đây chính là bản chất của

phương pháp mã hóa từ hóa Huffman

- Sự lặp lại của các ký tự :

Kỹ thuật nén dùng trong trường hợp này là thay dãy lặp đó bởi dãy mới gồm hai thành phần: số lần lặp và kí hiệu dùng để mã Phương pháp mã hóa kiểu này có tên là mã hóa loạt dài RLC (Run Length Coding)

- Những mẫu sử dụng tần suất:

Có thể có dãy ký hiệu nào đó xuất hiện với tần suất tương đối cao Do vây, có thể

mã hóa bởi ít bít hơn Đây là cơ sở của phương pháp mã hóa kiểu từ điển do Lempel-Ziv đưa ra và có cải tiến vào năm 1977, 1978 và do đó có tên gọi là phương pháp nén LZ77,LZ78 Năm 1984, Tery Welch đã cải tiến hiệu quả hơn và đặt tên là LZW (Lempel-Ziv-Welch)

- Độ dư thừa vị trí:

Do sự phụ thuộc lẫn nhau của dữ liệu, đôi khi biết được ký hiệu (giá trị) xuất hiện tại một vị trí, đồng thời có thể đoán trước sự xuất hiện của các giá trị ở các vị trí khác

Trang 21

nhau một cách phù hợp Chẳng hạn, ảnh biểu diễn trong một lưới hai chiều, một số điểm

ở hàng dọc trong một khối dữ lệu lại xuất hiện trong cùng vị trí ở các hàng khác nhau Do vậy, thay vì lưu trữ dữ liệu, ta chỉ cần lưu trữ vị trí hàng và cột Phương pháp nén dựa trên sự dư thừa này gọi là phương pháp mã hoá dự đoán

Cách đánh giá độ dư thừa như trên hoàn toàn mang tính trực quan nhằm biểu thị một cái gì đó xuất hiện nhiều lần Đối với dữ liệu ảnh, ngoài đặc thù chung đó, nó còn có những đặc thù riêng Thí dụ như có ứng dụng không cần toàn bộ dữ liệu thô của ảnh mà chỉ cần các thông tin đặc trưng biểu diễn ảnh như biên ảnh hay vùng đồng nhất Do vậy,

có những phương pháp nén riêng cho ảnh dựa vào biến đổi ảnh hay dựa vào biểu diễn ảnh

2.3 Phân loại phương pháp nén

2.3.1 Nén ảnh dựa vào nguyên lý nén

Nén bảo toàn thông tin (losses compression): bao gồm các phương pháp nén mà sau khi giải nén sẽ thu đựơc chính xác dữ liệu gốc.Tuy nhiên nén bảo toàn thông tin chỉ đạt hiệu quả nhỏ so với phương pháp nén không bảo toàn thông tin

Nén không bảo toàn thông tin (lossy compression): bao gồm các phương pháp nén sau khi giải nén sẽ không thu được dữ liệu như bản gốc Các phương pháp này được gọi

là “tâm lý thị giác” đó là lợi dụng tính chất của mắt người chấp nhận một số vặn xoắn trong ảnh khi khôi phục lại Phương pháp này luôn đem lại hiệu quả cao do loại bỏ đi những thông tin dư thừa không cần thiết

2.3.2 Nén dựa vào cách thức thực hiện

Phương pháp không gian (Spatial Data Compression): các phương pháp này thực

hiện nén bằng cách tác động trực tiếp lên việc lấy mẫu của ảnh trong miền không gian

Phương pháp sử dụng biến đổi (Transform Coding): gồm các phương pháp tác động lên sự biến đổi của ảnh gốc chứ không tác động trực tiếp

Trang 22

2.3.3 Nén dựa vào lý thuyết mã

Các phương pháp nén thế hệ thứ nhất: gồm các phương pháp có mức độ tính toán đơn giản như lấy mẫu, gán từ mã,…

Các phương pháp nén thế hệ thứ hai: gồm các phương pháp dựa vào mức độ bão hoà của tỷ lệ nén bằng cách sử dụng các phép toán tổ hợp đầu ra một cách hợp lý hoặc sử dụng biểu diễn ảnh như: phương pháp kim tự tháp Laplace, phương pháp dựa vào vùng gia tăng, phương pháp tách hợp

3 Quá trình nén và giải nén

Nén : dữ liệu gốc qua bộ mã hoá dữ liệu, bộ mã hoá này thực hiện nén dữ liệu đến

một mức thích hợp cho việc lưu trữ và truyền dẫn thông tin Quá trình này sẽ thực hiện việc loại bỏ hay cắt bớt những dư thừa của ảnh để thu được thông tin cần thiết nhưng vẫn đảm bảo được chất lượng ảnh

Giải nén : dữ liệu nén đi qua bộ giải mã dữ liệu, bộ giải mã sẽ thực hiện giải nén

để thu được dữ liệu gốc ban đầu Việc giải nén này thường phải dựa vào các thông tin đi kém theo dữ liệu nén, tuỳ thuộc vào kiểu nén hay phương pháp nén mà dữ liệu giải nén được có hoàn toàn giống với dữ liệu gốc ban đầu hay không

Tóm lại quá trình nén và giải nén dữ liệu có thể mô tả một cách tóm tắt theo sơ đồ dưới đây:

4 Các phép biến đổi trên miền tần số

4.1 Biến đổi Cosin rời rạc (DCT-Discrete Cosine Transform)

Trang 23

Biến đổi cosine rời rạc (DCT) biểu diễn ảnh dưới dạng tổng của các cosine của các thành phần biên độ và tần số khác nhau của ảnh Hàm dct2 tính DCT hai chiều của một ảnh DCT có tính chất mà với các ảnh điển hình, hầu hết các thông tin về ảnh chỉ tập trung trong một vài hệ số của DCT, trong khi các hệ số còn lại chỉ chứa rất ít thông tin

Vì lý do này, DCT thường được sử dụng trong các ứng dụng nén ảnh khác nhau nhờ hiệu suất gần như tối ưu của nó đối với các ảnh có độ tương quan cao giữa các điểm ảnh lân cận

DCT hai chiều của ma trận A có kích thước MxN được định nghĩa như sau :

Trang 24

4.2 Biến đổi Wavelet rời rạc (DWT – Discrete Wavelet Transform)

Mối quan hệ giữa hàm tỉ lệ và hàm wavelet đươc cho bởi:

Các phép lọc được tiến hành với nhiều tầng (level) khác nhau và để khối lượng tính toán không tăng, khi qua mỗi bộ lọc, tín hiệu được lấy mẫu xuống 2

Ứng với mỗi tầng, tín hiệu có độ phân giải khác nhau Do đó, phép biến đổi wavelet rời rạc được gọi là phân tích đa phân giải (MRA, multiresolution analysis)

Phân tích đa phân giải sử dụng biến đổi wavelet rời rạc

Trang 25

Tại mỗi tầng lọc, biểu thức của phép lọc được cho bởi công thức:

Trong đó, S(n) là tín hiệu, h(n) là đáp ứng xung của các bộ lọc thông thấp tương ứng với hàm tỉ lệ Φ(n) và g(n) là đáp ứng xung của các bộ lọc thông cao tương ứng với hàm wavelet ψ(n) Hai bộ lọc này liên hệ nhau theo hệ thức:

h(N-1-n) = (-1)ng(n)

trong đó, N là số mẫu trong tín hiệu

Tín hiệu S(n) có thể được tái tạo theo các bước ngược lại gọi là phép biến đổi wavelet rời rạc nghịch (IDWT, inverse discrete wavelet transform) được cho bởi:

Trong đó, Yhigh(k) và Ylow(k) lần lượt là tín hiệu ngõ ra sau khi đi qua các bộ lọc thông cao và bộ lọc thông thấp

Trang 26

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP NÉN ẢNH

1 Nén ảnh không mất thông tin

1.1 Phương pháp mã hóa loạt dài

Phương pháp mã hóa loạt dài lúc đầu được phát triển dành cho ảnh số 2 mức: mức đen (1), và mức trắng (0) như các văn bản trên nền trắng, trang in, các bản vẽ kỹ thuật Nguyên tắc của phương pháp là phát hiện một loạt các bít lặp lại, thí dụ như một loạt các bít 0 nằm giữa hai bít 1, hay ngược lại, một loạt bít 1 nằm giữa hai bít 0

Phương pháp này chỉ có hiệu quả khi chiều dài dãy lặp lớn hơn một ngưỡng nào

đó Dãy các bít lặp gọi là loạt hay mạch (run) Tiếp theo, thay thế chuỗi đó bởi một chuỗi mới gồm 2 thông tin: chiều dài chuỗi và bít lặp (ký tự lặp)

Như vậy, chuỗi thay thế sẽ có chiều dài ngắn hơn chuỗi cần thay Cần lưu ý rằng, đối với ảnh, chiều dài của chuỗi lặp có thể lớn hơn 255.Nếu ta dùng 1 byte để mã hóa thí

sẽ không đủ Giải pháp được dùng là tách các chuỗi đó thành hai chuỗi: một chuỗi có chiều dài 255, chuỗi kia là số bít còn lại

Phương pháp RLC được sử dụng trong việc mã hóa lưu trữ các ảnh Bitmap theo dạng PCX, BMP Phương pháp RLC có thể chia thành 2 phương pháp nhỏ: phương pháp dùng chiều dài tứ mã cố định và phương pháp thích nghi như kiểu mã Huffman Giả sử các mạch gồm M bits Để tiện trình bày, đặt M = 2m – 1 Như vậy mạch cũ được thay bởi mạch mới gồm m bits Với cách thức này, mọi mạch đều được mã hóa bởi từ mã có cùng

độ dài Người ta cũng tính được, với M = 15, p = 0,9, ta sẽ có m = 4 và tỷ số nén là 1,95 Với chiều dài cố định, việc cài đặt thuật toán là đơn giản Tuy nhiên, tỷ lệ nén sẽ không

tốt bằng chiều dài biến đổi hay gọi là mã RLC thích nghi

1.2 Phương pháp mã hóa Huffman

Nguyên tắc

Trang 27

Phương pháp mã hóa Huffman là phương pháp dựa vào mô hình thông kê Dựa vào dữ liệu gốc, người ta tính tần suất xuất hiện của các ký tự Việc tính tần suất được thực hiện bởi cách duyệt tuần tự tệp gốc từ đầu đến cuối Việc xử lý ở đây tính theo bit Trong phương pháp này người ta gán cho các ký tự có tần suất cao một từ mã ngắn, các

ký tự có tần suất thấp từ mã dài Nói một cách khác, các ký tự có tần suất càng cao được gán mã càng ngắn và ngược lại R rang với cách thức này, ta đã làm giảm chiều dài trung bình của từ mã hóa bằng cách dùng chiều dài biến đổi Tuy nhiên, trong một số tình huống khi tần suất là rất thấp, ta có thể không được lợi một chút nào, thậm chí còn bị thiệt một ít bit

Thuật toán

Thuật toán bao gồm 2 bước chính:

Giai đoạn thứ nhất: tính tần suất của các ký tự trong dữ liệu gốc: duyệt tệp gốc một cách tuần tự từ đầu đến cuối để xây dựng bảng mã Tiếp sau đó là sắp xếp lại bảng mã theo thứ tự tần suất giảm dần

Giai đoạn thứ hai: mã hóa: duyệt bảng tần suất từ cuối lên đầu để thực hiện ghép 2 phần tử có tần suất xuất hiện thấp nhất thành một phần tử duy nhất Phần tử này có tần suất bằng tổng 2 tần suất thành phần Tiến hành cập nhật lại bảng và đương nhiên loại bỏ

2 phần tử đã xét Quá trình được lặp lại cho đến khi bảng chỉ có một phần tử Quá trình này gọi là quá trình tạo cây mã Huffman vì việc tập hợp được tiến hành nhờ một cây nhị phân 2 nhánh Phần tử có tần suất thấp ở bên phải, phần tử kia ở bên trái Với cách tạo cây này, tất cả các bit dữ liệu/ký tự là nút lá, các nút trong là các nút tổng hợp Sau khi cây đã tạo xong, người ta tiến hành gán mã cho các nút lá Việc mã hóa rất đơn giản: mỗi lần xuống bên phải ta thêm 1 bit “1” vào từ mã, mỗi lần xuống bên trái ta thêm một bit

“0” Tất nhiên có thể làm ngược lại, chỉ có giá trên mã thay đổi còn tổng chiều dài là không đổi Cũng chính do lý do này mà cây có tên gọi là cây mã Huffman như trên đã gọi Quá trình giải nén tiến hành theo chiều ngược lại khá đơn giản Người ta cũng phải

Trang 28

dựa vào bảng mã tạo ra trong giai đoạn nén (bảng này được giữ lại trong cấu trúc của tệp nén cùng với dữ liệu nén) Thí dụ, với một tệp dữ liệu mà tần suất các ký tự cho bởi

1.3 Phương pháp LZW

Khái niệm nén từ điển được Jocob Lempe và Abraham Ziv đưa ra lần đầu tiên năm 1977 sau đó phát triển thành một họ giải thuật nén từ điển LZ Năm 1984 Welch đã cải tiến giải thuật LZ thành giải thuật mới hiệu quả hơn và được đặt tên là LZW ( Lempe – Ziv - Welch) Phương pháp này xây dựng từ điển lưu các chuỗi ký tự có tần suất lặp lại cao và thay thế bằng từ mã tương ứng mỗi khi gặp lại chúng, nó hay hơn các phương pháp trước đó ở kỹ thuật tổ chức từ điển cho phép nâng cao tỷ lệ nén

Giải thuật LZW được dùng cho tất cả các loại file nhị phân, thường được dùng để nén các loại dữ liệu như : văn bản, ảnh đen trắng, ảnh màu, ảnh đa cấp sám… và là chuẩn nén cho các dạng ảnh GIF và TIFF Số bit / pixel không ảnh hưởng đến hiệu quả của LZW

Phương pháp

Giải thuật nén LZW xây dựng một từ điển lưu các mẫu có tần suất xuất hiện cao trong ảnh Từ điển là tập hợp những cặp từ vựng và nghĩa của nó Trong đó, từ vựng sẽ là các từ mã được sắp xếp theo thứ tự nhất định nghĩa là một chuỗi con trong dữ liệu ảnh

Từ điển được xây dựng đồng thời với quá trình đọc dữ liệu Sự có mặt của một chuỗi con trong từ điển khẳng định rằng chuỗi đó đã từng xuất hiện trong phần dữ liệu đã đọc Thuật toán liên tục “tra cứu” và cập nhật từ điển sau mỗi lần đọc một ký tự ở dữ liệu đầu vào

Do kích thước bộ nhớ không phải vô hạn và để đảm bảo tốc độ tìm kiếm, từ điển chỉ giới hạn 4096 ở phần tử dùng để lưu lớn nhất là 4096 giá trị của các từ mã Như vậy

độ dài lớn nhất của từ mã là 12 bits (4096 = 212) Cấu trúc từ điển như sau:

Trang 29

256 từ mã đầu tiên theo thứ tự từ 0 … 255 chứa các số nguyên từ 0…255

Đây là mã của 256 kí tự cơ bản trong bảng mã ASCII

Từ mã thứ 256 chứa một mã đặc biệt là mã xoá (CC - Clear Code) Khi số mẫu lặp lớn hơn 4096 thì người ta sẽ coi ảnh gồm nhiều mảnh ảnh và từ điển sẽ gồm nhiều từ điển con Khi hết một mảnh ảnh sẽ gửi 1 mã xoá (CC) để báo hiệu kết thúc mảnh ảnh cũ và bắt đầu mảnh ảnh mới đồng thời sẽ khởi tạo lại từ điển

Từ mã thứ 257 chứa mã kết thúc thông tin (EOI - End Of Information) Thông thường một file ảnh GIF có thể chứa nhiều mảnh ảnh, mỗi mảnh ảnh này sẽ được mã hoá riêng Chương trình giải mã sẽ lặp đi lặp lại thao tác giải mã từng ảnh cho đến khi gặp mã kết thúc thông tin thì dừng lại

Các từ mã còn lại (từ 258 đến 4095) chứa các mẫu thường lặp lại trong ảnh 512 phần tử đầu tiên của từ điển biểu diễn bằng 9 bit Các từ mã từ 512 đến 1023 biểu diễn bởi 10 bit, từ 1024 đến 2047 biểu diễn bởi 11 bit, và từ 2048 đến 4095 biểu diễn bởi 12 bit

Trang 30

2 Các phương pháp nén trên miền tần số

2.1 Phương pháp nén ảnh BMP dựa vào phép biến đổi DCT

2.1.1 Chuẩn nén JPEG

JPEG (tiếng Anh, viết tắt cho Joint Photographic Experts Group) là một trong những phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu Chất lượng ảnh bị suy giảm sau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người

Trang 31

Đọc block 8*8:

Để nén ảnh theo chuẩn JPEG, ảnh gốc sẽ được xử lý trên từng vùng nhỏ (ma trận) 8*8 pixle Việc phân khối này giúp chúng ta giảm thời gian tính toán trong quá trình biến đổi DCT sau này

Chuyển hệ màu từ RGB sang hệ màu YCbCr

Hình ảnh được chuyển đổi từ RGB thành một không gian màu khác nhau gọi là YCbCr Nó có ba thành phần Y, Cb và Cr: Y: thành phần đại diện cho độ sáng của điểm ảnh, và các thành phần 11 Cb và Cr đại diện cho màu (chia thành các thành phần màu xanh và đỏ)

Trong không gian màu YCbCr, do đặc điểm nhạy cảm trong mắt con người với mật độ màu sắc và độ sáng, con người có thể cảm nhận tốt hơn đáng kể đối với độ sáng của một hình ảnh (thành phần Y) và kém nhạy với hai loại Cb và Cr nên hệ thống sẽ nén thành phần Y ít hơn thành phần Cb và Cr

Công thức chuẩn đổi block 8*8 RGB sang block YcbCr:

Thuật toán DCT

Để nén ảnh theo chuẩn JPEG, mỗi ma trận chia ảnh thành các khối 8x8 (hoặc 16x16) Mỗi khối 8x8 này sẽ được xử lý riêng biệt qua các bước của quá trình nén ảnh Đầu tiên, ta thực hiện biến đổi DCT thuận đối với mỗi khối Như chúng ta đã biết, do các điển ảnh kế cận nhau thường có tính tương quan rất cao, phép biến đổi DCT thuận có xu hướng tập trung hầu hết năng lượng của bức ảnh vào trong một vài hệ số DCT tần số thấp Đây là cơ sở để ta thực hiện nén ảnh Với một khối ảnh kích thước 8x8 trích từ ảnh nguồn, hầu hết các hệ số của nó đều bằng 0 hoặc gần bằng 0 Như vậy, ta có thể không

Trang 32

cần biểu diễn các hệ số này khi truyền dữ liệu ảnh đi Lưu ý rằng bản thân biến đổi DCT không làm mất mát thông tin của ảnh gốc, nó chỉ chuyển các thông tin này về một dạng khác mà ta có thể mã hóa một cách hiệu quả hơn

Chuẩn nén JPEG phân ảnh ra các khối 8x8 Biến đổi nhanh Cosin 2 chiều cho các khối 8x8 sẽ đạt hiệu quả hơn, việc biến đổi Cosin cho các khối có cùng kích cỡ có thể giảm được một phần các tính toán chung như việc tính hệ số Ci Khi n = 8 chúng ta chỉ

Ảnh sẽ chia làm B khối với:

Các khối được xác định bởi bộ số (m, n) với m=[0 MB-1] và n=[0 NB-1]

Trong đó :

m : thứ tự của khối theo chiều rộng n : thứ tự của khối theo chiều dài

Phân khối thực chất là xác định tương quan giữa toạ độ riêng trong khối với tạo độ thực của điểm ảnh trong ảnh ban đầu Nếu ảnh ban đầu ký hiệu Image[i,j] thì ma trận biểu diễn khối (m,n) là x[u,v] được tính:

x[u,v] = Image[mk + u, nl + v]

Công thức biến đổi cho mỗi khối là:

Trang 33

Trong đó

Thuật toán biến đổi nhanh Cosin hai chiều cho mỗi khối trong trường hợp này sẽ bao gồm 16 phép biến đổi nhanh Cosin một chiều Đầu tiên, người ta biến đổi nhanh Cosin một chiều cho các dãy điểm ảnh trên mỗi hàng Lần lượt thực hiện cho 8 hàng Sau

đó đem biến đổi nhanh Cosin một chiều theo từng cột của ma trận vừa thu được sau 8 phép biến đổi trên Cũng lần lượt thực hiện cho 8 cột Ma trận cuối cùng sẽ là ma trận hệ

số biến đổi của khối tương ứng

Giải thuật biến đổi nhanh được mô tả như hình sau:

Hình: Mô tả giải thuật biến đổi nhanh

)80

(

00

21

1

1 1

(

00

21

) 1 2 ( ) , 7

0

7

0(4

)

,

2 1

2 1 2

k

X kk

Định dạng
Số trang	66
Dung lượng	1,59 MB