Nén dữ liệu ảnh trong xử lý ảnh số

Trang 1

Ch-ơng 13 Nén dữ liệu ảnh

13.1 Chỉ dẫn

Nén ảnh là một kỹ thuật mã hoá hiệu suất cao ảnh số nhằm làm giảm số bit cần cho biểu diễn ảnh Chức năng của kỹ thuật này là giảm độ lớn dữ liệu phải lu trữ cùng với thời gian truyền trong khi vẫn giữ nguyên chất lợng của ảnh Để đánh giá

sự cần thiết của nén ảnh, chúng ta xem xét về yêu cầu bộ nhớ và thời gian truyền khi dùng một modem 9600 baud (bit/s) cho các ảnh sau đây:

■ Một ảnh 512 ì 512 điểm, 8 bit cho một điểm, ảnh mức xám yêu cầu 2,097,152 bit cho lu giữ và mất 3.64 phút để truyền.

■ Một ảnh màu RGB có cùng các bớc xử lý nh trờng hợp trên yêu cầu xấp xỉ 6 triệu bít cho lu trữ và mất gần 11 phút để truyền

■ Một phim âm bản có kích thớc 24 ì 36 mm (35 mm) chia bằng các khoảng cách nhau 12 àm, vào khoảng 3000 ì 2000 điểm, 8 bit cho một điểm, yêu cầu 48 triệu bit cho lu giữ ảnh và 83 phút để truyền Một phim âm bản màu sẽ yêu cầu một

số lớn gấp ba lần cho lu giữ và truyền.

Rõ ràng, việc truyền và lu giữ các ảnh sẽ có nhiều vấn đề Có rất nhiều ví dụ khác

mà sẽ dễ dàng làm sáng tỏ vai trò của nén ảnh, và rất có nhiều nghiên cứu tập trung vào lĩnh vực này Fax, một tài liệu đồ hoạ đợc truyền qua đờng dây điện thoại, nén dữ liệu ảnh y học, truyền hình là một vài trong số nhiều ứng dụng tiềm tàng của nén

ảnh Sự phát triển của kỹ thuật vi điện tử và sự phát triển của rất nhiều ứng dụng th

-ơng mại dẫn dắt sự phát triển cho các tiêu chuẩn và phần cứng của bộ nén ảnh theo thời gian thực.

Nén ảnh là đạt đợc bâừng cách loại bỏ các phần thừa trong ảnh Các phần thừa này có thể ở trong miền không gian, miền phổ, hoặc là phần thừa trong thời gian.

■ Phần thừa không gian là kết quả do mối quan hệ tơng quan giữa các điểm gần nhau.

■ Phần thừa phổ là kết quả do mối tơng quan giữa các mặt phẳng màu khác nhau.

■ Phần thừa thời gian là kết quả mối tơng quan của các khung khác nhau một dãy các ảnh nh trong truyền hình

Trong chơng này tôi sẽ trình bày với các bạn một số thuật toán nén ảnh có kết quả tốt đợc thừa nhận rộng rãi Chúng ta sẽ phát triển thuật toán thành mã ch ơng trình C, sau đó kiểm tra kết quả của các kỹ thuật này qua các ví dụ chạy thử Bạn sẽ

có nhiều kinh nghiệm bằng cách tự chạy các chơng trình này.

Trang 2

13.2 Mã thống kê

Những ảnh mà chúng ta thu nhận đợc mã hoá và lu giữ dới dạng "mã tự nhiên" Một mức xám của giá trị đợc mã hoá bằng 8 bit nhị phân bằng nhau Ví dụ một mức xám giá trị 6 đợc mã hoá là 0000 0110 Một sự sắp xếp mã hoá luân phiên nhau đợc dùng trong mã mức xám Loại mã này có đặc tính là bất kỳ hai từ mã liền nhau nào cũng chỉ khác nhau một vị trí Bảng 13.1 trình bày hai kiểu mã khác nhau cho một tín hiệu mẫu có giá trị vào khoảng từ 0 đến 7 Một kiểu cho ta thấy rằng tín hiệu không nhất thiết phải có giá trị thực sự từ 0 đến 7, nhng phải có 8 mức riêng biệt.

111 110 100 101 001 000 010 011

Những loại mã này thờng gọi là mã khoảng cách bằng nhau Mã khoảng cách

bằng nhau không đợc dùng trong trong thống kê dữ liệu Sự thừa nhận này đợc tạo

ra khi ta coi rằng tất cả các mức xám (hoặc giá trị tín hiệu chói) có cùng số lần xuất hiện trong ảnh Nếu điều này không đúng, dạng mã này không phải tốt nhất Nếu chúng ta phát triển một mã mà một số ít bít hơn đợc kí hiệu cho các từ mã biểu diễn các mức xám có khả năng xuất hiện cao hơn, thì trung bình độ dài từ mã sẽ nhỏ nhất

và loại mã mà chúng ta vừa phát triển là cơ bản cho mã phần thừa tối thiểu Tất cả các loại mã này đợc biết với tên mã có độ dài thay đổi hoặc đôi khi gọi là mã entropy Câu hỏi đặt ra cho chúng ta lúc này là :

■ Chiều dài từ mã trung bình tối thiểu mà có thể dùng giải mã để sửa lại mã chính xác là gì?

■ Làm cách nào chúng ta tạo ra mã này?

Câu trả lời cho câu hỏi đầu tiên có thể tìm thấy trong lý thuyết thông tin Nếu ta cho rằng một mức xám g của xác suất p(g) đợc cho bằng từ mã dài L(g) bit Chiều

dài từ mã trung bình, trong một ảnh mức xám 8 bit, đợc cho bởi

= ∑255

0

) ( ) ( g L g p

L bit/ pixel (13.1)

Một thừa nhận hợp lý nữa có thể suy ra là sự kiện có số lần xuất hiện ít, thì sẽ cung cấp nhiều thông tin hơn sự kiện số lần xuất hiện nhiều hơn Sự thừa nhận này dẫn chúng ta đến mối quan hệ

Trang 3

) ( log

1 )

(

2 p g g

Cơ số 2 dùng khi L(g) đợc cho dới dạng đơn vị nhị phân hoặc bit Chiều dài từ

nhỏ nhất mà có thể đợc dùng cho bởi

p

Biểu thức này gọi là entropy của tín hiệu Entropy thì không bao giờ âm vì p(g)

nằm trong khoảng [0,1] Đạo hàm của biểu thức entropy có thể tìm thấy trong các sách nói về tin học hoặc thông tin Chú ý rằng cho một ảnh 256 mức xám mà tất cả các mức có khả năng xuất hiện bằng nhau khi dùng biểu thức (13.3) chúng ta có:

−

= 2550

2

256

1 ( log 256

1

Điều này có nghĩa là một mã có độ dài bằng nhau có thể dùng trên một ảnh mà

có hàm phân bố cờng độ sáng đồng đều.

Câu trả lời cho câu hỏi thứ hai đề cập đến mã có phần thừa nhỏ nhất (mã tối u)

đợc Huffman tìm ra Loại mã này gọi là mã Huffman và đợc áp dụng rộng rãi trong các kỹ thuật mã hoá bằng phần cứng cũng nh bằng phần mềm trong các ứng dụng thơng mại Bây giờ chúng ta sẽ xem xét sơ đồ mã hoá Huffman.

Thuật toán mã hoá Huffman tuân theo các giới hạn sau:

1 Không có hai thông báo nào có sự sắp xếp của từ mã giống nhau.

2 Từ mã của thông báo đợc mã hóa theo cách mà không cần một sự chỉ dẫn nào thêm để chỉ ra đâu là nơi bắt đầu và đâu là nơi kết thúc của từ mã.

Hạn chế thứ hai chỉ ra rằng không có thông báo nào đợc mã hoá theo cách mà khi

từ mã xuất hiện, bit nối bit, nh là một phần của từ mã lớn hơn Ví dụ, 01, 102, và

202 là các từ mã hợp lệ Một dãy của các từ mã xuất hiện có dạng

1111022020101111102 có thể tách ra thành 111-102-202-01-01-111-102 Tất cả các vấn đề mà chúng ta cần quan tâm khi giải mã là bộ mã gốc Nếu nh một bộ mã bao gồm 11, 111, 102, 02 thì khi một thông báo bắt đầu vói 11, ta sẽ không biết liệu đây

là thông báo 11 hay đây là phần bắt đầu của thông báo 111 Nếu một thông báo

11102 xuất hiện thì ta sẽ không biết liệu đây là 111-02 hoặc là 11-102 đợc truyền đi Mã Huffman đợc mã hoá theo hai hạn chế trên đây và gọi là mã có độ d thừa tối thiểu hay gọi là mã tối u Phơng pháp mã hoá này theo hai bớc: bớc thu gọn và bớc

mở rộng Để xem xét phơng pháp mã hoá này ta coi rằng các thông báo để xây dựng

từ mã đợc sắp xếp theo thứ tự xác suất xuất hiện giảm dần

p(0) ≥ p(1) ≥ p(2) ≥ ≥ p(N - 1)

ở đây N là số của các thông báo Nh tôi đã chỉ ra ban đầu, cho bộ mã hoá tối u thì

độ dài của từ mã đợc xắp xếp theo thứ tự

L(0) ≤ L(1) ≤ L(2) ≤ ≤ L(N - 1)

Các bớc dới đây trình bày giải thuật mã hoá Huffman Giải thuật này, cũng nh phần lớn các giải thuật khác trong cuốn sách này, đợc phát triển bởi chính tác giả

Trang 4

13.2.1 Giải thuật thu gọn

Các bớc của giải thuật thu gọn đợc trình bày tốt nhất theo các bớc sau đây:

Đặt M = N và coi đây là một mảng tuyến tính có kích thớc N - 2.

Cho i = 0 đến N - 3 lặp lại các bớc sau:

{

Cộng p(M) và p(M - 1) Thay p(M - 1) bằng kết quả thu đợc.

Xác định vị trí, loc, trong M - 1 vị trí đầu tiên của mảng p trong đó p(M - 1) > p(loc).

Đặt temp = p(M - 1).

Chuyển các giá trị từ p(loc) đến p(M - 2) xuống một vị trí.

Đặt giá trị trung gian vào loc.

Lu giá trị trung gian trong mảng tuyến tính v theo

1 2

v

Hình 13.1 Giải thuật thu gọn.

Mảng tuyến tính v đợc dùng để xây dựng mã hoá Huffman theo bớc mở rộng đợc

trình bày ở dới đây

0.0625 0.0625 0.0625

0.0625 0.125

0.0625 0.0625

0.125 0.125

0.25 0.25

Trang 5

13.3.2 Bớc mở rộng

Bớc giải thuật này có thể trình bày theo các bớc sau:

1) Gán các giá trị ban đầu cho một mảng H theo:

H

H H H

0

1 2 3

.

( ) ( ) ( ) ( ) Chú ý là phần tử thứ hai bằng 1 còn các phần tử khác bằng 0

4) Dịch chuyển các phần tử các phần tử ở vị trí dới H[v(i)] một vị trí lên phía

trên Chèn giá trị 0 vào vị trí cuối cùng.

5) Sao chép temp tới vị trí thứ M trong H.

9) Nếu i ≤ (N - 2) quay lại bớc thứ ba.

Nếu không thì đã hoàn thành, và mã nằm trong bảng H.

Các bớc trên giải thích qua hình 13.2 dùng ví dụ hình 13.1.

Trang 6

Các bớc trên đợc lập ra bởi Huffman Lu và Chen đã nhận ra rằng thuật toán của Huffman không phải lúc nào cũng tạo ra một mã có độ dài đơn diệu tăng dần qua ví

dụ của họ dới đây:

Xem xét khả năng xuất hiện thông tin dới đây:

Theo giải thuật thu gọn ở trên chúng ta có

Bộ mã trên không thoả mãn điều kiện về chiều dài của từ mã đơn điệu tăng dần; tuy nhiên, bộ mã này có thể sử dụng nếu nó thoả mãn điều kiện có khả năng giải mã

đợc Lỗi này có thể sửa đợc bằng một thay đổi nhỏ theo Lu và Chen trong bớc thứ ba

và tạo ra một bộ mã

Trang 7

Chơng trình dới đây tạo ra bộ mã dùng các bớc thu gọn và mở rộng ở trên Chơng trình này sử dụng thuật toán Lu và Chen mô tả ở trên Chơng trình cũng tính trung bình độ dài từ Chơng trình không dùng trên ảnh, mà chỉ minh hoạ các bớc thực hiện việc sinh mã Huffman Chú ý điều kiện dùng trong bớc 3 của quá trình thu nhỏ đợc thay bằng điều kiện của Lu và Chen.

Chơng trình 13.1 Chơng trình ví dụ sinh mã Huffman.

/*Program 13.1 "HUFFMAN.C" Example program for generating the

Huffman code.*/

/* Example program to demonstrate the

algorithm for the generation procedure

of the Huffman code */

unsigned char v[11],L[13],code[13];

unsigned char ctemp,Ltemp;

Trang 9

trong chơng trình Chạy chơng trình và so sánh với bộ mã cho bởi Lu và Chen.

3 Dùng ví dụ cho bởi Lu và Chen, chú ý sự khác nhau trong chiều dài từ mã vói hai điều kiện khác nhau.

Nhiệm vụ tiếp theo của chúng ta thật rõ ràng Chúng ta cần viết một chơng trình

C để mã hoá và giải mã ảnh số dùng lợc đồ mã Huffman Chơng trình sẽ bao gồm: tính toán khả năng xảy ra của mỗi mức xám và xắp xếp lại theo thứ tự giảm dần của khả năng có thể Tất nhiên, chơng trình cũng bao gồm một vector để lu giữ các thông tin cần thiết về các mức xám theo khả năng của các sự kiện, ví dụ, một bảng tra cứu Chơng trình cũng sẽ loại trừ các sự kiện không có khả năng xảy ra Khi các bớc ở trên đợc thực hiện, mã Huffman đợc sinh ra theo giải thuật đợc mô tả trên Trong việc mã hoá ảnh số bạn cần nhớ rằng chơng trình sẽ cần nhiều byte trên đĩa Khi viết một thủ tục giải mã ta cần chú ý đến giới hạn này.

13.2.3 Mã hoá ảnh số

Trớc khi mã hoá ta cần tạo ra hai bảng tra cứu:

1 Một bảng tra cứu (LUT) chứa quan hệ các giá trị mức xám trên ảnh vói bộ mã hoá Huffman Bảng LUT này có thể phát triển dùng quan hệ:

table_code[gray[i]] = code[i]

ở đây code[i] là mã Huffman.

2 Một bảng tra cứu xác lập quan hệ giữa các mức xám trên ảnh vói chiều dài từ mã Huffman LUT có thể tạo ra theo mối quan hệ sau:

table_length [ gray[i]] = L[i]

Mã hoá theo các bớc sau:

a Mở một file để chứa ảnh đã đợc mã hoá

b Đặt Len = 0 và aux = 0.

aux là một thanh ghi bốn byte để truyền mã.

Len chứa số các bít còn lại trong aux.

Trang 10

c Đọc giá trị điểm ảnh.

d Xác định mã Huffman của nó, code[i], và độ dài của từ mã L[i], dùng hai bảng LUT để tạo ra giá trị ban đầu.

e Dịch aux sang trái L[i] bit.

f Thực hiện phép logic OR code[i] với aux.

g Len = Len + L[i].

h Nếu Len ≥ 8 thì chuyển 8 bit cuối đến file đầu ra và giảm Len đi 8.

i Nếu cha hết file thì chuyển đến bớc c

k Chuyển các bít còn lại trong thanh ghi aux ra file đầu ra.

Để giải mã đợc ảnh chúng ta cần phải tạo thêm phần header của file Header của file bao gồm cả chiều dài thực sự của file tính theo bit Chú ý là chiều dài thực sự có thể lớn hơn hoặc bằng chiều dài thực sự của file Điều này bởi vì chúng ta chỉ có thể chứa dới dạng đơn vị byte, còn file ảnh đã mã hoá phải có chiều dài không chia hết cho 8 Phần này chứa đủ thông tin để thiết lập các bảng LUT, dùng cho việc giải mã

ảnh Nó bao gồm các mức xám trên ảnh, dạng mã Huffman và chiều dài tơng đơng của chúng Chú ý rằng các từ mã đợc sắp xếp theo thứ tự giảm dần theo xác suất xuất hiện của chúng

Chơng trình C sau đây sẽ trình bày các bớc trên.

Chơng trình 13.2 "HUCODING" Mã hoá Huffman ảnh số.

/*Program 13.2 "HUCODING.C" Huffman coding of digital images.*//* This program is for coding a binary file

using Huffman codes */

unsigned char *v,*L,*gray, *table_length;

unsigned long int *code, *table_code, ctemp2;

unsigned long int aux1,aux2,Lmask,act_len,flength;

unsigned char mask,Len;

int ch;

float temp, sum, *pt, *p, big;

unsigned long int *histo;

Trang 11

printf("%s does not exist ",file_name1 );

histo=( unsigned long int *) malloc(256*sizeof(long int));

for(i=0; i<256; i++)

Trang 12

v=(unsigned char *)malloc((N-2)*sizeof(char));

code=(unsigned long int *)malloc(N*sizeof(unsigned long int));

L=(unsigned char *)malloc(N*sizeof(char));

for(i=0; i<(N-2); i++)

Trang 14

printf("\nAverage number of bits/pixel.=%f",sum);

free(v);

free(p) ;

free(pt);

/* Coding */

/* Writing the header in the output file

The first 4 bytes stores the true length in

bits of the stored image with the MSB stored

first The 5th byte is the number of Huffman

codes=N The following N bytes contain the N

natural codes for the gray levels, followed by N

bytes containing the Huffman code lengths These

are then followed by the actual Huffman codes

stored in packed form */

for(i=0;i<4;i++)

putc((int)0,fptro);

/* reserve the first 4 bytes for the true length of

the file in bits.*/

table_code=(unsigned long int *)malloc(256*sizeof(long int));

table_length=(unsigned char *)malloc(256*sizeof(char));

for(i=0; i<N; i++)

{

table_code[gray[i]]=code[i];

table_length[gray[i]]=L[i];

Trang 16

1 áp dụng chơng trình 13.2 cho IKRAM.IMG Tên file ra là IKRHUFF.IMG Bạn sẽ cần đến file này để kiểm tra chơng trình giải mã, chơng trình này sẽ đ-

ợc trình bày sau.

2 Tính độ dài từ trung bình từ kích thớc file ra So sánh với độ dài từ đã đợc tính bằng chơng trình.

13.2.4 Giải mã

Giải mã của một ảnh mã hoá bằng mã Huffman thực hiện qua các bớc sau:

1 Đặt Len = 0, flength = 0; aux = 0.

Len là số đếm của các bít đợc giải mã.

Flength là một số đếm của các để so sánh với chiều dài thực sự của file Aux là một thanh ghi bốn byte chứa các từ mã sẽ đợc giải mã.

Lặp lại các bớc sau đây cho tới khi chiều dài flength > true_length

{

2 Chuyển một byte từ file đến thanh ghi aux.

Lặp lại các bớc sau 8 lần:

{

3 Dịch trái thanh ghi aux đi một bít.

4 Dịch chuyển bit dấu lớn nhất của ch đến vị trí bít dấu nhỏ nhất của ch.

} ( cụ thể chuyển tói bớc 3).

} ( cụ thể chuyển tới bớc 2)

Các thủ tục trên tạo ra các bớc giả mã Bạn cần nhớ rằng header của file chứa các thông tin cho việc giải mã Một chơng trình C cho việc giải mã đợc trình bày ở phần dới đây.

Chơng trình 13.3 "HUDECDNG" Chơng trình giải mã ảnh đợc mã hoá Huffman.

/*Program 13.3 "HUDECDNG.C" Program for decoding a Huffman-coded image.*/

/*This program is for decoding binary files

coded in Huffman codes */

Trang 17

void main()

{

int ch,ind;

char file_name1 [14],file_name2[14];

Trang 18

gray=( unsigned char * )malloc(N*sizeof(char));

L=(unsigned char *)malloc(N*sizeof(char));

code=( unsigned long int *)malloc ( N*sizeof(long int));

for(i=0; i<N; i++)

Trang 19

1 1 2

3 4

0

0 0

Trang 20

Hình 13.3 Cây nhị phân giải mã Huffman hình 13.2.

Bài tập 13.3

1 áp dụng chơng trình 13.3 cho việc giải mã ảnh đã mã hoá ở bài tập 13.2.

2 Mã hoá Huffman có thể đạt đợc kết quả hơn nhờ sử dụng cây nhị phân Cây nhị phân trong hình 13.3 biểu diễn mã Huffman ở hình 13.2.

a.Viết chơng trình C sử dụng mã Huffman đặt trong phần header của file ảnh

đã mã hoá để tạo một cây nhị phân.

b.Mở rộng cho chơng trình giải mã dùng cây nhị phân Chơng trình phải đạt

đ-ợc một vài yêu cầu quan trọng nhanh hơn phơng pháp đã mô tả trong phần này giải thích tại sao.

13.3 Mã chiều dài thay đổi

Mã chiều dài thay đổi (RLC) là một phơng pháp nén ảnh dựa trên sự cắt bớt các

d thừa không gian Cho mã hoá chiều dài thay đổi một chiều, một mã chiều dài thay

đổi đợc định nghĩa là một số các phần tử điểm ảnh liên tục có chung một giá trị Một

ảnh có thể mã hoá dùng một cặp (mã chiều dài thay đổi, mã mức xám) Một chơng trình nh vậy sẽ không thể làm giảm kích thớc của ảnh nếu ảnh không chứa các điểm

có cùng các giá trị mức xám Điều kiện này xuất hiện trong một ảnh nhiều chi tiết.

Dù có thế đi chăng nữa thì định nghĩa của RLC có thể là một phơng pháp tốt để mã hoá mà có thể khắc phục các vấn đề xuất hiện dựa theo các điều kiện sau:

1 Một mã chiều dài thay đổi đợc xác định bằng ba bít cuối cùng có ý nghĩa của

nó đợc xác lập bằng 1 Còn 5 bít thấp của nó cung cấp một bộ đếm từ 1 đến

31 cho byte đi theo nó.

2 Nếu giá trị một điểm có mã chiều dài thay đổi bằng không, thì nó đợc mã hoá

nh sau:

a Nếu 3 bit cuối của nó đều xác lập lên 1, châửng hạn, ≥ 224, thì nó đợc mã hoá thành (11100000, giá trị điểm), cụ thể, mã chiều dài thay đổi bằng không theo sau bằng giá trị điểm

b.Cho các trờng hợp còn lại, nó đợc mã hoá nh giá trị điểm.

Các bớc trên giả thiết rằng trong một ảnh bình thờng, mã chiều dài thay đổi lớn hơn 31 ít xuất hiện, và các điểm có giá trị lớn hơn 224 cũng ít xuất hiện Ch ơng trình

C sau sẽ thực hiện các bớc trên.

Chơng trình 13.4 "RLC.C" Chơng trình cho giải thuật RLC.

/*Program 13.4 "RLC.C" Program for RLC.*/

/* Run length code */

/* This program can be used for either

coding images in RLC or decoding them */

#include <stdio.h>

#include <stdlib.h>

Trang 21

printf("This program can be used for both coding");

printf("\nand decoding images using 1-D RLC.");

printf("\n\n Enter choice:");

Trang 22

case '2': /* Decoding procedure.*/

printf("\nEnter file name for storing decoded image >");

Trang 23

2 Dùng mã Hufman để nén ảnh và so sánh với các phơng pháp mã hoá khác.

3 áp dụng các bớc giải mã Huffman và RLC để giải nén ảnh.

4 Viết một chơng trình C dùng các khái niệm cơ bản (mã chiều dài thay đổi, mã)

mà không sử dụng các bớc mô tả cho chơng trình 13.4 áp dụng chơng trình của bạn lên ảnh IKRAM.IMG Khi đó kích thớc của ảnh sau khi nén so với

ảnh gốc sẽ thế nào ?

5 áp dụng mã Huffman với:

a File rút ra từ phần 4.

b Chiều dài thay đổi và giá trị điểm chia bằng cách xem xét chúng nh hai file.

Có thể chuyển mã 1-D RLC sang mã 2-D RLC bằng cách kiểm tra các dòng trớc, hoặc kiểm tra bốn hớng khác nhau (trên, dới, trái, phải) Các 2-D RLC này có thể nén ảnh ở mức độ cao hơn

13.4 Mã chuyển đổi

Nhắc lại là biến đổi Fourier cho một ảnh thì có phần lớn các giá trị lớn nhất nằm

ở miền tần số thấp Mật độ các giá trị này giảm xuống nhanh chóng khi tần số tăng lên Tính chất này, tính chất mà chúng ta áp dụng để lọc ảnh, cũng đợc áp dụng trong khi nén ảnh Có một số phép biến đổi thuận tiện hơn phép biến đổi Fourier Phép biến đổi tối u nhất là phép biến đổi đợc đề xuất bởi Karhunen-Loeve (KL) Tuy nhiên, phép biến đổi này tự nó không thể đa ra các bớc tính toán nhanh hoặc hiệu quả hơn Một phép biến đổi xem có vẻ giống nh biến đổi KL nhng có thể tính toán

nh biến đổi Fourier rời rạc là phép biến đổi cosin rời rạc Biến đổi cosin có một sự thay đổi nhỏ tối u hoá trong miền tập trung năng lợng so với biến đổi KL; nhng do u

điểm của kỹ thuật tính toán nên nó đợc áp dụng nh một tiêu chuẩn trong kỹ thuật nén ảnh.

Phép biến đổi đợc áp dụng trên toàn bộ ảnh nhng thông thờng ngời ta hay áp dụng trên các khối nhỏ hơn có kích thớc 8 ì 8 hoặc 16 ì 16 Lý do là:

1 Biến đổi của các khối nhỏ thì dễ tính hơn là biến đổi cho toàn bộ ảnh.

2 Quan hệ giữa các điểm ảnh ít thay đổi giữa các điểm ảnh gần nhau.

Chúng tôi sẽ trình bày dới đây phép biến đổi cosin và các kỹ thuật tính toán hoàn thiện của nó Một số phép biến đổi khác nh Hadamard, Walsh, , không đợc nghiên

Trang 24

cứu trong cuốn sách này, bởi vì chúng không tối u bằng phép biến đổi Fourier và chúng có nhiều giới hạn trong lĩnh vực này.

13.4.1 Biến đổi cosin

Biến đổi một chiều cosin rời rạc (DCT-Discrete Cosin Transform) cho bởi

2 )

x N k

Dữ liệu đầu vào x(n) đợc sắp xếp lại theo thứ tự:

) 1 2 ( ) 1 (

) 2 (

N x

n x x

x k

) 1 4 ( cos ) (

~ )

2

k n n

x k

+

= 10

2 2

) 1 4 ( cos ] 2 (

~ ) (

~ [ ) 2

k n N

n x n x k

Trang 25

C¸c môc chØ sè lÎ:

=

+ +

=

) 1 2 )(

1 4 ( cos ) (

~ )

1 2

k n

n x k

) 1 4 ( cos ) 2 (

~ ) (

~ )

1 2 ( ( /2 1)

0

k N

n N

n x n x k

) 1 4 ( cos ) 2 (

~ ) (

~

2 2

) 1 4 ( cos ) 2 (

~ ) (

~ 2 )

1

2

(

1 ) 2 / ( 02

) 1 2 / ( 02

n N

n x n x

k N

n N

n x n x k

X

N n

2

) 1 4 ( cos 2

) 1 4 ( cos ) 2 (

~ ) (

~ 2 )

n N

n x n x k

n

π π

) 1 2 ( ) 1 2 ( 2 2

) 1 4 ( cos

π

(13.10)

2 (

~ ) (

~ ) (00

N n x n x n

n x n x x

2

) 1 4 ( cos 2 ) 2 (

~ ) (

~01

) 1 4 ( cos ) ( )

2

n n

x k

(13.13)

Vµ

Trang 26

) 2 ( 2

) 1 4 ( cos(

) ( )

1 2

n

k X N

k n n

x k

2 2

) 1 4 ( cos ) ( )

k n n

x k

) 2 ( 2

) 1 4 ( cos(

) ( )

k n n

x k

) 2 ( 2

) 1 4 ( cos ) 4 ( ) ( )

2 (

1 ) 4 / ( 0

00 00

n x n x k

(13.18)

13 16

2C

9 16

DCT

4 ®iÓm.

x(0) x(2) x(4) x(6)

) 0 (

~x

) 1 (

~x

) 2 (

~x

) 3 (

~x

DCT

4 ®iÓm.

2x(1) x(3)+x(1) x(5)+x(3) x(7)+x(5)

) 0 (

~x

) 1 (

~x

) 2 (

~x

) 3 (

~x

j

i

Ci j

π

cos

=

Trang 27

) 2 ( 2

) 1 4 ( cos 2 ) 4 ( ) ( )

1 2

n N

n x n x k

) 4 ( 2

) 1 4 ( cos

N

k n

π

) 2 ( 2

) 1 4 ( cos 2 ) 4 ( ) ( )

2 (

1 ) 4 / (

n x n x k

(13.20)

) 1 2 ( )

4 ( 2

) 1 4 ( cos

) 2 ( 2

) 1 4 ( cos 2 ) 4 ( ) ( )

01 01

k n

N

n N

n x n x k

10

N n x n x n

00 00

4 ( ) ( ( )

N

C

N n x n x n

) 4 ( ) ( )

n x n x n

) 1 4 ( 01

01

4 ( ) ( ( ) ( n = x n − x n + N CN n+

Trang 28

Hình 13.5 Bớc thứ hai của thuật toán biến đổi cosin.

Biểu thức (13.22) đến (13.25) biểu diễn cho toán tử bớm Thay các biểu thức này vào các biểu thức từ (13.18) đến (13.21) chúng ta có:

4 2

) 1 4 ( cos ) ( )

2

k n n

x k

0 11 00

00

) 4 ( 2

) 1 4 ( cos ) ( )

1 2 ( )

x k

4 2

) 1 4 ( cos ) ( )

2

k n n

x k

0 13 01

01

) 4 ( 2

) 1 4 ( cos ) ( )

1 2 ( ) 1 2

k n n

x k

Y k

-1 -1

2C5

8X11(1 )

2C8X11(0 )

DCT

X00(0 )X00(1 )

X00(2 )X00(3 )

Y00(0 )Y00(2 ) 2Y00(1 )Y00(3)+Y00(1 )

X10(0 )X10(1 )

2C5

8X13( 1)

2C8X13(0 )

DCT

X

01(0 )X01(1 )

X01(2 )X01(3 )

Y

01(0 )Y01(2 ) 2Y01(1 )Y01(3)+Y01(1 )

X12(0 )X12(1 )

Trang 29

) 4 ( 2

) 1 4 ( cos ) ( )

k n n

x k

) 1 4 ( cos ) ( )

k n n

x k

) 4 ( 2

) 1 4 ( cos ) ( )

k n n

x k

) 1 4 ( cos ) ( )

k n n

x k

cos ) 0 ( )

x

k x

k

4

5 cos ) 1 ( 4

cos ) 0 ( )

x

k x

k

4

5 cos ) 1 ( 4

cos ) 0 ( )

x

k x

13

k x

Các biểu thức này dẫn chúng ta đến lu đồ bớm cuối cùng trình bày ở hình 13.6.

Để rút ra tín hiệu đầu ra của lu đồ FCT chúng ta cần quay trở lại Cho ví dụ, từ biểu thức (13.21) và (13.15) chúng ta có thể viết:

Trang 30

12(0) x

12(1)

Y

12(0) Y

12(1)

1

C4-1

x

13(0) x

13(1)

Y

13(0) Y

13(1)

1

C4-1

x

10(0) x

X(0) X(4) 2X(2) X(6)+X(2) 2X(1) X(5)+X(3) 2(X(3)+X(1)) X(7)+X(5)+X(3)+

0 4 2 6 1 5 3 7

Trang 31

Hình 13.8 Tín hiệu ra sau dịch chuyển bít.

Hình 13.9 Bớc cộng truy hồi.

Tơng tự, chúng ta có thể rút ra từ các biểu thức (13.32) đến (13.34) và (13.15) các biểu thức dới đây:

X(5)+X(3) X(6)+X(2) X(7)+X(5)+X(3)+X(1)

0 1 2 3 4 5 6 7

-1

21212

X(1)

X(2)

X(3) X(4)

Trang 32

Vì vậy, tín hiệu ra từ các bớc cuối cùng của các thao tác bớm có thể tính dới dạng các hệ số của FCT nh trong hình 13.7 Nếu chúng ta sắp xếp lại vị trí của các giá trị bít dùng dịch chuyển bít, chúng ta rút ra tín hiệu ra nh hình (13.8) Sau đó,các tín hiệu ra này có thể đợc dùng để rut ra FCT nh hình (13.9) Bớc cuối cùng này gọi là

bớc cộng truy hồi.

Có rất nhiều bớc (các thao tác bớm, dịch chuyển bít, và cộng truy hồi) bây giờ có thể nằm trong một bớc trong hình 13.10 Từ sơ đồ này, chơng trình FCT có thể phát triển Chơng trình này dùng các thuật toán phát triển cho FFT Chơng trình dùng một bảng tra cứu để chứa các giá trị cosin, một bảng cho dịch chuyển bit Chi tiết của ch-

ơng trình này để lại cho ngời dùng nh một bài tập.

Bài tập13.5

1 Phát triển lu đồ cho DCT 16 và 32 điểm.

2 Sử dụng logic tơng tự đã đợc dùng cho việc phát triển chơng trình FFT, để viết một thuật toán cho FCT.

2-D FCT của một dãy 2-D thực đợc cho bởi

(13.4 7)

Thuật toán cho 2-D FCT có thể phát triển dùng phơng pháp hàng-cột bình thờng

nh thuật toán 2-D FFT Chơng trình 13.5 rút ra biến đổi FCT của các khối ngời dùng

tự xác định kích thớc, thông thờng là 8 ì 8 hoặc là 16 ì 16, bằng các chia nhỏ các khối của ảnh.

ảnh đợc giả sử là có chiều dài bằng chiều rộng với cac chiều là bội của 2 Chơng trình sử dụng thuật toán 1-D FCT và tận dụng các bảng tra cứu (LUT) nh các trạng thái trớc.

Chơng trình 13.5 “FCT2D.C“ 2-D FCT các khối ảnh (ngời dùng tự xác định kích thớc)

/*Program 13.5 "FCT2D.C" 2-D FCT of image blocks (user-pecified).*//* This program is for carrying out

2-D Fast Cosine Transform of blocks

subdividing a given image Block size is

void FCT(float *, unsigned int *, float *, int , int );

void bit_reversal(unsigned int *, int , int );

void WTS(float *,int , int );

1 1 2

1 1

0 2 2 1 2

1

2

2 1

) 1 2 ( cos 2

) 1 2 ( cos ) , (

N n

k k

N

k n N

k n n

n x N

k

Trang 34

-1 -1 -1

-1

-1 -1

-1 -1 -1

-1

-1 -1 -1 -1

C4

X(7)

X(3) X(4) X(5) X(6)

2C

9 16

2C

13

2C

Trang 35

Hình 13.10 Biểu đồ chuyển đổi cosin nhanh.

void FCT(float *x, unsigned int *L,

float *C, int m, int N){

Trang 37

N k

k

N

n k k

X n

= k cho 1

0

= k cho 2

1

k

ε

Thay vì lập lại cả một chơng trình để tính biến đổi ngợc FCT, chúng ta sẽ dùng lu

đồ của FCT tiến (forward) Để rút ra FCT ngợc, tất cả các việc mà chúng ta cần làm

là đảo ngợc biểu đồ ở hình 13.10 Hình 13.11 giới thiệu phép biến đổi ngợc của một bớm Kết quả của thuật toán biến đổi ngợc của lu đồ FCT cho trong hình 13.12 Từ l-

u đồ của hình 13.11 biến đổi ngợc của FCT có thể phát triển bình thờng từ FCT tiến Chơng trình tính 2-D FCT ngợc cho trong chơng trình 13.6 Giá trị của khối ảnh gốc phải đợc cho trớc bởi ngời dùng.

Hình 13.11 Phép đổi ngợc của một bớm.

89

1/2CX

0.5 A

B

C

-1 A=C+D

13

1

C

9 16

1

C

0.

5 -1

-1 -1

5 16

1

C

4 2

1

C

4 2

1

C

4 2

(1) x~

(2) x~

(3) x~

(4) x~

(6) x~

(7) x~

X(5

Trang 38

Hình 13.12 Biểu đồ đảo ngợc giải thuật FCT.

Chơng trình 13.6 "IFCT2D.C" Đảo ngợc FCT Kích thớc khối sử dụng trên

ảnh gốc.

/*Program 13.6 "IFCT2D.C" Inverse FCT Block size used on the original image should be known to the user.*/

/* This program is for carrying out

the inverse of the 2-D Fast Cosine Transform */

void IFCT(float *, unsigned int *, float *, int , int );

void bit_reversal(unsigned int *, int , int );

void WTSINV(float *,int, int);

printf ( "This program is for the inverse 2-D FCT \n" ) ;

printf ( "Enter name of input file ->") ;

Trang 39

printf("\nTransform image must have dimensions");

printf(" which are multiples of 2 \n ");

Tiêu đề	Nén Dữ liệu Ảnh Trong Xử Lý Ảnh Số
Trường học	Đại học Bách Khoa Hà Nội
Chuyên ngành	Xử lý ảnh số
Thể loại	Báo cáo môn học
Năm xuất bản	2023
Thành phố	Hà Nội

Định dạng
Số trang	86
Dung lượng	1,07 MB