Nén dữ liệu ảnh trong xử lý ảnh số
Trang 1
Ch-ơng 13 Nén dữ liệu ảnh
13.1 Chỉ dẫn
Nén ảnh là một kỹ thuật mã hoá hiệu suất cao ảnh số nhằm làm giảm số bit cần cho biểu diễn ảnh Chức năng của kỹ thuật này là giảm độ lớn dữ liệu phải lu trữ cùng với thời gian truyền trong khi vẫn giữ nguyên chất lợng của ảnh Để đánh giá
sự cần thiết của nén ảnh, chúng ta xem xét về yêu cầu bộ nhớ và thời gian truyền khi dùng một modem 9600 baud (bit/s) cho các ảnh sau đây:
■ Một ảnh 512 ì 512 điểm, 8 bit cho một điểm, ảnh mức xám yêu cầu 2,097,152 bit cho lu giữ và mất 3.64 phút để truyền.
■ Một ảnh màu RGB có cùng các bớc xử lý nh trờng hợp trên yêu cầu xấp xỉ 6 triệu bít cho lu trữ và mất gần 11 phút để truyền
■ Một phim âm bản có kích thớc 24 ì 36 mm (35 mm) chia bằng các khoảng cách nhau 12 àm, vào khoảng 3000 ì 2000 điểm, 8 bit cho một điểm, yêu cầu 48 triệu bit cho lu giữ ảnh và 83 phút để truyền Một phim âm bản màu sẽ yêu cầu một
số lớn gấp ba lần cho lu giữ và truyền.
Rõ ràng, việc truyền và lu giữ các ảnh sẽ có nhiều vấn đề Có rất nhiều ví dụ khác
mà sẽ dễ dàng làm sáng tỏ vai trò của nén ảnh, và rất có nhiều nghiên cứu tập trung vào lĩnh vực này Fax, một tài liệu đồ hoạ đợc truyền qua đờng dây điện thoại, nén dữ liệu ảnh y học, truyền hình là một vài trong số nhiều ứng dụng tiềm tàng của nén
ảnh Sự phát triển của kỹ thuật vi điện tử và sự phát triển của rất nhiều ứng dụng th
-ơng mại dẫn dắt sự phát triển cho các tiêu chuẩn và phần cứng của bộ nén ảnh theo thời gian thực.
Nén ảnh là đạt đợc bâừng cách loại bỏ các phần thừa trong ảnh Các phần thừa này có thể ở trong miền không gian, miền phổ, hoặc là phần thừa trong thời gian.
■ Phần thừa không gian là kết quả do mối quan hệ tơng quan giữa các điểm gần nhau.
■ Phần thừa phổ là kết quả do mối tơng quan giữa các mặt phẳng màu khác nhau.
■ Phần thừa thời gian là kết quả mối tơng quan của các khung khác nhau một dãy các ảnh nh trong truyền hình
Trong chơng này tôi sẽ trình bày với các bạn một số thuật toán nén ảnh có kết quả tốt đợc thừa nhận rộng rãi Chúng ta sẽ phát triển thuật toán thành mã ch ơng trình C, sau đó kiểm tra kết quả của các kỹ thuật này qua các ví dụ chạy thử Bạn sẽ
có nhiều kinh nghiệm bằng cách tự chạy các chơng trình này.
Trang 213.2 Mã thống kê
Những ảnh mà chúng ta thu nhận đợc mã hoá và lu giữ dới dạng "mã tự nhiên" Một mức xám của giá trị đợc mã hoá bằng 8 bit nhị phân bằng nhau Ví dụ một mức xám giá trị 6 đợc mã hoá là 0000 0110 Một sự sắp xếp mã hoá luân phiên nhau đợc dùng trong mã mức xám Loại mã này có đặc tính là bất kỳ hai từ mã liền nhau nào cũng chỉ khác nhau một vị trí Bảng 13.1 trình bày hai kiểu mã khác nhau cho một tín hiệu mẫu có giá trị vào khoảng từ 0 đến 7 Một kiểu cho ta thấy rằng tín hiệu không nhất thiết phải có giá trị thực sự từ 0 đến 7, nhng phải có 8 mức riêng biệt.
111 110 100 101 001 000 010 011
Những loại mã này thờng gọi là mã khoảng cách bằng nhau Mã khoảng cách
bằng nhau không đợc dùng trong trong thống kê dữ liệu Sự thừa nhận này đợc tạo
ra khi ta coi rằng tất cả các mức xám (hoặc giá trị tín hiệu chói) có cùng số lần xuất hiện trong ảnh Nếu điều này không đúng, dạng mã này không phải tốt nhất Nếu chúng ta phát triển một mã mà một số ít bít hơn đợc kí hiệu cho các từ mã biểu diễn các mức xám có khả năng xuất hiện cao hơn, thì trung bình độ dài từ mã sẽ nhỏ nhất
và loại mã mà chúng ta vừa phát triển là cơ bản cho mã phần thừa tối thiểu Tất cả các loại mã này đợc biết với tên mã có độ dài thay đổi hoặc đôi khi gọi là mã entropy Câu hỏi đặt ra cho chúng ta lúc này là :
■ Chiều dài từ mã trung bình tối thiểu mà có thể dùng giải mã để sửa lại mã chính xác là gì?
■ Làm cách nào chúng ta tạo ra mã này?
Câu trả lời cho câu hỏi đầu tiên có thể tìm thấy trong lý thuyết thông tin Nếu ta cho rằng một mức xám g của xác suất p(g) đợc cho bằng từ mã dài L(g) bit Chiều
dài từ mã trung bình, trong một ảnh mức xám 8 bit, đợc cho bởi
= ∑255
0
) ( ) ( g L g p
L bit/ pixel (13.1)
Một thừa nhận hợp lý nữa có thể suy ra là sự kiện có số lần xuất hiện ít, thì sẽ cung cấp nhiều thông tin hơn sự kiện số lần xuất hiện nhiều hơn Sự thừa nhận này dẫn chúng ta đến mối quan hệ
Trang 3) ( log
1 )
(
2 p g g
Cơ số 2 dùng khi L(g) đợc cho dới dạng đơn vị nhị phân hoặc bit Chiều dài từ
nhỏ nhất mà có thể đợc dùng cho bởi
p
Biểu thức này gọi là entropy của tín hiệu Entropy thì không bao giờ âm vì p(g)
nằm trong khoảng [0,1] Đạo hàm của biểu thức entropy có thể tìm thấy trong các sách nói về tin học hoặc thông tin Chú ý rằng cho một ảnh 256 mức xám mà tất cả các mức có khả năng xuất hiện bằng nhau khi dùng biểu thức (13.3) chúng ta có:
−
= 2550
2
256
1 ( log 256
1
Điều này có nghĩa là một mã có độ dài bằng nhau có thể dùng trên một ảnh mà
có hàm phân bố cờng độ sáng đồng đều.
Câu trả lời cho câu hỏi thứ hai đề cập đến mã có phần thừa nhỏ nhất (mã tối u)
đợc Huffman tìm ra Loại mã này gọi là mã Huffman và đợc áp dụng rộng rãi trong các kỹ thuật mã hoá bằng phần cứng cũng nh bằng phần mềm trong các ứng dụng thơng mại Bây giờ chúng ta sẽ xem xét sơ đồ mã hoá Huffman.
Thuật toán mã hoá Huffman tuân theo các giới hạn sau:
1 Không có hai thông báo nào có sự sắp xếp của từ mã giống nhau.
2 Từ mã của thông báo đợc mã hóa theo cách mà không cần một sự chỉ dẫn nào thêm để chỉ ra đâu là nơi bắt đầu và đâu là nơi kết thúc của từ mã.
Hạn chế thứ hai chỉ ra rằng không có thông báo nào đợc mã hoá theo cách mà khi
từ mã xuất hiện, bit nối bit, nh là một phần của từ mã lớn hơn Ví dụ, 01, 102, và
202 là các từ mã hợp lệ Một dãy của các từ mã xuất hiện có dạng
1111022020101111102 có thể tách ra thành 111-102-202-01-01-111-102 Tất cả các vấn đề mà chúng ta cần quan tâm khi giải mã là bộ mã gốc Nếu nh một bộ mã bao gồm 11, 111, 102, 02 thì khi một thông báo bắt đầu vói 11, ta sẽ không biết liệu đây
là thông báo 11 hay đây là phần bắt đầu của thông báo 111 Nếu một thông báo
11102 xuất hiện thì ta sẽ không biết liệu đây là 111-02 hoặc là 11-102 đợc truyền đi Mã Huffman đợc mã hoá theo hai hạn chế trên đây và gọi là mã có độ d thừa tối thiểu hay gọi là mã tối u Phơng pháp mã hoá này theo hai bớc: bớc thu gọn và bớc
mở rộng Để xem xét phơng pháp mã hoá này ta coi rằng các thông báo để xây dựng
từ mã đợc sắp xếp theo thứ tự xác suất xuất hiện giảm dần
p(0) ≥ p(1) ≥ p(2) ≥ ≥ p(N - 1)
ở đây N là số của các thông báo Nh tôi đã chỉ ra ban đầu, cho bộ mã hoá tối u thì
độ dài của từ mã đợc xắp xếp theo thứ tự
L(0) ≤ L(1) ≤ L(2) ≤ ≤ L(N - 1)
Các bớc dới đây trình bày giải thuật mã hoá Huffman Giải thuật này, cũng nh phần lớn các giải thuật khác trong cuốn sách này, đợc phát triển bởi chính tác giả
Trang 413.2.1 Giải thuật thu gọn
Các bớc của giải thuật thu gọn đợc trình bày tốt nhất theo các bớc sau đây:
Đặt M = N và coi đây là một mảng tuyến tính có kích thớc N - 2.
Cho i = 0 đến N - 3 lặp lại các bớc sau:
{
Cộng p(M) và p(M - 1) Thay p(M - 1) bằng kết quả thu đợc.
Xác định vị trí, loc, trong M - 1 vị trí đầu tiên của mảng p trong đó p(M - 1) > p(loc).
Đặt temp = p(M - 1).
Chuyển các giá trị từ p(loc) đến p(M - 2) xuống một vị trí.
Đặt giá trị trung gian vào loc.
Lu giá trị trung gian trong mảng tuyến tính v theo
1 2
v
Hình 13.1 Giải thuật thu gọn.
Mảng tuyến tính v đợc dùng để xây dựng mã hoá Huffman theo bớc mở rộng đợc
trình bày ở dới đây
0.0625 0.0625 0.0625
0.0625 0.125
0.0625 0.0625
0.125 0.125
0.125 0.125
0.25 0.25
0.25 0.25
Trang 513.3.2 Bớc mở rộng
Bớc giải thuật này có thể trình bày theo các bớc sau:
1) Gán các giá trị ban đầu cho một mảng H theo:
H
H H H
0
1 2 3
.
( ) ( ) ( ) ( ) Chú ý là phần tử thứ hai bằng 1 còn các phần tử khác bằng 0
4) Dịch chuyển các phần tử các phần tử ở vị trí dới H[v(i)] một vị trí lên phía
trên Chèn giá trị 0 vào vị trí cuối cùng.
5) Sao chép temp tới vị trí thứ M trong H.
9) Nếu i ≤ (N - 2) quay lại bớc thứ ba.
Nếu không thì đã hoàn thành, và mã nằm trong bảng H.
Các bớc trên giải thích qua hình 13.2 dùng ví dụ hình 13.1.
Trang 6Các bớc trên đợc lập ra bởi Huffman Lu và Chen đã nhận ra rằng thuật toán của Huffman không phải lúc nào cũng tạo ra một mã có độ dài đơn diệu tăng dần qua ví
dụ của họ dới đây:
Xem xét khả năng xuất hiện thông tin dới đây:
Theo giải thuật thu gọn ở trên chúng ta có
Bộ mã trên không thoả mãn điều kiện về chiều dài của từ mã đơn điệu tăng dần; tuy nhiên, bộ mã này có thể sử dụng nếu nó thoả mãn điều kiện có khả năng giải mã
đợc Lỗi này có thể sửa đợc bằng một thay đổi nhỏ theo Lu và Chen trong bớc thứ ba
và tạo ra một bộ mã
Trang 7Chơng trình dới đây tạo ra bộ mã dùng các bớc thu gọn và mở rộng ở trên Chơng trình này sử dụng thuật toán Lu và Chen mô tả ở trên Chơng trình cũng tính trung bình độ dài từ Chơng trình không dùng trên ảnh, mà chỉ minh hoạ các bớc thực hiện việc sinh mã Huffman Chú ý điều kiện dùng trong bớc 3 của quá trình thu nhỏ đợc thay bằng điều kiện của Lu và Chen.
Chơng trình 13.1 Chơng trình ví dụ sinh mã Huffman.
/*Program 13.1 "HUFFMAN.C" Example program for generating the
Huffman code.*/
/* Example program to demonstrate the
algorithm for the generation procedure
of the Huffman code */
unsigned char v[11],L[13],code[13];
unsigned char ctemp,Ltemp;
Trang 9trong chơng trình Chạy chơng trình và so sánh với bộ mã cho bởi Lu và Chen.
3 Dùng ví dụ cho bởi Lu và Chen, chú ý sự khác nhau trong chiều dài từ mã vói hai điều kiện khác nhau.
Nhiệm vụ tiếp theo của chúng ta thật rõ ràng Chúng ta cần viết một chơng trình
C để mã hoá và giải mã ảnh số dùng lợc đồ mã Huffman Chơng trình sẽ bao gồm: tính toán khả năng xảy ra của mỗi mức xám và xắp xếp lại theo thứ tự giảm dần của khả năng có thể Tất nhiên, chơng trình cũng bao gồm một vector để lu giữ các thông tin cần thiết về các mức xám theo khả năng của các sự kiện, ví dụ, một bảng tra cứu Chơng trình cũng sẽ loại trừ các sự kiện không có khả năng xảy ra Khi các bớc ở trên đợc thực hiện, mã Huffman đợc sinh ra theo giải thuật đợc mô tả trên Trong việc mã hoá ảnh số bạn cần nhớ rằng chơng trình sẽ cần nhiều byte trên đĩa Khi viết một thủ tục giải mã ta cần chú ý đến giới hạn này.
13.2.3 Mã hoá ảnh số
Trớc khi mã hoá ta cần tạo ra hai bảng tra cứu:
1 Một bảng tra cứu (LUT) chứa quan hệ các giá trị mức xám trên ảnh vói bộ mã hoá Huffman Bảng LUT này có thể phát triển dùng quan hệ:
table_code[gray[i]] = code[i]
ở đây code[i] là mã Huffman.
2 Một bảng tra cứu xác lập quan hệ giữa các mức xám trên ảnh vói chiều dài từ mã Huffman LUT có thể tạo ra theo mối quan hệ sau:
table_length [ gray[i]] = L[i]
Mã hoá theo các bớc sau:
a Mở một file để chứa ảnh đã đợc mã hoá
b Đặt Len = 0 và aux = 0.
aux là một thanh ghi bốn byte để truyền mã.
Len chứa số các bít còn lại trong aux.
Trang 10c Đọc giá trị điểm ảnh.
d Xác định mã Huffman của nó, code[i], và độ dài của từ mã L[i], dùng hai bảng LUT để tạo ra giá trị ban đầu.
e Dịch aux sang trái L[i] bit.
f Thực hiện phép logic OR code[i] với aux.
g Len = Len + L[i].
h Nếu Len ≥ 8 thì chuyển 8 bit cuối đến file đầu ra và giảm Len đi 8.
i Nếu cha hết file thì chuyển đến bớc c
k Chuyển các bít còn lại trong thanh ghi aux ra file đầu ra.
Để giải mã đợc ảnh chúng ta cần phải tạo thêm phần header của file Header của file bao gồm cả chiều dài thực sự của file tính theo bit Chú ý là chiều dài thực sự có thể lớn hơn hoặc bằng chiều dài thực sự của file Điều này bởi vì chúng ta chỉ có thể chứa dới dạng đơn vị byte, còn file ảnh đã mã hoá phải có chiều dài không chia hết cho 8 Phần này chứa đủ thông tin để thiết lập các bảng LUT, dùng cho việc giải mã
ảnh Nó bao gồm các mức xám trên ảnh, dạng mã Huffman và chiều dài tơng đơng của chúng Chú ý rằng các từ mã đợc sắp xếp theo thứ tự giảm dần theo xác suất xuất hiện của chúng
Chơng trình C sau đây sẽ trình bày các bớc trên.
Chơng trình 13.2 "HUCODING" Mã hoá Huffman ảnh số.
/*Program 13.2 "HUCODING.C" Huffman coding of digital images.*//* This program is for coding a binary file
using Huffman codes */
unsigned char *v,*L,*gray, *table_length;
unsigned long int *code, *table_code, ctemp2;
unsigned long int aux1,aux2,Lmask,act_len,flength;
unsigned char mask,Len;
int ch;
unsigned char ctemp,Ltemp;
float temp, sum, *pt, *p, big;
unsigned long int *histo;
Trang 11printf("%s does not exist ",file_name1 );
histo=( unsigned long int *) malloc(256*sizeof(long int));
for(i=0; i<256; i++)
Trang 12v=(unsigned char *)malloc((N-2)*sizeof(char));
code=(unsigned long int *)malloc(N*sizeof(unsigned long int));
L=(unsigned char *)malloc(N*sizeof(char));
for(i=0; i<(N-2); i++)
Trang 14printf("\nAverage number of bits/pixel.=%f",sum);
free(v);
free(p) ;
free(pt);
/* Coding */
/* Writing the header in the output file
The first 4 bytes stores the true length in
bits of the stored image with the MSB stored
first The 5th byte is the number of Huffman
codes=N The following N bytes contain the N
natural codes for the gray levels, followed by N
bytes containing the Huffman code lengths These
are then followed by the actual Huffman codes
stored in packed form */
for(i=0;i<4;i++)
putc((int)0,fptro);
/* reserve the first 4 bytes for the true length of
the file in bits.*/
table_code=(unsigned long int *)malloc(256*sizeof(long int));
table_length=(unsigned char *)malloc(256*sizeof(char));
for(i=0; i<N; i++)
{
table_code[gray[i]]=code[i];
table_length[gray[i]]=L[i];
Trang 161 áp dụng chơng trình 13.2 cho IKRAM.IMG Tên file ra là IKRHUFF.IMG Bạn sẽ cần đến file này để kiểm tra chơng trình giải mã, chơng trình này sẽ đ-
ợc trình bày sau.
2 Tính độ dài từ trung bình từ kích thớc file ra So sánh với độ dài từ đã đợc tính bằng chơng trình.
13.2.4 Giải mã
Giải mã của một ảnh mã hoá bằng mã Huffman thực hiện qua các bớc sau:
1 Đặt Len = 0, flength = 0; aux = 0.
Len là số đếm của các bít đợc giải mã.
Flength là một số đếm của các để so sánh với chiều dài thực sự của file Aux là một thanh ghi bốn byte chứa các từ mã sẽ đợc giải mã.
Lặp lại các bớc sau đây cho tới khi chiều dài flength > true_length
{
2 Chuyển một byte từ file đến thanh ghi aux.
Lặp lại các bớc sau 8 lần:
{
3 Dịch trái thanh ghi aux đi một bít.
4 Dịch chuyển bit dấu lớn nhất của ch đến vị trí bít dấu nhỏ nhất của ch.
} ( cụ thể chuyển tói bớc 3).
} ( cụ thể chuyển tới bớc 2)
Các thủ tục trên tạo ra các bớc giả mã Bạn cần nhớ rằng header của file chứa các thông tin cho việc giải mã Một chơng trình C cho việc giải mã đợc trình bày ở phần dới đây.
Chơng trình 13.3 "HUDECDNG" Chơng trình giải mã ảnh đợc mã hoá Huffman.
/*Program 13.3 "HUDECDNG.C" Program for decoding a Huffman-coded image.*/
/*This program is for decoding binary files
coded in Huffman codes */
Trang 17void main()
{
int ch,ind;
unsigned char ctemp,Ltemp;
char file_name1 [14],file_name2[14];
Trang 18gray=( unsigned char * )malloc(N*sizeof(char));
L=(unsigned char *)malloc(N*sizeof(char));
code=( unsigned long int *)malloc ( N*sizeof(long int));
for(i=0; i<N; i++)
Trang 191 1 2
3 4
0
0 0
Trang 20Hình 13.3 Cây nhị phân giải mã Huffman hình 13.2.
Bài tập 13.3
1 áp dụng chơng trình 13.3 cho việc giải mã ảnh đã mã hoá ở bài tập 13.2.
2 Mã hoá Huffman có thể đạt đợc kết quả hơn nhờ sử dụng cây nhị phân Cây nhị phân trong hình 13.3 biểu diễn mã Huffman ở hình 13.2.
a.Viết chơng trình C sử dụng mã Huffman đặt trong phần header của file ảnh
đã mã hoá để tạo một cây nhị phân.
b.Mở rộng cho chơng trình giải mã dùng cây nhị phân Chơng trình phải đạt
đ-ợc một vài yêu cầu quan trọng nhanh hơn phơng pháp đã mô tả trong phần này giải thích tại sao.
13.3 Mã chiều dài thay đổi
Mã chiều dài thay đổi (RLC) là một phơng pháp nén ảnh dựa trên sự cắt bớt các
d thừa không gian Cho mã hoá chiều dài thay đổi một chiều, một mã chiều dài thay
đổi đợc định nghĩa là một số các phần tử điểm ảnh liên tục có chung một giá trị Một
ảnh có thể mã hoá dùng một cặp (mã chiều dài thay đổi, mã mức xám) Một chơng trình nh vậy sẽ không thể làm giảm kích thớc của ảnh nếu ảnh không chứa các điểm
có cùng các giá trị mức xám Điều kiện này xuất hiện trong một ảnh nhiều chi tiết.
Dù có thế đi chăng nữa thì định nghĩa của RLC có thể là một phơng pháp tốt để mã hoá mà có thể khắc phục các vấn đề xuất hiện dựa theo các điều kiện sau:
1 Một mã chiều dài thay đổi đợc xác định bằng ba bít cuối cùng có ý nghĩa của
nó đợc xác lập bằng 1 Còn 5 bít thấp của nó cung cấp một bộ đếm từ 1 đến
31 cho byte đi theo nó.
2 Nếu giá trị một điểm có mã chiều dài thay đổi bằng không, thì nó đợc mã hoá
nh sau:
a Nếu 3 bit cuối của nó đều xác lập lên 1, châửng hạn, ≥ 224, thì nó đợc mã hoá thành (11100000, giá trị điểm), cụ thể, mã chiều dài thay đổi bằng không theo sau bằng giá trị điểm
b.Cho các trờng hợp còn lại, nó đợc mã hoá nh giá trị điểm.
Các bớc trên giả thiết rằng trong một ảnh bình thờng, mã chiều dài thay đổi lớn hơn 31 ít xuất hiện, và các điểm có giá trị lớn hơn 224 cũng ít xuất hiện Ch ơng trình
C sau sẽ thực hiện các bớc trên.
Chơng trình 13.4 "RLC.C" Chơng trình cho giải thuật RLC.
/*Program 13.4 "RLC.C" Program for RLC.*/
/* Run length code */
/* This program can be used for either
coding images in RLC or decoding them */
#include <stdio.h>
#include <stdlib.h>
Trang 21printf("This program can be used for both coding");
printf("\nand decoding images using 1-D RLC.");
printf("\n\n Enter choice:");
Trang 22case '2': /* Decoding procedure.*/
printf("\nEnter file name for storing decoded image >");
Trang 232 Dùng mã Hufman để nén ảnh và so sánh với các phơng pháp mã hoá khác.
3 áp dụng các bớc giải mã Huffman và RLC để giải nén ảnh.
4 Viết một chơng trình C dùng các khái niệm cơ bản (mã chiều dài thay đổi, mã)
mà không sử dụng các bớc mô tả cho chơng trình 13.4 áp dụng chơng trình của bạn lên ảnh IKRAM.IMG Khi đó kích thớc của ảnh sau khi nén so với
ảnh gốc sẽ thế nào ?
5 áp dụng mã Huffman với:
a File rút ra từ phần 4.
b Chiều dài thay đổi và giá trị điểm chia bằng cách xem xét chúng nh hai file.
Có thể chuyển mã 1-D RLC sang mã 2-D RLC bằng cách kiểm tra các dòng trớc, hoặc kiểm tra bốn hớng khác nhau (trên, dới, trái, phải) Các 2-D RLC này có thể nén ảnh ở mức độ cao hơn
13.4 Mã chuyển đổi
Nhắc lại là biến đổi Fourier cho một ảnh thì có phần lớn các giá trị lớn nhất nằm
ở miền tần số thấp Mật độ các giá trị này giảm xuống nhanh chóng khi tần số tăng lên Tính chất này, tính chất mà chúng ta áp dụng để lọc ảnh, cũng đợc áp dụng trong khi nén ảnh Có một số phép biến đổi thuận tiện hơn phép biến đổi Fourier Phép biến đổi tối u nhất là phép biến đổi đợc đề xuất bởi Karhunen-Loeve (KL) Tuy nhiên, phép biến đổi này tự nó không thể đa ra các bớc tính toán nhanh hoặc hiệu quả hơn Một phép biến đổi xem có vẻ giống nh biến đổi KL nhng có thể tính toán
nh biến đổi Fourier rời rạc là phép biến đổi cosin rời rạc Biến đổi cosin có một sự thay đổi nhỏ tối u hoá trong miền tập trung năng lợng so với biến đổi KL; nhng do u
điểm của kỹ thuật tính toán nên nó đợc áp dụng nh một tiêu chuẩn trong kỹ thuật nén ảnh.
Phép biến đổi đợc áp dụng trên toàn bộ ảnh nhng thông thờng ngời ta hay áp dụng trên các khối nhỏ hơn có kích thớc 8 ì 8 hoặc 16 ì 16 Lý do là:
1 Biến đổi của các khối nhỏ thì dễ tính hơn là biến đổi cho toàn bộ ảnh.
2 Quan hệ giữa các điểm ảnh ít thay đổi giữa các điểm ảnh gần nhau.
Chúng tôi sẽ trình bày dới đây phép biến đổi cosin và các kỹ thuật tính toán hoàn thiện của nó Một số phép biến đổi khác nh Hadamard, Walsh, , không đợc nghiên
Trang 24cứu trong cuốn sách này, bởi vì chúng không tối u bằng phép biến đổi Fourier và chúng có nhiều giới hạn trong lĩnh vực này.
13.4.1 Biến đổi cosin
Biến đổi một chiều cosin rời rạc (DCT-Discrete Cosin Transform) cho bởi
2 )
x N k
Dữ liệu đầu vào x(n) đợc sắp xếp lại theo thứ tự:
) 1 2 ( ) 1 (
) 2 (
N x
n x x
x k
) 1 4 ( cos ) (
~ )
~ )
2
k n n
x k
+
= 10
2 2
) 1 4 ( cos ] 2 (
~ ) (
~ [ ) 2
k n N
n x n x k
Trang 25C¸c môc chØ sè lÎ:
=
+ +
=
) 1 2 )(
1 4 ( cos ) (
~ )
1 2
k n
n x k
) 1 4 ( cos ) 2 (
~ ) (
~ )
1 2 ( ( /2 1)
0
k N
n N
n x n x k
) 1 4 ( cos ) 2 (
~ ) (
~
2 2
) 1 4 ( cos ) 2 (
~ ) (
~ 2 )
1
2
(
1 ) 2 / ( 02
) 1 2 / ( 02
n N
n x n x
k N
n N
n x n x k
X
N n
N n
2
) 1 4 ( cos 2
) 1 4 ( cos ) 2 (
~ ) (
~ 2 )
n N
n N
n x n x k
n
π π
) 1 2 ( ) 1 2 ( 2 2
) 1 4 ( cos
π
(13.10)
2 (
~ ) (
~ ) (00
N n x n x n
n x n x x
2
) 1 4 ( cos 2 ) 2 (
~ ) (
~01
) 1 4 ( cos ) ( )
2
n n
x k
(13.13)
Vµ
Trang 26) 2 ( 2
) 1 4 ( cos(
) ( )
1 2
n
k X N
k n n
x k
2 2
) 1 4 ( cos ) ( )
k n n
x k
) 2 ( 2
) 1 4 ( cos(
) ( )
k n n
x k
) 2 ( 2
) 1 4 ( cos ) 4 ( ) ( )
2 (
1 ) 4 / ( 0
00 00
n x n x k
(13.18)
13 16
2C
9 16
DCT
4 ®iÓm.
x(0) x(2) x(4) x(6)
) 0 (
~x
) 1 (
~x
) 2 (
~x
) 3 (
~x
DCT
4 ®iÓm.
2x(1) x(3)+x(1) x(5)+x(3) x(7)+x(5)
) 0 (
~x
) 1 (
~x
) 2 (
~x
) 3 (
~x
j
i
Ci j
π
cos
=
Trang 27) 2 ( 2
) 1 4 ( cos 2 ) 4 ( ) ( )
1 2
n N
n x n x k
) 4 ( 2
) 1 4 ( cos
N
k n
π
) 2 ( 2
) 1 4 ( cos 2 ) 4 ( ) ( )
2 (
1 ) 4 / (
n x n x k
(13.20)
) 1 2 ( )
4 ( 2
) 1 4 ( cos
) 2 ( 2
) 1 4 ( cos 2 ) 4 ( ) ( )
01 01
k n
N
n N
n x n x k
10
N n x n x n
00 00
4 ( ) ( ( )
N
C
N n x n x n
) 4 ( ) ( )
n x n x n
) 1 4 ( 01
01
4 ( ) ( ( ) ( n = x n − x n + N CN n+
Trang 28Hình 13.5 Bớc thứ hai của thuật toán biến đổi cosin.
Biểu thức (13.22) đến (13.25) biểu diễn cho toán tử bớm Thay các biểu thức này vào các biểu thức từ (13.18) đến (13.21) chúng ta có:
4 2
) 1 4 ( cos ) ( )
2
k n n
x k
0 11 00
00
) 4 ( 2
) 1 4 ( cos ) ( )
1 2 ( )
x k
4 2
) 1 4 ( cos ) ( )
2
k n n
x k
0 13 01
01
) 4 ( 2
) 1 4 ( cos ) ( )
1 2 ( ) 1 2
k n n
x k
Y k
-1 -1
-1 -1
2C5
8X11(1 )
2C8X11(0 )
DCT
DCT
X00(0 )X00(1 )
X00(2 )X00(3 )
Y00(0 )Y00(2 ) 2Y00(1 )Y00(3)+Y00(1 )
X10(0 )X10(1 )
2C5
8X13( 1)
2C8X13(0 )
DCT
DCT
X
01(0 )X01(1 )
X01(2 )X01(3 )
Y
01(0 )Y01(2 ) 2Y01(1 )Y01(3)+Y01(1 )
X12(0 )X12(1 )
Trang 29) 4 ( 2
) 1 4 ( cos ) ( )
k n n
x k
) 1 4 ( cos ) ( )
k n n
x k
) 4 ( 2
) 1 4 ( cos ) ( )
k n n
x k
) 1 4 ( cos ) ( )
k n n
x k
cos ) 0 ( )
x
k x
k
4
5 cos ) 1 ( 4
cos ) 0 ( )
x
k x
k
4
5 cos ) 1 ( 4
cos ) 0 ( )
x
k x
13
k x
k x
Các biểu thức này dẫn chúng ta đến lu đồ bớm cuối cùng trình bày ở hình 13.6.
Để rút ra tín hiệu đầu ra của lu đồ FCT chúng ta cần quay trở lại Cho ví dụ, từ biểu thức (13.21) và (13.15) chúng ta có thể viết:
Trang 3012(0) x
12(1)
Y
12(0) Y
12(1)
1
C4-1
x
13(0) x
13(1)
Y
13(0) Y
13(1)
1
C4-1
x
10(0) x
X(0) X(4) 2X(2) X(6)+X(2) 2X(1) X(5)+X(3) 2(X(3)+X(1)) X(7)+X(5)+X(3)+
0 4 2 6 1 5 3 7
Trang 31Hình 13.8 Tín hiệu ra sau dịch chuyển bít.
Hình 13.9 Bớc cộng truy hồi.
Tơng tự, chúng ta có thể rút ra từ các biểu thức (13.32) đến (13.34) và (13.15) các biểu thức dới đây:
X(5)+X(3) X(6)+X(2) X(7)+X(5)+X(3)+X(1)
0 1 2 3 4 5 6 7
-1
21212
X(1)
X(2)
X(3) X(4)
Trang 32Vì vậy, tín hiệu ra từ các bớc cuối cùng của các thao tác bớm có thể tính dới dạng các hệ số của FCT nh trong hình 13.7 Nếu chúng ta sắp xếp lại vị trí của các giá trị bít dùng dịch chuyển bít, chúng ta rút ra tín hiệu ra nh hình (13.8) Sau đó,các tín hiệu ra này có thể đợc dùng để rut ra FCT nh hình (13.9) Bớc cuối cùng này gọi là
bớc cộng truy hồi.
Có rất nhiều bớc (các thao tác bớm, dịch chuyển bít, và cộng truy hồi) bây giờ có thể nằm trong một bớc trong hình 13.10 Từ sơ đồ này, chơng trình FCT có thể phát triển Chơng trình này dùng các thuật toán phát triển cho FFT Chơng trình dùng một bảng tra cứu để chứa các giá trị cosin, một bảng cho dịch chuyển bit Chi tiết của ch-
ơng trình này để lại cho ngời dùng nh một bài tập.
Bài tập13.5
1 Phát triển lu đồ cho DCT 16 và 32 điểm.
2 Sử dụng logic tơng tự đã đợc dùng cho việc phát triển chơng trình FFT, để viết một thuật toán cho FCT.
2-D FCT của một dãy 2-D thực đợc cho bởi
(13.4 7)
Thuật toán cho 2-D FCT có thể phát triển dùng phơng pháp hàng-cột bình thờng
nh thuật toán 2-D FFT Chơng trình 13.5 rút ra biến đổi FCT của các khối ngời dùng
tự xác định kích thớc, thông thờng là 8 ì 8 hoặc là 16 ì 16, bằng các chia nhỏ các khối của ảnh.
ảnh đợc giả sử là có chiều dài bằng chiều rộng với cac chiều là bội của 2 Chơng trình sử dụng thuật toán 1-D FCT và tận dụng các bảng tra cứu (LUT) nh các trạng thái trớc.
Chơng trình 13.5 “FCT2D.C“ 2-D FCT các khối ảnh (ngời dùng tự xác định kích thớc)
/*Program 13.5 "FCT2D.C" 2-D FCT of image blocks (user-pecified).*//* This program is for carrying out
2-D Fast Cosine Transform of blocks
subdividing a given image Block size is
void FCT(float *, unsigned int *, float *, int , int );
void bit_reversal(unsigned int *, int , int );
void WTS(float *,int , int );
1 1 2
1 1
0 2 2 1 2
1
2
2 1
) 1 2 ( cos 2
) 1 2 ( cos ) , (
N n
k k
N
k n N
k n n
n x N
k
k
Trang 34-1 -1 -1
-1
-1 -1
-1 -1 -1
-1
-1 -1 -1 -1
C4
C4
C4
C4
X(7)
X(3) X(4) X(5) X(6)
2C
9 16
2C
13
2C
Trang 35Hình 13.10 Biểu đồ chuyển đổi cosin nhanh.
void FCT(float *x, unsigned int *L,
float *C, int m, int N){
Trang 37N k
k
N
n k k
X n
= k cho 1
0
= k cho 2
1
k
ε
Thay vì lập lại cả một chơng trình để tính biến đổi ngợc FCT, chúng ta sẽ dùng lu
đồ của FCT tiến (forward) Để rút ra FCT ngợc, tất cả các việc mà chúng ta cần làm
là đảo ngợc biểu đồ ở hình 13.10 Hình 13.11 giới thiệu phép biến đổi ngợc của một bớm Kết quả của thuật toán biến đổi ngợc của lu đồ FCT cho trong hình 13.12 Từ l-
u đồ của hình 13.11 biến đổi ngợc của FCT có thể phát triển bình thờng từ FCT tiến Chơng trình tính 2-D FCT ngợc cho trong chơng trình 13.6 Giá trị của khối ảnh gốc phải đợc cho trớc bởi ngời dùng.
Hình 13.11 Phép đổi ngợc của một bớm.
89
1/2CX
0.5 A
B
C
-1 A=C+D
13
1
C
9 16
1
C
0.
5 -1
-1 -1
-1 -1
-1 -1
5 16
1
C
4 2
1
C
4 2
1
C
4 2
(1) x~
(2) x~
(3) x~
(4) x~
(6) x~
(7) x~
X(5
Trang 38Hình 13.12 Biểu đồ đảo ngợc giải thuật FCT.
Chơng trình 13.6 "IFCT2D.C" Đảo ngợc FCT Kích thớc khối sử dụng trên
ảnh gốc.
/*Program 13.6 "IFCT2D.C" Inverse FCT Block size used on the original image should be known to the user.*/
/* This program is for carrying out
the inverse of the 2-D Fast Cosine Transform */
void IFCT(float *, unsigned int *, float *, int , int );
void bit_reversal(unsigned int *, int , int );
void WTSINV(float *,int, int);
printf ( "This program is for the inverse 2-D FCT \n" ) ;
printf ( "Enter name of input file ->") ;
Trang 39printf("\nTransform image must have dimensions");
printf(" which are multiples of 2 \n ");