Tim hieu mo hinh nen anh su dung bien doi wavelet

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮTDCT Biến đổi Cosine rời rạc Discrete Cosine Transform DPCM Điều xung mã vi sai Differized Pulse Code Modulation DWT Biến đổi Wavelet rời rạc Discret

Trang 1

thông tin, Khoa Công nghệ thông tin Đại học Thái Nguyên đã nhiệt tình giảng dạy và hết lòng giúp đỡ em trong quá trình học tập và nghiên cứu đề tài.

Luận văn được hoàn thành tại Khoa Công nghệ thông tin dưới sự hướng

dẫn của PGS.TS Ngô Quốc Tạo Em xin bày tỏ lòng kính trọng và biết ơn

sâu sắc tới thầy.

Em cũng xin chân thành cảm ơn các bạn đồng nghiệp phòng Khảo thí & Đảm bảo chất lượng trường Đại học Hải Phòng đã tạo điều kiện giúp đỡ trong quá trình hoàn thành luận văn này.

Sự quan tâm, giúp đỡ của gia đình và bạn bè, đặc biệt lớp Cao học K7 Khoa Công nghệ thông tin đã cổ vũ, động viên em trong suốt thời gian học tập và thực hiện đề tài.

Mặc dù có nhiều cố gắng song luận văn không thể tránh khỏi những thiếu sót, em mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn Xin chân thành cảm ơn!

Thái Nguyên, tháng 11 năm 2010

Học viên

Phạm Nghĩa Luân

Trang 3

Tôi xin cam đoan luận văn “Tìm hiểu mô hình nén ảnh sử dụng biến đổi WAVELET” là do tôi tự tìm hiểu và được hoàn thành dưới sự hướng dẫn

của thầy giáo PGS TS Ngô Quốc Tạo

Trang 4

MỤC LỤC

Trang

Trang phụ bìa

Trang nhiệm vụ

Mục lục i

Danh mục các ký hiệu, các chữ viết tắt iii

Danh mục các bảng iv

Danh mục các hình vẽ, đồ thị v

MỞ ĐẦU 1

Chương 1 3

TỔNG QUAN VỀ BIẾN ĐỔI WAVELET 3

1.1 Tại sao sử dụng biến đổi Wavelet ? 3

1.2 Mã hoá băng con (Subband coding) 4

1.3 Biến đổi Wavelet (Wavelet transform) 7

1.3.1 Biến đổi Wavelet rời rạc (Discrete Wavelet transform – DWT) 9

1.3.2 Biểu diễn đa phân giải (Multiresolution) 10

1.3.3 Biến đổi Wavelet và các bộ lọc 14

1.3.4 Hệ thống biến đổi Wavelet nhiều chiều 15

1.3.5 Thiết kế bộ lọc Wavelet 16

1.4 Tính chất của biến đổi Wavelet 21

1.5 Một số ứng dụng nổi bật của Wavelet 22

1.5.1 Nén tín hiệu 22

1.5.2 Lọc nhiễu 22

1.5.3 Phát hiện biên 22

Chương 2 23

MỘT SỐ DẠNG CỦA BIẾN ĐỔI WAVELET 23

2.1 Biến đổi Wavelet Haar 23

2.2 Biến đổi Wavelet Meyer 24

2.3 Biến đổi Wavelet Daubechies 25

Chương 3 27

BIẾN ĐỔI WAVELET TRONG NÉN ẢNH 27

Trang 5

3.1 Tổng quan về nén ảnh 27

3.1.1 Giới thiệu chung về nén ảnh 27

3.1.2 Phân loại các kỹ thuật nén 28

3.1.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh 29

3.2 Mã hóa của ảnh con Wavelet (Coding of the Wavelet subimages) 30

3.2.1 Lượng tử hóa xấp xỉ kế tiếp (Quantization by successive approximation) 31

3.2.2 Những điểm giống nhau giữa các băng tần 32

3.3 Thuật toán EZW (Embedded zero tree Wavelet algorithm) 34

3.3.1 Thuật toán 34

3.3.2 Phân tích thuật toán 36

3.4 Phương pháp mã hoá phân cấp theo vùng (Set partitioning in hierarchical trees - SPIHT) 38

3.5 Mã hoá nhúng khối với cắt xén tối ưu hóa (Embedded block coding with optimised truncation - EBCOT) 44

3.5.1 Lượng tử hoá mặt phẳng bit (Bit plane quantisation) 47

3.5.2 Điều kiện số học mã hóa của mặt phẳng bit (mã hóa bậc 1) 48

3.5.3 Mã hóa phân đoạn mặt phẳng bit (Fractional bit plane coding) 50

3.5.4 Sự hình thành tầng (layer) và tổ chức dòng bit (mã hoá bậc 2) 59

3.5.5 Điều chỉnh tỷ lệ (Rate control) 60

Chương 4 62

CHƯƠNG TRÌNH MINH HỌA 62

4.1 Nén ảnh sử dụng biến đổi Wavelet 62

KẾT LUẬN 65

TÀI LIỆU THAM KHẢO 66

Trang 6

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DCT Biến đổi Cosine rời rạc (Discrete Cosine Transform)

DPCM Điều xung mã vi sai (Differized Pulse Code Modulation)

DWT Biến đổi Wavelet rời rạc (Discrete Wavelet Transform)

EBCOT Mã hoá nhúng khối với cắt xén tối ưu hóa

(Embedded block coding with optimised truncation)

EZW Wavelet cây zero (Embedded Zerotree Wavelet)

IDWT Biến đổi Wavelet rời rạc ngược

JPEG Chuẩn nén ảnh của ủy ban JPEG quốc tế

(Joint Photographic Experts Group)

JPEG2000 Chuẩn nén ảnh JPEG2000

MRA Phân tích đa phân giải (Multi Resolution Analysis)

MSE Sai số bình phương trung bình (Mean Square Error)

PCM Điều xung mã (Pulse Code Modulation)

PCRD Tỷ lệ biến dạng nén (Post Compression Rate Distortion)

PSNR Tỷ số tín hiệu đỉnh trên nhiễu (Peak Signal to Noise Ratio)

QMF Lọc gương cầu tứ phương (Quardrature Mirror Filters)

RLC Mã hoá loạt dài (Run Length Coding)

ROI Kỹ thuật mã hóa ảnh theo vùng (Region Of Interest) –

Một tính năng mới nổi bật của JPEG2000SOT Cây định hướng không gian (Spatial Orientation Tree)

STFT Biến đổi Fourier thời gian ngắn

(Short Time FourierTransform)

Wavelet Biến đổi băng con Wavelet

Trang 7

DANH MỤC CÁC BẢNG

Bảng 1.1 Bộ lọc phân tích thông thấp và thông cao của bộ lọc song trực giao

số nguyên (5, 3) 18Bảng 1.2 Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 3) lọc song trực giao 19Bảng 1.3 Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 7) lọc song trực giao 19Bảng 3.1 Phân công chín bối cảnh dựa trên ý nghĩa khu vực lân cận 53

Trang 8

DANH MỤC CÁC HÌNH VẼ

Hình 1.1 Một dải của bộ lọc lấy dải 4

Hình 1.2 Hai dải của một bộ lọc phân tích 5

Hình 1.3 Hai dải của một bộ mã hoá / giải mã băng con 5

Hình 1.4a Sự tạo thành và phục hồi băng con thông thấp 6

Hình 1.4b Sự tạo thành và phục hồi băng con thông cao 7

Hình 1.5 Sự ảnh hưởng của các tham số lên sóng mẹ 8

Hình 1.6 Đa phân giải không gian 11

Hình 1.7 (a) Hàm tỷ lệ Haar (b) Wavelet Haar (c) Xấp xỉ của một hàm liên tục x(t) ở độ phân giải thô A0x(t) (d) Độ phân giải xấp xỉ cao A1x(t) 13

Hình 1.8 Một trong những giai đoạn biến đổi Wavelet 15

Hình 1.9 Biến đổi Wavelet nhiều dải mã hóa bằng cách sử dụng lặp đi lặp lại chia tách hai dải 16

Hình 1.10 (a) Bảy subimages tạo ra bởi các bộ mã hóa của hình 1.9 20

Hình 2.1 Hàm ψ (t ) của biến đổi Haar 23

Hình 2.2 Biến đổi Fourier của hàm tỉ lệ cho cở sở Meyer 24

Hình 2.3 Hàm ψ (t ) của biến đổi Meyer 25

Hình 2.4 Hàm ψ (t ) của họ biến đổi Daubechies n với n=2, 3, 7, 8 26

Hình 3.1 Sơ đồ khối một hệ thống nén ảnh điển hình Error! Bookmark not defined. Hình 3.2 Nguyên tắc của xấp xỉ kế tiếp 31

Hình 3.3 Cây tứ phân biểu diễn của các băng tần cùng một hướng 33

Hình 3.4 Cây không gian định hướng và thiết lập phân vùng trong SPIHT .40 Hình 3.5 Lượng tử hoá miền không thay đổi với kích thước bước Δb 47

Hình 3.6 Tám biểu tượng lân cận tức thời 49

Hình 3.7 Dải lấy mẫu thứ tự trong một khối mã 49

Trang 9

Hình 3.8 Tác động của thứ tự mã hoá phân đoạn mặt phẳng bit trong giảm

biến dạng 51

Hình 3.9 Tỷ lệ biến dạng với phân đoạn tối ưu 52

Hình 3.10 Một minh hoạ của mã hóa phân đoạn mặt phẳng bit 57

Hình 3.11 Hiệu suất nén của các thuật toán mã hóa Wavelet khác nhau 61

Hình 4.1 Lựa chọn file ảnh dạng bitmap 62

Hình 4.2 Kết quả sau khi nén sử dụng biến đổi Wavelet 63

Hình 4.3 Lựa chọn file giải nén 63

Hình 4.4 Kết quả sau khi giải nén 64

Trang 10

MỞ ĐẦU

Sự phân tích biến đổi Wavalet bắt đầu từ giữa những năm 80, vào thờiđiểm này chúng được phát triển để dò các tín hiệu địa chấn Tầm quan trọngcủa phép phân tích Wavelet duy trì trong phạm vi nhỏ, chủ yếu trong cộngđồng toán học vào cuối những năm 80 Ứng dụng của sự phân tích phép biếnđổi Wavelet trong khoa học và trong các công trình thực sự bắt đầu từ nhữngnăm đầu của thập niên 90

Biến đổi Wavelet (Wavelet transform) được cung cấp để đặc biệt dùngcho việc phân tích tín hiệu, nhất là những tín hiệu không theo chu kì, nhiễu,

gián đoạn, nhất thời, v.v Biến đổi Wavelet được dùng trong nhiều ứng dụng.

Trong xử lý ảnh, nó có thể được ứng dụng trong khử nhiễu, nén ảnh, phântích không gian tần của ảnh, v.v

Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet,việc tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin

và truyền thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết.Trong những năm gần đây, có rất nhiều phương pháp đã và đang được nghiêncứu rộng rãi để thực hiện nén ảnh Tất cả đều với một mục đích chung là làmthế nào để biểu diễn một ảnh với ít bit nhất để có thể tối thiểu hoá dung lượngkênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực củaảnh Điều này tương đương với việc biểu diễn ảnh có độ tin cậy cao nhất với

số bit nhỏ nhất

Đề tài này trình bày kỹ thuật nén ảnh và khử nhiễu sử dụng biến đổiWavelet cho ảnh tĩnh So với các kỹ thuật nén sử dụng phép biến đổi trướcđây như biến đổi Fourier (FT), biến đổi cosine rời rạc (DCT), v.v., biến đổiWavelet rời rạc (DWT) có nhiều ưu điểm không chỉ trong xử lý ảnh mà cònnhiều ứng dụng khác Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (dựatrên DWT) có tính năng vượt trội so với JPEG (dựa trên DCT)

Trang 11

Luận văn gồm có 4 chương với các nội dung sau:

Chương 1: Trình bày cơ sở toán học của phép biến đổi Wavelet, trong

đó đề cập đến mã hóa băng con, biến đổi Wavelet rời rạc với cách tiếp cậnphân tích đa phân giải Đề cập đến cách thiết kế bộ lọc Wavelet, trình bàynhững tích chất cơ bản của phép biến đổi Wavelet, đồng thời nêu ra một sốứng dụng nổi bật của Wavelet như nén tín hiệu, lọc nhiễu…

Chương 2: Chương này đã giới thiệu một số họ của biến đổi Wavelet.Đặc biệt họ Wavelet Daubechies - họ biến đổi Wavelet áp dụng trongJPEG2000

Chương 3: Trình bày cụ thể biến đổi Wavelet trong nén ảnh Trước hếttrình bày tổng quan về nén ảnh và các kỹ thuật nén ảnh, mã hóa Wavelet ảnhcon Giới thiệu các thuật toán như thuật toán EZW, SPIHT, mã hóa EBCOT

Chương 4: Chương trình minh họa

Luận văn đã đạt được một số kết quả nhưng cũng không tránh khỏi những saisót Rất mong nhận được sự đóng góp ý kiến của các thầy cô, bạn bè và cácbạn đồng nghiệp để đề tài được hoàn thiện hơn nữa

Trang 12

Chương 1 TỔNG QUAN VỀ BIẾN ĐỔI WAVELET 1.1 Tại sao sử dụng biến đổi Wavelet ?

Trước khi giới thiệu về biến đổi Wavelet và ứng dụng của nó trong nénảnh, có thể đặt ra 2 câu hỏi:

- Có điểm gì chưa hợp lý khi sử dụng DCT không? và tại sao sử dụngbiến đổi Wavelet?

- Nếu Wavelet là tốt hơn DCT, tại sao các phương pháp nén ảnh trướcđây (JPEG) không sử dụng?

Câu trả lời cho phần đầu tiên là như sau:

Biến đổi DCT và các biến đổi theo khối khác chia ảnh thành nhữngkhối không chồng nhau và xử lý mỗi khối riêng rẽ Để có được tỷ lệ bit thấp,các hệ số của biến đổi được lượng tử hóa, như vậy sẽ có một lỗi đáng kể khikhôi phục lại ảnh ban đầu Lỗi khi khôi phục này thấy rõ hơn tại biên của mỗikhối (vì các khối được biến đổi độc lập) Để khắc phục lỗi này, người ta còn

đề cập tới việc sử dụng khối chồng lên nhau (khối giả) Tuy nhiên, biến đổiWavelet là cách tiếp cận khác và đã dự kiến sẽ loại bỏ việc sử dụng khối giả

Câu trả lời cho phần thứ hai liên quan đến công nghệ được dùng chonén ảnh ở thập niên 1980, thời điểm một số phương pháp nén ảnh được giớithiệu (JPEG) Tại thời điểm này, mặc dù biến đổi Wavelet và mã hoá băngcon đã được biết đến, tuy nhiên, chưa có phương pháp mã hóa hiệu quả củabiến đổi Wavelet Trong thực tế, các kiến nghị về sử dụng biến đổi Waveletchưa được đề cập tới, do đó, biến đổi DCT được sử dụng trong nén ảnh

Tuy nhiên, sau sự ra đời của một số chuẩn nén JPEG, việc nghiên cứu

và sử dụng biến đổi Wavelet được đề cập tới Đặc biệt, sau khi Jussef Shapiro

giới thiệu Embedded zero tree Wavelet - EZW Trong chương này, chúng tôi

đề cập tới biến đổi Wavelet và sự hiệu quả của biến đổi này trong nén ảnh

Trang 13

1.2 Mã hoá băng con (Subband coding)

Trước khi xem xét biến đổi Wavelet, chúng ta tìm hiểu về mã hóa băngcon Về mặt hình dáng, biến đổi Wavelet và mã hóa băng con tương tự nhau.Tuy nhiên, mã hóa băng con là giải thuật, còn biến đổi Wavelet được giớithiệu dạng toán học

Mã hóa băng con lần đầu tiên được Crochiere giới thiệu vào năm 1976.Đây là kỹ thuật tốt cho nén tiếng nói và ảnh Nguyên tắc cơ bản của mã hóabăng con là chia phổ tín hiệu thành nhiều đoạn, sau đó mã hóa và truyền mỗiđoạn đó một cách độc lập Nguyên tắc này phù hợp với mã hóa hình ảnh Thứnhất, với ảnh số, phổ của chúng không đều, phần lớn năng lượng được tậptrung ở dải tần số thấp hơn Thứ hai, con người cảm nhận về nhiễu có xuhướng ở cả hai tần số cao và thấp và điều này cho phép các nhà thiết kế điềuchỉnh dạng nén theo tiêu chí thị giác Thứ ba, có thể chia nhỏ ảnh thành khối,cấu trúc khối không thay đổi, do đó có thể sử dụng bộ biến đổi sang khônggian tần như DCT

Trong mã hoá băng con, dải tần được tách bằng bộ lọc dải, minh họatrong hình 1.1 Bộ lọc được thiết kế dựa trên sự cảm nhận hình ảnh của mắtngười

Hình 1.1 Một dải của bộ lọc lấy dải

Trang 14

Với cách tiếp cận này, ảnh được chia thành nhiều khối nhỏ Các khốinày được lượng tử hóa, mã hóa và truyền đi Quá trình khôi phục ảnh đượcthực hiện khi nhận được các khối trên, thông qua bộ lọc tổng hợp Hình 1.2 là

Hình 1.3 Hai dải của một bộ mã hoá / giải mã băng con

Tại các bộ mã hóa, phép lấy mẫu giảm xuống 2 lần, phần còn lại được

sử dụng như trình tự ban đầu Hiệu quả của việc lấy mẫu xuống/ nén trên

Trang 15

miền tần số tăng gấp đôi chiều rộng của tất cả các thành phần trong mẫuquang phổ

Tại các bộ giải mã, lấy mẫu lên là một thủ tục bổ sung, bằng cách chènmột số số không vào giữa mỗi mẫu đầu vào, và coi như phần không gian mởrộng của các chuỗi đầu vào

Tuy nhiên, vấn đề khó khăn của phương pháp là khó xây dựng bộ lọc lýtưởng phân tích vị trí cắt hợp lý Điều này được thể hiện trong hình 1.4a Mộttín hiệu cho thấy mẫu gốc đã được bộ lọc lấy thông thấp để năng lượng một

số vẫn còn ở trên F s / 4, tần số cắt của bộ lọc lý tưởng cho các nhiệm vụ đề ra.

Lấy mẫu xuống nén tín hiệu và mở rộng để cung cấp cho B, và C là hình ảnh

sau khi giãn nở hoặc lấy mẫu lên Cũng như tại bội số của F s , quá trình này

tạo ra các thành phần phổ bổ sung tại bội số lẻ của F s / 2 Những sai số lấy

mẫu gây ra khi việc phục hồi phân giải cuối cùng diễn ra tại D

Hình 1.4a Sự tạo thành và phục hồi băng con thông thấp

Trang 16

Trong trường hợp thông cao, hình 1.4b, các hiện tượng tương tự xảy ra,

để phục hồi năng lượng sai số lấy mẫu trong khu vực của F s / 4 Những hình

ảnh đầu ra cuối cùng được tạo ra bằng cách thêm phần giải thông thấp hơn vàthông cao cho quá trình hình thành và phục hồi dữ liệu của bộ lọc có liênquan Năng lượng sai số lấy mẫu thường được dự kiến sẽ gây nhiễu

Hình 1.4b Sự tạo thành và phục hồi băng con thông cao

1.3 Biến đổi Wavelet (Wavelet transform)

Biến đổi Wavelet là một trường hợp đặc biệt của mã hoá băng con, biếnđổi này được sử dụng nhiều trong nén ảnh và video Mã hóa băng con cho ảnhđược dựa trên phân tích tần số, còn các biến đổi Wavelet được dựa trên lýthuyết xấp xỉ Tuy nhiên, để làm trơn cục bộ có thể mô hình hóa như đa thứctrên từng khúc Trong thực tế, Wavelet cung cấp một phương pháp hiệu quả

để xấp xỉ các hàm với một số lượng nhỏ các hàm cơ sở Về mặt toán học, một

Trang 17

biến đổi Wavelet của một hàm bình phương khả tích x (t) là khai triển nó

thành một tập các hàm cơ sở, như sau:

Trong đó Ψa, b (t) được gọi là hàm cơ sở, a là tham số co dãn, b là tham

số dịch Ψ (t) được gọi là sóng mẹ (mother Wavelet ) và được định nghĩa:

b

1

Ảnh hưởng của các tham số được thể hiện trong hình 1.5

Hình 1.5 Sự ảnh hưởng của các tham số lên sóng mẹ

Trong hình 1.5: (a) Wavelet mẹ Ψ (t) = Ψ1, 0 (t), a = 1, b = 0

(b) Wavelet Ψ1, b (t), a = 1, b ≠ 0

(c) Wavelet Ψ 2,0 (t) ở tỷ lệ a = 2, b = 0

(d) Wavelet Ψ 0.5,0 (t) ở tỷ lệ a = 1 / 2, b = 0

Với tham số a khác nhau, chiều rộng của các hàm cơ sở khác nhau Với

a lớn sẽ mở rộng phạm vi của hàm cơ sở trong miền thời gian và vì thế hẹp

hơn trong miền tần số Do đó nó cho phép thay đổi theo thời gian và độ phân

giải tần số (với sự cân bằng giữa cả hai) trong biến đổi Wavelet Tham số a là

Trang 18

thuộc tính của biến đổi Wavelet làm cho nó thích hợp với việc phân tích cáctín hiệu có kích cỡ đường biên khác nhau như trong hình ảnh tự nhiên

1.3.1 Biến đổi Wavelet rời rạc (Discrete Wavelet transform – DWT)

Như định nghĩa biến đổi Wavelet trong (1.11) ánh xạ tín hiệu một chiều

x (t) vào một hàm hai chiều X w (a, b) và những tín hiệu ban đầu có thể được phục hồi từ tính toán biến đổi Wavelet trên giá trị rời rạc của a và b a có thể

được thực hiện rời rạc bằng cách chọn a a0m , với a 0 > 1 và m là một số nguyên Tăng a lên, băng thông của các hàm cơ sở (hoặc độ phân giải tần số)

giảm và vì thế độ phân giải các ô là cần thiết hơn để bao phủ khu vực Tương

tự như vậy, làm rời rạc b tương ứng với mẫu trong thời gian (lấy mẫu tần số

phụ thuộc vào băng thông của tín hiệu được lấy mẫu đó lần lượt là tỷ lệ

nghịch với a), nó có thể được chọn b nb0a0m Đối với a 0 = 2 và b 0 = 1 có những sự lựa chọn của Ψ(t) sao cho hàm Ψ m, n (t) tạo thành một cơ sở trực

giao của không gian của các hàm bình phương khả tích Có nghĩa là bất kỳ

hàm bình phương khả tích x (t) có thể được biểu diễn như là một sự kết hợp

tuyến tính của hàm cơ sở như:

t t

m

Đáng lưu ý là cho mỗi lần tăng m, giá trị của a gấp đôi Tức là tăng gấp

đôi chiều rộng trong miền thời gian và giảm một nửa chiều rộng ở miền tần

số Điều này tương đương cho phân tích tín hiệu với băng con bát phân vàtương ứng với biến đổi Wavelet hai ngôi tương tự như trong hình 1.1, dùng để

mô tả các nguyên tắc cơ bản của mã hóa băng con, và do đó biến đổi Wavelet

là một loại mã hóa băng con

1.3.2 Biểu diễn đa phân giải (Multiresolution)

Trang 19

Áp dụng biến đổi Wavelet để mã hóa hình ảnh tốt hơn có thể được hiểu

với quan điểm của phân tích tín hiệu đa phân giải Giả sử có một hàm Φ (t) sao cho xác lập Φ (t - n), n  Z là trực giao Cũng giả sử Φ (t) là lời giải của

hai quy mô phương trình khác nhau:

Trong đó c n là hệ số giãn nở (expansion coefficient) và là hình chiếu

của x (t) vào Φ (t - n) Từ đó phép giãn của một hàm thay đổi độ phân giải của

nó, có thể biểu diễn cho x (t) tại các độ phân giải khác nhau bởi hệ số giãn nở

và hàm co Φ (t) Do đó x (t) tại bất kỳ độ phân giải m có thể được biểu như sau:

)2

(2

m

Nếu V m là không gian được tạo ra bởi 2 -m/2 Φ (2 -m t - n), sau đó từ 1.15,

Φ (t) là như vậy với bất kỳ i > j, các hàm tạo ra không gian V i cũng nằm trong

V j , tức là V i  V j (i> j) Vì vậy, không gian ở quy mô tiếp có thể được lồng nhau, như vậy V m cho m tăng có thể được xem như là không gian của độ phân giải giảm Do đó, một không gian ở độ phân giải thô V j-1 có thể được khaitriển thành hai không gian con (subspaces): một không gian ở độ phân giải tốt

hơn V j và một bù trực giao của V j , biểu diễn bởi W j sao cho V j + W j = V j-1

trong đó W jV j Không gian W j là không gian của sự khác biệt giữa thô và tỷ

lệ độ phân giải tốt hơn, có thể được xem như là lượng chi tiết thêm vào khi đi

từ một độ phân giải V j nhỏ hơn đến có độ phân giải lớn hơn V j-1 Việc phâncấp của không gian được mô tả trong hình 1.6

Trang 20

Hình 1.6 Đa phân giải không gian

Mallat đã chỉ ra rằng trong các cơ sở nói chung cho W j bao gồm trong

dịch và phép giãn của một hàm mẫu nguyên đơn Ψ (t), gọi là một Wavelet

Vì vậy, W m là không gian được tạo ra bởi Ψm, n (t) = 2 -m/2 Ψ (2 -m t - n) Wavelet

Ψ (t)  V _1 có thể được lấy từ Φ (t) như sau:

Hàm Φ (t) được gọi là hàm tỷ lệ (scaling function) của biểu diễn đa

phân giải Vì vậy, các hệ số của biến đổi Wavelet (1.14) tương ứng với phép

chiếu của x (t) vào một không gian chi tiết của độ phân giải m, W m Do đó,một biến đổi Wavelet về cơ bản là phân tích một tín hiệu vào không gian củacác độ phân giải khác nhau Dưới đây là một ví dụ về tính toán Wavelet Haarthông qua kỹ thuật này

1 0

1 )

Trang 21

Vì vậy, bằng cách sử dụng (1.19), Wavelet Haar có thể tìm thấy như sau:

1 1

2 1 0

1 ) (

t

t t

Hàm tỷ lệ Φ (t) (một một hàm rect) và Wavelet Haar tương ứng Ψ (t) ví

dụ này được thể hiện trong hình 1.7a và b Về quan điểm xấp xỉ, sự phân tích

đa phân giải có thể được giải thích như sau: Cho x (t) có thể xấp xỉ ở độ phân giải j bằng hàm A j x (t) qua loạt khai triển hàm trực giao cơ sở Từ W j biểu

diễn cho không gian của sự khác biệt giữa một tỷ lệ thô V j-1 và một tỷ lệ trơn

V j , sau đó D j x (t)  W j biểu diễn cho sự khác biệt của xấp xỉ của x (t) tại j-1

( )

(t A1x t A0x t D0x t

Hình 1.7c và d hiển thị xấp xỉ của một hàm liên tục tại hai độ phân giải

liên tiếp sử dụng một hàm tỷ lệ hình chữ nhật Một khối thô A 0 x (t) được hiển thị trong hình 1.7c và ở độ phân giải xấp xỉ cao A 1 x (t) trong hình 1.7d nơi mà

các hàm tỷ lệ là một phiên bản phóng rộng (giãn nở) của hàm hình chữ nhật

Trang 22

Đối với một hàm trơn x (t), phần lớn các biến thể (tín hiệu năng lượng) được chứa trong A 0 x (t), và D 0 x (t) là gần như bằng không Bằng cách lặp lại thủ tục này chia tách và phân vùng A 0 x (t) = A 1 x (t) + D 1 X (t), biến đổi Wavelet của tín hiệu x (t) có thể được lấy và do đó hàm gốc x (t) có thể được biểu diễn

về Wavelet của nó như là:

) ( )

(

) ( )

( )

(t D0x t D1x t D2x t D x t A x t

Trong đó n biểu diễn cho số phép khai triển Từ đó dải động của các tín hiệu chi tiết D j x (t) đều nhỏ hơn nhiều so với hàm ban đầu x (t), chúng được

dễ mã hơn hệ số trong dãy khai triển (1.13)

1.3.3 Biến đổi Wavelet và các bộ lọc

Đối với thủ tục chia tách lặp mô tả ở trên được thực hiện nên có một

thuật toán hiệu quả cho việc thu thập D j x (t) từ việc khai triển hệ số ban đầu của x (t) Một trong những hậu quả của phân vùng không gian đa phân giải là hàm tỷ lệ Φ (t) sở hữu một thuộc tính tương tự Nếu Φ (t) và (t) được phân

n t d

t

n t d

t

n t c

t

n t c

t

) 2 ( 2 )

(

) 2 ( 2 )

(

) 2 ( 2 )

(

) 2 ( 2 )

(

(1.21)

Những hệ thức truy hồi cung cấp cách tính toán các hệ số xấp xỉ của

x(t) ở độ phân giải j, A j x (t), và các hệ số của tín hiệu chi tiết D j x (t) từ các hệ

số xấp xỉ của x (t) tại một độ phân giải cao A j-1 x (t) Trong thực tế, thao tác

toán học đơn giản có thể chỉ ra rằng cả hai hệ số xấp xỉ tại một độ phân giảitốt hơn và hệ số chi tiết có thể đạt được bằng xoắn (convolving) các hệ số xấp

xỉ tại một độ phân giải thô với một bộ lọc và lấy mẫu xuống bởi hệ số 2 Đối

Trang 23

với một hệ số xấp xỉ độ phân giải thấp, bộ lọc là một bộ lọc thông thấp với

vòi (taps) h k =c -k , và cho các chi tiết lọc là một bộ lọc thông cao với vòi g k =d -k.Ngược lại, tín hiệu ở độ phân giải cao có thể được phục hồi từ xấp xỉ của nóvới độ phân giải thấp hơn và hệ số chi tiết của tín hiệu tương ứng Nó có thểđược thực hiện bởi lấy mẫu lên các hệ số của xấp xỉ với độ phân giải thấp hơn

và các hệ số chi tiết của một hệ số 2, xoắn (convolving) chúng với các bộ lọctổng hợp các vòi h  k c k và g  k d k tương ứng, và cộng chúng với nhau Mộtbước của quá trình chia tách và nghịch đảo được thể hiện trong hình 1.8, mà

là trong thực tế, giống như hình 1.3 cho băng con Vì vậy, quá trình lọc chiatách các tín hiệu vào thành các thành phần thông thấp và thông cao và từ đólàm tăng độ phân giải tần số của hệ số 2, nhưng lấy mẫu xuống làm giảm độphân giải theo thời gian (temporal) do yếu tố tương tự Do đó, tại mỗi bước kếtiếp, tần số có độ phân giải tốt hơn ở độ phân giải theo thời gian là đạt được

Hình 1.8 Một trong những giai đoạn biến đổi Wavelet

(a) phân tích (b) tổng hợp

1.3.4 Hệ thống biến đổi Wavelet nhiều chiều

Những biến đổi Wavelet đa chiều có thể thu được bằng cách mở rộngkhái niệm về cấu trúc bộ lọc hai băng hình 1.8 trong mỗi phân đoạn Ví dụ,phân tách một hình ảnh hai chiều có thể được thực hiện bằng cách thực hiệnphân tách một chiều theo hàng và sau đó theo cột

Một biến đổi Wavelet bảy dải mã hóa của loại này được minh họa tronghình 1.9, nơi chia tách dải được thực hiện luân phiên tại các hướng ngang vàdọc Trong hình, L và H biểu diễn cho các bộ lọc phân tích thông thấp và

Trang 24

thông cao với một lấy mẫu xuống 2:1, tương ứng Ở giai đoạn đầu tiên củaphân tách nhị tố (dyadic), ba ảnh con (subimages) với nội dung tần số caođược tạo ra Subimage LH1 thấp chủ yếu theo đường ngang, nhưng cao theođường dọc tần số chi tiết hình ảnh Đây là đảo ngược trong subimage HL1.Subimage HH1 cao ngang và cao dọc chi tiết hình ảnh Những chi tiết hìnhảnh ở một tần số thấp hơn được đại diện bởi các băng LH2, HL2 và HH2 tươngứng Dải LL2 là một hình ảnh lấy mẫu con thông thấp, là một bản sao của cáchình ảnh ban đầu, nhưng ở một kích thước nhỏ hơn.

Hình 1.9 Biến đổi Wavelet nhiều dải mã hóa bằng cách sử dụng lặp đi lặp lại

chia tách hai dải

1.3.5 Thiết kế bộ lọc Wavelet

Như chúng ta đã thấy trong phần 1.3.3, trong thực tế biến đổi Wavelet

có thể được thực hiện bởi một dãy các bộ lọc, tương tự như các băng con.Quan hệ giữa phân tích và tổng hợp của tỷ lệ và hàm Wavelet cũng làm theotrong các bộ lọc tổng hợp và phân tích các băng con Do đó ta có thể sử dụngcác khái niệm về các bộ lọc trong (1.7) để thiết kế bộ lọc Wavelet Tuy nhiên,nếu sử dụng bộ lọc sản phẩm như đã được sử dụng cho các băng con, ta

Trang 25

không đạt được bất cứ điều gì mới Nhưng, nếu chúng ta thêm một số ràngbuộc về bộ lọc sản phẩm, đó là thuộc tính của biến đổi Wavelet được duy trì,sau đó một bộ lọc Wavelet có thể được thiết kế

Một trong những ràng buộc bắt buộc phải được trình bày trong bộ lọc

sản phẩm P(z) là bộ lọc kết quả H 0 (z) và H 1 (z) là liên tục do yêu cầu của định

nghĩa Wavelet

Hơn nữa, đó là đôi khi mong muốn có Wavelet với số lượng lớn nhất

có thể dẫn xuất liên tục Đặc tính này trong điều kiện của biến đổi z có nghĩa

là bộ lọc Wavelet và hậu thức bộ lọc sản phẩm nên có các điểm 0 (zeros) tại

z= -1 Kích thước hệ số của số dẫn xuất hoặc số các điểm 0 tại z = -1 là được

đưa ra bởi tính đều đặn (tính quy luật) của Wavelet và cũng được gọi lànhững khoảnh số triệt tiêu Điều này có nghĩa là để có bộ lọc chuẩn (regular

filters), bộ lọc phải có đủ số điểm 0 tại z = -1, lớn hơn số lượng các điểm 0,

trực giao (biorthogonal filters) Trong bộ lọc song trực giao, phân tích thông

thấp và tổng hợp thông cao là trực giao với nhau và tương tự các phân tíchthông cao và tổng hợp thông thấp là trực giao với nhau, vì thế mà có tên bộlọc song trực giao Lưu ý rằng, trong các bộ lọc song trực giao, từ đó thôngthấp và thông cao của một trong hai bộ lọc phân tích hoặc tổng hợp có thể có

độ dài khác nhau, chúng không phải là bản thân trực giao với nhau

Vì vậy, cho một bộ lọc Wavelet có ít nhất n điểm 0 tại z = -1, ta chọn

bộ lọc sản phẩm được:

Trang 26

) ( ) 1 ( )



mà Q(z) có n không rõ hệ số Tùy thuộc vào sự lựa chọn của Q(z) và của

Wavelet đều đặn, ta có thể thiết kế một bộ lọc Wavelet như mong muốn Ví

dụ với:

n = 2 và Q(z) = -1 + 4z -1 - z -2

bộ lọc sản phẩm trở thành:

) 4

1 ( ) 1 ( )

và với một sự gán trọng số thích hợp cho trực chuẩn (orthonormality) và sau

đó phân tích, nó dẫn đến thiết đặt hai bộ (5, 3) và (4, 4) giàn bộ lọc của (1.10)

Hệ số gia trọng (weighting factor) được xác định từ (1.7) Các bộ lọc này đã

được xuất phát ban đầu cho băng con, nhưng như ta thấy chúng cũng có thểđược sử dụng cho Wavelet Bộ lọc đôi (5, 3) là bộ lọc được đề nghị cho mãhóa không tổn hao (lossless) trong JPEG 2000 Các hệ số của bộ lọc phân tíchcủa nó được cho trong bảng 1.1

Bảng 1.1 Bộ lọc phân tích thông thấp và thông cao của bộ lọc song trực giao

3

38 6

1 ( ) 1 ( ) (

6 3

38 6

1 ) ( 3

4 3 2

1 6

1

4 3 2 1

z z

P

z z z

z z

Q vµ n

(1.24)cặp (9,3) của bộ lọc Daubechies được đưa ra trong Bảng 1.2 Các giàn lọcđược đề nghị cho mã hóa ảnh tĩnh trong MPEG-4

Bảng 1.2 Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 3) lọc

song trực giao

Trang 27

Bảng 1.3 Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 7) lọc

Trang 28

Hình 1.10 (a) Bảy subimages tạo ra bởi các bộ mã hóa của hình 1.9

(b) Bố trí của các băng riêng lẻHình ảnh ban đầu (không được hiển thị) kích thước là 352 điểm ảnh bởi

240 dòng Băng 1-4, tại hai cấp độ của các phân khu, được 88 bởi 60, và băng5-7 là 176 bởi 120 điểm ảnh Tất cả các băng, nhưng băng 1 (LL2) đã đượckhuếch đại bởi một hệ số 4 và một độ lệch +128 để tăng cường khả năng hiểnthị các mức chi tiết thấp Phạm vi cho nén băng thông phát sinh chủ yếu là từcác mức năng lượng thấp xuất hiện trong subimages thông cao

Từ đó tại biên ảnh của tất cả các điểm ảnh đầu vào không có giá trị,một phần mở rộng của các kết cấu đối xứng đầu vào được thực hiện trước khi

áp dụng biến đổi Wavelet ở mỗi mức Các loại đối xứng mở rộng có thể khácnhau Ví dụ như trong MPEG-4, để đáp ứng các điều kiện xây dựng lại hoànhảo với Daubechies cặp bộ lọc phân tích (9, 3) tap, hai loại đối xứng mở rộngđược sử dụng

Loại A chỉ được sử dụng ở giai đoạn tổng hợp Nó được sử dụng ở giaiđoạn mép đuôi (trailing edge) của lọc thông thấp và mép trước (leading edge)của lọc thông cao Nếu các điểm ảnh tại biên của các đối tượng được biểu

diễn bởi abcde, sau đó mở rộng loại A trở thành edcba | abcde, nơi mà các

Trang 29

ký tự trong kiểu chữ đậm là những điểm ảnh trên bản gốc và chúng ở trongmặt trơn là những điểm ảnh mở rộng Lưu ý rằng trong một cặp bộ lọc phân

tích (9,3) của bảng 1.2, các cặp bộ lọc tổng hợp sẽ được (3, 9) với G 0 (z)=H 1 (-z)

và G 1 (z)= -H 0 (-z) , như đã được thể hiện trong (1.4)

Loại B là phần mở rộng được sử dụng cho cả mép trước và mép đuôicủa các bộ lọc phân tích thông thấp và thông cao Đối với các bộ lọc tổnghợp, nó được sử dụng tại mép trước của thông thấp, nhưng ở mép đuôi củathông cao Với loại mở rộng các điểm ảnh ở mép trước và trở thành mép đuôi

edcb | abcde và abcde | dcba, tương ứng.

1.4 Tính chất của biến đổi Wavelet

Tất cả chúng ta đều biết rằng biến đổi Fourier là một biến đổi đã và

đang được áp dụng rộng rãi trong nhiều ngành khoa học và kỹ thuật khác

nhau Biến đổi Fourier chuyển một hàm tín hiệu từ miền thời gian sang miền tần số Sử dụng biến đổi Fourier ta có thể biết được trong tín hiệu f (t) có các thành phần tần số nào Tuy nhiên biến đổi Fourier có một nhược điểm cơ bản

là với một tín hiệu f (t) ta không thể biết được rằng tại một thời điểm t thì tín

hiệu có các thành phần tần số nào Một phép biến đổi tốt hơn biến đổi Fourier

phải là phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại một thời điểm t bất kỳ trong tín hiệu f (t ) có thành phần tần

số nào Phép biến đổi Wavelet ra đời đã khắc phục được các nhược điểm của biến đổi Fourier trong phân tích tín hiệu Biến đổi Wavelet dù chỉ làm việc

với các tín hiệu một chiều (liên tục hoặc rời rạc) nhưng sau khi biến đổi xong

ta thu được một hàm số hai biến hoặc một tập các cặp giá trị W(a,b) minh họa các thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t Các giá trị W(a i ,b ) tạo thành một cột (i=1, 2, , n) cho biết một thành phần tần số có trong những thời điểm t nào và các giá trị W(a,b i ) tạo thành hàng cho biết tại một thời điểm t của tín hiệu f (t ) có các thành phần tần số nào

Trang 30

1.5 Một số ứng dụng nổi bật của Wavelet

Phần này chỉ nêu ra các lĩnh vực mang tính chất tổng quát các ứngdụng của Wavelet với tính chất giới thiệu và gợi mở

1.5.1 Nén tín hiệu

Do đặc điểm của mình, Wavelet đặc biệt tốt khi sử dụng để nén hayphân tích các tín hiệu không dừng, đặc biệt là tín hiệu ảnh số và các ứng dụngnén tiếng nói, nén dữ liệu

1.5.2 Lọc nhiễu

Tính chất của biến đổi Wavelet mà chúng ta đã xét tới trong phần ứngdụng cho nén tín hiệu được mở rộng bởi Iain Johnstone và David Donohostrong các ứng dụng khử nhiễu cho tín hiệu Phương pháp lọc nhiễu này đượcgọi là Wavelet Shrinkage Denoising (WSD)

1.5.3 Phát hiện biên

Biên của ảnh được có thể được định nghĩa một cách toán học như lànhững điểm khác biệt cục bộ Gần đây, biến đổi Fourier được xem là công cụtoán học chính để phân tích những điểm khác biệt này Tuy nhiên chuyển đổiFourier là toàn cục và không thích nghi tốt với những sự khác biệt cục bộ này.Thật là khó để tìm thấy vị trí và phân bố không gian của những điểm khácbiệt với biến đổi Fourier Wavelet là một phân tích cục bộ, nó thích ứng choviệc phân tích tín hiệu trong miền tần số - thời gian, cái mà cần thiết cho việcphát hiện những điểm biên

Chương 2 MỘT SỐ DẠNG CỦA BIẾN ĐỔI WAVELET 2.1 Biến đổi Wavelet Haar

Trang 31

Biến đổi Haar Wavelet là biến đổi đơn giản nhất trong các phép biếnđổi Wavelet Hình vẽ 1.7 cho thấy dạng của hàm ψ (t ) với biến đổi Haar Dotính chất đơn giản của biến đổi Haar mà nó được ứng dụng tương đối nhiềutrong nén ảnh, khi áp dụng biến đổi này để nén ảnh thì thuật toán nén ảnh trênmáy tính có một số điểm khác với công thức toán học của biến đổi Haar:

Hàm (t) là hàm thoả mãn điều kiện sau:

1 0 nÕu 1 )

Nếu chúng ta định nghĩa hàm  (t)   ( 2t)   ( 2t 1 ), chúng ta sẽ nhậnđược hàm sau:

1 2 / 1 nÕu 1

2 / 1 0 nÕu 1

( 2 )

Hàm Haar là hàm Wavelet cơ bản nhất

Hình 2.1 Hàm ψ (t ) của biến đổi Haar

2.2 Biến đổi Wavelet Meyer

Yves Meyer là một trong những nhà khoa học đã đặt nền móng chophép biến đổi Wavelet Phép biến đổi Wavelet mang tên Meyer cũng là phépbiến đổi thông dụng, biến đổi này có khả năng phân tích tín hiệu tốt hơn nhiều

so với biến đổi Haar

Trang 32

Yves Meyer cấu trúc cơ sở Wavelet trực giao như sau, đầu tiên địnhnghĩa chuyển đổi Fourier (  ) của hàm tỉ lệ (t) như sau:

3

4 3

2 nÕu 1

4

3 2 cos

3

2 nÕu

1 )

0 t nÕu 0

Trang 33

Hình 2.3 Hàm ψ (t ) của biến đổi Meyer

2.3 Biến đổi Wavelet Daubechies

Giống như Meyer, Daubechies cũng là một nhà khoa học có công lao tolớn trong việc nghiên cứu phát triển phép biến đổi Wavelet Biến đổiDaubechies là một trong những phép biến đổi phức tạp nhất trong biến đổiWavelet Họ biến đổi này được ứng dụng hết sức rộng rãi, biến đổi Wavelet

áp dụng trong JPEG2000 là một biến đổi trong họ biến đổi WaveletDaubechies

Chúng ta đã được biết biến đổi Wavelet Haar trong phần trên, đó chính

là họ Wavelet Daubechies chỉ với 2 hệ số tỉ lệ được gọi là D2 hay HaarWavelet

Dưới đây là một số hàm ψ(t) trong họ biến đổi Wavelet Daubechies:

Trang 34

Hình 2.4 Hàm ψ (t ) của họ biến đổi Daubechies n với n=2, 3, 7, 8

Trang 35

Chương 3 BIẾN ĐỔI WAVELET TRONG NÉN ẢNH 3.1 Tổng quan về nén ảnh

3.1.1 Giới thiệu chung về nén ảnh

Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý

dữ liệu đa phương tiện Mục đích là làm thế nào để lưu trữ bức ảnh dưới dạng

có kích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ yêu cầu số bít mã hoá

ít hơn so với bức ảnh gốc Nén ảnh thực hiện được là do một thực tế: thôngtin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, có tổ chức Do đó,nếu bóc tách được tính trật tự, cấu trúc đó thì sẽ biết được phần thông tin nàoquan trọng nhất trong bức ảnh để biểu diễn và truyền đi với số lượng bít íthơn so với ảnh gốc mà vẫn đảm bảo tính đầy đủ thông tin Ở phía thu, quátrình giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính xác so vớiảnh gốc nhưng vẫn thoả mãn chất lượng yêu cầu, đảm bảo đủ thông tin cần thiết

Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng cónhững tính chất như sau:

• Có sự tương quan dẫn đến dư thừa thông tin theo không gian: Trongphạm vi một bức ảnh hay một khung video tồn tại sự dư thừa đáng kể do mốitương quan giữa các điểm ảnh lân cận

• Có sự tương quan dẫn đến dư thừa thông tin theo phổ: Các dữ liệu thuđược từ các bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tương quan đáng

kể giữa các mẫu thu, đây chính là nguyên nhân dẫn đến dư thừa theo phổ

• Có sự tương quan dẫn đến dư thừa thông tin theo thời gian: Trongmột chuỗi ảnh video, tồn tại sự tương quan giữa các điểm ảnh của các khungvideo, điều này cho thấy có sự dư thừa thông tin theo thời gian

Trong hình 3.1, bộ mã hoá dữ liệu thực hiện quá trình nén bằng cáchgiảm kích thước dữ liệu ảnh gốc đến một mức phù hợp với việc lưu trữ và

Trang 36

truyền dẫn trên kênh Tỉ lệ bít đầu ra của bộ mã hoá được tính là số bít chomột mẫu (điểm ảnh) Bộ mã hoá kênh thực hiện việc chuyển đổi luồng bít đãđược nén thành dạng tín hiệu phù hợp cả cho việc lưu trữ và truyền dẫn,thường bộ mã hoá kênh sử dụng các kỹ thuật: mã hoá có độ dài thay đổi –RLC (Run Length Coding), mã hoá Huffman, mã hoá số học Bộ giải mã thựchiện quá trình ngược lại so với bộ mã hoá.

Trong các hệ thống nén, tỉ lệ nén chính là tham số quan trọng đánh giákhả năng nén của hệ thống, công thức được tính như sau:

Tỉ lệ nén = Kích thước dữ liệu gốc / Kích thước dữ liệu nén

Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn toàn bộ bức ảnh Đối với ảnh video, kích thước chính là số bít để biểu diễn một đoạn

khung hình video

3.1.2 Phân loại các kỹ thuật nén

Các kỹ thuật nén chủ yếu được phân loại như sau: nén tổn hao vàkhông tổn hao, mã hoá dự đoán và mã hoá dựa trên phép biến đổi, mã hoábăng con

3.1.2.1 Nén tổn hao và không tổn hao

Trong các kỹ thuật nén không tổn hao (losses compression), ảnh khôiphục giống hoàn toàn so với ảnh gốc Tuy nhiên, nén không tổn hao chỉ đạtđược hiệu quả nén rất nhỏ Trái lại, các kỹ thuật nén có tổn hao (lossycompression) có thể đạt được hiệu quả nén cao hơn rất nhiều mà ở điều kiệncảm nhận hình ảnh thông thường sự mất mát thông tin không cảm nhận được

và vì thế vẫn đảm bảo chất lượng ảnh Một số kỹ thuật nén có tổn hao gồm:điều xung mã vi sai – DPCM, điều xung mã – PCM, lượng tử hoá véctơ –

VQ, mã hoá biến đổi và băng con Ảnh khôi phục trong hệ thống nén có tổnhao luôn có sự suy giảm thông tin so với ảnh gốc bởi vì: phương pháp nénnày đã loại bỏ những thông tin dư thừa không cần thiết

Trang 37

3.1.2.2 Mã hoá dự đoán và mã hoá dựa trên phép biến đổi

Đối với mã hoá dự đoán (predictive coding) các giá trị mang thông tin

đã được gửi hay đang sẵn có sẽ được sử dụng để dự đoán các giá trị khác, vàchỉ mã hoá sự sai lệch giữa chúng Phương pháp này đơn giản và rất phù hợpvới việc khai thác các đặc tính cục bộ của bức ảnh Kỹ thuật DPCM chính làmột ví dụ điển hình của phương pháp này Trong khi đó, mã hoá dựa trênphép biến đổi (transform based coding) thì lại thực hiện như sau:

- Trước tiên thực hiện phép biến đổi với ảnh để chuyển sự biểu diễnảnh từ miền không gian sang một miền biểu diễn khác Các phép biến đổithường dùng là: DCT - biến đổi Cosine rời rạc, DWT - biến đổi Wavelet rờirạc, LT - biến đổi trồng (lapped)

- Tiếp đó thực hiện mã hoá đối với các hệ số biến đổi Phương phápnày có hiệu suất nén cao hơn rất nhiều so với phương pháp nén dự đoán bởi vìchính các phép biến đổi (sử dụng các thuộc tính nén năng lượng của mình) đãgói gọn toàn bộ năng lượng bức ảnh chỉ bằng một số ít các hệ số, số lớn các

hệ số còn lại ít có ý nghĩa hơn sẽ bị loại bỏ sau khi lượng tử hoá và như vậylượng dữ liệu phải truyền nhỏ đi rất nhiều Trong phương pháp mã hoá dựđoán, sai lệch giữa ảnh gốc và ảnh dự đoán vẫn có ý nghĩa (còn sử dụng ởbước tiếp theo) sau khi lượng tử hoá, chính điều này làm cho phương pháp mãhoá dự đoán có nhiều dữ liệu được truyền đi hơn so với phương pháp mã hoábiến đổi

3.1.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh

Để đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu racủa bộ mã hoá, người ta thường sử dụng hai tham số:

 Sai số bình phương trung bình – MSE (mean square error).

 Tỉ số tín hiệu trên nhiễu đỉnh – PSNR (peak to signal to noise ratio)

Định dạng
Số trang	74
Dung lượng	2,3 MB