1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu đánh giá hiệu quả các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

85 27 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 85
Dung lượng 5,06 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

TÊN ĐỀ TÀI: NGHIÊN CỨU ĐÁNH GIÁ HIỆU QUẢ CÁC PHÉP BIẾN ĐỔI ĐA TỈ LỆ VÀ ỨNG DỤNG TRONG XỬ LÝ ẢNH NHIỆM VỤ VÀ NỘI DUNG: Tìm hiểu, phân tích, nghiên cứu các giải thuật đa tỉ lệ Wavelets, R

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA

- -

LUẬN VĂN THẠC SĨ

NGHIÊN CỨU ĐÁNH GIÁ HIỆU QUẢ CÁC

PHÉP BIẾN ĐỔI ĐA TỈ LỆ VÀ ỨNG DỤNG

TRONG XỬ LÝ ẢNH

GVHD: PGS TS LÊ TIẾN THƯỜNG

TP HỒ CHÍ MINH, NĂM 2013

Trang 2

Thành phần Hội đồng đánh giá luận văn thạc sĩ bao gồm:

1 PGS TS LÊ TIẾN THƯỜNG

2 TS HOÀNG TRANG

3 TS VÕ TRUNG DŨNG

4 TS HOÀNG MINH TRÍ

5 TS VÕ NGUYÊN QUỐC BẢO

Xác nhận của Chủ Tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chửa

Trang 3

ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập -Tự do -Hạnh phúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ

I TÊN ĐỀ TÀI: NGHIÊN CỨU ĐÁNH GIÁ HIỆU QUẢ CÁC PHÉP BIẾN ĐỔI ĐA TỈ LỆ VÀ

ỨNG DỤNG TRONG XỬ LÝ ẢNH

NHIỆM VỤ VÀ NỘI DUNG: Tìm hiểu, phân tích, nghiên cứu các giải thuật đa tỉ lệ (Wavelets, Ridgelets, Curvelets, Contourlets) và xem xét một cách toàn diện các công trình liên quan đến ứng dụng vào xử lý ảnh: triệt nhiễu Nhờ đó có thể đưa ra một đánh giá chính xác về các công trình liên quan, tổng hợp và phát triển các ý tưởng để xây dựng phương pháp tương ứng cho việc xử lý ảnh được tốt và phù hợp cho từng loại ảnh Tiếp theo, luận văn sẽ thực hiện mô phỏng hệ thống được thiết kế bằng phần mềm MATLAB và so sánh kết quả với các phương pháp khác, nhằm đưa ra kết luận, đánh giá cũng như có hướng phát triển cho các công trình nghiên cứu tiếp theo

III NGÀY HOÀN THÀNH NHIỆM VỤ: 22/11/2013

IV CÁN BỘ HƯỚNG DẪN: PGS TS LÊ TIẾN THƯỜNG

Trang 4

LỜI CẢM ƠN -**** -

Trước tiên, tôi xin gửi lời cám ơn chân thành đến PGS.TS Lê Tiến

Thường vì đã cho tôi cơ hội được làm việc trong lĩnh vực xử lý ảnh, với

những hướng dẫn tận tình và đầy kinh nghiệm của thầy, cũng như những

lời động viên, khuyến khích tôi trong suốt quá trình thực hiện luận văn Sự

tận tình của thầy vừa là nguồn động lực vừa tạo cho chúng tôi sự ham

thích nghiên cứu khoa học Chúng tôi luôn trân trọng những hướng dẫn và

gợi ý rất chuyên môn, sự kiên nhẫn và đặc biệt là sự thân thiện của thầy

Kế đến, tôi cũng xin được tri ân quý thầy cô khoa Điện- Điện tử, đặc biệt

là Bộ môn Viễn thông đã vung đấp cho chúng tôi nền tảng kiến thức để có

thể thực hiện luận văn này

Trang 5

MỤC LỤC

NHIỆM VỤ LUẬN VĂN THẠC SĨ 3

LỜI CẢM ƠN 4

MỤC LỤC 5

DANH MỤC HÌNH 6

ABSTRACT 8

TÓM TẮT LUẬN VĂN 9

CHƯƠNG 0 ĐẶT VẤN ĐỀ 10

CHƯƠNG I CƠ SỞ LÝ THUYẾT 13

I Khái niệm cơ bản về xử lý ảnh 13

1 Ảnh và pixel: 13

2 Ảnh màu và các hệ màu: 14

3 Các loại định dạng ảnh 17

4 Kết luận 18

II Các phép biến đổi đa tỉ lệ 19

1 Biến đổi Wavelets 19

2 Biến đổi Ridgelets 25

3 Biến đổi Curvelets 37

4 Biến đổi Contourlets 49

5 So sánh đánh giá các phép biến đổi đa tỉ lệ trong xử lý ảnh 62

CHƯƠNG II ỨNG DỤNG CÁC PHÉP BIẾN ĐỔI ĐA TỈ LỆ VÀO XỬ LÝ ẢNH 64

I Wavelets 64

II Ridgelets 71

III Curvelets 73

IV Contourlets 76

V So sánh kết quả 78

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 82

TÀI LIỆU THAM KHẢO 84

Trang 6

DANH MỤC HÌNH

Hình 1 Một kết quả triệt nhiễu của nghiên cứu [19] a) Ảnh nhiễu và b) Ảnh triệt nhiễu sử dụng

Curvelets 11

Hình 2 Ảnh nhiễu và ảnh triệt nhiễu bằng Ridgelets bị hiện tượng “wrap-around” trong nghiên cứu [9] 11

Hình 3 Tọa độ hệ thống màu RGB 15

Hình 4 Hệ màu CMY và CMYK 15

Hình 5 Quan hệ giữa các hệ màu RGB và CMY 16

Hình 6 Mặt phẳng màu C b C r tại Y=0.5 16

Hình 7 Minh họa lưới dyadic với các giá trị của m và n 22

Hình 8 Hàm ( )t của biến đổi Haar 23

Hình 9 Hàm ( )t của biến đổi Meyer 23

Hình 10 Hàm ( )t của biến đổi Daubechies n với n=2,3,7,8 24

Hình 11 Ví dụ về xử lý ảnh bằng Wavelets: Triệt nhiễu a) ảnh gốc, b) ảnh nhiễu, c) ảnh triệt nhiễu bằng Wavelets 25

Hình 12 Biến đổi Ridgelet rời rạc 27

Hình 13 Ví dụ về lát cắt Fourier rời rạc với hệ số trung bình tốt nhất 35

Hình 14 Tập hợp tối ưu của các vector trung bình cho FRAT với kích thước p = 31 35

Hình 15 Các quá trình của phép biến đổi Curvelets thế hệ thứ nhất 38

Hình 16 Sơ đồ của phép biến đổi Curvelet First generation 38

Hình 17 Quá trình phân tích không gian trong mỗi băng con 39

Hình 18 Một hình được phân tách thành nhiều băng con khác nhau 41

Hình 19 Biến đổi Ridgelet là cốt lõi của biến đổi Curvelet 42

Hình 20 (a) Một Curvelet với bề rộng 2-j và chiều dài 2-j/2 và (b) một số Curvelet ở độ giãn là 2 và những hướng khác nhau 43

Hình 21 Curvelet ở những tỉ lệ khác nhau (a, b, c, d, e, f) trong một hướng được chỉ ra trong miền không gian và miền tần số với bên trái và bên phải tương ứng 46

Hình 22 Các Curvelet sẽ lấp đầy không gian bởi những cái nêm (phần được bôi đen) ở trong miền tần số 47

Hình 23 Wrapping Curvelet ở miền tần số bằng các cửa sổ hình chữ nhật như trên 47

Hình 24 Các bước của quá trình biến đổi Curvelet based Wrapping 48

Hình 25 Mô hình cấu trúc của phép biến đổi Contourlets 51

Hình 26 Vẽ đường cong bằng Wavelets và bằng Contourlets 51

Hình 27 Bộ lọc Laplace Pyramids và bộ lọc Directional Filter Bank 52

Hình 28 Quá trình phân tích ảnh 53

Hình 29 Bộ lọc tổng hợp tín hiệu 53

Hình 30 Mặt phẳng chia miền tần số theo các hướng 54

Hình 31 Bộ lọc hai kênh quincunx 54

Hình 32 Phép toán Shearing ảnh 55

Hình 33 Cấu trúc cây của DFB chia ảnh làm các hướng 55

Hình 34 (a) Các không gian con đa tỉ lệ và đa hướng được tạo ra bởi cấu trúc Contourlets (b) lưới nhúng của không gian con ( ) , j l j k W 56

Hình 35 Biên ảnh khôi phục trơn hơn so với Wavelets 57

Hình 36 Mô hình chia 4 và chia 8 hướng dùng Contourlets 57

Trang 7

Hình 37 Cấu trúc phân tích hình cây của Contourlet 57

Hình 38 Ví dụ về biến đổi Contourlets 58

Hình 39 Bộ lọc không lấy mẫu băng con hai kênh 60

Hình 40 Tháp không lấy mẫu con 60

Hình 41 Mặt phẳng miền tần số được phân tích 61

Hình 42 Băng lọc có hướng không lấy mẫu con 61

Hình 43 Đáp ứng tần số của hai bộ lọc sau khi đã lấy mẫu lên 61

Hình 44 Ví dụ 4 hướng miền tần số 62

Hình 45 Contourlet không lấy mẫu con 62

Hình 46 Biến đổi DWT 2 mức 65

Hình 47 Ngưỡng cứng và ngưỡng mềm 66

Hình 48 Ảnh gốc và ảnh nhiễu 67

Hình 49 Các hệ số nhiễu và hệ số ngưỡng 67

Hình 50 Ảnh nhiễu và ảnh triệt nhiễu cứng (Giap_general) SNR=19.4 68

Hình 51 Ảnh nhiễu và ảnh triệt nhiễu cứng (dhbk) SNR=19.6 68

Hình 52 Ảnh nhiễu và ảnh triệt nhiễu cứng (cameraman) SNR=22.1 68

Hình 53 Ảnh nhiễu và ảnh triệt nhiễu cứng (Barbara) SNR=18.5 68

Hình 54 Các giá trị SNR của triệt nhiễu cứng ứng với các giá trị mức ngưỡng T 69

Hình 55 Các giá trị PSNR của triệt nhiễu cứng ứng với các giá trị mức ngưỡng T 69

Hình 56 Ảnh nhiễu và ảnh triệt nhiễu mềm (Giap_general) SNR=19.8 70

Hình 57 Ảnh nhiễu và ảnh triệt nhiễu mềm (dhbk) SNR=20.4 70

Hình 58 Ảnh nhiễu và ảnh triệt nhiễu mềm (cameraman) SNR=22.7 70

Hình 59 Ảnh nhiễu và ảnh triệt nhiễu mềm (Barbara) SNR=19.7 70

Hình 60 Các giá trị SNR của triệt nhiễu mềm ứng với các giá trị mức ngưỡng T 71

Hình 61 Các giá trị PSNR của triệt nhiễu mềm ứng với các giá trị mức ngưỡng T 71

Hình 62 So sánh các giải thuật triệt nhiễu với ảnh 257 x 257 72

Hình 63 Ridgelets và hiện tượng “bọc-quanh” (wrap-around) 73

Hình 64 Ảnh triệt nhiễu bằng Curvelets (Giap_general) SNR=22.3 74

Hình 65 Ảnh triệt nhiễu bằng Curvelets (dhbk) SNR=20.6 74

Hình 66 Ảnh triệt nhiễu bằng Curvelets (cameraman) SNR=24.3 74

Hình 67 Ảnh triệt nhiễu bằng Curvelets (Barbara) SNR=21.1 75

Hình 68 Các giá trị SNR của triệt nhiễu bằng Curvelets ứng với các giá trị mức ngưỡng 75

Hình 69 Các giá trị PSNR của triệt nhiễu bằng Curvelets ứng với các giá trị mức ngưỡng 76

Hình 70 Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (Giap_general) SNR=19.2 76

Hình 71 Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (dhbk) SNR=22.2 76

Hình 72 Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (cameraman) SNR=22 77

Hình 73 Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (Barbara) SNR=17.8 77

Hình 74 Các giá trị SNR của triệt nhiễu bằng Contourlets ứng với các giá trị mức ngưỡng 77

Hình 75 Các giá trị PSNR của triệt nhiễu bằng Contourlets ứng với các giá trị mức ngưỡng 78

Hình 76 So sánh giá trị SNR, PSNR và thời gian xử lý của các giải thuật triệt nhiễu 78

Hình 77 So sánh tỉ số SNR của các giải thuật 79

Hình 78 So sánh tỉ số PSNR của các giải thuật 79

Hình 79 So sánh khả năng xử lý đường cong của các phép biến đổi trên ảnh Giap_general: a) Wavelets ngưỡng cứng, b) Wavelets ngưỡng mềm, c) Curvelets, d) Contourlets 80

Trang 8

The multiscale transforms have long been applied in digital signal processing due to their advantages such as: the ability to analyze the frequencies at a point of time (space), the ability to handle the curves Although there are many related researches, but there is no research to be able to evaluate and synthesize the results and effectiveness of the mutiscale transforms, include Wavelets, Ridgelets, Curvelets, Contourlets in image processing In this thesis, in turn the multiscale transforms and related research in image processing will be researched Then getting the core elements of image processing using multiscale transforms, building the corresponding ideas for a good image processing and suitable for each kind of images

Các phép biến đổi đa tỉ lệ từ lâu đã được áp dụng rất nhiều vào trong xử lý số tín hiệu nhờ các ưu điểm của chúng như: khả năng phân tích tần số tại một điểm thời gian (không gian), khả năng xử lý các đường cong Mặc dù đã có rất nhiều các công trình liên quan, nhưng vẫn chưa có một công trình nào có khả năng đánh giá và tổng hợp các kết quả cũng như tính hiệu quả của các phương pháp biến đổi đa tỉ lệ, bao gồm Wavelets, Ridgelets, Curvelets, Contourlets trong xử lý ảnh Trong luận văn này, tôi thực hiện việc lần lượt nghiên cứu các phép biến đổi đa tỉ lệ và các công trình liên quan trong xử lý ảnh Nhờ đó rút ra được các yếu tố cốt lõi trong xử lý ảnh bằng các phép biến đổi đa tỉ lệ, xây dựng ý tưởng tương ứng cho việc xử lý ảnh được tốt và phù hợp cho từng loại ảnh

Trang 9

TÓM TẮT LUẬN VĂN

Trong những năm gần đây, cùng với sự phát triển như vũ bão của khoa học công nghệ, kỹ thuật xử

lý ảnh cũng đạt được những tiến bộ vượt bậc Trước đây phép biến đổi Fourier được sử dụng một cách rộng rãi, nhưng nó cũng có một nhược điểm cơ bản, đó là ta không thể biết được rằng tại một điểm a thì có các thành phần tần số nào Một phép biến đổi tốt hơn biến đổi Fourier phải là phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại điểm a bất kỳ trong ảnh có thành phần tần số nào Phép biến đổi Wavelets ra đời đã khắc phục được các nhược điểm của biến đổi Fourier trong phân tích tín hiệu Biến đổi Wavelets dù chỉ làm việc với các tín hiệu một chiều (liên tục hoặc rời rạc) nhưng có thể cho ta một hàm số hai biến hoặc một tập các cặp giá trị W (a,b) minh họa các thành phần tần số khác nhau tại điểm t Tuy vậy, biến đổi wavelets cũng thể hiện các hạn chế khi phân tích các đặc điểm cong tồn tại phổ biến trong ảnh Nguyên nhân

là vì các hệ số của biến đổi wavelets hai chiều chỉ chứa thông tin vị trí ở các tỉ lệ khác nhau, và hoàn toàn không có thông tin biểu diễn hướng hay góc Nghĩa là các hệ số wavelets không thể xác định được quan hệ thể hiện là một đoạn thẳng hay đoạn cong Các giải thuật đa tỉ lệ khác là Ridgelets, Curvelets và Contourlets sẽ giải quyết được vấn đề này

Luận văn này sẽ tập trung vào hai vấn đề chính, đó là tìm hiểu, phân tích, nghiên cứu các giải thuật

đa tỉ lệ (Wavelets, Ridgelets, Curvelets, Contourlets) và xem xét một cách toàn diện các công trình liên quan đến ứng dụng vào xử lý ảnh: triệt nhiễu Nhờ đó có thể đưa ra một đánh giá chính xác về các công trình liên quan, tổng hợp và phát triển các ý tưởng để xây dựng phương pháp tương ứng cho việc xử lý ảnh được tốt và phù hợp cho từng loại ảnh Tiếp theo, luận văn sẽ thực hiện mô phỏng hệ thống được thiết kế bằng phần mềm MATLAB và so sánh kết quả với các phương pháp khác Cuối cùng là kết luận và hướng phát triển đề tài

Trang 10

CHƯƠNG 0 ĐẶT VẤN ĐỀ

Trong những năm gần đây, cùng với sự phát triển của mạng dữ liệu trên nền internet, nhu cầu chia

sẻ ảnh cũng ngày càng phát triển Cùng với nhu cầu đó, vấn đề đặt ra là làm thế nào tìm được một

kỹ thuật xử lý ảnh tốt, có khả năng xử lý tốt mọi loại ảnh cũng ngày càng cấp thiết

Mục đích của luận văn là trình bày một số kỹ thuật xử lý ảnh phổ biến hiện nay Đó là các phép biến đổi Wavelets, Ridgelets, Curvelets, Contourlets Mỗi phép biến đổi có một ưu, nhược riêng

Trước đây, biến đổi Wavelets được giới thiệu như sự cải tiến của biến đổi Fourier và ngày càng được ứng dụng rộng rãi trong nhiều lĩnh vực [10] Lý do chính là dữ liệu biến đổi Wavelets biểu diễn được thông tin trong cả miền tần số và không gian (trong khi biến đổi Fourier chỉ thể hiện trong miền tần số) nhờ vào xây dựng thông tin tần số xuất hiện ở các tỉ lệ và vị trí khác nhau[3], [22]

Tiêu biểu các công trình nghiên cứu ở nước ngoài về Wavelets như của tác giả Daubechies [2] hay [6] với những nền tảng chung về Wavelets Hay của tác giả J.-L.Starck [1], [5] và tác giả D.L Donoho [23], [24], [25], [26] trình bày về ứng dụng của Wavelets vào xử lý ảnh Tuy vậy, biến đổi wavelets cũng thể hiện các hạn chế khi phân tích các đặc điểm cong tồn tại phổ biến trong ảnh [17] Nguyên nhân là vì các hệ số của biến đổi wavelets hai chiều chỉ chứa thông tin vị trí ở các tỉ

lệ khác nhau, và hoàn toàn không có thông tin biểu diễn hướng hay góc

Chính vì lý do này, một loạt các phép biến đổi khác được phát triển nhằm khắc phục nhược điểm này như phép biến đổi Ridgelets, Contourlets hay Curvelets Ở nước ngoài, rất nhiều nghiên cứu

đã được đưa ra dựa trên các phép biến đổi này như của tác giả J.-L Starck [4] hay Minh N Do và Martin Vetterli [7], [8], [9], [20], [21] hoặc [11]… Còn ở Việt Nam thì một loạt các công trình nghiên cứu của PGS.TS Lê Tiến Thường và các cộng sự trong thời gian gần đây [28], [29, [30]

Một trong những phép biến đổi mới được đưa ra là Ridgelets, được giới thiệu bởi Candes và Donoho [27], [12], [13] và họ đã chứng tỏ được khả năng xử lý có hiệu quả của giải thuật này với các thành phần cạnh Theo sau là một loạt các nghiên cứu của J.-L Starck [4], Minh N Do, and Martin Vetterli [9] và nhiều tác giả khác [14], [15], [16] Biến đổi này có thể trình bày một cách có hiệu quả ba thông số: tỉ lệ, vị trí và hướng của ảnh [11] Tuy nhiên biến đổi này lại vấp phải một vấn đề, đó là bị hiện tượng “wrap-around” [9]

Một trong những phép biến đổi tiếp theo đạt được những thành công nhất định là phép biến đổi Curvelets với một loạt các nghiên cứu mạnh mẽ cả trong và ngoài nước Ở ngoài nước là các nghiên cứu của các tác giả J.-L Starck [4], [19] và trong nước là các tác giả Hoàng Anh Ngọ,

Trang 11

Nguyễn Ngọc Hải [18] và đặc biệt là các nghiên cứu gần đây của PGS.TS Lê Tiến Thường và các cộng sự [28], [30] đã thể hiện khả năng xử lý tốt của phép biến đổi này, đây là một phép biến đổi đầy tiềm năng

Hình 1 Một kết quả triệt nhiễu của nghiên cứu [19] a) Ảnh nhiễu và b) Ảnh triệt

nhiễu sử dụng Curvelets

Hình 2 Ảnh nhiễu và ảnh triệt nhiễu bằng Ridgelets bị hiện tượng “wrap-around”

trong nghiên cứu [9]

Một phép biến đổi khác là Contourlets cũng được nghiên cứu mạnh mẽ trong thời gian gần đây

Trang 12

như của các tác giả Minh N Do và Martin Vetterli [20], [21], PGS.TS Lê Tiến Thường và các cộng sự [29] Đây cũng là một phép biến đổi hứa hẹn trong tương lai

Tuy nhiên từ trước đến nay vẫn chưa có một tài liệu nào có đánh giá cụ thể và so sánh khả năng xử

lý ảnh của các phép biến đổi này Luận văn sẽ dùng kết quả thực nghiệm của một ứng dụng xử lý ảnh cơ bản, đó là triệt nhiễu, để đánh giá hiệu quả xử lý của các phép biến đổi Thông số đánh giá

là SNR, PSNR và hiệu ứng thị giác Đặc biệt luận văn sẽ có đánh giá khả năng xử lý đường cong của mỗi phép biến đổi, đây là vấn đề mà phép biến đổi Wavelets xử lý không tốt Ngoài ra, luận văn còn đánh giá thời gian xử lý của mỗi phép biến đổi, qua đó thể hiện được hiệu suất tiêu tốn tài nguyên của các phép biến đổi Thông qua các kết quả thực nghiệm thu được, luận văn sẽ có đánh giá khả năng xử lý của mỗi phép biến đổi Điều này hứa hẹn sẽ đem lại một cái nhìn tổng quát và giúp người đọc có đánh giá của riêng mình mỗi khi lựa chọn một phép biến đổi nào để ứng dụng trong xử lý ảnh

Trang 13

CHƯƠNG I CƠ SỞ LÝ THUYẾT

Trong những năm 80 của thế kỷ trước, biến đổi wavelets được giới thiệu như sự cải tiến của biến đổi Fourier và ngày càng được ứng dụng rộng rãi trong nhiều lĩnh vực Lý do chính là dữ liệu biến đổi wavelets biểu diễn được thông tin trong cả miền tần số và không gian (trong khi biến đổi Fourier chỉ thể hiện trong miền tần số) nhờ vào xây dựng thông tin tần số xuất hiện ở các tỉ lệ và vị trí khác nhau Trong xử lý ảnh, khái niệm đa tỉ lệ đóng góp rất nhiều vào các kỹ thuật phân rã hay phân tích ảnh như Wavelets, Ridgelets ta có thể nhận xét là các thông tin ảnh xuất hiện ở một số tỉ

lệ nhất định là khác nhau Nhận xét này có thể quan sát được ở lĩnh vực bản đồ, trong đó một số chi tiết chỉ xuất hiện ở tỉ lệ nhỏ, nhưng không xuất hiện ở tỉ lệ lớn và ngược lại Hoặc trong ảnh sinh học, chúng ta có thể khai thác và phân tích thông tin ở mức độ phân tử hay tế bào Từ nhận xét trên,

ta thấy kỹ thuật đa tỉ lệ rất thích hợp trong các bài toán phân tích hình ảnh ở các tỉ lệ khác nhau Đặc biệt phương pháp dựa trên biến đổi đa tỉ lệ tỏ ra rất thích hợp khi chất lượng ảnh không tốt

I Khái niệm cơ bản về xử lý ảnh

Chương này nêu lên các khái niệm cơ bản trong lĩnh vực xử lý ảnh như ảnh số, pixel, hệ màu, các định dạng ảnh,…Xử lý ảnh hiện nay đã trở nên phổ biến, do đó các khái niệm này không quá

Trong đó ( , )i x y : : hàm số biểu thị giá trị của nguồn sáng tác động lên cảm biến, hay nơi

thu nhận ảnh

0i x y( , ) 

r(x,y) : hàm số biểu thị độ phản chiếu của vật thể với nguồn sáng lên cảm biến

0r x y( , ) 1 : giá trị 0 nghĩa là nguồn sáng bị hấp thụ hoàn toàn, trong khi giá trị 1 nghĩa

là nguồn sáng hoàn toàn xuyên qua vật đến cảm biến

Trang 14

2 Ảnh màu và các hệ màu:

Một hệ thống màu là một hệ thống mà mỗi điểm trong đó được tương ứng duy nhất với một màu Các hệ thống màu khác nhau sẽ được định hướng theo phần cứng (màn hình màu hoặc máy in) hoặc phụ thuộc vào ứng dụng

Các hệ màu cơ bản đối với xử lý ảnh là RGB, CMY/CMYK, YUV

Phần này sẽ nêu tóm lược về các hệ thống màu này

Trang 15

Hình 3 Tọa độ hệ thống màu RGB

Màu black là cơ bản, nằm ở gốc tọa độ, còn màu White nằm ở góc xa nhất so với gốc tọa

độ Các mức xám được đề cập ở phần 1.2 thuộc đường thẳng nối liền giữa hai điểm black

và white

Mỗi điểm màu khác nhau trong khối lập phương được định nghĩa bằng vector từ nó đến gốc tọa độ, và là sự kết hợp của ba màu cơ bản R, G, B Các giá trị của màu R, G, B được chuẩn hóa giá trị trong khoảng [0,1]

Số bit dùng để biểu diễn một pixel được gọi là độ sâu của điểm ảnh (pixel depth) Giả sử mỗi điểm thành phần R, G, B được mã hóa bằng 8 bit thì ta nói hệ màu RGB có độ sâu là

24 (24=8x3) Các ảnh dùng hệ màu này thường được gọi là full-color image Số lượng màu tổng cộng là (28)3 = 224=16777216 màu

Hệ màu RGB là hệ màu thường dùng trong màn hình màu

1.4 Hệ màu CMY/CMYK:

Hệ màu CMY sử dụng các màu Cyan, Magenta và Yellow làm ba màu cơ bản Các loại máy in thường sử dụng hệ màu này Sự chuyển đổi giữa 2 hệ màu RGB và CMY là:

111

Trang 16

Hình 5 Quan hệ giữa các hệ màu RGB và CMY

Người ta sử dụng hệ màu CMYK để tạo một hệ màu tối hơn (K biểu thị màu đen)

1.5 Hệ màu YUV (YCbCr):

Hệ màu này được dùng đầu tiên cho video hệ PAL analog, tuy nhiên bây giờ nó được dùng cho chuẩn CCIR 601 của video số Nó tách riêng thành phần độ sáng từ thông tin về màu sắc và thành phần độ sáng được mã hóa trong Y thành hai thành phần màu blue-difference (Cb) và red-difference (Cr)

Trang 17

3 Các loại định dạng ảnh

3.1 BMP

BMP hay còn gọi là bitmap là một dạng tập tin hình ảnh phổ biến Đặc điểm nổi bật của định dạng này là ảnh không bị nén bởi bất kỳ một thuật toán nào Do đó thông thường, ảnh bitmap có dung lượng lớn hơn so với các định dạng khác

Cấu trúc của ảnh BMP gồm:

Bitmap header (14 bytes): giúp nhận dạng file ảnh bitmap

Bitmap information (40 bytes): chứa các thông tin cơ bản về ảnh như số bit/pixel, kích

thước, vị trí bắt đầu vùng data ảnh, v.v…

Color palette: định nghĩa các màu được sử dụng trong ảnh

Bitmap data: lưu dữ liệu ảnh

hệ số nén lớn Tuy nhiên, đối với hình ảnh có chất lượng màu cao như “High color” thì việc mất mát dữ liệu là không đáng kể File ảnh nén JPEG thường được lưu trữ dưới định dạng file JFIF (JPEG File Interchange Format) Gần như tất cả các camera số có thể lưu ảnh dưới dạng JPEG, có hỗ trợ 8 bit mỗi màu (3 màu 24 bit tổng cộng)

JPEG 2000 là một chuẩn nén ảnh cho phép cả nén không tổn hao và nén tổn hao Phương pháp nén ảnh ở JPEG 2000 khác so với JPEG/JFIF; nó cải thiện chất lượng ảnh và hệ số nén, nhưng bù lại yêu cầu nhiều phép tính toán hơn JPEG 2000 cũng thêm vào các tính năng bị thiếu trong JPEG JPEG 2000 không phổ biến như JPEG, nhưng nó được sử dụng rất nhiều trong các chương trình chỉnh sửa phim chuyên nghiệp

3.4 Exif

Exif (Exchangeable image file format) là một chuẩn định dạng file giống với định dạng JFIF với sự mở rộng TIFF; nó được kết hợp trong phần mềm tạo file JPEG có trong nhiều camera Mục đích của nó là để ghi lại và chuẩn hóa việc trao đổi dữ liệu hình ảnh giữa

Trang 18

máy ảnh số và phần mềm chỉnh sửa ảnh Dữ liệu được ghi lại bao gồm các thiết lập camera, ngày giờ, tốc độ màn sập (shutter), thông tin màu sắc, kích cỡ ảnh,…

3.6 RAW

Định dạng RAW là một trong những tùy chọn trong các máy ảnh số Định dạng này thường sử dụng thuật toán nén ảnh không tổn hao, và tạo ra ảnh có dung lượng nhỏ hơn nhiều so với định dạng TIFF Mặc dù có một tiêu chuẩn của định dạng file raw (ISO 12234-2, TIFF/EP), các định dạng raw được sử dụng bởi nhiều camera không được chuẩn

hóa, mỗi camera khác nhau sẽ cho một định dạng raw khác nhau

3.7 PNG

PNG (Portable Network Graphics) là định dạng tập tin hình ảnh cũng có đặc điểm là nén không tổn hao, được ra đời với mục đích tạo nên một chuẩn mực mới cho ảnh sử dụng trong đồ họa web, cải thiện và thay thế ảnh GIF

3.8 PPM/PGM/PBM/PNM

Họ định dạng Netpbm bao gồm định dạng PPM (Portable Pixmap), PGM (Portable Graymap) và PBM (Portable bitmap) Các định dạng này là thuần túy ASCII hoặc là tập tin nhị phân raw với header ASCII, cung cấp các chức năng cơ bản chuyển đổi mặt phẳng điểm ảnh (pixmap), mặt phẳng độ xám (graymap) và mặt phẳng bit (bitmap) giữa các nền tảng (platform) khác nhau Một vài ứng dụng xem các định dạng này một cách chung, gọi

là PNM (Portable Any Map)

3.9 WEBP

Định dạng WebP là định dạng hình ảnh mới, sử dụng thuật toán nén tổn hao Định dạng này được thiết kế bởi Google để giảm kích cỡ file nhằm mục đích tăng tốc độ load trang web Mục đích chính của WebP là thay thế JPEG để trở thành định dạng chính của hình ảnh trên các trang web

4 Kết luận

Chương 1 đã cung cấp một số kiến thức cơ bản về xử lý ảnh, về pixel (điểm ảnh), các hệ màu

Trang 19

và các định dạng ảnh khác nhau trên máy tính Đây là những kiến thức căn bản để bước vào

bộ môn xử lý ảnh

II Các phép biến đổi đa tỉ lệ

1 Biến đổi Wavelets

1.1 Biến đổi Wavelets liên tục (CWT)

Biến đổi Wavelets liên tục (Continuous Wavelets Transform - CWT) của một hàm f(t) được bắt đầu từ một hàm Wavelets mẹ (mother Wavelet) ψ (t ) Hàm Wavelets mẹ ψ (t )

có thể là bất kỳ một hàm số thực hoặc phức liên tục nào thoả mãn các tính chất sau đây: Tích phân suy rộng trên toàn bộ trục t của hàm ψ (t ) là bằng 0 Tức là:

Điều kiện (1.8) có nghĩa là hàm ψ (t ) phải là một hàm bình phương khả tích nghĩa là hàm

ψ (t ) thuộc không gian L2

(R) các hàm bình phương khả tích

Sau khi hàm Wavelets ψ (t ) được lựa chọn, biến đổi Wavelets liên tục của một hàm bình phương khả tích f (t ) được tính theo công thức:

*1W( , b)a f t( ) t b dt

a a

1( )

a b

t

a a

     

chúng ta có thể viết được:

,W( , b)af t( )a b( )t dt



Theo toán học ta gọi đây là tích vô hướng của hai hàm f (t ) và a b, ( )t

Trang 20

t t

a a

    

điều đó cho thấy rằng a là tham số tỷ lệ

Khi a >1 thì hàm Wavelets sẽ được trải rộng còn khi 0 < a <1 thì hàm sẽ được co lại Sau đây chúng ta sẽ định nghĩa phép biến đổi ngược của biến đổi Wavelets liên tục Gọi Ψ(ω )

là biến đổi Fourier của ψ (t ):

hai hàm f (t ) và a b, ( )t Các hàng của ma trận tương ứng với các giá trị của a và các cột tương ứng với các giá trị của b do cách tính biến đổi Wavelets theo tích vô hướng đã trình

Trang 21

1.2 Biến đổi Wavelets rời rạc (DWT)

Việc tính toán các hệ số Wavelets tại tất cả các tỉ lệ là một công việc hết sức phức tạp Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ Để giảm thiểu công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành tính toán Hơn nữa nếu việc tính toán được tiến hành tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số 2 thì kết quả thu được sẽ hiệu quả và chính xác hơn rất nhiều Quá trình chọn các tỷ lệ và các

vị trí để tính toán như trên tạo thành lưới nhị tố (dyadic) Một phân tích như trên hoàn toàn

có thể thực hiện được nhờ biến đổi Wavelets rời rạc (DWT) Do đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelets liên tục (CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau:

Trang 22

cơ bản là với một tín hiệu f (t ) ta không thể biết được rằng tại một thời điểm t thì tín hiệu có các thành phần tần số nào Một phép biến đổi tốt hơn biến đổi Fourier phải là phép biến đổi

có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại một thời điểm t bất kỳ trong tín hiệu f(t ) có thành phần tần số nào Phép biến đổi Wavelets ra đời đã khắc phục được các nhược điểm của biến đổi Fourier trong phân tích tín hiệu Biến đổi Wavelets

dù chỉ làm việc với các tín hiệu một chiều (liên tục hoặc rời rạc) nhưng sau khi biến đổi xong ta thu được một hàm số hai biến hoặc một tập các cặp giá trị W(a,b) minh họa các thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t Các giá trị W(ai,b) tạo thành một cột (i=1, 2, , n) cho biết một thành phần tần số có trong những thời điểm t nào và các giá trị W(ai,b) tạo thành hàng cho biết tại một thời điểm t của tín hiệu f(t ) có các thành phần tần số nào

Hình 7 Minh họa lưới dyadic với các giá trị của m và n

Được nghiên cứu từ trước những năm 80 của thế kỷ trước và cũng đã được ứng dụng trong một số ngành khoa học và công nghệ khác nhau nhưng biến đổi Wavelets vẫn là một lĩnh vực đang và sẽ tiếp tục được nghiên cứu và phát triển cũng như ứng dụng rộng rãi hơn nữa Tham số b trong biến đổi Wavelets cho biết khoảng dịch của hàm Wavelets mẹ và độ phân giải các tần số khác nhau của f(t ) được minh họa bởi hệ số tỷ lệ chính là a Biến đổi Wavelets ngày càng được áp dụng rộng rãi đặc biệt là trong xử lý tiếng nói, xử lý ảnh số Tín hiệu tiếng nói là tín hiệu một chiều nhưng do đặc điểm của tiếng nói là tín hiệu không dừng nên việc sử dụng Fourier là không đủ để phân tích một cách đầy đủ các đặc trưng của tiếng nói Khác với tín hiệu tiếng nói, xử lý tín hiệu ảnh số là xử lý tín hiệu hai chiều và do đặc điểm của ảnh số là bao giờ cũng có tính định hướng và tính định vị Tính định hướng của một ảnh nghĩa là trong ảnh bao giờ cũng có một số ít các thành phần tần số nhưng các

Trang 23

thành phần tần số này trải rộng trên toàn bộ không gian ảnh còn tính định vị của ảnh chính

là tính chất biểu thị rằng tại một vùng của ảnh có thể có rất nhiều thành phần tần số Ảnh biểu thị tính định vị rõ nhất chính là ảnh có nhiều biên vùng phân tách rõ rệt, tại các đường biên bao giờ cũng có nhiều thành phần tần số khác nhau, còn hầu hết các ảnh có tông liên tục đều là những ảnh có tính định hướng

1.4 Giới thiệu một số họ wavelet

1.4.1 Biến đổi wavelets Haar

Biến đổi Haar Wavelets là biến đổi đơn giản nhất trong các phép biến đổi wavelets.Hình vẽ 1.2 cho thấy dạng của hàm ( )t với biến đổi Haar Do tính chất đơn giản của biến đổi Haar mà nó được ứng dụng tương đối nhiều trong nén ảnh, khi áp dụng biến đổi này để nén ảnh thì thuật toán nén ảnh trên máy tính có một số điểm khác với công thức toán học của biến đổi Haar:

Hình 8 Hàm ( )t của biến đổi Haar

1.4.2 Biến đổi wavelets Meyer

Yves Meyer là một trong những nhà khoa học đã đặt nền móng cho phép biến đổi

Wavelets.Phép biến đổi Wavelets mang tên Meyer cũng là một phép biến đổi thông dụng, biến đổi này có khả năng phân tích tín hiệu tốt hơn nhiều so với biến đổi Haar Dạng của hàm ( )t với biến đổi Meyer cho ở hình vẽ:

Hình 9 Hàm ( )t của biến đổi Meyer

Trang 24

1.4.3 Biến đổi wavelets Daubechies

Giống như Meyer, Daubechies cũng là một nhà khoa học có công lao to lớn trong việc nghiên cứu phát triển phép biến đổi Wavelets.Biến đổi Daubechies là một trong những phép biến đổi phức tạp nhất trong biến đổi Wavelets.Họ biến đổi này được ứng dụng hết sức rộng rãi, biến đổi Wavelets áp dụng trong JPEG2000 là một biến đổi trong họ biến đổi Wavelets Daubechies Dưới đây là một số hàm ψ(t) trong họ biến đổi Wavelets Daubechies (hình 8):

Hình 10 Hàm ( )t của biến đổi Daubechies n với n=2,3,7,8

Phép biến đổi wavelets là sự lựa chọn phổ biến để giải quyết nhiều vấn đề trong xử lý ảnh Tuy vậy, biến đổi wavelets cũng thể hiện các hạn chế khi phân tích các đặc điểm cong tồn tại phổ biến trong ảnh Nguyên nhân là vì các hệ số của biến đổi wavelets hai chiều chỉ chứa thông tin vị trí ở các tỉ lệ khác nhau, và hoàn toàn không có thông tin biểu diễn hướng hay góc

Các phép biến đổi Ridgelets và Curvelet đã được phát triển như là câu trả lời cho sự yếu kém của biến đổi wavelets trong việc xử lý các đường cong, góc cạnh…

Trang 25

(a) (b) (c)

Hình 11 Ví dụ về xử lý ảnh bằng Wavelets: Triệt nhiễu a) ảnh gốc, b) ảnh

nhiễu, c) ảnh triệt nhiễu bằng Wavelets

2 Biến đổi Ridgelets

Nhờ vào sự đơn giản của mình, nên biến đổi Wavelets đã được sử dụng rất nhiều trong xử lý ảnh Điều này được dựa trên sự thật rằng trong miền Wavelets, gần như toàn bộ thông tin ảnh được gói trong một số các hệ số Tuy nhiên, Wavelets lại không thể trình bày một cách có hiệu quả các điểm dọc theo các cạnh hoặc các đường thẳng Vì thế, có một vài giải thuật mới đã được phát triển dựa trên các biến đổi hai chiều với mong đợi sẽ nâng cao chất lượng xử lý ảnh hơn là các giải thuật truyền thống

Dựa trên xu hướng này, Candes và Donoho đã giới thiệu một giải thuật mới có tên là Ridgelets

và họ đã chứng tỏ được khả năng xử lý có hiệu quả của giải thuật này với các thành phần cạnh Biến đổi này có thể trình bày một cách có hiệu quả ba thông số: tỉ lệ, vị trí và hướng của ảnh

2.1 Biến đổi Ridgelets rời rạc

Cho ψ là hàm thoả mãn điều kiện :

a b

x x

a a

     

Trang 26

Trong đó, a>0 xác định tỉ lệ, - ∞ <b< + ∞ là giá trị xác định vị trí, và 0 ≤ θ< 2π xác định hướng

Cho một hàm hai biến khả tích f(x), các hệ số Ridgelets được định nghĩa:

2

, ,( , , ) ( ) ( )

điểm đặc biệt và sau đó áp dụng biến đổi wavelets.Biến đổi Radon tổng quát cho hàm f là

tập các tích phân đường được xác định bởi (θ,t) , trong đó θ  [0,2π), t R:

với δ là hàm xung Dirac Sau đso biến đổi Ridgelets chính là việc áp dụng của một biến đổi

wavelets 1 chiều trên từng lát cắt của biến đổi Radon Với mỗi lát cắt, góc θ giữ nguyên còn giá trị t thay đổi

Để so sánh với biến đổi wavelets hai chiều, xét công thức biến đổi wavelets trên hàm f như

a b

t

a a

    

 

Điều dễ nhận thấy là wavelets với tham số thể hiện một tọa độ điểm trong không gian hai chiều, vì vậy chỉ hiệu quả để phân tích các cực trị dạng điểm trong ảnh Tuy nhiên, yếu tố bất đẳng hướng không được xét đến ở mọi cấp phân giải Trong khi đó biến đổi Ridgelets với tham số biểu diễn độ dời và góc của đường thẳng sẽ hiệu quả khi phân tích đối tượng có cực trị nằm trên đường thẳng

Trang 27

Công thức biến đổi ngược của biến đổi Ridgelets được xác định

Hình 12 Biến đổi Ridgelet rời rạc

2.2 Biến đổi Ridgelets liên tục:

Trước tiên ta cần có khái niệm sơ lược về biến đổi Ridgelets liên tục – Continuos Ridgelets Transform (CRT) và tìm sự kết nối của nó với biến đổi Wavelets liên tục Cho một hàm hai biến khả tích f(x), CRT trong miền R2 có thể được định nghĩa:

Trang 28

Trong đó 1/2

     là biến đổi Wavelets một chiều

Biến đổi CRT xuất hiện tương tự như biến đổi CWT hai chiều ngoại trừ các hệ số điểm (b1,

b2) được thay thế bởi các hệ số đường (b,θ) Tóm tắt, các biến đổi hai chiều trên liên quan: Wavelets   scale, point-position

Ridgelets   scale, line-position

Ta có thể kết luận: Phân tích Wavelets rất hiệu quả trong việc trình bày các đối tượng đặc trưng bởi các điểm cá biệt, phân tích Ridgelets hiệu quả trong việc trình bày các đối tượng đặc trưng bởi các đường Thật ra, ta có thể xem biến đổi Ridgelets như các ghép các biến đổi Wavelets một chiều dọc theo các đường

Trong biến đổi hai chiều, các điểm và các đường liên quan đến nhau thông qua biến đổi Radon, nghĩa là biến đổi Wavelets và biến đổi Ridgelets thì được kết nối với nhau thông qua biến đổi Radon Công thức cho biến đổi Radon là:

2.3 Biến đổi Radon hữu hạn

Như đã đề nghị từ phần trước, một biến đổi Ridgelets thời gian rời rạc có thể đạt được bằng cách sử dụng một biến đổi Radon thời gian rời rạc Việc rời rạc hóa của biến đổi Radon có thể được xấp xỉ dựa vào công thức liên tục Tuy nhiên trong phần luận văn này, ta không sử dụng chúng như là biến đổi ngược cho ảnh số

Trang 29

Biến đổi Radon hữu hạn ( Finite Radon Transform – FRAT) được xác định như là tổng của các điểm ảnh trên một tập hợp các đường – line Các đường này được định nghĩa như một dạng hình học hữu hạn tương tự như cách mà các đường cho biến đổi Radon liên tục trong hình học Euclidean Kí hiệu Zp={0,1….,p-1}, trong đó p là số nguyên tố Lưu ý là Zp là một trường hữu hạn

FRAT của một hàm f thực trên lưới hữu hạn Z được định nghĩa như là: p2

Trong hình học Euclidean, đường Lk,l trong vùng affine Z là được trình bày một cách duy p2

nhất bởi độ dốc và hướng k ( k=p tương ứng với các đường ngang hoặc chéo hữu hạn) và

điểm chặn l của nó Ta có thể kiểm tra rằng có p2+p đường được định nghĩa theo cách này

và mọi đường đều chứa p điểm Thêm nữa, bất kỳ hai điểm phân biệt nào trong miền Z 2p

đều chỉ trong một đường Nghĩa là, hai đường thẳng không song song chỉ cắt nhau tại một điểm Cho một độ dốc bất kỳ, có p đường thẳng song song có khả năng bao phủ hoàn toàn miền Z2p Nghĩa là:

Phương trình trên chỉ ra một cách rõ rang khả năng dự trữ của FRAT Trong mỗi hướng, chỉ

có p-1 các hệ số FRAT độc lập Các hệ số này trong p+1 hướng với các giá trị trung bình chiếm tổng cộng (p+1)(p-1)+1=p2 các hệ số độc lập trong miền Radon hữu hạn

Trong miền analog với các trường hợp liên tục, finite back-projection (FBP) được định

nghĩa là tổng các hệ số Radon của tất cả các đường đi qua điểm cho trước, ví dụ:

k l P

Trang 30

Trong đó Pi,j kí hiệu tập hợp các chỉ số của tất cả các đường đi qua điểm (i,j), Chính xác hơn, ta có thể viết lại:

i j

Pk l l  j ki (mod ), p kZp} {( , )}  p i (1.38) Công thức FBP ở trên được định nghĩa trong tính toán FRAT ngược Lưu ý rằng các ma trận biến đổi cho FRAT và FBP hoán vị lẫn nhau Nói cách khác, các không gian con của các

hàm trung bình bằng không được định nghĩa trong Z , thì FRAT là một khung chặt chẽ ( 2p

tight frame)

Cả hai công thức biến đổi thuận và nghịch của FRAT đều đòi hỏi các phép cộng p3 và các phép nhân p2 Có một cách thực hiện một cách nhanh chóng cho FRAT, ta bỏ qua các pixel của ảnh gốc và sử dụng biểu đồ p: một cho mỗi hệ số FRAT của ảnh

Đối với mỗi tập hợp A, đặt δA cho hàm thuộc tính của A Sau đó, ta có thể viết các hàm cơ bản cho FRAT như { p1/2Lk l, : 0   k p , 0   l p } Các thuộc tính đã đề cập trước đây của đường thẳng trong hình học Z : 2p

m n i      p , tiếp cận đến đúng góc của p lớn (large) Do vậy ta

có thể nói Radon hữu hạn thì gần như là trực giao

2.4 Biến đổi Ridgelets hữu hạn trực giao

Bây giờ với một biến đổi FRAT khả nghịch, ta có thể đạt được một biến đổi Ridgelets rời rạc khả nghịch bằng cách thực hiện một biến đổi Wavelets rời rạc trên mỗi vector, còn được

gọi là một projection, (rk[0], rk[1],…,rk[p-1]), của các hệ số Radon mà tại đó hướng k là cố

định Kết quả có thể được gọi là biến đổi Ridgelets hữu hạn ( Finite Ridgelets Transform –

FRIT) Bởi vì tính chất tuần hoàn của các hệ số FRAT cho mỗi hướng, biến đổi Wavelets tuần hoàn được chọn và sẽ được giả định trong phần tiếp theo

Lưu ý rằng FRAT thì dư và không trực giao Trong phần tiếp theo ta sẽ thể hiện điều này bằng cách thực hiện biến đổi DWT một chiều trên các phép chiếu của FRAT theo một cách đặc biệt, ta có thể loại bỏ được sự dư thừa này và đạt được một phép biến đổi trực giao

Trang 31

Giả sử rẳng DWT được thực hiện theo một bộ lọc – bank cấu trúc cây trực giao với J trạng thái, trong đó G0 và G1 là các bộ lọc tổng hợp thông thấp và thông cao tương ứng Tập hợp các hàm {g1(j)[n-2jm], g0(J)[n-2jm]}, j=1…J và n,m ∈Z là các cơ sở trực giao của các chuỗi Wavelets rời rạc Trong đó G(j) là các bộ lọc tương đương ở mức j Các hàm cơ sở từ g0(J)

được gọi là các hàm tỉ lệ, các hàm khác gọi là hàm Wavelets Thông thường, bộ lọc G1 được thiết kế để thỏa mãn điều kiện băng cao, G1(z)|z=1=0 Vì thế mỗi hàm cơ sở Wavelets có tổng bằng không

Đối với một thiết lập cơ bản, giả sử rằng ta có một tập hợp của (p+1) biến đổi trực giao một chiều trên Rp

1

w [l]

k l p

Trang 32

hiệu là 0 Vậy là ta đã hoàn thành việc chứng minh kết quả sau

Định lý 4.2: Cho một tập cơ sở trực giao p + 1 trong miền l2

(Zp): { ( )

wm k , m∈ Zp}, 0≤k≤p và thỏa mãn điều kiện Z, ta có:

Trang 33

hệ số tỉ lệ Khi DWT được thực hiện trên tối đa các mức có thể, tất cả các hệ số tỉ lệ còn lại

ở các hình chiếu khác nhau là như nhau, kết quả là ta có loại bỏ tất cả, chỉ cần giữ lại một trong số chúng Kết quả ta được biến đổi FRIT trực giao

 Kết quả nói trên đã được chứng minh với những thiết lập cơ bản nơi mà những biến đổi khác nhau có thể được ứng dụng trên những hình chiếu FRAT khác nhau Điều này cho phép chúng ta sử dụng các cơ sở thích nghi, như là các gói Wavelets, trên mỗi phép chiếu một cách độc lập Thêm vào đó, bởi vì hiệu ứng “ bọc xung quanh” ( wrap around) của FRAT, các hình chiếu của nó có thể có các thành phần tuần hoàn, do đó đối với một vài hình chiếu ta có thể sử dụng một biến đổi loại Fourier như DCT Lưu ý rằng nếu ta thực hiện biến đổi Fourier một chiều trên tất cả các hình chiếu FRAT thì ta sẽ đạt được biến đổi Fourier hai chiều

2.5 Bậc tối ưu của các hệ số Radon hữu hạn

Cách cơ bản nhất của định nghĩa đường trong miền 2

Đây là trong miền analog với công thức đường x cos +x sin - t=0 1  2  trong miền R2 Vì thế với đường được định nghĩa như công thức ở trên, (a,b) là các vector thông thường hữu hạn của nó và t là hệ số dịch của nó Lưu ý rằng tất cả các phương trình liên quan đến thông

số đường thì liên quan đến miền hữu hạn Zp

Xem xét phương trình sau để liên hệ giữa công thức FRAT thông thường và công thức ở trên:

0

Nếu b≠0 và theo công thức trên  -1 -1

j = - b ai + b t, trong đó b-1

ký hiệu cho bội số ngược

của b trong miền hữu hạn Zp Đối với trường hợp b = 0, thì a ≠ 0, công thức trên thành:

LL đối với trường hợp b=0, t=al

Trang 34

Thêm vào đó, có thể kiểm tra một cách dễ dàng rằng đối với c ∈ Zp , c≠0 thì {cl : l ∈ Zp}=

Zp Vì vậy đối với một vector trung bình cố định (a,b), tập hợp các đường

Thuyết lát cắt chiếu rời rạc cho FRAT: Biến đổi DFT 1 chiều Ra,b [w] của một phép chiếu FRAT r a,b [t] thì giống như biến đổi DFT 2 chiều F[u,v] của f(i,j) được ước lượng dọc theo lát cắt rời rạc theo hướng (a,b):

Ta có thể thấy được vai trò của các vector trung bình (ak,bk) trong FRAT Đối với trường hợp các lát chiếu, các vector trung bình được chọn (a, b) cho các hướng riêng biệt điều khiển bật các hệ số trong các lát cắt Fourier tương ứng Đối với ảnh, ta chỉ tập trung chú ý đến năng lượng tập trung ở miền tần số thấp Mặt khác, biến đổi Wavelets cũng tập trung vào miền tần số thấp Do đó để đảm bảo rằng các phép chiếu FRAT được trơn (smooth), các thành phần tần số thấp sẽ chi phối tín hiệu, thì điểm (a, b) cần được chọn để càng gần đến điểm gốc của miền Fourier càng tốt

Trang 35

Hình 13 Ví dụ về lát cắt Fourier rời rạc với hệ số trung bình tốt nhất (mũi tên liền) cho hướng đó (với p=17,k=11 và vector trung bình tốt nhất là (1,3))

Hình 14 Tập hợp tối ưu của các vector trung bình cho FRAT với kích thước

p = 31

Thêm vào đó, việc lựa chọn điểm (a, b) gần nhất đến điểm gốc sẽ hướng đến các hướng được trình bày của các lát cắt Fourier - là hướng có ít “quấn quanh” (wrap around) – một phần của lát cắt không đi qua điểm gốc - trong miền tần số Vector trung bình cho hướng riêng biệt của FRAT có thể được chọn như là vector từ điểm gốc đến bất kỳ điểm nào khác trên lát cắt Fourier

Sau khi tính toán tập hợp các vector trung bình, FRAT và biến đổi ngược của nó được thực hiện với cùng một giải thuật nhanh như ở trên

Ảnh hưởng của các bậc mới của các hệ số FRAT trên FRIT được trình bày trong hình dưới Như ta có thể thấy , với các bậc tối ưu, các hàm cơ bản của FRAT kế cận trong một hướng

Trang 36

thì gần nhau hơn do đó kết quả là các hàm cơ bản FRIT giống nhiều hơn các điểm bất thường rời rạc

2.6 FRAT và FRIT xếp

FRAT trong phần trước được định nghĩa với một cơ sở tuần hoàn trên miền Z2p Điều này tương đương với việc áp dụng phép biến đổi lên chu kì của ảnh đầu vào – f Do đó các hệ số biên độ FRAT lớn liên quan có thể dẫn đến sự gián đoạn dọc theo biên ảnh Để vượt qua vấn đề này, ta sử dụng cách tương tự như trong biến đổi khối cosin bằng cách mở rộng các ảnh đối xứng về biên của nó

Giả sử rằng p là một số chính p>2, p là số lẻ và có thể được viết: p=2n-1 Giả sử rằng một ảnh vào kích thước n x n, f[i,j], 0≤ i,j < n Ảnh này được xếp lại đối với dòng i = 0 và j = 0

để tạo ra một ảnh p x p f [i, j], -n < j,j <n, trong đó:

[ , ] [ , ]

Chu kỳ của f i j[ , ] thì đối xứng và liên tục dọc theo biên của ảnh gốc, do đó loại bỏ được các bước nhày không liên tục là kết quả của việc mở rộng chu kỳ của f [i, j] Áp dụng FRAT lên f i j[ , ] được kết quả là các hệ số biến đổi p (p+1) Lưu ý dải các chỉ số pixel mới của

ảnh f i j[ , ] Ta có thể thấy rằng các hệ số FRAT của f i j[ , ] thể hiện các thuộc tính đối xứng nhất định , vì thể ảnh gốc có thể được tái tạo một cách hoàn hảo bằng cách chỉ giữ lại

n2 hệ số

Xem xét biến đổi DFT hai chiều của f i j[ , ]:

,

1[ , ]= [ , ]Wp ui vj

Trang 37

Do đó đối xứng của F u v[ , ] mang lại:

Tuy nhiên, tính chất trực giao có thể bị mất đối với FRIT gấp ( kết quả của việc áp dụng DWT một chiều trên n+1 phép chiếu của FRAT gấp) Điều này gây ra một sự thật rằng các hàm cơ sở từ cùng một hướng của FRAT gấp có thể trùng với nhau Mặt khác, nếu chúng ta nới lỏng các điều kiện trực giao, sau đó bằng việc xây dựng các phép chiếu FRAT gấp đối xứng qua t = 0 và t = n-1/2 Điều này sẽ cho phép sử dụng các phép biến đổi Wavelets gấp với Wavelets đối xứng song trực giao

3 Biến đổi Curvelets

Trong xử lý ảnh, các cạnh (edge) thường khó xử lý hơn các đường thẳng và biến đổi Ridgelets không đủ hiệu quả để xử lý chúng Tuy nhiên, một cách máy móc chúng ta vẫn có thể áp dụng Ridgelets theo ý tưởng: tại một tỉ lệ thích hợp, độ cong của các cạnh thì gần tương đương với đường thẳng Đó chính là ý tưởng đầu tiên của Biến đổi Curvelet dạng thứ nhất

3.1 Biến đổi Curvelet thế hệ thứ nhất

Trang 38

Biến đổi Ridgelet chính là nền tảng của phép biến đổi Curvelet Vào năm 1999, biến đổi Wavelet dị hướng Wavelet xuất hiện,có tên là Ridgelet được đề xuất bởi Candes và Donoho Biến đổi Ridgelet là sự tối ưu trong việc đại diện các đường thẳng đặc biệt Để phân tích những đường đặc biệt này,một ý tưởng rất tự nhiên đưa ra là xét đến từng thành phần của bức ảnh Sau đó sử dụng biến đổi Ridgelet để thu được những ảnh con Kiểu biến đổi dựa trên biến đổi Ridgelet này được gọi là biến đổi Curvelet Được đề xuất lần đầu tiên bởi Candes và Donoho vào năm 2000 Tuy nhiên những ứng dụng đầu tiên(được gọi là biến đổi Curvelet thế hệ đầu) bị giới hạn bởi vì dạng hình học của biến đổi Ridgelet vẫn chưa rõ ràng Về sau đã xuất hiện biến đổi Curvelet thế hệ hai đơn giản hơn dựa trên những kĩ thuật biến đổi ở miền tần số Biến đổi Curvelet thế hệ hai được xem như một công cụ rất hữu hiệu trong những ứng dụng trong việc xử lí ảnh Tổng quan về phép biến đổi Curvelet về cơ bản được chia làm bốn giai đoạn sau

Hình 15 Các quá trình của phép biến đổi Curvelets thế hệ thứ nhất

Hình 16 Sơ đồ của phép biến đổi Curvelet First generation

Trang 39

a) Phân tách không gian trong mỗi băng con:

Hình 17 Quá trình phân tích không gian trong mỗi băng con

+) Phân tích băng con:

Ta định nghĩa một bộ lọc băng con P0, P0 (∆S, s≥0) Đối tượng f là bộ lọc cho băng con

0 1 2( , , , )

Ta xem xét các thông số sau để định nghĩa bộ lọc:

∅0: Một bộ lọc thông thấp.Bộ lọc cho những thành phần tần số trong tầm  1

Trang 40

0 0P f * f

Có một số liên hệ giữa biến đổi Curvelet và biến đổi Wavelet trong phần này Phân tách băng con có thế được xấp xỉ như việc sử dụng những biến đổi Wavelet đã biết

+ Sử dụng biến đổi Wavelet, f sẽ được phân tích thành các thành phần S0, D1, D2, D3 …

+ P0f được xây dựng riêng từ S0, D1 và có thể bao gồm một phần của D2, D3

+ s f được xây dựng từ D2s, D2s+1

P0f có đặc tính trơn(tần số thấp) và có thể đại diện một cách hữu hiệu bằng cách sử dụng

những cơ sở Wavelet Nhưng có sự lẫn lộn rằng những được gián đoạn ảnh hưởng đến

những lớp tần số cao s f Liệu chúng có thể được đại diện một cách hiệu quả?

Ans: Nhìn vào các mảnh vỡ của những cạnh,chúng xuất hiện như những gợn thẳng với nhau Bên cạnh đó ta sẽ phân loại những lớp này thành những thành phần nhỏ hơn để tránh những lỗi xảy ra

0 1 2( , , , )

Ví dụ về sự phân tách băng con:

Ngày đăng: 28/01/2021, 14:31

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm