Trong những năm trở lại đây, ngoài việc phát triển các phương pháp xử lý truyền thống giới xử lý ảnh còn quan tâm đến một phương pháp xử lý ảnh mới dựa trên phương trình vi phân từng phầ
Trang 1LỜI MỞ ĐẦU
Ngày nay, khoa học kỹ thuật ngày càng phát triển kéo theo rất nhiều nhu cầu
về tiện ích trong đời sống xã hội, trong đó phải kể đến lĩnh vực xử lý ảnh với rất
nhiều ứng dụng tiện ích: nhận dạng vân tay, mặt người, bảo mật, xử lý ảnh y tế,…
Việc nghiên cứu các giải pháp xử lý ảnh, cải tiến các thuật toán xử lý vẫn được tiếp
tục nhằm đáp ứng các nhu cầu của thực tế
Trong những năm trở lại đây, ngoài việc phát triển các phương pháp xử lý
truyền thống giới xử lý ảnh còn quan tâm đến một phương pháp xử lý ảnh mới dựa
trên phương trình vi phân từng phần (PDE) đó là xử lý ảnh bằng phương pháp lọc
khuếch tán phi tuyến,…do có nhiều ưu điểm hơn so với các phương pháp đã có Và
mục tiêu của nghiên cứu này là cung cấp một nền tảng toán học cho lọc khuếch tán
phi tuyến như một sự biến đổi quy mô không gian đủ linh hoạt để rút gọn ảnh mà
không làm mất khả năng tăng cường biên Và quan trọng hơn là đưa ra giải pháp kết
hợp nhằm cải thiện hơn nữa khả năng phân tích, xử lý, khôi phục ảnh nâng cao chất
lượng ảnh
Vì vậy, tôi quyết định chọn đề tài: “Nghiên cứu tách đường cong và vật thể
trong ảnh 3D bằng phương pháp lọc khuếch tán phi tuyến kết hợp Curvelet” làm
luận văn thạc sỹ
Trong quá trình hoàn thành luận văn, tôi xin đặc biệt cảm ơn tới PGS.TS
Nguyễn Thúy Anh Tôi cũng gửi lời cảm ơn tới Ban giám hiệu Trường Đại Học
Bách Khoa Hà Nội đã hỗ trợ, tạo điều kiện cho tôi trong thời gian học tập Tôi xin
cảm ơn các bạn đồng nghiệp và người thân trong gia đình đã luôn động viên, khích
Trang 2TÓM TẮT NỘI DUNG LUẬN VĂN
Khử nhiễu ảnh là một trong những vấn đề quan trọng nhất, được nghiên cứu phổ biến trong xử lý ảnh và tầm nhìn máy tính Hướng tới tác vụ khôi phục một ước lượng tốt của ảnh thực từ một khảo sát ảnh chất lượng thấp mà không làm thay đổi cấu trúc hữu ích trong ảnh như các điểm gián đoạn và các biên là công việc cần thiết Mặc dù vẫn còn hạn chế về lý thuyết, nhưng lọc khuếch tán phi tuyến đã trở thành một công cụ xử lý ảnh rất hiệu quả trong những năm gần đây
Mục tiêu của nghiên cứu này là cung cấp một nền tảng toán học cho lọc khuếch tán phi tuyến liên tục như một sự biến đổi quy mô không gian linh hoạt để rút gọn ảnh mà không làm mất khả năng tăng cường biên Lớp không đẳng hướng
sử dụng một tensor khuếch tán có thể áp dụng được cho cấu trúc ảnh Nó cho phép tính tồn tại, tính duy nhất, và các kết quả có tính quy luật Kết quả phụ thuộc một cách liên tục vào ảnh ban đầu, và nó thỏa mãn nguyên lý cực trị Tất cả các vấn đề khảo sát bao gồm các mô hình đẳng hướng tuyến tính và phi tuyến áp dụng cho các ảnh vector-valued m-chiều Dựa trên những kết quả đạt được, luận văn đưa ra mô hình kết hợp, phát triển phương pháp mới, kết hợp giữa lọc khuếch tán phi tuyến và biến đổi Curvelet, tận dụng những ưu điểm của hai phương pháp để tách đường cong và vật thể trong ảnh 3D
NỘI DUNG NGHIÊN CỨU Chương 1: Giới thiệu chung
Chương 2: Khôi phục và làm trơn ảnh bằng PDE
Chương 3: Các mô hình lọc khuếch tán
Chương 4: Thực nghiệm, đánh giá kết quả và kết luận
Trang 3
ABSTRACT
Image noise reduction is one of the most important issues which are widely studied in the image processing and computer vision It is necessary to aim at the task of restoring a good estimate of the real image from a low quality survey image without altering its useful structures like the discontinuity and the border In recent years, although the theories have been limited, the non-linear diffusion filtering (NLDF) has become an effective image processing tool
The purpose of the research is to provide a mathematical foundation for the continuously non-linear filtering diffusion as a transformation of flexible space scale to reduce image without losing its boost border The anisotropic layer uses a diffusive tensor that would be applied for the structure of image That allows the uniqueness, the unicity, and the regularity of results The result depends continuously on the initial image, and it satisfies the extreme principle The surveys including the isotropic linear model and nonlinear are applied to the vector-valued
m image-dimension Based on these results, this thesis brings the combined model, develops the new methods, combines nonlinear diffusion filtering and curvelet change, uses the advantages of the two methods to extract curves and objects in 3D images
CONTENT Chapter 1: An overview
Chapter 2: Restoration and image smoothing by PDE
Chapter 3: Diffusion filtering models
Chapter 4: Simulation, assessment and conclusion
Trang 4MỤC LỤC
LỜI MỞ ĐẦU 1
TÓM TẮT NỘI DUNG LUẬN VĂN 2
ABSTRACT 3
MỤC LỤC 4
DANH MỤC CÁC HÌNH ẢNH 8
CHƯƠNG 1 GIỚI THIỆU CHUNG VỀ ĐỀ TÀI 1
1.1 Lý thuyết về biên ảnh 1
1.1.1 Vị trí của biên trong phân tích ảnh 1
1.1.2 Biên và các kỹ thuật dò biên 1
1.2 Bài toán tách đường cong và vật thể trong ảnh 3D 2
1.2.1 Phân tích và xử lý ảnh 3D 3
1.2.2 Tạo ảnh 3D 5
1.2.3 Ứng dụng của ảnh 3D 7
1.3 Tổng quan lọc nhiễu trong xử lý ảnh 9
1.3.1 Các bộ lọc cổ điển 9
1.3.2 Xử lý ảnh dùng PDE 9
1.4 Mục đích đối tượng và phạm vi nghiên cứu của đề tài 10
1.5 Phương pháp nghiên cứu đề tài 11
1.6 Ý nghĩa khoa học và thực tiễn của đề tài 11
CHƯƠNG 2 TỔNG QUAN VỀ XỬ LÝ ẢNH DỰA TRÊN PDE 12
2.1 Mô tả bản chất vật lý của quá trình khuếch tán 12
2.2 Tổng quan lọc khuếch tán tuyến tính 14
Trang 52.2.2 Đặc điểm quy mô không gian 16
2.2.3 Hạn chế 19
2.3 Tổng quan lọc khuếch tán phi tuyến 19
2.3.1 Mô hình Perona-Malik 20
2.3.2 Các mô hình phi tuyến điển hình 26
2.3.3 Mô hình phi tuyến không đẳng hướng 28
2.4 Các nghiên cứu về phản ứng khuếch tán 30
2.4.1 Các phương trình phản ứng khuếch tán đơn 31
2.4.2 Các phương trình phản ứng khuếch tán kết hợp 32
2.5 Phương pháp xử lý hình thái cổ điển 35
2.5.1 Hình thái thang màu xám và nhị phân 35
2.5.2 Các hoạt động cơ bản 36
2.5.3 Hình thái quy mô liên tục 37
2.5.4 Kết quả lý thuyết 38
2.5.5 Đặc điểm quy mô không gian 39
2.6 Phương pháp xử lý hình thái dựa trên đặc tuyến 40
2.6.1 Bộ lọc đặc tuyến trung bình 40
2.6.2 Lọc bất biến Afin 42
2.7 Phương pháp biến phân toàn phần 44
2.7.1 Phương pháp bảo toàn TV 45
2.7.2 Phương pháp TV tối thiểu 46
CHƯƠNG 3 GIỚI THIỆU CÁC MÔ HÌNH LỌC KHUẾCH TÁN 49
3.1 Mô hình lọc khuếch tán liên tục 49
3.1.1 Cấu trúc bộ lọc cơ bản 49
Trang 63.1.2 Tensor cấu trúc 50
3.1.3 Kết quả lý thuyết 51
3.1.4 Đặc điểm quy mô không gian 53
3.2 Mô hình lọc khuếch tán bán rời rạc 60
3.2.1 Mô hình tổng quan 60
3.2.2 Kết quả lý thuyết 61
3.2.3 Đặc điểm quy mô không gian 62
3.3 Mô hình lọc khuếch tán rời rạc 68
3.3.1 Mô hình tổng quan 68
3.3.2 Kết quả lý thuyết 70
3.3.3 Đặc điểm quy mô không gian 70
3.4 Mô hình lọc khuếch tán kết hợp biến đổi Curvelet 72
3.4.1 Giới thiệu 72
3.4.2 Biến đổi Curvelet 74
3.4.3 Mô tả mô hình đề xuất 81
CHƯƠNG 4 THỰC NGHIỆM, ĐÁNH GIÁ VÀ KẾT LUẬN 83
4.1 Giới thiệu 83
4.2 Khử nhiễu ảnh sử dụng lọc khuếch tán phi tuyến 83
4.2.1 Thực nghiệm mô tả khái niệm khuếch tán 83
4.2.2 Khuếch tán tăng cường biên 86
4.2.3 Khuếch tán tăng cường thích nghi 87
4.2.4 Khuếch tán phi tuyến (khái niệm cơ bản) 89
4.2.5 Khuếch tán phi tuyến 1-D 91
4.3 Tách đường cong và vật thể với bộ lọc khuếch tán phi tuyến 92
Trang 74.3.1 Tách ảnh 3D thành các ảnh 2D 92
4.3.2 Khuếch tán phi tuyến giảm nhiễu và rút gọn ảnh 93
4.3.3 Tách biên từ ảnh 3D sử dụng lọc khuếch tán phi tuyến 95
4.4 Khuếch tán phi tuyến kết hợp curvelet (xử lý 2D) 96
4.4.1 Khử nhiễu 96
4.4.2 Tách biên 96
4.4.3 Khôi phục biên 97
4.5 Khuếch tán phi tuyến kết hợp curvelet (xử lý 3D) 98
4.5.1 Khử nhiễu 98
4.5.2 Tách biên 99
4.5.3 Khôi phục biên 99
KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU 101
DANH MỤC CÁC KÝ HIỆU 102
TÀI LIỆU THAM KHẢO 103
PHỤ LỤC 104
Trang 8DANH MỤC CÁC HÌNH ẢNH
Hình 1.1 Các bước trong phân tích ảnh 1
Hình 1.2 Cách bố trí 2 camera trong việc chụp cặp ảnh stereo 5
Hình 1.3 Hai ảnh stereo để tạo ảnh lập thể 5
Hinh 1.4 Hình ảnh chi tiết hệ thống chụp ảnh stereo song song 6
Hình 1.5 Stereo được chụp từ các máy bay 8
Hình 1.6 Ảnh stereo được chụp từ các vệ tinh 9
Hình 1.7 Phương trình vi phân 10
Hình 2.1 Quá trình khuếch tán vật lý 13
Hình 2.2 (a) Khuếch tán ; (b) Hàm thông lượng Φ(s) 21
Hình 3.1 Cửa sổ V(t) (trái) và W(r) (phải) 76
Hình 3.2 Cửa sổ (bên trái) và hình chiếu đứng (bên phải) 76
Hình 3.3 Cửa sổ (bên trái) và hình chiếu đứng (bên phải) 78
Hình 4.1 (a) Khuếch tán; (b) Thông lượng 84
Hình 4.2 Kết quả khi tăng lambda 85
Hình 4.3 Sự ảnh hưởng của tham số m 86
Hình 4.4 Tính chất khôi phục ảnh của các bộ lọc khuếch tán (a)ảnh không nhiễu;(b)ảnh nhiễu;(c)lọc khuếch tán tuyến tính; (d)lọc khuếch tán phi tuyến đẳng hướng 86
Hình 4.5 Tính chất khử nhiễu của khuếch tán tăng cường thích nghi 88
Hình 4.6 Xử lý khuếch tán phi tuyến nhiệt độ trên thanh kim loại 90
Hình 4.7 Tín hiệu nhị phân và các loại nhiễu 91
Hình 4.8 Khuếch tán phi tuyến khôi phục tín hiệu nhiễu (10%) 92
Hình 4.9 Khuếch tán phi tuyến khôi phục tín hiệu nhiễu (100%) 92
Hình 4.10 Ảnh 3D đầu vào 93
Hình 4.11 (a) Hình chụp được từ camera trái, (b) Hình chụp được từ camera phải 93
Hình 4.12: Giảm nhiễu với bộ lọc khuếch tán phi tuyến đẳng hướng 94
Hình 4.13: Rút gọn ảnh với bộ lọc khuếch tán phi tuyến 94
Hình 4.14 Sơ đồ thực nghiệm 95
Hinh 4.15 Kết quả tách biên ảnh không nhiễu với lọc khuếch tán phi tuyến 95
Hinh 4.16 Kết quả tách biên ảnh được khử nhiễu với lọc khuếch tán phi tuyến 96
Trang 9Hình 4.17 Kết quả khử nhiễu với lọc khuếch tán phi tuyến 96
Hình 4.18 Kết quả tách biên curvelet 97
Hình 4.19 Kết quả khôi phục biên ảnh 97
Hình 4.20 Sơ đồ thực nghiệm mô hình kết hợp 98
Hình 4.21 Kết quả khử nhiễu với lọc khuếch tán phi tuyến 98
Hình 4.22 Kết quả tách biên curvelet 99
Hình 4.23 Kết quả khôi phục biên ảnh 99
Trang 10CHƯƠNG 1 GIỚI THIỆU CHUNG VỀ ĐỀ TÀI
1.1 Lý thuyết về biên ảnh
1.1.1 Vị trí của biên trong phân tích ảnh
Phân tích ảnh là một quá trình gồm nhiều giai đoạn Đầu tiên là giai đoạn tiền
xử lý ảnh Sau giai đoạn này, ảnh được tăng cường hay được khôi phục để làm nổi các đặc tính ( feature extraction ), tiếp theo là phân đoạn ảnh (segmentation) thành các phần tử Ví dụ, như phân đoạn dựa theo biên, dựa theo vùng,… Và tuỳ theo các ứng dựng, giai đoạn tiếp theo có thể là nhận dạng ảnh ( phân thành các lớp có miêu tả) hay là giải thích và miêu tả ảnh Hình 1.2 mô tả tóm lược các bước của quá trình phân tích ảnh:
Hình 1.1 Các bước trong phân tích ảnh
Do đó, biên có tầm quan trọng đặc biệt trong quá trình phân tích ảnh
1.1.2 Biên và các kỹ thuật dò biên
Trong phần này chúng ta sẽ đề cập đến một số nội dung: khái niệm về biên, phân loại các phương pháp phát hiện biên và qui trình phát hiện biên
Khái niệm về biên
Trang 11Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên
Một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành biên hay đường bao ảnh của ảnh (boundary)
Ví dụ, trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen
và có ít nhất một điểm trắng là lân cận
Để hình dung tầm quan trọng của biên ta xét ví dụ sau: Khi người hoạ sĩ vẽ một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như cái mặt bàn, chân bàn mà không cần thêm các chi tiết khác, người xem đã có thể nhận ra nó là một cái bàn nếu ứng dụng của ta là phân lớp nhận diện đối tượng, thì coi như nhiệm vụ đã hoàn thành Tuy nhiên nếu đòi hỏi thêm về các chi tiết khác như vân gỗ hay màu sắc,…thì với chừng ấy thông tin là chưa đủ
Nhìn chung về mặt toán học người ta coi điểm biên của ảnh là điểm có sự biến đổi đột ngột về độ xám.Như vậy phát hiện biên một cách lý tưởng là xác định được tất cả các đường bao trong các đối tượng Định nghĩa toán học của biên ở trên là cơ
sở cho các kỹ thuật phát hiện biên Điều quan trọng là sự biến thiên mức xám giữa các ảnh trong một vùng thường là nhỏ, trong khi đó biến thiên mức xám của điểm vùng lân cận (khi qua biên) lại khá lớn
1.2 Bài toán tách đường cong và vật thể trong ảnh 3D
Hình ảnh 3D (có thể gọi là ảnh lập thể hoặc ảnh 3D) là một kỹ thuật để tạo ra hoặc tăng cường ảo giác về chiều sâu một hình ảnh bằng thị giác lập thể cho hai mắt Bất kỳ hình ảnh 3D nào cũng được gọi là ảnh lập thể Ban đầu, ảnh lập thể đề cập đến một cặp ảnh stereo có thể xem được bằng cách sử dụng kính nhìn Trong luận văn này sẽ đề cập cụ thể đến ảnh 3D đuôi *.jps(stereoscopic images file) được tạo bởi 2 ảnh *.jpg
Hầu hết các phương pháp tạo ảnh 3D được tạo từ hai hình ảnh riêng biệt của mắt trái và mắt phải của người xem Những hình ảnh hai chiều này sau đó được kết hợp trong não để cung cấp cho các nhận thức về chiều sâu 3D Kỹ thuật này được
Trang 12phân biệt với màn hình 3D hiển thị hình ảnh ba chiều đầy đủ, cho phép người quan sát tăng cường thông tin về các đối tượng 3 chiều
Đối với việc tách đường cong cần một số bước xử lý ngược lại với tạo ảnh 3D Ảnh đối tượng cần được xử lý để tách thành các ảnh 2D và dùng làm nguồn để tách đường cong từ ảnh 3D ban đầu
1.2.1 Phân tích và xử lý ảnh 3D
Ảnh 3D tạo ra ảo giác về chiều sâu ba chiều từ hình ảnh hai chiều ảnh mà con người nhìn được, bao gồm cả chiều sâu, là một quá trình phức tạp mà chỉ bắt đầu với việc tiếp nhận của thông tin hình ảnh được thực hiện qua đôi mắt, cùng với
sự xử lý của bộ não, như nó làm cho đầu óc được tư duy qua các thông tin được cung cấp Một trong những chức năng thị giác rất quan trọng xảy ra trong não khi
nó diễn giải những gì mắt thấy là đánh giá khoảng cách tương đối của các đối tượng khác nhau từ người xem, kích thước chiều sâu của các đối tượng Não sẽ sử dụng một số tín hiệu để xác định khoảng cách tương đối và chiều sâu trong màn ảnh thu được, bao gồm:
- Thị giác lập phương
- Sự điều tiết của mắt
- Sự chồng chéo của đối tượng
- Góc nhìn đối diện của một đối tượng có kích thước cho trước
- Quan điểm tuyến tính
- Vị trí thẳng đứng
- Độ mờ, độ bão hòa
- Thay đổi kích thước của chi tiết mô hình kết cấu
Ảnh lập thể là việc tạo ra ảo giác về chiều sâu trong một bức ảnh, phim hoặc hình ảnh hai chiều bằng cách quan sát cùng một hình ảnh nhưng có sự khác nhau nhỏ khi nhìn bằng mỗi mắt, và do đó đầu tiên nó bổ sung thêm các tín hiệu rất tốt
Cả hai hình ảnh 2D bù đắp cho nhau sau đó được kết hợp trong não để cung cấp nhận thức về ảnh 3D Điều quan trọng cần lưu ý rằng kể từ khi tất cả các điểm trong
Trang 13ảnh tập trung tại cùng một mặt phẳng bất kể độ sâu của nó trong màn ảnh ban đầu, gợi ý thứ hai, tập trung, vẫn không bị trùng lặp và sau đó ảo giác về chiều sâu là không đầy đủ Ngoài ra cũng có hai ảnh hưởng của ảnh 3D mà không tự nhiên với tầm nhìn của con người: đầu tiên, là sự không phù hợp giữa sự hội tụ và sự điều tiết, gây ra bởi sự khác biệt giữa vị trí nhận thức của một đối tượng ở phía trước hoặc phía sau màn hình hiển thị hoặc màn hình và nguồn gốc thực sự của ánh sáng và thứ hai, có thể nhiễu xuyên âm giữa hai mắt, do hình ảnh tách biệt không hoàn hảo bởi một số phương pháp
Mặc dù thuật ngữ “3D” được sử dụng ở khắp nơi, nó cũng quan trọng cần lưu
ý là trình bày các hình ảnh 2D đôi là khác biệt so với hiển thị một ảnh ba chiều đầy
đủ Sự khác biệt đáng chú ý nhất là, trong trường hợp hiển thị ảnh 3D, đầu của người quan sát và chuyển động của mắt sẽ không tăng cường thông tin về các đối tượng 3 chiều được hiển thị Màn hình ba chiều hoặc màn hình thể tích là những ví
dụ mà không có hạn chế này Tương tự như công nghệ phát lại âm thanh, trong đó không thể để tạo lại một trường âm thanh 3 chiều đầy đủ chỉ với hai loa âm thanh nổi, nên không thể nói hình ảnh 2D kép là ảnh 3D Chính xác thuật ngữ “ảnh lập thể” là phức tap hơn so với cái tên phổ biến “ảnh 3D” Mặc dù hầu hêt màn hình lập thể không đủ điều kiện như màn hình hiển thị 3D thực tế, tất cả các màn hình 3D thực tế cũng là màn hình lập thể với vì nó đáp ứng đủ tiêu chuẩn của màn hình lập thể
Hầu hết các màn hình 3D sử dụng phương pháp lập thể này để truyền tải hình ảnh Nó lần đầu tiên được phát minh bởi Sis Charles Wheatstone vào năm 1838, và cải thiện bởi Sis David Brewter người làm thiết bị xem 3D di động đầu tiên
Wheatstone ban đầu được sử dụng kính thực thể của mình (một thiết bị khá cồng kềnh) với bản vẽ vì nghề nhiếp ảnh là chưa có sẵn, nhưng bài báo gốc của ông dường như thấy trước sự phát triển của một phương pháp hình ảnh thực tế
Ảnh lập thể là hữu ích trong việc xem hình ảnh xuất từ tập hợp dữ liệu đa chiều lớn như được sản xuất bởi dữ liệu thực nghệm Một bằng sáng chế đầu cho hình ảnh 3D trong rạp chiếu phim và truyền hình đã được cấp cho nhà vật lý
Trang 14Theodor V.lonescu vào năm 1936 Chụp ảnh ba chiều hiện đại công nghiệp có thể
sử dụng máy quét 3D để phát hiện và ghi lại thông tin ba chiều Những thông tin sâu hơn về ảnh ba chiều có thể được dựng lại từ hai hình ảnh sử dụng một máy tính bằng các điểm ảnh tương ứng trong những hình ảnh trái và phải
1.2.2 Tạo ảnh 3D
Trong ảnh lập thể, sử dụng hai máy ảnh được tách trong không gian từ hình ảnh một đối tượng 3 chiều như hình 1, trong trường hợp đơn giản trục quang học của hai máy ảnh song song với nhau bị ngăn cách bởi một khoảng cách S
Hình 1.2 Cách bố trí 2 camera trong việc chụp cặp ảnh stereo
Từ hai máy ảnh chúng ta có một cái nhìn khác nhau của cùng một đối tượng với các điển hình cho một khối lập phương thể hiện trong hình 2 Vì vậy, chúng ta nhận được sự thay đổi về đường dọc, từ đó có thể trích xuất thông tin chiều sâu Hệ thống này là tương đương với hệ thống thị giác của con người, nơi mà chúng ta có 2 mắt ngăn cách bởi khoảng 60-70mm khi xem một đối tượng 3 chiều, sẽ thấy hai cái nhìn khác nhau
Hình 1.3 Hai ảnh stereo để tạo ảnh lập thể
Trang 15Giả định trục quang học của hai máy ảnh là song song và cách nhau bằng khoảng cách S Bây giờ hãy xem hình ảnh của một điểm P cách một khoảng X0 tới trục của một máy ảnh và cách một khoảng X1 tới trục quang của máy kia
Hinh 1.4 Hình ảnh chi tiết hệ thống chụp ảnh stereo song song
Nếu những vị trí ảnh của P trong 2 camera là và tương ứng, theo đó từ biểu đồ trên chúng ta có:
U là khoảng cách từ ống kính tới mặt quan sát, trong đó chúng ta giả định là như nhau với cả 2 máy ảnh Do đó chúng ta có vị trí ảnh của P đang ở
Bây giờ từ dạng hình học, chúng ta có điều đó, chúng ta biết rằng trục của hai máy ảnh được ngăn cách bởi S, vì vậy nếu 2 trục của nó là song song, thì:
Thế vào ta có:
Trang 16Với
Gọi ∆x là sự khác biệt giữa ảnh của P trong 2 hình ảnh Bây giờ cho 1 ống kính tiêu cự f chúng ta có vị trí của đối tượng và mặt phẳng ảnh cho bởi công thức ống kính của Gaussian
Tuy nhiên trong một hệ thống thực tế chúng ta có một khoảng cách từ đối tượng đến ống kính tiêu cự bé, với v >>u Do đó chúng ta có thể xấp xỉ u f, khoảng cách từ ống kính đến mặt phẳng quan sát đơn giản bằng với chiều dài tiêu cự của ống kính Nếu chúng ta áp dụng xấp xỉ này thì sẽ có:
Và cũng lưu ý rằng z là khoảng cách từ mặt phẳng đối tượng đến mặt phẳng quan sát được cho bới z= u+v, sau đó chúng ta có được một biểu thức cho khoảng cách từ mặt phẳng quan sát đến điểm P:
và có sự khác biệt lớn như yêu cầu để có thông tin sâu hơn
Trang 17Hình 1.5 Stereo được chụp từ các máy bay
Biết được sự khác biệt giữa hai ảnh, chúng ta có thể tính toán sự thay đổi chiều cao trong khu vực chồng chéo lên nhau và được sử dụng rộng rãi trong việc đưa ra bản đồ tự động
Hệ thống này có vẻ đơn giản nhưng khó khăn hơn nhiều so với sự kiến vì hướng của máy bay có thể thay đổi đáng kể do nhiều yếu tố Điều này dẫn đến sự định hướng của trục quang học máy ảnh thay đổi và do đó toàn bộ hệ thống hình ảnh sẽ thay đổi về mặt hình học Điều này có thể khắc phục bằng cách theo dõi chính xác tốc độ máy bay và góc độ của nó
Ngoài ra, hình ảnh 3D từ một vệ tinh viễn thám là một chương trình rất thiết thực mà hai hình ảnh được phát hiện từ các quỹ đạo khác nhau vào những thời điểm khác nhau như trong hình 5 Đối với một vệ tinh quỹ đạo rất ổn định và vì không có hiệu ứng khí quyển, hầu hết các vấn đề liên quan đến ảnh chụp được là không xảy
ra và chất lượng ảnh tốt Trên một số hệ thống truyền hình vệ tinh cảm biến hình ảnh có thể được hướng dẫn để tối đa hóa diện tích chồng lên nhau Hình ảnh 3D có chất lượng đặc biệt tốt thu được từ hệ thống SPOT
Trang 18Hình 1.6 Ảnh stereo được chụp từ các vệ tinh
1.3 Tổng quan lọc nhiễu trong xử lý ảnh
1.3.1 Các bộ lọc cổ điển
Các ảnh khi thu vào để xử lý trên máy tính nói chung thường không có chất lượng tốt (trừ khi được thu trong những điều kiện lý tưởng như trong phòng thí nghiệm) Trong ảnh, ngoài đối tượng chính cần quan tâm còn rất nhiều các đối tượng nhiễu Các nhiễu làm giảm hoặc nhiều khi làm mất khả năng biểu lộ thông tin của đối tượng chính trong ảnh Với mỗi loại nhiễu cần có các bộ lọc thích hợp Với nhiễu cộng và nhiễu nhân người ta thường dùng các bộ lọc thông thấp, trung bình
và lọc đồng hình Với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài
1.3.2 Xử lý ảnh dùng PDE
Từ khoảng những năm cuối của thế kỷ 20 việc ứng dụng PDE cho xử lý ảnh đã được khởi động nghiên cứu, bắt đầu từ các bài báo của Witkin và Koenderink, tiếp theo là các công trình nghiên cứu của Osher và Rudin, L.Alvarez và L.Mazorra, P.Perona và J.Malik với các PDE thành phần thực, G.Gillboa và Y.Y.Zeevi, N.Sochen với các PDE thành phần số phức Xử lý ảnh bằng PDE đã cho thấy là một phương pháp xử lý ảnh hiệu quả khi thực hiện các tác vụ làm trơn, giảm nhiễu, tìm
Trang 19biên, phân vùng ảnh, phục hồi cấu trúc ảnh, nén ảnh, thay đổi histogram,…
Hình 1.7 Phương trình vi phân
Các thuật toán xử lý ảnh dùng PDE có nhiều đặc tính tốt do:
Tính chất cục bộ tự nhiên của PDE phù hợp với rất nhiều các đặc điểm cục
bộ của ảnh Do vậy biểu diễn quá trình biến đổi ảnh qua PDE là rất thích hợp
Đã sẵn có nền tảng lý thuyết toán học về PDE chặt chẽ và phong phú bao gồm sự hội tụ, tính ổn định, lời giải duy nhất…
Đã có nhiều dạng sơ đồ rời rạc hóa cho việc thực hiện các thuật toán PDE
Thuật toán được mô tả ngắn gọn không dài dòng phức tạp và dễ hiểu
Dễ dàng khái quát hóa, mở rộng chiều một cách đơn giản bằng cách sử dụng các toán tử Laplace, Divergence và Gradient
Các PDE được sử dụng để xử lý ảnh thường ở hai lớp: PDE khuếch tán tuyến tính và PDE khuếch tán phi tuyến
1.4 Mục đích đối tượng và phạm vi nghiên cứu của đề tài
Bởi sự độc đáo, đa dạng về thuộc tính bản chất và bởi sự phong phú về các ứng dụng tiềm năng của phương pháp xử lý ảnh bằng lọc khuếch tán phi tuyến nên đề tài
đồ án tập trung nghiên cứu chỉ giới hạn với các vấn đề sau:
Nghiên cứu về xử lý ảnh 3D dựa trên phương thức xử lý phi tuyến
Trang 20 Nghiên cứu về mô hình các bộ lọc khuếch tán phi tuyến
Nghiên cứu xây dựng thuật toán xử lý ảnh bằng phương pháp lọc khuếch tán phi tuyến
Thảo luận về một số ứng dụng của phương pháp lọc khuếch tán phi tuyến
1.5 Phương pháp nghiên cứu đề tài
Sử dụng công cụ toán học biến đổi các phương trình mô tả quá trình vật lý của đối tượng cần nghiên cứu, biến đổi phương trình khuếch tán
Phân tích các mô hình bộ lọc dựa trên phương thức xử lý phi tuyến
Xây dựng thuật toán xử lý ảnh bằng phương pháp lọc khuếch tán phi tuyến
Xây dựng mô hình lai kết hợp giữa khuếch tán phi tuyến và biến đổi Curvelet
1.6 Ý nghĩa khoa học và thực tiễn của đề tài
Đề xuất nghiên cứu mô hình lai kết hợp giữa phương pháp lọc khuếch tán phi tuyến với một số phương pháp khác nhằm cải tiến các phương pháp và nâng cao chất lượng xử lý ảnh
Ý nghĩa thực tiễn:
Nghiên cứu ứng dụng cho các công nghệ xử lý ảnh xây dựng thị giác máy cho hệ robot tự động
Cải tiến các phương pháp xử lý ảnh
Xây dựng các hệ tính toán và xử lý ảnh chuyên dụng thời gian thực trên phần cứng dùng các công nghệ hiện đại có thể ứng dụng trong công nghiệp
và an ninh quốc phòng
Trang 21CHƯƠNG 2 TỔNG QUAN VỀ XỬ LÝ ẢNH DỰA TRÊN PDE
Các phương pháp dựa trên PDE xuất hiện trong rất nhiều lĩnh vực khác nhau của xử lý ảnh và thị giác máy từ nhận dạng và điều chỉnh histogram đến biểu đồ thị giác
Chương này xem xét ứng dụng chính của PDE là khôi phục và làm trơn ảnh
Có sự tham khảo và đề cập đến nhiều nội dung trong văn bản gốc với các phương trình toán học và chứng minh đầy đủ Mục đích là để thấy rõ các điểm giống nhau, khác nhau, ưu điểm và nhược điểm của những kỹ thuật này, và chỉ ra những kết quả chính và các vấn đề mở trong lĩnh vực đang phát triển nhanh chóng này
Đối với mỗi lớp của phương pháp ý tưởng cơ bản được giải thích và thảo luận về cơ sở lý thuyết, khía cạnh số, sự phát triển và ứng dụng của chúng Nhiều ý tưởng xuất phát từ các hiện tượng vật lý như truyền sóng hoặc truyền nhiệt Tuy nhiên, cũng có cả khí động học, các nghiên cứu về độ mặn đại dương học, hoặc các
cơ chế của võng mạc và não cũng liên quan chặt chẽ với các phương pháp tiếp cận này
2.1 Mô tả bản chất vật lý của quá trình khuếch tán
Hầu hết chúng ta đều có một ấn tượng trực quan về khuếch tán, nó là một quá trình vật lý làm cân bằng sự khác nhau về mật độ mà không tạo ra hay phá hủy chất Quá trình vật lý này có thể được quan sát và xem xét một cách dễ dàng theo một công thức toán học
Trang 22Hình 2.1 Quá trình khuếch tán vật lý
Tính chất cân bằng được biểu diễn theo định luật Fick:
J = - D.∇u (2.1) Phương trình này nói rằng một gradient mật độ ∇u gây ra một thông lượng J để
bù cho gradient này Mối quan hệ giữa ∇u và J được mô tả bằng tenxơ khuếch tán
D, một ma trận đối xứng xác định dương Trường hợp J và ∇u là song song được gọi là đẳng hướng Sau đó chúng ta có thể thay thế tenxơ khuếch tán bằng một khuếch tán g dương vô hướng có giá trị Trong trường hợp tổng quát không đẳng hướng, J và ∇u là không song song
Quá trình khuếch tán chỉ vận chuyển chất mà không phá hủy nó hay tạo ra chất mới được biểu diễn bằng phương trình liên tục:
∂t u = - div J (2.2) Trong đó t biểu thị thời gian
Nếu thay định luật Fick vào phương trình liên tục chúng ta thu được phương trình khuếch tán:
Trang 232.2 Tổng quan lọc khuếch tán tuyến tính
PDE đơn giản và phương pháp nghiên cứu tốt nhất để làm trơn ảnh là áp dụng một quá trình khuếch tán tuyến tính Chúng ta sẽ tập trung vào mối quan hệ giữa lọc khuếch tán tuyến tính và tích chập Gauss, phân tích các tính chất làm trơn ảnh của
nó cũng như các dẫn xuất của nó, và đánh giá các tính chất cơ bản của không gian quy mô Gauss được gây ra bởi lọc khuếch tán tuyến tính Sau đó là một khảo sát về các khía cạnh riêng được đưa ra và thảo luận về các ứng dụng, các hạn chế của mô hình khuếch tán tuyến tính Phần này được kết thúc với một tóm tắt về hai khái niệm tuyến tính có thể kết hợp một tiên đề: quy mô không gian Gauss afin và định hướng quá trình khuếch tán
2.2.1 Mối quan hệ với làm trơn ảnh bằng bộ lọc Gauss
Làm trơn ảnh bằng bộ lọc Gauss
Cho một ảnh độ xám f được biểu diễn bởi một ánh xạ giá trị thực f ∈ L1 (ℝ2
) Một cách được sử dụng phổ biến để làm trơn f là tính tích chập
∫
ℝ
(2.4) Trong đó biểu thị Gauss hai chiều (sai số chuẩn) :
Tiếp theo, chúng ta hãy khảo sát hoạt động trong miền tần số Khi xác định biến đổi Fourier Ғ bằng
∫ 〈 〉
Chúng ta thu được theo định lý tích chập
Trang 24Tương đương với bộ lọc khuếch tán tuyến tính
Đó là một kết quả kinh điển cho bất kỳ f bị chặn ∈ ℝ quá trình khuếch tán tuyến tính
(2.9) (2.10) Chúng ta có các trường hợp
{
√ (2.11) Đây là trường hợp duy nhất cho phép chúng ta giới hạn các hàm số thỏa mãn
Trang 25
2.2.2 Đặc điểm quy mô không gian
Trên thực tế các hình ảnh thường bao gồm các cấu trúc với rất nhiều quy mô khác nhau Trong những trường hợp đó quy mô phù hợp cho thông tin được mô tả
là không rõ ràng trước đó nó mong muốn để có một ảnh biểu diễn ở nhiều quy mô Hơn nữa, bằng cách so sánh các cấu trúc ở các quy mô khác nhau, người ta có được một hệ thống phân cấp của các cấu trúc ảnh giúp giảm bớt một sự giải thích cho ảnh tiếp theo
Một quy mô không gian là một biểu diễn ảnh liên tục theo các tỷ lệ, đưa ảnh f vào trong một tập { } của nó, cho thấy nó đáp ứng một số yêu cầu nhất định Hầu hết các đặc tính này có thể được phân loại như kiến trúc, làm trơn (làm giảm thông tin) hoặc yêu cầu bất biến
Một điều kiện quan trọng là đệ quy, tức là t = 0, biểu diễn quy mô không gian cho ảnh ban đầu f, và việc lọc ảnh có thể được chia thành một chuỗi các nhánh bộ lọc:
(2.17) Tính chất này thường được gọi là tính chất nửa nhóm Các nguyên lý kiến trúc khác bao gồm các tính chất thể hiện tính chu kỳ của và tính cục bộ khi t tiến dần đến 0
Các tính chất làm trơn và làm giảm thông tin phát sinh từ mong muốn rằng việc biến đổi không tạo ra các thành phần lạ khi đi từ ảnh ban đầu đến biểu diễn sơ bộ
Do đó, ở một quy mô sơ bộ chúng ta không nên có các cấu trấu bổ sung được tạo ra bởi phương pháp lọc và không phải bởi các cấu trúc cơ bản ở các quy mô tốt hơn Tính chất đơn giản này đã được chỉ rõ bởi một số tác giả theo nhiều cách khác nhau, bằng việc sử dụng các khái niệm như không tạo ra các đặc tuyến có bậc mới (quan
hệ nhân quả), không làm tăng đường cực trị cục bộ, giảm số đường cực trị cục bộ, nguyên lý max-min, nguyên lý so sánh, và các hàm Lyapunov Đặc biệt trong các
Trang 26thiết lập tuyến tính nhiều trong số các khái niệm này là tương đương nhau hoặc có liên quan chặt chẽ với nhau
Chúng ta có thể xem một hình ảnh như một biểu diễn của một lớp tương đương bao gồm tất cả các hình ảnh mô tả cùng một đối tượng Hai hình ảnh trong lớp lại khác nhau ví dụ thay đổi cấp xám, biến đổi và quay hay thậm chí phức tạp hơn chẳng hạn như ánh xạ afin Điều này làm cho điều kiện hợp lý rằng việc phân tích quy mô không gian là bất biến đối với nhiều trong số các biến đổi này như có thể,
để chỉ phân tích đối tượng được mô tả
Nghiên cứu đầu tiên của Alvarez, Guichard, Lions và Morel cho thấy tất cả các quy mô không gian đáp ứng một số kiến trúc khá tự nhiên, việc làm giảm thông tin
và các tiên đề bất biến bị chi phối bởi một PDE với ảnh gốc là điều kiện ban đầu
Do đó, PDEs là khuôn khổ phù hợp cho các quy mô không gian
Thường thì các điều kiện này được bổ sung thêm một giả định tương đương với nguyên lý xếp chồng, cụ thể là tuyến tính:
∈ ℝ (2.18) Như chúng ta sẽ thấy dưới đây, việc áp dụng tuyến tính hạn chế ý tưởng quy
mô không gian cho một biểu diễn cơ bản
Quy mô không gian Gauss
Quy mô không gian được khảo sát tốt nhất và đầu tiên là quy mô không gian Gauss, thu được qua việc lấy tích chập với Gauss phương sai đồng biến, hay tương đương bằng cách lọc khuếch tán tuyến tính theo (2.9), (2.10)
Theo Iijima xem xét một biến đổi quan sát Φ phụ thuộc vào một tham số quy
mô và biến đổi ảnh ban đầu f(x) vào trong một tập mờ Φ[ ] Lớp này của biến đổi làm mờ được gọi là boke (phân kỳ) Ông giả định rằng nó có cấu trúc
[ ] ∫ { }
Trang 27Và cấu trúc đó phải thỏa mãn năm điều kiện:
1) Tuyến tính
Nếu mật độ của một mô hình gấp đôi mật độ ban đầu của nó, sau đó cũng xảy ra với mô hình được quan sát:
[ ] [ ] (2.20) 2) Tính bất biến tịnh tiến:
Lọc một hình ảnh được tịnh tiến giống như tịnh tiến một hình ảnh được lọc
[ ] [ ] (2.21) 3) Tính bất biến quy mô:
Nếu một mô hình được mở rộng về mặt không gian bởi một số yếu tố như λ, sau đó có tồn tại một như vậy
[ ( ) ] [ ] (2.22) 4) Tính chất nửa nhóm:
Nếu f được khảo sát theo một tham số và khảo sát này được khảo sát theo một tham số , thì tương đương với việc khảo sát f theo một tham số phù hợp :
[ [ ] ] [ ] (2.23) 5) Bảo toàn tính dương:
Nếu ảnh ban đầu là dương tính, thì ảnh được khảo sát cũng là dương tính
[ ] (2.24) Theo các yêu cầu này Iijima xuất phát theo một cách rất có hệ thống
Trang 28phương Tây Lý thuyết quy mô không gian của Nhật Bản đã được ứng dụng vào một khuôn khổ tổng quan cho việc nhận dạng mẫu, khai thác tính năng và phân loại đối tượng, và nhiều kết quả đã được đưa ra sớm hơn trong giới nghiên cứu phương Tây Ngoài giá trị lịch sử của chúng, những kết quả này của người Nhật đã cho thấy nhiều tính năng thú vị thu hút được sự quan tâm của các nhà nghiên cứu về lý thuyết quy mô không gian để có cái nhìn gần gũi hơn với chúng
2.2.3 Hạn chế
Mặc dù lọc khuếch tán tuyến tính có một số tính chất độc đáo và dễ dàng để xử
lý, nhưng nó cho thấy một số nhược điểm sau đây:
Một nhược điểm dễ thấy của làm trơn Gauss là trên thực tế nó không chỉ có nhiễu trơn mà còn làm mờ đi các đặc điểm quan trọng như các biên và do đó gây khó khăn cho việc phát hiện Kể từ khi làm trơn Gauss được thiết kế không được quy ước, nó không thể xét đến bất kỳ một thông tin nào trước đó trên các cấu trúc có giá trị được bảo toàn (hay thậm chí được nâng cấp)
Lọc khuếch tán tuyến tính làm sai lệch các biên khi đi từ quy mô tốt hơn sang sơ bộ Vì vậy các cấu trúc được xác định ở một quy mô sơ bộ không cung cấp vùng thích hợp và phải đưa được về ảnh ban đầu Trên thực tế, thông tin sai lệch thu được ở các quy mô khác nhau thì khó xác định và không nhất quán có thể dẫn đến những bất ổn
Một số đặc tính làm trơn của quy mô không gian Gauss không thực hiện được từ trường hợp 1-D đến các không gian cao hơn Một đường biên giao điểm không khép kín có thể chia thành hai khi quy mô tăng lên, và nó không chính xác rằng số vùng cực trị không được tăng lên Một phân tích về mặt toán học của các hiện tượng như vậy đã được thực hiện bởi Damon và Rieger Nó cho thấy rằng việc tạo ra từng cặp đường cực trị và điểm vòm không phải là một ngoại lệ, nhưng diễn ra một cách tổng quan
2.3 Tổng quan lọc khuếch tán phi tuyến
Các phương pháp làm trơn thích nghi dựa trên ý tưởng của việc ứng dụng một quá trình mà bản thân nó phụ thuộc vào các tính chất vùng của ảnh Mặc dù khái
Trang 29niệm này rất nổi tiếng trong giới xử lý ảnh, nhưng một công thức PDE tương ứng mới được đưa ra bởi Perona và Malik vào năm 1987 Chúng ta sẽ thảo luận chi tiết hơn về mô hình này, đặc biệt là bài toán giả định sai của nó Điều này dẫn đến các nghiên cứu mở rộng Những kỹ thuật này có thể được mở rộng tới những quá trình không đẳng hướng sử dụng một tenxơ khuếch tán thích nghi thay vì một khuếch tán
vô hướng
2.3.1 Mô hình Perona-Malik
Qua những thảo luận ở trên về lọc khuếch tán tuyến tính chúng ta đã thấy được những ưu nhược điểm của nó Và để khắc phục những nhược điểm đó, chúng ta sẽ thảo luận về tính năng vượt trội của lọc khuếch tán phi tuyến
Trước tiên chúng ta sẽ nói về ý tưởng cơ bản
Perona và Malik đề xuất một phương pháp khuếch tán phi tuyến để khắc phục các vấn đề cục bộ và làm mờ của lọc khuếch tán tuyến tính Họ áp dụng một quá trình không đồng nhất làm giảm khuếch tán ở những vị trí có tính hợp lý lớn hơn các biên Tính hợp lý này được đo bằng ∇ Các bộ lọc Perona-Malik dựa trên phương trình:
Có một điều thú vị là tồn tại một mối quan hệ giữa (2.26) với động lực học thần kinh nhận thức ánh sáng: năm 1984 Cohen và Grossberg [94] đã đề xuất một mô hình vỏ não thị giác sơ cấp với các hiệu ứng ức chế tương tự như trong mô hình Perona-Malik
Trang 30Những thí nghiệm của Perona và Malik thì rất ấn tượng và trực quan: các biên vẫn được duy trì ổn định trong một thời gian rất dài Nó đã được chứng minh rằng việc dò biên dựa trên quá trình này nhanh hơn so với dò biên Canny tuyến tính, thậm chí không áp dụng triệt tiêu cực đại không và hạn chế hiện tượng trễ Điều này
là do sự khuếch tán và dò biên tương tác với nhau trong một quá trình duy nhất thay
vì luôn bị coi là hai quá trình độc lập được áp dụng về sau
Tăng cường biên
Để nghiên cứu hoạt động của bộ lọc Perona-Malik ở các biên, chúng ta sẽ xét trường hợp không gian một chiều Điều này sẽ làm đơn giản hóa phép biểu diễn và
mô tả hoạt động chính khi gần một biên thẳng một ảnh hai chiều xấp xỉ như một hàm của một biến
Đối với khuếch tán (2.27) suy ra hàm thông lượng thỏa mãn cho |s| ≤ λ, và cho |s| > λ, xem Hình 2.2 khi đó (2.26) có thể được viết lại như sau
Chúng ta thấy rằng mặc dù khuếch tán không âm của nó mô hình Perona-Malik loại parabol thuận cho , loại parabol nghịch cho
Hình 2.2 (a) Khuếch tán ; (b) Hàm thông lượng Φ(s)
Do đó, λ đóng vai trò của một tham số tương phản phân ly thuận (độ tương phản
Trang 31thấp) từ các vùng khuếch tán nghịch (độ tương phản cao)
Không phải là khó để xác minh rằng bộ lọc Perona-Malik làm tăng độ dốc tại các điểm uốn của các biên trong một vùng nghịch: nếu tồn tại một giải pháp làm trơn u một cách đầy đủ nó thỏa mãn
(2.29) Một vị trí nơi mà đạt cực đại tại một số thời điểm t được đặc trưng bởi
và Do vậy
( ) (2.30) Trong trường hợp hai chiều, (2.28) được thay thế bởi [12]
Trong đó tọa độ ξ và η biểu thị hướng vuông góc và song song với ∇ tương ứng Do vậy, chúng ta có khuếch tán thuận dọc theo các đường đẳng phốt (tức là các đường của mức xám không đổi) được kết hợp với khuếch tán thuận nghịch dọc theo các luồng (đường biến thiên mức xám tối đa)
Chúng ta thấy rằng hoạt động khuếch tán thuận nghịch không chỉ giới hạn khuếch tán đặc biệt (2.27) mà còn xuất hiện trong tất cả các khuếch tán làm suy giảm nhanh chóng gây ra các hàm thông lượng không đơn điệu Việc làm giảm nhanh chóng các khuếch tán được hướng tới một cách rõ ràng trong phương pháp Perona-Malik khi nó cho kết quả mong muốn về việc làm mờ các dao động nhỏ và làm nét các biên Do vậy, nó là lý do chính cho các kết quả ấn tượng một cách rõ ràng của kỹ thuật khôi phục này
Điều đó chứng tỏ rằng giá trị tối ưu cho tham số tương phản λ phải phụ thuộc vào vấn đề này Một số đề xuất đã được thực hiện để tạo thuận lợi cho một sự lựa chọn như vậy trong thực tế, ví dụ việc thích ứng với nó để một điểm phân vị được chỉ định trong tích gradient histogramme, bằng cách sử dụng các tính chất thống kê của việc thiết lập các vùng được coi là phẳng, hoặc ước tính bằng các phương thức hình học của vùng ảnh
Trang 32Bài toán giả định sai
Thật không may, các phương trình thuận nghịch của Perona-Malik gây ra một
số vấn đề lý thuyết Mặc dù không có lý thuyết tổng quan cho quá trình parabol phi tuyến, nhưng có tồn tại các khuôn khổ nhất định cho phép thành lập các kết quả giả định đúng cho một lớp lớn các phương trình Xét ba ví dụ như sau:
Cho S(N) biểu thị tập các ma trận đối xứng N x N và Hess(u) Hessian của u Các bất đẳng thức vi sai cổ điển dựa trên bổ đề Nagumo-Westphal yêu cầu khai triển phương trình phi tuyến cơ bản
∇ (2.32) Thỏa mãn tính chất đơn điệu
(2.33) Với tất cả ∈ trong đó Y – X là bán toàn phương dương
Cùng một yêu cầu cần thiết cho việc áp dụng lý thuyết về các giải pháp Một giới thiệu chi tiết vào khuôn khổ này có thể tìm thấy trong một bài báo của Crandall, Ishii và Lions [103]
Cho H là một không gian Hilbert với tích vô hướng và A: H H Để áp dụng các khái niệm của các hoạt động đơn điệu tối đa cho vấn đề này
(2.34)
Phải đảm bảo rằng A là đơn điệu,
∈ (2.36) Chúng ta thấy rằng hàm thông lượng không đơn điệu của quá trình Perona-Malik ngụ ý rằng (2.32) không được thỏa mãn cũng không được định nghĩa bởi ∇ ∇ là đơn điệu Do vậy, không khuôn khổ nào được áp dụng
để đảm bảo các kết quả giả định đúng
Một lý do tại sao người ta bi quan về giả định đúng của phương trình
Trang 33Perona-Malik là một kết quả của Hollig [187] Ông đã xây dựng một quá trình khuếch tán thuận nghịch mà có thể có nhiều giải pháp Mặc dù quá trình khác với quá trình Perona-Malik, nhưng nó là một trong báo hiệu điều gì có thể xảy ra Năm 1994 phỏng đoán chung là các bộ lọc Perona-Malik có thể có các giải pháp không ổn định, nhưng người ta cũng không nên mong đợi tính độc đáo cũng như tính ổn định Trong khi đó, nhiều kết quả lý thuyết có giá trị cung cấp những hiểu biết sâu hơn về tính thực tế về bài toán giả định sai của các bộ lọc Perona-Malik
Kawohl và Kutev đã chứng minh rằng quá trình Perona-Malik không có giải pháp chung cho dữ liệu ban đầu liên quan đến khuếch tán nghịch Sự tồn tại của giải pháp cục bộ vẫn chưa được chứng minh Tuy nhiên, nếu chúng tồn tại, Kawohl và Kutev đã chỉ ra rằng những giải pháp này là duy nhất và thỏa mãn nguyên lý max-min Hơn nữa, theo các giả thuyết đặc biệt trên các dữ liệu ban đầu thì có thể thiết lập một nguyên lý so sánh
Các kết quả của You và cộng sự [446] đưa ra bằng chứng cho thấy quá trình Perona-Malik là không ổn định đối với nhiễu của ảnh ban đầu Họ đã chỉ ra rằng hàm năng lượng dẫn đến quá trình Perona-Malik khi sự suy giảm đường dốc nhất có một số lượng vô hạn các cực tiểu chung dày đặc trong không gian ảnh Mỗi cực tiểu tương ứng một ảnh liên tục từng mảng, và các ảnh ban đầu khác nhau có thể kết thúc trong cực tiểu khác nhau với
Phương trình khuếch tán thuận nghịch của Perona-Malik không phi tự nhiên khi
họ mới xem xét lần đầu tiên: bên cạnh tầm quan trọng của chúng trong tầm nhìn máy tính họ đã đề xuất một mô hình toán học cho biến đổi nhiệt và khối lượng trong một dòng cắt nhiễu được phân tầng một cách ổn định Một mô hình như vậy được
sử dụng để giải thích nhiệt độ không đổi theo từng bước hoặc độ mặn trong đại dương Các phương trình có liên quan cũng đóng một vai trò quan trọng trong các dao động phổ biến và tính đàn hồi
Về khía cạnh số, tính bất ổn chủ yếu là do quan sát được gọi là hiệu ứng bậc thang, một biên đường sigma khai triển thành các đoạn tuyến tính theo mảng được phân biệt bởi các bước nhảy Nó đã được quan sát bởi Posmentier năm 1977 [333]
Trang 34Ông đã sử dụng một phương trình Perona-Malik cho các mô phỏng số về độ mặn trong các đại dương Bắt đầu từ một sự phân bố ban đầu làm tăng độ trơn, ông đã cho thấy việc tạo ra các nhiễu dẫn đến một biên dạng không đổi theo từng bước sau một thời gian
Trong xử lý ảnh, các nghiên cứu số của hiệu ứng bậc thang đã được thực hiện bởi Nitzberg và Shihota [310], Frohlich và Weickert [148], và Benhamouda [36] Tất cả các kết quả đều theo cùng một hướng: số lượng các vùng tạo ra phụ thuộc rất lớn vào hiệu ứng phân bố đều của sự rời rạc Những sự rời rạc tốt hơn thì không đều
và dẫn đến nhiều bậc hơn Weickert và Benhamouda đã chỉ ra rằng hiệu ứng phân
bố đều của một rời rạc vi sai hữu hạn tiêu chuẩn là đủ để đưa các bộ lọc Malik tới một vấn đề ban đầu được giả định đúng cho một hệ thống phi tuyến của các phương trình vi phân thông thường Cách giải chung của nó thỏa mãn nguyên lý max-min và hội tụ cho cho một trạng thái ổn định không đổi
Cũng có tồn tại một giải thích về mặt rời rạc tại sao việc tăng bậc về bản chất là quan sát được sự bất ổn: trong không gian 1-D, các rời rạc FD tiêu chuẩn là đơn điệu, bảo đảm rằng không có thêm dao động xảy ra trong khai triển Điều này đã được chứng minh bởi Dzu Magaziewa [123] trong trường hợp bán rời rạc và bởi Benhamouda trong trường hợp rời rạc với một sự rời rạc thời gian rõ ràng
Biểu diễn quy mô không gian
Perona và Malik đã phủ định giả định về tiên đề quy mô không gian tuyến tính của Koenderink mà việc làm trơn nên xử lý tất cả các điểm không gian và các mức quy mô như nhau Thay vào đó, họ yêu cầu các biên vùng phải được sắc nét và trùng với các biên về tất cả ngữ nghĩa ở mỗi cấp phân giải, và việc làm trơn trong vùng đó phải được ưu tiên để làm trơn liên vùng Các tính chất này được quan tâm trong thực tế, khi chúng đảm bảo rằng các kiến trúc có thể phát hiện được một cách
dễ dàng và các vấn đề tương ứng có thể được bỏ qua Các thí nghiệm đã chứng minh rằng các bộ lọc Perona-Malik thỏa mãn những yêu cầu này khá tốt
Để thiết lập một tính chất quy mô không gian làm trơn cho quá trình khuếch tán
Trang 35phi tuyến này, một cách tự nhiên nó sẽ được chứng minh theo nguyên lý max-min,
để cho biết rằng có tồn tại một giải pháp làm trơn toàn diện Kể từ khi vấn đề tồn tại được sử dụng là nút cổ chai trong quá khứ, sự thử nghiệm đầu tiên là do Kawohl và Kutev những người đã thiết lập một nguyên lý cực trị về giải pháp không ổn định cục bộ cho các bộ lọc Perona-Malik Tất nhiên, điều này chỉ thỏa mãn một phần, vì theo lý thuyết quy mô không gian người ta quan tâm tới việc có một nguyên lý cực trị cho toàn bộ khoảng thời gian [
Tuy nhiên, các thử nghiệm khác để áp dụng các khuôn khổ quy mô không gian cho quá trình Perona-Malik vẫn chưa thành công
Salden, Florack và Eberly đã đề xuất để thực hiện lý thuyết quy mô không gian tuyến tính cho trường hợp phi tuyến bằng cách xem xét quá trình khuếch tán phi tuyến Nhưng các bộ lọc Perona-Malik lại không thuộc về lớp này
Alvarez, Guichard, Lions và Morel [12] đã phát triển một tiên đề quy mô không gian phi tuyến bao gồm lý thuyết quy mô không gian tuyến tính cũng như quá trình hình thái phi tuyến Tiên đề làm trơn của họ là một giả định đơn điệu (nguyên lý so sánh) đòi hỏi phải có quy mô không gian để duy trì:
(2.37) Tính chất này liên quan chặt chẽ với nguyên lý max-min và -ổn định của giải pháp Tuy nhiên, mô hình Perona-Malik không phù hợp với khuôn khổ này, bởi vì giải pháp không ổn định cục bộ của nó thỏa mãn nguyên lý so sánh chỉ trong một khoảng thời gian giới hạn, chứ không phải cho tất cả > 0
2.3.2 Các mô hình phi tuyến điển hình
Như đã đề cập ở trên, các nghiên cứu về mặt số có thể cung cấp các chuẩn ngầm định làm ổn định quá trình Perona-Malik Do đó, nó đã được đề xuất để đưa sự chuẩn hóa một cách trực tiếp vào phương trình liên tục làm cho nó trở nên độc lập hơn để thực thi về mặt số Khi tính linh hoạt của giải pháp có thể phụ thuộc vào các loại chuẩn hóa một cách giới hạn, người ta phải điều chỉnh sự chuẩn hóa để đạt
Trang 36được mục tiêu của phương trình nhiệt thuận nghịch Người ta có thể áp dụng sự chuẩn hóa về không gian-thời gian (và đương nhiên là có cả sự kết hợp của cả hai) Dưới đây chúng ta sẽ thảo luận về ba ví dụ minh họa sự đa dạng của các khả năng
và sự điều chỉnh của họ đối với một nhiệm vụ cụ thể
1 Nỗ lực chuẩn hóa không gian đầu tiên có lẽ là của Posmentier-người đã xem xét nhiều hiệu ứng ổn định trung bình gradient trong khuếch tán [333] Một công thức toán học của ý tưởng này được đưa ra bởi Catte, Lions, Morel và Coll Bằng cách thay thế khuếch tán ∇ của mô hình Perona-Malik bởi một tập được làm trơn Gauss ∇ với và họ đưa ra phương trình
Tồn tại tính quy luật và tính duy nhất của nghiệm với đã cho Quá trình đã được phân tích và sửa đổi nhiều lần theo nhiều cách: Whitaker và Pizer đã đề xuất rằng tham số chuẩn hóa phải là một hàm suy giảm theo thời gian t, và về sau Li và Chen đã đề xuất tham số tương phản suy giảm λ Một nghiên cứu chi tiết về sự ảnh hưởng của các tham số trong một mô hình Perona-Malik chuẩn hóa được thực hiện bởi Benhamouda Kacur và Mikula
đã khảo sát một sửa đổi cho phép khuếch tán khác nhau theo các dải giá trị xám khác nhau Các chuẩn hóa không gian của quá trình Perona-Malik dẫn đến các phương trình khuếch tán không đẳng hướng được đề xuất bởi Weickert [413, 415] Torkamani-Azar và Tait đề nghị thay thế tích chập Gauss bằng bộ lọc hàm số mũ của Shen và Castan
Từ một quan điểm thực tế, các chuẩn không gian cung cấp các lợi thế rằng chúng làm cho các bộ lọc không nhạy cảm với nhiễu ở các quy mô nhỏ hơn
σ Vì vậy, khi coi như một phương trình khôi phục ảnh, nó cho thấy bên cạnh tham số tương phản λ còn thêm vào một quy mô nhiễu σ Điều này nhằm tránh một thiếu sót của quá trình Perona-Malik mà giải thích sai các dao động mạnh do nhiễu khi các cạnh cần được duy trì hay thậm chí tăng cường
2 P.-L Lions đã chứng minh rằng quá trình mang tính một chiều
Trang 37(2.39)
dẫn đến một bộ lọc giả định đúng Chúng ta xem xét v là thời gian trễ của trong đó tham số xác định trễ Các phương trình này là một trường hợp đặc biệt của qui chuẩn không gian-thời gian của Nitzberg và Shiota khi bỏ qua qui chuẩn không gian bất kỳ Mumford phỏng đoán rằng
mô hình này cho các trạng thái ổn định liên tục theo từng mảng Trong trường hợp này, giải pháp trạng thái ổn định sẽ giải quyết vấn đề phân đoạn
3 Trong trường hợp dòng chảy trượt, Barenblatt đã chuẩn hóa phương trình nhiệt thuận nghịch một chiều bằng cách xét phương trình bậc ba
( ) (2.41) Trong đó Ψ là hàm đồng biến và bị chặn đều trong ℝ, và khi Qui chuẩn này đã được biểu diễn vật lý bằng cách đưa vào khuếch tán một thời gian nghỉ Đối với vấn đề giá trị biên ban đầu tương ứng với điều kiện biên Neumann đồng nhất họ đã chứng minh sự tồn tại của một giải pháp chuẩn duy nhất Họ cũng chỉ ra rằng các giải pháp làm trơn có thể trở thành không liên tục trong thời gian hữu hạn, trước khi họ kết luận về một trạng thái ổn định liên tục theo từng mảng
2.3.3 Mô hình phi tuyến không đẳng hướng
Tất cả các bộ lọc khuếch tán phi tuyến mà chúng ta đã khảo sát cho tới lúc này đều sử dụng một khuếch tán vô hướng có giá trị g được điều chỉnh cho phù hợp với cấu trúc ảnh cơ bản Vì vậy, chúng là đẳng hướng và thông lượng ∇ luôn song song với ∇ Tuy nhiên trong một số ứng dụng nhất định nó là điều mong muốn để đặc tuyến thông lượng hướng tới các đặc tính đang quan tâm Những yêu cầu này không thể được thỏa mãn bởi một khuếch tán vô hướng nữa, một tensor khuếch tán dẫn đến các bộ lọc khuếch tán không đẳng hướng phải được đưa vào ứng dụng
Ý tưởng không đẳng hướng đầu tiên trong xử lý ảnh là của Graham vào năm
1962, sau đó là Newman và Dirilten, Lev, Zucker và Rosenfeld, và Nagao và
Trang 38Matsuyama Họ đã sử dụng các mặt nạ chập mà phụ thuộc vào cấu trúc ảnh cơ bản Liên quan đến phương pháp tiếp cận thống kê đã được đề xuất bởi knutsson, Wilson
và Granlund Những ý tưởng này đã tiếp tục được phát triển bởi Nitzberg và Shiota, Lindeberg và Garding, và Yang Họ đề nghị sử dụng các dạng mặt nạ Gauss phù hợp Các bộ lọc khuếch tán không đẳng hướng thường áp dụng các chiến lược qui chuẩn không gian Một nghiên cứu lý thuyết tổng quan cho các bộ lọc khuếch tán không đẳng hướng được qui chuẩn không gian sẽ được trình bày ở các phần tiếp theo
Dưới đây là hai nghiên cứu đại diện về quá trình khuếch tán không đẳng hướng Nghiên cứu đầu tiên cho thấy các ưu điểm với các cạnh nhiễu, trong khi nghiên cứu thứ hai là sự thích nghi tốt với việc xử lý các đặc tính một chiều Chúng được gọi tương ứng là khuếch tán không đẳng hướng tăng cường biên và khuếch tán không đẳng hướng thích nghi
a) Qui chuẩn không đẳng hướng của quá trình Perona-Malik
Theo bản chất của một phương trình khuếch tán đẳng hướng phi tuyến phân đoạn (2.37) hoạt động giống như bộ lọc khuếch tán tuyến tính (2.9), nhưng tại các biên sự khuếch tán bị hạn chế Vì vậy, nhiễu ở các biên không thể loại
bỏ được bởi quá trình này Để khắc phục vấn đề này, một giải pháp mong đợi hơn là khuếch tán dọc theo các biên để khuếch tán vuông góc với chúng Các
mô hình không đẳng hướng không chỉ tính đến các mô đun của bộ dò biên
∇ mà còn cả hướng của nó Chúng ta sẽ xây dựng hệ trực giao của các vetor đặc trưng , của tensor khuếch tán D phản ánh cấu trúc biên được ước lượng:
Để làm trơn dọc theo biên hơn là làm trơn ngang qua nó, Weickert đã đề xuất
để lựa chọn các giá trị riêng tương ứng và khi
∇ (2.44) Một cách tổng quan, ∇ không trùng với các vector riêng của D khi σ > 0
Trang 39Do đó, mô hình này hoạt động không đẳng hướng thực sự Nếu chúng ta cho tham số qui chuẩn σ tiến dần về 0, chúng ta kết thúc với quá trình Perona-Malik đẳng hướng
b) Các mô hình không đẳng hướng trong việc làm trơn các đối tượng một chiều
Lý do thứ hai cho việc đưa không đẳng hướng vào quá trình khuếch tán xuất phát từ mong muốn xử lý các đặc tính một chiều như các cấu trúc cạnh Cottet và Germain đã xây dựng một tensor khuếch tán với các vector riêng như trong (2.42) và các giá trị riêng tương ứng
∇ ∇
( ∇
) (2.46)
Đây là một quá trình khuếch tán cơ bản trực giao với ∇ Với , chúng
ta thấy rằng ∇ trở thành một vector riêng của D với giá trị riêng tương ứng
0 Vì vậy, quá trình dừng lại hoàn toàn Theo hướng này, nó sẽ không đi tới một qui chuẩn không đẳng hướng của phương trình Perona-Malik Các kết quả giả định đúng cho bộ lọc Cottet-Germain bao gồm một thử một cho các giải pháp không ổn định Khi mô hình Cottet-Germain khuếch tán chỉ theo một hướng, nó xóa kết quả mà phụ thuộc rất nhiều vào hướng làm trơn Với việc tăng cường các cấu trúc cạnh song song, người ta có thể chứng minh mô hình này khi thay thế ∇ bằng một bộ mô tả mạnh hơn sự định hướng cục
bộ, tensor cấu trúc Điều này dẫn đến khuếch tán không đẳng hướng thích nghi
2.4 Các nghiên cứu về phản ứng khuếch tán
Phần này chúng ta khảo sát các nghiên cứu biến phân, trong đó các phương trình phản ứng khuếch tán hoặc các hệ kết hợp của chúng được giải thích như các bộ tối thiểu hóa nghịch biến của các hàm năng lượng thích hợp Ý tưởng này kết hợp với các phương pháp khuếch tán để dò biên và phân đoạn Bên cạnh việc giải thích biến phân còn tồn tại các nghiên cứu lý thuyết khác về các bộ lọc khuếch tán chẳng hạn như trường ngẫu nhiên Markov và lĩnh vực xử lý nhiệt, và thống kê, và các mô hình
Trang 40xác định tính tương tác hạt nhân
2.4.1 Các phương trình phản ứng khuếch tán đơn
Nordstrom đã đề nghị để thiết lập lại u của một ảnh bị xuống cấp f bằng cách tối thiểu hàm năng lượng
∫ ∇ (2.47) Tham số β và λ là các trọng số dương và [ ] cho một biểu diễn biên mờ: trong một vùng, w tiến dần đến 1 trong khi ở các biên, w thì gần bằng 0 Số hạng đầu tiên của E gây ra các sai số của u từ f (giá trị sai số), số hạng thứ hai phát hiện sự không làm trơn của u trong từng vùng (giá trị ổn định), và số hạng cuối cùng đo sự phát triển biên (giá trị biên) Giá trị của ba số hạng này là điển hình cho các phương pháp phục hồi ảnh biến phân
Các phương trình Euler tương ứng với hàm năng lượng này được viết như sau
( ) ∇ (2.49) Với một điều kiện biên đồng nhất cho u Giải (2.48) cho w ta được
∇
(2.50)
Chúng ta thấy rằng w là giống hệt nhau với khuếch tán Perona-Malik ∇
đã được đề cập trong (2.27) Do đó, (2.48) có thể được coi như phương trình trạng thái ổn định của
∇ ∇ (2.51) Phương trình này cũng có thể đạt được một cách trực tiếp như phương pháp nghịch biến của hàm
∫ ( ∇
)
(2.52)