Phạm vi nghiên cứu - Nghiên cứu và phân tích các khía cạnh lý thuyết của xử lý ảnh, bao gồmPixel, mức xám/màu, các đặc điểm không gian, một số kỹ thuật nâng cao chấtlượng ảnh số.. - Nâng
TỔNG QUAN VỀ XỬ LÝ ẢNH
Tổng quan về hệ thống xử lý ảnh
Con người thu thập thông tin về môi trường xung quanh qua các giác quan, trong đó thị giác đóng vai trò quan trọng Sự phát triển của phần cứng máy tính đã thúc đẩy lĩnh vực xử lý hình ảnh và đồ họa, mang lại nhiều ứng dụng trong đời sống hàng ngày Xử lý hình ảnh và đồ họa trở thành yếu tố thiết yếu trong tương tác giữa người và máy tính Quá trình này bao gồm các phương pháp và thuật toán áp dụng cho hình ảnh đầu vào nhằm đạt được kết quả mong muốn, có thể là những bức ảnh được cải thiện hoặc những kết luận có ý nghĩa.
Quá trình xử lý ảnh bắt đầu bằng việc thu nhận ảnh, đây là bước quyết định cho quá trình XLA Hình ảnh đầu vào được thu thập qua các thiết bị như camera, cảm biến và máy quét, sau đó được số hóa Các thông số quan trọng trong giai đoạn này bao gồm độ phân giải, chất lượng màu sắc, dung lượng bộ nhớ và tốc độ thu nhận ảnh của thiết bị.
Tiền xử lý là bước quan trọng trong việc cải thiện chất lượng ảnh, bao gồm các kỹ thuật như tăng cường độ tương phản, khử nhiễu, loại bỏ bóng và điều chỉnh độ lệch Những cải tiến này thường được thực hiện thông qua các bộ lọc, nhằm nâng cao độ rõ nét và tính chân thực của hình ảnh.
Quá trình trích chọn đặc trưng nhằm phát hiện các đặc điểm nổi bật trong ảnh gốc để tạo ra biểu diễn có ý nghĩa hơn Các phương pháp bao gồm xác định điểm quan tâm và sử dụng kỹ thuật như lọc, biến đổi Fourier, hoặc các thuật toán học máy như CNN Mục tiêu là giảm thiểu thông tin không cần thiết và tạo ra biểu diễn dễ dàng phân tích cho các bước xử lý tiếp theo.
Hậu xử lý là giai đoạn quan trọng sau khi trích chọn đặc trưng, nơi áp dụng các kỹ thuật và thuật toán nhằm cải thiện và tinh chỉnh kết quả ảnh Các phương pháp trong hậu xử lý bao gồm làm mịn, gia tăng độ tương phản, loại bỏ nhiễu, và cân bằng sáng, giúp nâng cao chất lượng ảnh Giai đoạn này cũng chuẩn bị cho các tác vụ xử lý tiếp theo như nhận dạng, phân loại hoặc phân đoạn.
Hệ quyết định là bước quan trọng trong việc áp dụng các phương pháp và thuật toán để đưa ra quyết định dựa trên thông tin và đặc trưng trích xuất từ ảnh Hệ thống này có thể sử dụng các thuật toán máy học, học sâu (deep learning) hoặc các phương pháp khác nhằm phân loại, nhận dạng và dự đoán thông tin trong ảnh một cách hiệu quả.
Trong quá trình xử lý ảnh, việc lưu trữ thông tin và kết quả là rất quan trọng, với các hệ thống thường sử dụng cơ sở dữ liệu để quản lý dữ liệu ảnh và kết quả liên quan Cơ sở dữ liệu giúp lưu trữ và truy xuất ảnh gốc, kết quả xử lý, và thông tin liên quan, tạo điều kiện thuận lợi cho việc tái sử dụng và tra cứu dữ liệu Bước đối sánh liên quan đến việc so sánh thông tin và đặc trưng của ảnh với các mẫu hoặc dữ liệu tham chiếu để xác định đối tượng hoặc tìm kiếm tương tự Các phương pháp đối sánh có thể bao gồm so sánh histogram, so sánh biên, so sánh dấu vân tay, và sử dụng mô hình học máy để nhận dạng.
Những vấn đề cơ bản trong xử lý ảnh
1.2.1 Một số khái niệm cơ bản
Ảnh được hình thành từ các điểm ảnh, bao gồm ảnh kỹ thuật số, hình ảnh in từ máy in, và hình ảnh quang học chiếu qua ống kính.
Điểm ảnh (fixel) là đơn vị cơ bản nhất trong hình ảnh kỹ thuật số, chứa thông tin về màu sắc và độ sáng Khi nhiều điểm ảnh được sắp xếp, chúng tạo thành hình ảnh mà con người có thể nhìn thấy Kích thước hình ảnh được đo bằng số lượng điểm ảnh theo chiều ngang và chiều dọc, ví dụ như 1920x1080 pixels.
Mức xám, màu: là các giá trị có thể có của các điểm ảnh của ảnh.
Ảnh mức xám (Grayscale) là loại hình ảnh chỉ sử dụng các mức độ sáng để biểu diễn mà không có thông tin màu sắc Mỗi điểm ảnh trong ảnh mức xám chỉ có một giá trị duy nhất đại diện cho cường độ ánh sáng tại điểm đó, với giá trị thường nằm trong khoảng từ 0 đến 255.
0 (đen) đến 255 (trắng), trong đó 0 là màu đen tuyệt đối và 255 là màu trắng tuyệt đối.
Ảnh màu chứa thông tin về màu sắc thông qua các kênh màu như RGB (Đỏ, Xanh lục, Xanh lam) hoặc CMYK (Xanh lam, Đỏ tươi, Vàng, Đen) Mỗi điểm ảnh trong ảnh màu được đại diện bởi một tập hợp giá trị màu sắc cho từng kênh, giúp tái tạo màu sắc và độ sáng của hình ảnh một cách chính xác.
1.2.2 Nắn chỉnh biến dạng Ảnh thu thường biến dạng do các thiết bị quang học và điện tử Nắn chỉnh biến dạng thực hiện việc biến đổi hình học giữa hai ảnh: ảnh nguồn và ảnh đích.
Sự biến đổi hình học xác định mối quan hệ giữa các điểm ảnh nguồn và điểm ảnh đích thông qua các hàm toán học Những hàm này có thể được áp dụng cho toàn bộ ảnh hoặc chỉ một vùng cụ thể Trong quá trình nắn chỉnh ảnh, cần xác định các đặc trưng ảnh hưởng đến thuật toán, dẫn đến hai khuynh hướng: tác động toàn cục và tác động cục bộ Tác động toàn cục áp dụng các thuật toán giống nhau cho mọi điểm ảnh, trong khi tác động cục bộ chỉ điều chỉnh một số vùng nhất định, giữ nguyên các vùng khác.
Để cải thiện chất lượng hình ảnh, các phép chiếu được xây dựng dựa trên tập hợp các điểm điều khiển Giả sử có hai ảnh I (ảnh thu nhận) và I' (ảnh mong muốn), với mỗi điểm Pi thuộc I tương ứng với một điểm Pi' trên I', tạo thành n cặp điểm điều khiển.
Nắn chỉnh biến dạng là tìm hàm f: Pi → f(Pi) sao cho
(1.1) Thông thường các điểm điều khiển được lấy bằng cách chụp những hình ảnh cấu trúc định sẵn như là ảnh lưới giống như ảnh mong muốn trên hình 1.2.
Có hai loại nhiễu cơ bản trong quá trình thu nhận ảnh mà chúng ta cần loại bỏ:
Nhiễu hệ thống là loại nhiễu có quy luật và cấu trúc xác định, thường xuất hiện do sai số trong quá trình thu nhận ảnh, thiết bị cảm biến, hoặc xử lý ảnh Loại nhiễu này có thể được khử hiệu quả bằng các phép biến đổi hoặc kỹ thuật xử lý phù hợp với cấu trúc của nó.
Nhiễu ngẫu nhiên là loại nhiễu không có quy luật, thường xuất hiện dưới dạng các giá trị pixel ngẫu nhiên không liên quan đến thông tin hình ảnh thực Loại nhiễu này có thể làm mờ hoặc mất chi tiết trong hình ảnh Để khắc phục, các phương pháp như bộ lọc trung bình, bộ lọc Gaussian và các kỹ thuật khử nhiễu khác thường được áp dụng nhằm làm mịn hình ảnh và loại bỏ nhiễu.
Chỉnh số mức xám là nhằm khắc phục tính không đồng đều của hệ thống,thông thường có 2 hướng tiếp cận:
Giảm số mức xám là quá trình nhóm các mức xám gần nhau thành một bó, giúp đơn giản hóa hình ảnh Khi giảm xuống chỉ còn 2 mức xám, hình ảnh sẽ được chuyển đổi thành đen trắng.
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
Phân tích ảnh
Trích chọn đặc điểm là một bước quan trọng trong quá trình xử lý ảnh, giúp tiến tới việc hiểu ảnh Các đặc điểm của đối tượng được lựa chọn dựa trên mục đích nhận dạng cụ thể trong phân tích ảnh Dưới đây là một số đặc điểm của ảnh cần lưu ý.
Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn …
Phân bố mức xám trong hình ảnh, thường được thể hiện qua biểu đồ histogram, phản ánh sự phân bố của các mức độ xám Thông qua phân bố mức xám, người dùng có thể nắm bắt thông tin về cường độ ánh sáng và độ tương phản của hình ảnh, từ đó hiểu rõ hơn về tổng thể cũng như các khu vực cụ thể trong hình ảnh.
Phân bố xác suất là cách mô tả xác suất xảy ra của các giá trị pixel trong hình ảnh, thể hiện mối quan hệ giữa các giá trị này và xác suất tương ứng Công cụ này thường được áp dụng trong việc phát hiện và phân loại các vật thể trong hình ảnh, giúp nâng cao độ chính xác trong phân tích hình ảnh.
Biên độ (Amplitude) là chỉ số phản ánh độ lớn của tín hiệu hoặc cường độ ánh sáng tại từng điểm ảnh trong hình ảnh Đối với hình ảnh màu, biên độ có thể được tính toán riêng cho từng kênh màu hoặc tổng hợp từ tất cả các kênh màu.
Điểm uốn (Curvature) là sự thay đổi hình dạng hoặc độ cong tại mỗi điểm trên đường cong hoặc biên Trong phân tích hình ảnh, điểm uốn giúp nhận diện các đặc điểm cụ thể, chẳng hạn như ranh giới giữa các vật thể và các đặc điểm quan trọng của chúng.
1.3.2 Đặc điểm biến đổi: Đặc điểm biến đổi là các đặc điểm của hình ảnh được trích chọn bằng cách thực hiện lọc vùng, thường sử dụng các mặt nạ đặc điểm Các bộ vùng này giúp nhấn mạnh hoặc loại bỏ các đặc điểm cụ thể trong hình ảnh dựa trên hình dạng và kích thước của chúng Dưới đây là một số ví dụ về các đặc điểm biến đổi thông thường và các mặt nạ đặc điểm tương ứng:
Biên là ranh giới phân định giữa các khu vực trong ảnh có sự khác biệt về cường độ hoặc màu sắc Mặt nạ đặc điểm cho biên thường bao gồm các vùng nhọn với độ dày và hình dạng đặc trưng, như khe hẹp hoặc đường cạnh.
Góc trong hình ảnh được xác định là những điểm có sự thay đổi lớn về cường độ hoặc màu sắc, thường xuất hiện tại nơi giao nhau của hai hoặc nhiều biên Mặt nạ đặc điểm cho góc thường có hình dạng các khe hẹp với các cạnh sắc nét hoặc hình thoi.
Đỉnh (Peaks) là những điểm cao nhất trong một khu vực nhất định của hình ảnh, thể hiện sự tập trung mạnh mẽ của cường độ hoặc màu sắc Mặt nạ đặc điểm cho đỉnh thường được hình thành từ các khe hẹp hoặc các vùng hình chữ nhật nhỏ.
Vùng là các khu vực trong hình ảnh có những đặc điểm chung về cường độ hoặc màu sắc, thường được xác định bằng các mặt nạ đặc trưng Những mặt nạ này thường có hình dạng lớn như hình chữ nhật hoặc hình tròn, giúp phân loại và phân tích các vùng trong hình ảnh một cách hiệu quả.
1.3.3 Đặc điểm biên và đường biên: Đặc điểm biên và đường biên là các đặc trưng quan trọng trong phân tích hình ảnh và nhận dạng đối tượng Các đặc điểm này thường được sử dụng để mô tả các ranh giới và đường biên của đối tượng trong ảnh, và có thể được trích chọn thông qua việc xử lý ảnh biên Dưới đây là một số thông tin chi tiết:
Đặc điểm biên (Edge Features) là những yếu tố quan trọng trong ảnh, thể hiện sự thay đổi đột ngột về cường độ hoặc màu sắc của các điểm ảnh, giúp xác định ranh giới giữa các vùng trong hình ảnh Các đặc điểm này bao gồm thông tin về độ dốc, độ cong và độ sắc nét của biên, đóng vai trò then chốt trong việc phân tích và nhận diện hình ảnh.
Đặc điểm đường biên mô tả các tính chất của đường biên đối tượng trong hình ảnh, bao gồm độ dài, hình dạng và hướng Những đặc điểm này thường được sử dụng để phân tích hình dạng và cấu trúc của đối tượng Để thu được ảnh biên, có thể áp dụng các phép toán trong xử lý ảnh.
- Toán tử Gradient: Sử dụng để tính toán đạo hàm của hàm mức xám để xác định các vùng có sự thay đổi nhanh chóng trong cường độ.
- Toán tử La bàn (Sobel, Prewitt, Roberts, etc.): Được sử dụng để tìm ra các biên trong hình ảnh bằng cách tính toán đạo hàm theo hướng x hoặc y.
- Toán tử Laplace: Sử dụng để tìm ra các biên bằng cách tính toán đạo hàm bậc hai của hàm mức xám.
1.3.4 Nhận dạng và phân loại ảnh:
Nhận dạng tự động, mô tả đối tượng, và phân loại mẫu là những vấn đề quan trọng trong thị giác máy, ứng dụng rộng rãi trong nhiều ngành khoa học Một câu hỏi quan trọng là: mẫu (pattern) là gì? Watanabe, một trong những chuyên gia hàng đầu trong lĩnh vực này, định nghĩa mẫu là một thực thể được xác định một cách mơ hồ và có thể gán cho một tên gọi Ví dụ về mẫu bao gồm ảnh vân tay, ảnh chụp vật thể, chữ viết, khuôn mặt người, và ký đồ tín hiệu tiếng nói Để nhận dạng hoặc phân loại một mẫu, có thể sử dụng hai phương pháp chính.
Phân loại có mẫu (supervised classification): ví dụ phân tích phân biệt
(discriminant analyis), trong đó mẫu đầu vào được định danh thành một phần của một lớp đã xác định.
Phân loại không có mẫu, hay còn gọi là phân loại không giám sát (clustering), là phương pháp mà các mẫu được phân nhóm vào các lớp khác nhau dựa trên tiêu chí đồng dạng Các lớp này vẫn chưa được xác định hoặc biết đến cho đến khi quá trình phân loại diễn ra.
Xử lý nâng cao chất lượng ảnh
1.4.1 Cải thiện ảnh sử dụng các toán tử không gian
Phép cửa sổ di chuyển (Moving Window):
Hầu hết các phương pháp xử lý ảnh sử dụng toán tử không gian đều áp dụng kỹ thuật cửa sổ di chuyển Phương pháp này thực hiện biến đổi tại một điểm ảnh dựa vào giá trị của các điểm ảnh xung quanh nằm trong một cửa sổ bao trùm.
Gọi I và J là ảnh sao cho J=T[J] T[X] là một phép biến đổi sao cho
(1.2) Đây là phép biến đổi cửa sổ di chuyển với kích thước (s+1) x (d+1) và giá trị được biến đổi nằm ở góc bên trái cửa sổ.
Phép nhân chập và mẫu:
Nhân chập là một phép biến đổi hình ảnh thông qua việc sử dụng một ma trận mẫu Khi có một bức ảnh I với kích thước M x N và một mẫu T có kích thước m x n, quá trình nhân chập của ảnh I theo mẫu T sẽ được tính toán dựa trên một công thức cụ thể.
Theo công thức (1.3), giá trị biến đổi được hiển thị ở góc trên bên trái của cửa sổ, trong khi công thức (1.4) lại cho thấy giá trị biến đổi nằm ở góc dưới bên phải.
Trong quá trình thực hiện phép nhân chập, một số thao tác có thể dẫn đến việc ảnh không được xác định tại các vị trí nhất định, gây ra kích thước ảnh thu được nhỏ hơn Ảnh được thực hiện theo công thức 1.3 và 1.4 chỉ khác nhau ở một phép dịch chuyển, vì vậy ta sẽ coi phép nhân chập theo công thức 1.3 để đơn giản hóa.
1.4.2 Cân bằng Histogram Ảnh I được gọi là cân bằng "lý tưởng" nếu với mọi mức xám g, g’ ta có h(g) = h(g’) Giả sử, ta có:
I~ kích thước m x n new_level ~ số mức xám mới của ảnh sau cân bằng, thông thường giá trị này có thể bằng đúng số mức xám của ảnh gốc.
~ số điểm ảnh trung bình của mỗi mức xám của ảnh đã cân bằng
~ số điểm ảnh có mức xám ≤ g trên ảnh gốc Cần xác định hàm f: g-> f(g) sao cho:
Ví dụ: cân bằng ảnh sau với new_level = 4 g h(g) t(g) f(g)
Sau khi thực hiện cân bằng, mặc dù kết quả chưa đạt được trạng thái "lý tưởng", nhưng biểu đồ tần suất đã trở nên đồng đều hơn so với ảnh gốc.
1.4.3 Lọc trung bình Định nghĩa (trung bình)
Cho dãy x1, x2 …, xn khi đó trung bình của dãy ký hiệu AV({xn}) được dịnh nghĩa:
Kỹ thuật lọc trung bình
Giả sử ta có ảnh I, điểm ảnh P, cửa sổ W(P) và ngưỡng Khi đó kỹ thuật lọc trung bình phụ thuộc không gian bao gồm các bước cơ bản sau:
Giá trị 16 sau phép lọc trung bình có giá trị 4, các giá trị còn giữ nguyên sau phép lọc.
Cho dãy x1; x2 …; xn đơn điệu tăng (giảm) khi đó trung vị của dãy ký hiệu là Med({xn}) được định nghĩa
Kỹ thuật lọc trung vị
Giả sử ta có ảnh I ngưỡng cửa số W(p) và điểm ảnh P
Khi đó kĩ thuật trung vị phụ thuộc không gian bao gồm các bước cơ bản:
CHƯƠNG 2 KỸ THUẬT LỌC TRUNG BÌNH VÀ LỌC TRUNG VỊ
TRONG XỬ LÝ ẢNH NHIỄU
Nhiễu đốm và Nhiễu muối tiêu
Nhiễu muối tiêu là loại nhiễu xuất hiện do sai số trong quá trình truyền dữ liệu, dẫn đến việc các pixel được thay đổi giá trị một cách ngẫu nhiên Các pixel này có thể mang giá trị bằng 0 hoặc giá trị cực đại, tạo ra hình ảnh với các chấm tương tự như muối và tiêu.
Một ví dụ điển hình của nhiễu xung là hiện tượng "muối tiêu", trong đó các điểm ảnh bị nhiễu có thể có giá trị từ 0 đến 255 Cụ thể, nếu một điểm ảnh đạt giá trị cực đại 255, nó sẽ tạo ra đốm trắng, trong khi giá trị cực tiểu 0 sẽ tạo ra đốm đen Khi nói về ảnh nhiễu muối tiêu 30%, điều này có nghĩa là 15% các điểm ảnh có giá trị cực tiểu và 15% có giá trị cực đại, tạo nên hiệu ứng nhiễu đặc trưng.
Hình 2.2 Ảnh nhiễu muối tiêu
Nhiễu Speckle, hay còn gọi là nhiễu đốm, là loại nhiễu xuất hiện do tác động của điều kiện môi trường lên cảm biến hình ảnh trong quá trình thu nhận hình ảnh Loại nhiễu này thường được nhận thấy trong các bức ảnh y tế, ảnh radar hoạt động, và ảnh radar khẩu độ tổng hợp (SAR).
Hình 2.3 Nhiễu đốm trong ảnh siêu âm
Kỹ thuật lọc trung bình và lọc trung vị trong xử lý ảnh nhiễu
2.2.1 Lọc trung bình trong xử lý ảnh nhiễu
Lọc trung bình là một kỹ thuật lọc tuyến tính, hoạt động như một bộ lọc thông thấp Thuật toán này sử dụng một cửa sổ lọc 3x3 để quét qua từng điểm ảnh của ảnh đầu vào Tại mỗi vị trí điểm ảnh, giá trị của các điểm ảnh trong vùng 3x3 của ảnh gốc được đưa vào ma trận lọc Giá trị điểm ảnh của ảnh đầu ra được tính bằng cách lấy giá trị trung bình của tất cả các điểm ảnh trong cửa sổ lọc Quá trình tính toán bao gồm hai bước: tính tổng các thành phần trong cửa sổ lọc và chia tổng này cho số lượng phần tử của cửa sổ lọc.
Hình 2.4 Mô tả kỹ thuật lọc trung bình 2.2.2 Lọc trung vị trong xủa lý ảnh nhiễu
Lọc trung vị là một kỹ thuật lọc phi tuyến quan trọng trong xử lý ảnh Thuật toán này sử dụng một cửa sổ lọc 3x3 để quét qua từng điểm ảnh của ảnh đầu vào Tại mỗi vị trí điểm ảnh, thuật toán lấy giá trị từ các điểm ảnh tương ứng trong vùng 3x3 và sắp xếp chúng theo thứ tự Cuối cùng, điểm ảnh nằm chính giữa (trung vị) của dãy giá trị đã sắp xếp được gán cho điểm ảnh tương ứng trong ảnh đầu ra.
Hình 2.5 Mô tả kỹ thuật lọc trung vị
ỨNG DỤNG LỌC NHIỄU VÀ KẾT QUẢ
Một số kết quả mô phỏng
Môi trường thử nghiệm: 2 chương trình thực hiện 2 kỹ thuật lọc nhiễu làm trơn ảnh được viết và chạy trên matlab.
Mục tiêu của nghiên cứu là lọc nhiễu để làm mượt ảnh, với dữ liệu đầu vào là các bức ảnh bị nhiễu Nhóm nghiên cứu đã phát triển một chương trình để tạo ra ảnh nhiễu, sau đó sử dụng những bức ảnh này làm đầu vào cho chương trình lọc mượt ảnh, áp dụng hai kỹ thuật lọc khác nhau.
Cách thức đánh giá: Đánh giá kết quả nhận được dựa vào trực quan nhìn thấy.
Hình 3.6 Kết quả loại bỏ nhiễu của Kỹ thuật lọc trung bình
Hình 3.7 Kết quả loại bỏ nhiễu của kỹ thuật lọc trung vị
Đánh giá, so sánh kết quả
Sau khi thực hiện chương trình, nhóm đã nhận thấy cả hai bộ lọc đề đều hoạt động hiệu quả, với Kỹ thuật lọc trung vị mang lại kết quả tốt hơn.
Kỹ thuật lọc trung bình với kernel lớn hơn có khả năng lọc tốt hơn nhưng lại làm giảm chất lượng ảnh, đặc biệt không hiệu quả với nhiễu muối tiêu Để cải thiện kỹ thuật này, có thể áp dụng một ngưỡng, chỉ thay thế giá trị điểm ảnh hiện tại bằng giá trị trung bình của vùng lân cận khi giá trị trung bình đó nhỏ hơn ngưỡng đã định.
Kỹ thuật lọc trung vị là phương pháp hiệu quả để xử lý hình ảnh có giá trị pixel bất thường, như trong trường hợp nhiễu muối tiêu Phương pháp này thay thế các giá trị pixel bị nhiễu, có mức xám khác biệt với các điểm xung quanh, bằng mức xám gần nhất từ các pixel lân cận, giúp cải thiện chất lượng hình ảnh.