20 Phân loại 20 1 Giới thiệu Trong nhiều ứng dụng xử lí ảnh, kích cỡ và hình dạng của các phần tử như bong bong, trạng thái mù, giọt, chất màu, nhân tế bào phải được phân tích Trong những trường hợp này, các tham số cần quan tâm được định nghĩa rõ ràng và có thể được đo trực tiếp từ các ảnh chụp được Chúng ta xác định vùng và hình dạng của mỗi phân tử mà chúng được phát hiện bằng các phương pháp trong phần 19 5 1 và 19 3 Biết được các tham số này sẽ cho phép tất cả các câu hỏi cần quan tâm có th.
Trang 120 Ph ân lo ại
20.1 Giới thiệu
Trong nhiều ứng dụng xử lí ảnh, kích cỡ và hình dạng củacác phần tử như bong bong, trạng thái mù, giọt, chất màu,nhân tế bào phải được phân tích Trong những trường hợpnày, các tham số cần quan tâm được định nghĩa rõ ràng và
có thể được đo trực tiếp từ các ảnh chụp được Chúng ta xácđịnh vùng và hình dạng của mỗi phân tử mà chúng đượcphát hiện bằng các phương pháp trong phần 19.5.1 và 19.3.Biết được các tham số này sẽ cho phép tất cả các câu hỏicần quan tâm có thể được trả lời Từ dữ liệu thu thập được,chúng ta có thể tính toán ví dụ histogram của vùng phần tử(hình 20.1.c) Ví dụ này là điển hình đối với một lớp rộngcác ứng dụng khoa học Các tham số đối tượng có thể đượcđánh giá một cách trực tiếp và rõ ràng từ dữ liệu hình ảnhgiúp trả lời các câu hỏi khoa học đưa đưa ra
Các ứng dụng khác phức tạp hơn yêu cầu phân biệt các lớpđối tượng khác nhau trong một ảnh Trường hợp dễ nhất vàđiển hình được đưa ra là nhiệm vụ kiểm tra công nghiệp.Kích cỡ của một đối tượng được kiểm tra có trong phạm vidung sai cho phép không? Có phần nào bị bỏ sót? Có saihỏng nào ví dụ như các vết xước không? Dựa trên kết quảphân tích kiểm tra, đối tượng này có thể là được xác nhậnđạt hoặc được coi là bị lỗi
Việc gán các đối tượng trong ảnh tới một lớp nhất địnhnào đó (giống như các khía cạnh khác trong phân tích và xử
lí ảnh) là một vấn đề học thuật thực sự mà nó không chuyênbiệt cho phân tích ảnh nhưng là một kĩ thuật rất thông dụng
Trang 2Về điều này, viêc phân tích ảnh là một phần của lĩnh vựcnghiên cứu nhận dạng mẫu Một ứng dụng cổ điển của nhậndạng mẫu mà mọi người đều biết là nhận dạng tiếng nói.Các từ được nói ra được chứa trong một tín hiệu ấm thanh1D (một chiều) Ở đây việc phân loại là để nhận ra âm vị,
từ và cấu của ngồn ngữ nói Nhiệm vụ tương ứng trong xử líảnh là nhận dạng văn bản (text recognition), nhận dạng chữcái và từ của một đoạn văn bản, việc nhận dạng chữ cái và
từ của một đoạn văn bản cũng được biết như nhận dạng kí
tự quang học (optical character recognition - OCR)
Hình 20.1: Các bước phân tích phân bố kích cỡ của phần tử (hạt đậu): a- Ảnh gốc,b- ảnh nhị phân, và c- Phân bố vùng
Một khó khăn chung trong phân loại liên quan đến một thực
tế là mỗi quan hệ giữa các tham số quan tâm và dữ liệu ảnh
Trang 3là không hiển nhiên, rõ ràng Các đối tượng được phân loạikhông liên quan trực tiếp đến một dải nhất định các giá trịcủa một đặc điểm nhưng phải được xác định bởi đặc trưngquang học của nó trong ảnh Cho ví dụ chúng ta có thể phânbiệt hạt đậu, hạt tiêu khô và các hạt hoa hướng dương tronghình 20.2? Mối liên quan giữa các đặc trưng quang học vàcác lớp đối tượng cần một nghiên cứu cẩn thận Chúng taminh họa mối quan hệ phức tạp giữa các đặc điểm đối tượng
và đặc trưng quang học của nó với hai ví dụ
Hình 20.2:Nhiệm vụ phân loại: Hạt nào là hạt tiêu, hạt đậu hạt hướng dương hay không hạt nào trong ba loại hạt trên A- ảnh gốc và B ảnh nhị phân sau khi phân đoạn
Tình trạng cây cối bị tàn lụi bởi môi trường (Waldsterben
-Sự hủy hoại rừng trên diện rộng bởi mưa axit và các ônhiễm môi trường) là một trong nhiều vấn đề lớn mà các nhàkhoa học đang phải đối măt Trong các hệ thống cảm ứng từ
xa, nhiệm vụ của chúng là sắp xếp và phân lớp các khu vực
bị phá hủy trong rừng từ hình ảnh của vệ tinh và không gian.Trong ví dụ này, mối quan hệ giữa các lớp khác nhau củađặc điểm và hủy hoại trong các ảnh là ít rõ ràng Các nghiêncứu chi tiết là cần thiết để khám phá các mối quan hệ phứctạp này Các ảnh không gian phải được so sánh với cácnghiên cứu trên mặt đất Chúng ta có thể cần nhiều hơn mộtđặc tính để nhận biết các lớp nhất định của việc hủy họai
Trang 4rừng
Có nhiều ứng dụng tương tự trong y tế và sinh học Mộttrong các câu hỏi tiêu chuẩn trong y học là phân biệt đượcgiữa khỏe mạnh và bệnh tật Lại một lần nữa, rõ ràng chúng
ta không thể trông mong một quan hệ đơn giản giữa hai lớpđối tượng và đặc tính của của đối tượng được theo dõi trongcác ảnh
Một ví dụ nữa được chỉ ra trong hình 20.3 Chúng ta sẽkhông có vấn đề gì trong việc nhận ra trong các đối tượngthì cái nào là đèn Làm thế nào hệ thống máy móc hình ảnhthực hiện được nhiệm vụ này Các đặc tính nào chúng ta cóthể rút ra từ những bức ảnh này giúp chúng ta nhận ra chiếcđèn Trong khi chúng ta không gặp vấn đề gì trong việc nhận
ra chiếc đèn trong hình 20.3, chúng ta cảm thấy là không thểvới câu hỏi làm thế nào thực hiện điều này dùng một chiếcmáy tính Rõ ràng nhiệm vụ này là rất phức tạp Chúng tanhận ra đèn vì chúng ta đã nhìn thấy nhiều đèn khác trướcđây và ghi nhớ trải nghiệm này Nhưng làm thế nào nhữngkinh nghiệm này được lưu lại và việc so sánh này được thựchiên Rõ ràng là không chỉ cơ sở sở dữ liệu về hình dạnghình học của đèn mà chúng ta còn biết hoàn cảnh nào haymôi trường nào có đèn và chúng được sử dụng làm gì.Nghiên cứu các vấn đề thuộc loại này là một phần trong lĩnhvực nghiên cứu trí tuệ nhân tạo (viết tắt là AI- Artificialintellidence)
Liên quan đến các ứng dụng khoa học, kĩ thuật hình ảnh
là một phần trong động lực phát triển của khoa học tự nhiênthực nghiệm và đang ngày càng phát triển, nó thường xuyênxảy ra trường hợp các đối tượng không biết xuất hiện màkhông có cơ chế phân lớp nào sẵn sàng cho những đối tượng
Trang 5này Mục tiêu của xử lí hình ảnh là tìm ra các lớp có thể chonhững đối tượng mới này Vì vậy, chúng ta cần những kĩthuật phân loại mà chúng không yêu cầu bất kì kiến thức gìtrước đó
Tổng kết lại, chúng ta kết luận rằng việc phân loại bao gồmhai chức năng cơ bản như sau:
Mối liên hệ giữa các đặc điểm của ảnh (các đặc trưng quanghọc) và các lớp đối tượng được tìm kiếm phải được nghiêncứu chi tiết nhất có thể Chủ đề này là một phần trong lĩnhvực khoa học tương ứng và trong việc cấu thành ảnh ví dụquang học như đã được tranh luận trong chương 6-8
Từ vô số các đặc điểm ảnh, chúng ta phải lựa chọn một tậptối ưu để cho phép các lớp đối tượng khác nhau được phânbiệt một cách rõ ràng với công việc phải làm là tối thiểu và
ít lỗi nhất có thể bởi một kĩ thuạt phân lớp hợp lí Nhiệm vụnày được gọi là phân loại này là chủ đề của chương này.Chúng ta ở đây chỉ đề cập đến một vài vấn đề cơ bản nhưlựa chọn loại chính xác, số lượng đặc tính (phần 20.2) vàmột vài kĩ thuật phân loại đơn giản (phần 20.3)
Trang 6H ì n h 20.3: Làm thế nào chúng ta nhận ra tất cả nhưng chỉ một trong những đối tượng là đèn
Sự phân loại dựa trên đối tượng đơn giản hơn nhiều có thểđược sử dụng nếu các đối tượng khác nhau có thể tách ra từnền và không chạm hay đè lên nhau Việc phân loại dựa trênđối tượng nên được sử dụng nếu có thể vì số lượng dữ liệu
Trang 7cần được xử lí ít hơn nhiều Toàn bộ các đặc điểm dựa trênpixel được tranh luận trong chương 11-15 như giá trị xámtrung bình, định hướng cục bộ, số sóng cục bộ, biến thể giátrị xám, có thể được tính trung bình trên toàn bộ vùng củađối tượng và được sử dụng như các đặc trưng miêu tả đặctính đối tượng Thêm nữa, chúng ta có thể dùng toàn bộ cáctham số miêu tả hình dạng của đối tượng đã được nói đếntrong chương 19 Thỉnh thoảng, việc áp dụng cả hai quátrình phân loại được yêu cầu Đầu tiên, phân loại dựa trênpixel để tách đối tượng ra khỏi các đối tượng khác và nềnsau đó sử dụng phân loại dựa trên đối tượng bằng cách ứngdụng các đặc tính hình học của đối tượng
20.2.2 Cluster
Một tập P đặc điểm tạo ra một không gian M kích cỡ Pđược kí hiệu như không gian đặc tính hay không gian đođạc Mỗi pixel hay đối tượng được biểu diễn như một vectorđặc tính trong không gian này Nếu các đặc tính biểu diễnmột lớp đối tượng tốt, tât cả các vector đặc tính của đốitượng từ lớp này có thể nằm gần nhau trong không gian đặctính Chúng ta coi việc phân lớp như một quá trình thống kê
và gán hàm mật độ xác suất kích cỡ P tới mỗi lớp đối tượng.Chúng ta có thể ước lượng hàm xác suất bằng cách lấy mẫu
từ một lớp đối tượng đã cho, tính toán vector đặc tính và giatăng điểm tương ứng trong không gian đặc tính rời rạc Thủtục này là một histogram kích cỡ P được khái quát hóa.(phần 3.2.1) Khi một lớp đối tượng biểu diễn một phân bốxác suất hẹp trong không gian đặc tính, chúng ta nói đếnmột cluster Nó sẽ có thể phân tách các đối tượng vào cáclớp đối tượng đã cho nếu các cluster của các lớp đối tượngđược tách rời khỏi nhau Với những đặc điểm ít thích hợphơn, các cluster chồng lên nhau hoặc thậm chí tệ hơn khôngmột cluster nào có thể tồn tại Trong trường hợp này việc
Trang 8phân loại mà không có lỗi nào là không thể
20.2.3 Lựa chọn đặc tính
Chúng ta bắt đầu bằng một ví dụ, phân loại các hạt khácnhau (trong hình 20.2) thành 3 lớp: lớp hạt tiêu, lớp hạt đậu,lớp hạt hướng dương Hình 20.4a, b thể hiện biểu đồ của haiđặc tính vùng và độ lệch tâm Trong biểu đồ vùng thể hiệnhai đỉnh, trong đồ thị độ lệch tâm thì chỉ có một đỉnh đượcquan sát Trong bất kỳ trường hợp nào, không đặc tính nàotrong hai đặc tính có thể một mình phân biệt được 3 lớp hạttrên Nếu chúng ta lấy cả hai thông số cùng nhau, chúng ta
có thể phân biệt được ít nhất hai vùng (trong hình 20.4c).Hai lớp này có thể được nhận diện là lớp hạt tiêu và lớp hạtđậu Cả hai loại hạt này đều hầu như là hình tròn và vì vậythể hiện sự lệch tâm thấp (từ 0 đến 0.2) Do vậy, cả hai loạihạt trên kết hợp lại thành một đỉnh trong đồ thị độ lệch tâmhình 20.4b Hạt hướng dương không tạo nên vùng dày vìchúng biến đổi lớn trong hình dạng và kích thước Nhưng rõràng là chúng có kích cỡ tương đương với hạt đậu, do đóchúng không đủ dùng để nhận dạng nếu chỉ dùng đặc tínhvùng
Trang 9Trong hình 20.4c, chúng ta có thể nhận diện nhiều nhữngđối tượng rìa ngoài Thứ nhất, có nhiều đối tượng nhỏ với độlệch tâm lớn Đó là các đối tượng có thể thấy được phần nàocủa các hạt ở mép bức ảnh 20.2 Ngoài ra còn có 5 đối tượnglớn trong ảnh khi mà các hạt đậu chạm vào nhau tạo thànhnhững đối tượng ảnh lớn Độ lệch tâm của những đối tượnglớn này cũng lớn và có thể không phân biệt được chúng vớicác hạt hướng dương khi dùng hai tam số đơn giản và vùng
và độ lệch tâm
Trang 10Chất lượng của đặc tính rất là quan trọng cho một sự phânloại tốt Điều đó nghĩa là gì? Góc độ đầu tiên, chúng ta cóthể nghĩ rằng như rất nhiều đặc tính có thể lựa chọn tốt nhất.Nói chung, đó không phải là một điều đáng kể Trong hình20.5a, thể hiện không gian đặc tính một chiều của 3 lớp Đặctính thứ hai không cần thiết để cải thiện sự phân chia nhưtrong hình 20.5b Vùng thứ 2 và thứ 3 vẫn chồng lấn Mộtkhảo sát hơn nữa về sự phân bổ trong không gian đặc tínhkết luận giải thích điều này: Đặc tính thứ 2 không nói chochúng ta biết nhiều cái mới, nó biến đổi trong sự tương quanmạnh với đặc tính 1 Do đó, hai đặc tính là tương quanmạnh.
Hai sự việc cơ sở đáng được lưu tâm, người ta thường bỏqua là nhiều lớp có thể được phân biệt với một số ít tham số.Chúng ta cho rằng, một đặc tính có thể tách biệt được hailớp Vậy, 10 đặc tính có thể tách biệt được 210 = 1024 lớpđối tượng Ví dụ đơn giản này minh họa khả năng tách biệtrất lớn với số ít các thông số Vấn đề cốt lõi là sự phân bốngang nhau của các vùng trong không gian đặc tính Từ đó,
Trang 11điều đó rất quan trọng để tìm ra đúng các đặc tính, ví dụnghiên cứu mối quan hệ giữa các đặc tính của đối tượng vàcác đặc tính của hình ảnh một cách cẩn thận.
20.2.4 Sự khác biệt của các lớp trong không gian đặc tính.
Ngay cả nếu chúng ta có những tính năng tốt nhất có thể cóthì vẫn có các lớp học không thể được tách ra Trong trườnghợp như vậy, nó luôn luôn là giá trị nhắc nhở chúng ta rằngtách các đối tượng trong các lớp học được xác định cũng chỉ
là một mô hình thực tế
Thông thường, việc chuyển từ lớp này sang lớp khác có thểkhông phải là đột ngột mà phải dần dần Ví dụ, bất thườngtrong một phần tử có thể xuất hiện biến đổi với một mức độkhác nhau, ở đó không là hai lớp riêng biệt, "bình thường"
và "không hợp lý", mà là một sự chuyển tiếp liên tục giữahai lớp trên Vì vậy, chúng ta cũng không thể mong đợi để
có được sự phân tách các lớp tốt trong không gian đặc tínhtrong mỗi trường hợp Chúng ta có thể rút ra hai kết luận.Đầu tiên, nó không được bảo đảm rằng chúng ta sẽ có được
sự phân tách tốt giữa các lớp trong không gian đặc tính,ngay cả khi các đặc tính tối ưu đã được lựa chọn Thứ hai,tình trạng này có thể buộc chúng ta phải xem xét lại phânloại đối tượng Hai lớp đối tượng có thể hoặc trong thực tế
là trong một lớp hoặc trong kỹ thuật trực quan để phân biệtchúng có thể là không đầy đủ
Trong một ứng dụng quan trọng khác, nhận dạng ký tựquang học hay OCR, chúng ta có các lớp riêng biệt Mỗi ký
tự là một lớp được xác định tốt Trong khi đó là dễ dàng đểphân biệt hầu hết các chữ cái, một số, ví dụ 'O' hoa và con
số "0", hoặc các chữ cái 'I' và 'l' và các con số '1 ', rất giốngnhau,nghĩa là, nằm gần nhau trong không gian đặc tính
Trang 12(hình 20.6) Một phân lớp tốt vậy mà hầu như cũng khôngphân biệt các tính đặc tính, đặt ra vấn đề nghiêm túc chonhiệm vụ phân loại lớp.
Làm thế nào chúng ta có thể phân biệt chữ lớn 'O' từ con số
"0" hoặc 'l' và 'I' hoa? Chúng ta có thể đưa ra hai câu trả lờicho câu hỏi này Đầu tiên, các phông chữ có thể được thiết
kế lại để làm cho chữ cái phân biệt tốt hơn giữa chúng Thật
ra, các bộ phông chữ đặc biệt đã được thiết kế cho nhậndạng ký tự tự động
Thứ hai, thông tin bổ sung có thể được đưa vào phân loạiquá trình Tuy nhiên, điều này đòi hỏi việc phân loại khônglại ở cấp độ cá nhân các chữ cái, mà nó phải được cải tiến ởtrong mức từ
Sau đó, nó rất dễ dàng để thiết lập các quy tắc tốt hơn trong
giúp phân biệt chữ 'O' từ con số "0" là chữ cái và con sốkhông được trộn lẫn trong một từ Như một ví dụ bộ đếmcho quy tắc này, mã bưu điện Anh hay Canada có chứa một
sự pha trộn chữ cái và con số Bất cứ ai là người không đượcđào tạo để đọc sự hỗn hợp pha trộn không bình thường nàyđều có thể có vấn đề nghiêm trọng trong việc đọc và ghi nhớchúng Như một ví dụ khác, chữ cái viết hoa có thể đượcphân biệt chữ thường 'l' của bằng quy tắc là chữ in hoa chỉ ởđầu từ đầu tiên trong một từ hoặc trong một đoạn văn.Chúng ta khép lại phần này với bình luận rằng yêu cầu xemmột phân loại có thể có vấn đề nhất định hoặc bởi bản chấtcủa nó hoặc bởi loại của đặc tính có thể là ít quan trọngnhất, nếu không, tốt hơn là lựa chọn thích hợp của mộtphương pháp phân loại
20.2.5 Biến đổi trục cơ sở.
Trang 13Các cuộc thảo luận trong phần trước đề xuất rằng chúng taphải chọn tính năng đối tượng rất cẩn thận Mỗi tính năngmang lại những thông tin mới là trực giao với những gìchúng ta đã biết về lớp đối tượng Nghĩa là, các lớp đốitượng với một phân bố tương tự trong một đặc tính nênkhông có sự ltuowng quan với tính năng khác Nói cáchkhác, các đặc tính nên không có tương quan Mối tươngquan của các đặc tính có thể được nghiên cứu với phươngpháp thống kê được thảo luận trong phần 3.3 và giả sử phânphối của các đặc tính của các lớp khác nhau đã được biết (cógiám sát phân loại).
Một con số quan trọng là hiệp phương sai chéo covariance) của của hai tính năng mp và mq từ vector đặc tínhP-chiều cho một lớp đối tượng, được định nghĩa là:
ta có thể hình thành một ma trận đối xứng với các hệ số Cpq,
ma trận hiệp phương sai