Cũng đã có một số kết quả được đưa ra cho bài toán phân đoạn ảnh nha khoa như sử dụng các đặc trưng của ảnh nha khoa như cấu trúc ảnh, màu sắc, hình dáng trong quá trình phân đoạn gồm ph
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
…… ….***…………
TRẦN MẠNH TUẤN
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÂN CỤM BÁN
Chuyên ngành: Cơ sở toán học cho tin học
Mã số: 62 46 01 10
TÓM TÁT LUẬN ÁN TIẾN SĨ TOÁN HỌC
HÀ NỘI – 2016
Trang 2Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ -
Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Người hướng dẫn khoa học 1: PGS.TS LÊ BÁ DŨNG
Người hướng dẫn khoa học 2: TS VŨ NHƯ LÂN
và Công nghệ Việt Nam v ào hồi giờ ngày tháng năm
Có thể tìm hiểu luận án tại:
- Thư viện Học viện Khoa học và Công nghệ
- Thư viện Quốc gia Việt Nam
Trang 3MỞ ĐẦU
Phân đoạn ảnh là chia nhỏ một ảnh thành các vùng đông nhất cấu tạo nên ảnh hoặc các đối tượng [17], [52] Phân đoạn ảnh thường được sử dụng để xác định: vị trí đối tượng (chẳng hạn như các loại cây trồng, khu vực đô thị, rừng của một hình ảnh vệ tinh, v.v.) và các đường biên, ranh giới (đường thẳng, đường cong, v.v.) trong ảnh Với ảnh nha khoa thì mục đích của phân đoạn ảnh nha khoa là bước xử lý quan trọng trong nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệu quả các bệnh quanh răng
Ảnh X-quang nha khoa gồm 3 phần chính [54]: i) Phần răng: phần có độ xám cao và là phần
ta nhìn thấy rõ nhất trên ảnh; ii) Phần cấu trúc răng: là phần có độ xám trung bình gồm lợi răng, xương, phần khác (tủy, xi măng v.v.); iii) Phần nền: là phần có giá trị độ xám nhỏ nhất là nền tảng của cấu trúc răng Với cấu trúc của ảnh X-quang nha khoa thì việc phân đoạn ảnh phức tạp hơn phân đoạn ảnh thông thường [70]
Bài toán phân đoạn ảnh nha khoa đã được sử dụng để hỗ trợ việc chẩn đoán bệnh nha khoa
và dự đoán tuổi nha khoa [51] Đồng thời, phân đoạn ảnh nha khoa mang lại những thông tin có giá trị cho những nha sĩ trong quá trình phân tích các thông tin từ một hình ảnh [51] Liên quan đến độ chính xác của phân đoạn ảnh nha khoa, cần có các phương pháp học máy khác nhau được áp dụng [30], [35] Kết quả phân đoạn ảnh nha khoa còn cung cấp thêm các thông tin cho các nha sỹ trong quá trình chẩn đoán bệnh, giúp các nha sỹ chẩn đoán bệnh chính xác và hiệu quả hơn
Với bài toán phân đoạn ảnh nha khoa, các nghiên cứu trước đây đã đưa ra các kỹ thuật phân đoạn như phân đoạn ảnh dựa trên phân ngưỡng [21], [27], phân đoạn ảnh dựa trên phân cụm [44], [70] Tuy nhiên các phương pháp này thường gặp vấn đề khi xác định tham số ngưỡng hay biên chung của các mẫu răng và phương pháp phân cụm mờ được cho là xử lý tốt hơn [59]
Trong phân cụm rõ, dữ liệu được chia vào các nhóm, trong đó mỗi điểm dữ liệu thuộc vào chính xác một cụm [10] Trong phân cụm mờ, mỗi điểm dữ liệu có thể thuộc vào nhiều hơn một cụm với độ thuộc tương ứng [10] Khi đó, tương ứng với các điểm dữ liệu là ma trận độ thuộc, với giá trị của các phần tử trong ma trận chỉ ra mức độ các điểm dữ liệu thuộc vào các cụm khác nhau [10] Các phương pháp phân cụm mờ được sử dụng nhiều trong các bài toán nhận dạng mẫu, phát hiện tri thức từ các cơ sở dữ liệu, đánh giá rủi ro và nó có ứng dụng nhiều trong phân đoạn ảnh Trong các nghiên cứu gần đây việc sử dụng các thông tin bổ trợ cung cấp bởi người dùng được gắn với đầu vào trong phân cụm mờ để hướng dẫn, giám sát và điều khiển quá trình phân cụm Các thuật toán phân cụm mờ kết hợp với các thông tin bổ trợ do người dùng xác định trước hình thành lên nhóm các thuật toán phân cụm bán giám sát mờ [23]
Một số nghiên cứu gần đây cho thấy các thuật toán phân cụm bán giám sát mờ rất hiệu quả trong nhiều lĩnh vực như xử lý ảnh [16], [31], [49], nhận dạng mẫu, nhận dạng khuôn mặt [5], [33], đánh giá rủi ro [15], dự báo phá sản [36] Đặc biệt là trong xử lý ảnh với các ảnh màu và ảnh y học Cũng đã có một số kết quả được đưa ra cho bài toán phân đoạn ảnh nha khoa như sử dụng các đặc trưng của ảnh nha khoa như cấu trúc ảnh, màu sắc, hình dáng trong quá trình phân đoạn gồm phương pháp lấy ngưỡng [21], [27], phương pháp phân cụm [70] Tuy nhiên nghiên cứu này, chưa
có kết quả nào của phân cụm bán giám sát mờ được áp dụng cho các ảnh X-quang nói chung và ảnh X-quang nha khoa nói riêng, mà chủ yếu các nghiên cứu trước cũng đã sử dụng phân cụm mờ và đồng thời đã sử dụng các đặc trưng của ảnh nha khoa nhưng chưa sử dụng thông tin không gian
Nội dung nghiên cứu chính của luận án tập trung vào việc đề xuất, cải tiến các kỹ thuật phân đoạn ảnh bằng thuật toán phân cụm bán giám sát mờ Trong quá trình phân đoạn ảnh nha khoa, các
kỹ thuật phân cụm mờ (FCM) [10], phân cụm bán giám sát mờ (eSFCM) [67] và kỹ thuật tách ngưỡng Otsu [43] là các kỹ thuật cơ bản làm tiền đề cho các phương pháp mới được đề xuất trong luận án Trong các phương pháp mới trình bày trong luận án, thông tin bổ trợ được xác định là ma trận độ thuộc của thuật toán phân cụm mờ FCM kết hợp với các thông tin đặc trưng của ảnh nha khoa Đây là một cách tiếp cận mới mà các phương pháp trước đó chưa đề cập đến Đồng thời, luận
án trình bày một số cách xác định thông tin bổ trợ phù hợp ứng với từng đối tượng đầu vào khác nhau Từ đó thực hiện việc cài đặt và đánh giá các đề xuất trên máy tính
Mục tiêu nghiên cứu: Nghiên cứu các thuật toán phân cụm bán giám sát mờ vào phân đoạn
ảnh Phát triển các nghiên cứu đề xuất cải tiến các phương pháp phân cụm bán giám sát mờ cho
Trang 4phân đoạn ảnh nha khoa Các thuật toán cải tiến được đề xuất dựa trên các thông tin không gian đặc trưng của ảnh nha khoa nhằm mục đích nâng cao chất lượng phân cụm của các thuật toán phân cụm bán giám sát mờ áp dụng với bài toán phân đoạn ảnh nha khoa
Với mục tiêu nghiên cứu ở trên luận án đã thu được một số đóng góp mới như sau:
Luận án đã nghiên cứu phát triển các thuật toán phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa, cụ thể:
- Đề xuất các phương pháp phân đoạn ảnh nha khoa dựa trên phân cụm bán giám sát mờ lai ghép (Lai ghép giữa phân cụm bán giám sát mờ với phân cụm mờ và phương pháp tách ngưỡng Otsu)
- Đề xuất phân cụm bán giám sát mờ có sử dụng đặc trưng không gian ảnh nha khoa vào bài toán phân đoạn ảnh;
- Vận dụng các phương pháp giải tối ưu đa mục tiêu để giải bài toán tối ưu đa mục tiêu của phân cụm bán giám sát mờ, từ đó đưa ra các mệnh đề, định lý và tính chất nghiệm của bài toán;
- Xây dựng kho dữ liệu các hàm xác định thông tin bổ trợ cho phân cụm bán giám sát mờ,
từ đó lựa chọn hàm thông tin bổ trợ phù hợp với từng ảnh đầu vào để chất lượng cụm được tốt hơn
Cài đặt thực nghiệm các thuật toán cải tiến dựa trên thu thập và phân tích dữ liệu ảnh về các mẫu bệnh nha khoa Ứng dụng phân đoạn ảnh trong hệ hỗ trợ chẩn đoán nha khoa
Ngoài phần phần mở đầu và kết luận, luận án được cấu trúc thành ba chương:
Chương 1 trình bày về tổng quan về phân cụm bán giám sát mờ trong bài toán phân đoạn ảnh Đồng thời trình bày các lý thuyết cơ sở sử dụng trong quá trình học tập và nghiên cứu Thông qua chương này, luận án đưa ra được cái nhìn tổng quan về bài toán nghiên cứu, các khái niệm và thuật toán cơ bản sử dụng trong nghiên cứu của luận án
Các đóng góp chính của luận án lần lượt được trình bày trong chương 2, chương 3
Chương 2 trình bày kết quả nghiên cứu các phương pháp phân cụm bán giám sát mờ sử dụng cho phân đoạn ảnh nha khoa Trong chương này trình bày về phân cụm bán giám sát mờ lai ghép Đặc biệt luận án còn trình bày đề xuất phát triển của phân cụm bán giám mờ có sử dụng thông tin đặc trưng không gian sử dụng phương pháp nhân tử Lagrange và thỏa dụng mờ giải bài toán tối ưu đa mục tiêu Đồng thời, trong chương 2, luận án xây dựng cách xác định thông tin bổ trợ phù hợp từng ảnh đầu vào để có được kết quả phù hợp nhất
Chương 3 trình bày các kết quả thực nghiệm thu được khi cài đặt các thuật toán phân cụm bán giám sát mờ đề xuất ở chương 2 trên bộ dữ liệu ảnh X-quang nha khoa Trong đó có phân tích dữ liệu
sử dụng và các tiêu chí đánh giá thông qua các độ đo, từ đó xác định các kết quả này được sử dụng để đánh giá hiệu năng các thuật toán đề xuất và so sánh với các thuật toán khác đã được nghiên cứu gần đây cho các bài toán tương tự Ứng dụng của phân đoạn ảnh trong thiết kế hệ hỗ trợ chẩn đoán bệnh Cuối cùng, kết luận nêu những đóng góp, hướng phát triển, những vấn đề quan tâm và các công trình đã được công bố của luận án
CHƯƠNG 1 TỔNG QUAN VỀ PHÂN CỤM BÁN GIÁM SÁT MỜ TRONG PHÂN
ĐOẠN ẢNH NHA KHOA
Trong chương này, luận án đã nêu ra bài toán nghiên cứu trong thời gian vừa qua Qua đó có được cái nhìn tổng quan về bài toán nghiên cứu trong luận án, cụ thể là bài toán phân đoạn ảnh nha khoa và bài toán chẩn đoán bệnh nha khoa Luận án đã trình bày các kết quả nghiên cứu liên quan được đề xuất gần đây Đồng thời trong chương này, luận án đã trình bày lý thuyết về tập mờ, phân cụm, phương pháp giải tối ưu và hệ suy diễn mờ Các kiến thức này là nền tảng để giải quyết các bài toán phân đoạn ảnh và chẩn đoán nha khoa mà luận án đang hướng tới
1.1 Bài toán phân đoạn ảnh nha khoa
1.1.1 Khái niệm
Phân đoạn ảnh chia nhỏ một ảnh thành các vùng cấu thành nên nó hoặc các đối tượng [17], [52] Phân đoạn ảnh thường được sử dụng để xác định vị trí đối tượng (chẳng hạn như các loại cây trồng, khu vực đô thị, rừng của một hình ảnh vệ tinh, v.v.) và các đường biên/ranh giới (đường thẳng, đường cong, v.v.) trong ảnh Chính xác hơn, phân đoạn ảnh là quá trình gán nhãn cho mọi pixel trong ảnh mà những pixel có cùng nhãn thì có chung một số đặc điểm nhất định nào đó
Trang 51.1.2 Ảnh X-quang nha khoa
Cơ quan của răng bao gồm răng và nha chu quanh răng, là đơn vị hình thái và chức năng của
bộ răng Răng là bộ phận trực tiếp nhai nghiền thức ăn, nha chu là bộ phận giữ và nâng đỡ răng đồng thời là bộ phận nhận cảm, tiếp nhận và dẫn truyền lực nhai Răng gồm men, ngà (mô cứng) và tủy (mô mềm) Nha chu gồm xương chân răng, men chân răng, dây chằng, xương ổ răng, nướu (lợi), xương Bộ răng là một thể thống nhất thuộc hệ thống nhai tạo thành bởi sự sắp xếp có tổ chức của các cơ quan răng [2]
1.1.3 Nhu cầu và ứng dụng trong y học
Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai trò rất quan trọng [14, 20] trong quá trình này Khi đó, phân đoạn ảnh nha khoa là bước xử lý then chốt trong nha khoa nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệu quả các bệnh về răng như viêm chân răng, bệnh nha chu, viêm túi răng [55, 56] Khi đó ứng dụng đầu tiên của phân đoạn ảnh là chẩn đoán bệnh nha khoa
Một trong những ứng dụng thú vị của phân đoạn ảnh nha khoa từ hình ảnh X-quang là giám định pháp y [23], [50], việc giám định pháp y thường sử dụng các công nghệ khoa học để phân tích (trong đó có phân tích răng) trong việc xác định con người, Do đó, nó trở nên quan trọng để đưa ra quyết định xác định hình thái mặt của con người dựa trên các đặc tính: kích thước răng, khoảng cách giữa các răng và các mẫu xoang, xương trên mặt v.v [50] Bên cạnh việc giám định pháp y, phân đoạn ảnh nha khoa còn có một số ứng dụng khác: xác định số răng [35], ước lượng tuổi nha khoa [65], phân đoạn ảnh nha khoa có thể phân tích các mảng bám răng [24], v.v
1.2 Tổng quan về các nghiên cứu liên quan
Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai trò rất quan trọng [32, 49] Phân đoạn ảnh cũng là công việc khó khăn nhất của xử lý ảnh Trong đó, phân đoạn ảnh nha khoa là bước xử lý then chốt nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệu quả các bệnh về răng như viêm chân răng, bệnh nha chu, viêm túi răng [42], [43] Khi đó quá trình phân đoạn ảnh là một trong các bước quan trọng và cần thiết để phân tích ảnh X-quang nha khoa cho các quá trình xử lý sau này như: hỗ trợ chẩn đoán [50], xác định các thành phần khác nhau trong ảnh (răng, lợi, tủy v.v.) [51]
Hình 1.1 Ảnh nha khoa
(a) Ảnh X-quang nha khoa; (b) Lỗ trống răng bị thiếu Ảnh X-quang nha khoa gồm 3 phần chính (hình 1.1 a) [54]: i) Phần răng: phần có độ xám cao và là phần ta nhìn thấy rõ nhất trên ảnh; ii) Phần cấu trúc răng: là phần có độ xám trung bình gồm lợi răng, xương, phần khác (tủy, xi măng v.v.); iii) Phần nền: là phần có giá trị độ xám nhỏ nhất là nền tảng của cấu trúc răng Với cấu trúc của ảnh X-quang nha khoa thì việc phân đoạn ảnh phức tạp hơn phân đoạn ảnh thông thường [71] Nói cách khác, sự kết nối giữa các phần khác nhau của một hình ảnh nha khoa X-quang và chất lượng thấp của hình ảnh do tạp chất, độ tương phản thấp, sai sót về chức năng quét hình ảnh, v.v làm giảm hiệu suất phân đoạn Ví dụ, các lỗ trống trong răng bị mất trong (hình 1.1 b) không thể được xử lý bằng kỹ thuật xử lý ảnh dựa trên ngưỡng thông thường [26] Vì vậy, phương pháp khai phá dữ liệu phân đoạn ảnh X-quang nha khoa đã được nghiên cứu để đạt được độ chính xác cao của phân đoạn [40]
Trang 6Hình 1.2 Các phương pháp phân đoạn ảnh
Hình 1.2 giới thiệu một số phương pháp phân đoạn ảnh [45] dựa trên điểm ảnh, dựa trên biên và dựa trên vùng Trong phân đoạn ảnh có rất nhiều kỹ thuật khác nhau được sử dụng và các
kỹ thuật đó có thể được chia thành 2 loại xu hướng cơ bản là: i) Áp dụng các kỹ thuật xử lý ảnh [13], [37] gồm: phương pháp ngưỡng, các phương pháp dựa biên và dựa trên vùng ; ii) Áp dụng phương pháp phân cụm [46] gồm: K-means [60], Fuzzy C-Means (FCM) [10] Các phương pháp có
sử dụng kỹ thuật xử lý ảnh thường phải biến đổi để biểu diễn ảnh dưới dạng nhị phân, thông qua ngưỡng hoặc sử dụng một đường cong phức tạp để xác định biên Một phương pháp thường được
sử dụng là phương pháp tách ngưỡng Otsu [43] Các phương pháp này thường gặp vấn đề hết sức khó khăn là xác định tham số ngưỡng hay biên chung của các mẫu răng [59] Trong khi các phương pháp sử dụng kỹ thuật phân cụm để xác định các cụm thì không cần trước thông tin về ngưỡng và các đường cong Tuy nhiên các phương pháp này đặt ra một thách thức là việc lựa chọn các tham số
và phát hiện biên giữa các cụm [12], [38], [39], [53] Điều này đặt ra các động lực của việc cải tiến các phương pháp phân đoạn ảnh để đạt được hiệu suất tốt hơn
Các nghiên cứu trước đây [6], [66] cho thấy rằng nếu có thêm thông tin bổ sung kết hợp với quá trình phân cụm thì chất lượng phân cụm được tăng cường Việc nghiên cứu đề xuất các phương pháp phân cụm bán giám sát mờ với các thông tin bổ trợ là một trong ba loại [70]: các ràng buộc Must-link và Cannot-link, các nhãn lớp của một phần dữ liệu, độ thuộc được xác định trước Ví dụ, nếu chúng ta biết rằng một điểm ảnh đại diện cho một vùng tương ứng là răng thì ta gãn nhãn cho điểm ảnh vào lớp răng, các điểm ảnh khác trong ảnh X-quang nha khoa được phân cụm cùng với sự
hỗ trợ của các điểm ảnh đã biết Thông tin về điểm ảnh đã biết làm cho kết quả phân đoạn ảnh chính xác hơn Trong các thuật toán phân cụm bán giám sát mờ được đề xuất trong luận án, thông tin bổ trợ được sử dụng là ma trận thành viên được xác định trước Đối với loại thông tin này, các thuật toán phân cụm bán giám sát mờ (SSFC) [66], thuật toán phân cụm bán giám sát mờ sử dụng Entropy (eSFCM) [67] có hiệu quả hơn so với thuật toán phân cụm mờ FCM Trong các thuật toán này, thông tin bổ trợ được tích hợp vào hàm mục tiêu của thuật toán phân cụm bán giám sát mờ FCM
Một ảnh X-quang đầu vào có thể chỉ ra một số bệnh về răng chứ không phải một bệnh duy nhất Nếu việc chẩn đoán được thực hiện trên từng vùng của ảnh càng chi tiết thì kết quả chẩn đoán cho toàn bộ ảnh càng chính xác Mục tiêu của phân đoạn từ một hình ảnh X-quang nha khoa là tạo
ra nhiều phân vùng khác nhau từ một ảnh đầu vào sao cho các điểm ảnh trong một phân vùng có sự tương đồng cao hơn so với các phân vùng khác Những ảnh X-quang nha khoa có thể được phân loại theo từng vùng khác nhau cụ thể là vùng nền và vùng cấu trúc răng hoặc vùng có bệnh và vùng không có bệnh [71] Những vùng này sau đó được so sánh với các tiêu chuẩn bệnh bằng một phương pháp tìm kiếm nhanh để xác định hình ảnh nha khoa có hay không chứa bệnh nha khoa nào
Phát hiện biên
Kỹ thuật Gradient
Các phương pháp phân đoạn ảnh
Lấy ngưỡng Phân cụm
Tập mức
Đường mức kích hoạt
Xây dựng vùng
Phân tách/
Kết hợp
Phương pháp đồ thị
Trang 7Vấn đề này đã được nghiên cứu rộng rãi trong các công trình [10], [12], [19], [29], [30], [43], [45] Trong đó, các phương pháp điển hình và phổ biến là phương pháp tách ngưỡng Otsu [43], phân cụm
mờ FCM [10], phân cụm bán giám sát mờ theo quy tắc Entropy eSFCM [67]
1.3 Một số kiến thức cơ sở
1.3.1 Tập mờ
Tập mờ [1] được coi là phần mở rộng của tập kinh điển Nếu X là một không gian nền (một tập nền)
và những phần tử của nó được biểu thị bằng x, thì một tập mờ A trong X được xác định bởi một cặp các giá trị:
( , )| ,0 1
x x x X x
Trong đó A (x) được gọi là hàm liên thuộc của x trong A viết tắt là MF Nó không còn là hàm hai
giá trị như đối với tập kinh điển nữa, mà là một hàm với một tập các giá trị hay còn gọi là một ánh
xạ Tức là, hàm liên thuộc ánh xạ mỗi một phần tử của X tới một giá trị liên thuộc trong khoảng
[0,1]
1.3.2 Phân cụm
Phân cụm dữ liệu [10] là quá trình nhóm một tập các đối tượng tương tự nhau trong tập dữ liệu vào các cụm sao cho các đối tượng thuộc cùng một cụm là tương đồng, còn các đối tượng thuộc các cụm khác nhau sẽ ít tương đồng Trong phân cụm mờ, các điểm dữ liệu có thể thuộc vào nhiều hơn một cụm và tương ứng với các điểm dữ liệu là ma trận độ thuộc, với giá trị của các phần tử chỉ
ra mức độ các điểm dữ liệu thuộc vào các cụm khác nhau [10] Khi đó các thuật toán phân cụm mờ kết hợp với các thông tin bổ trợ hình thành lên nhóm các thuật toán gọi là phân cụm bán giám sát
mờ [65]
Các thuật toán phân cụm bán giám sát mờ xây dựng dựa trên các thuật toán phân cụm mờ kết hợp với các thông tin bổ trợ được người dùng cung cấp Các thông tin bổ trợ nhằm mục đích hướng dẫn, giám sát và điều khiển quá trình phân cụm
Thông tin bổ trợ thường được xây dựng dựa trên 3 loại cơ bản [70] là: i)Các ràng buộc link và Cannot-link; ii) Các nhãn lớp của một phần dữ liệu; iii) Độ thuộc được xác định trước Trong luận án tập trung nghiên cứu phân cụm bán giám sát mờ với thông tin bổ trợ là độ thuộc được xác định trước
Must-Một số nghiên cứu về phân đoạn ảnh sử dụng phân cụm bán giám sát thường dùng loại thông tin
bổ trợ là giá trị hàm độ thuộc bổ sung Với loại thông tin bổ trợ này, Zhang [70] đã áp dụng quy tắc entropy để giảm số chiều và đề xuất một tiếp cận mới với ý tưởng là kết hợp một thành phần theo quy tắc entropy vào hàm mục tiêu Bên cạnh đó, Yasunori [66] đã đề xuất thuật toán phân cụm mờ bán giám sát trên cơ sở của FCM bổ sung thêm hàm độ thuộc bổ trợ sử dụng trong quá trình phân cụm Bouchachia và Pedryzc [12] sử dụng thông tin bổ trợ vào việc xác định các thành phần u kj
thông qua giá trị trung gian u kj
1.3.3 Phương pháp giải bài toán tối ưu đa mục tiêu
Phương pháp nhân tử Lagrange
Phương pháp thỏa dụng mờ
1.4 Kết luận
Trong chương này, luận án đã nêu ra bài toán nghiên cứu trong thời gian vừa qua Qua đó có được cái nhìn tổng quan về bài toán nghiên cứu trong luận án, cụ thể là bài toán phân đoạn ảnh nha kho Luận án đã trình bày nghiên cứu liên qua trong thời gian qua Đồng thời trong chương này, luận án đã trình bày lý thuyết về: tập mờ, phân cụm, phương pháp giải tối ưu Các kiến thức này là nền tảng để giải quyết các bài toán phân đoạn ảnh và chẩn đoán nha khoa mà luận án đang hướng tới
CHƯƠNG 2 MỘT SỐ THUẬT TOÁN PHÂN CỤM BÁN GIÁM SÁT MỜ CHO PHÂN
ĐOẠN ẢNH NHA KHOA
Trong chương này, luận án trình bày các phương pháp phân cụm bán giám sát mờ mới cụ thể là thuật toán phân cụm bán giám sát mờ lai ghép sẽ được trình bày trong mục 2.1, các kết quả ở mục này đã được công bố tại [CT3] Thuật toán phân cụm bán giám sát mờ có đặc trưng không gian được trình bày trong mục 2.2 Phương pháp giải tối ưu đa mục tiêu bằng thỏa dụng mờ với bài toán
Trang 8phân cụm bán giám sát mờ có đặc trưng không gian được trình bày trong mục 2.3, các kết quả ở mục này đã được công bố tại [CT5] Phương pháp xác định thông tin bổ trợ phù hợp cho thuật toán phân cụm bán giám sát mờ có đặc trưng không gian được trình bày trong mục 2.4, các kết quả ở mục này đã được công bố tại [CT2] Cuối cùng một số đánh giá sẽ được đưa ra trong phần tổng kết chương 2.5
2.1 Thuật toán phân cụm bán giám sát mờ lai ghép
2.1.1 Lƣợc đồ tổng quan lai ghép
Lược đồ tổng quan được thể hiện trong Hình 2.1 dưới đây Từ một ảnh X-quang có thể có hoặc không có chứa các vùng nền, khi đó sử dụng một thủ tục để kiểm tra điều này trước khi phân đoạn ảnh Phương pháp Otsu được áp dụng để loại bỏ các khu vực nền từ hình ảnh Sau đó tiến hành phân cụm mờ (FCM) Các kết quả của quá trình phân cụm là các tâm cụm và ma trận độ thuộc Khi đó kết quả nhận được là gần đúng với kết quả của bài toán, đồng thời sử dụng các kết quả đó là các thông tin bổ trợ cho các thuật toán phân cụm bán giám sát mờ trong bước tiếp theo Thuật toán phân cụm bán giám sát mờ (eSFCM) được sử dụng để cải thiện các kết quả của quá trình phân cụm trong giai đoạn xử lý phân đoạn ảnh
Dùng phương pháp tách ngưỡng Otsu để loại bỏ vùng nền trong ảnh
Dùng thuật toán eSFCM để làm rõ và cải tiến các kết quả
với ma trận độ thuộc được xác định trước từ FCM
Kết thúc Đánh giá hiệu năng của thuật toán bằng các tiêu chuẩn khác nhau
Dùng thuật toán FCM để loại bỏ các vùng cấu trúc răng từ các kết quả của
bước trước
Kiểm tra xem ảnh đầu vào có vùng nền hay không?
Sai
Đúng
Các kết quả phân đoạn ảnh
Trang 92.1.3 Thuật toán phân cụm bán giám mờ lai ghép
Bảng 2.1 Thuật toán phân cụm bán giám sát mờ lai ghép
Input Ảnh đầu vào, số cụm C, ma trận độ thuộc bổ trợ U ; ngưỡng dừng; số lần lặp
3: Xây dựng thông tin bổ trợ U từ ma trận độ thuộc UFCM bỏ đi các giá trị hàm
thuộc nhỏ nhất tại các điểm
4: Phân cụm bán giám sát mờ (eSFCM) với anh đầu vào và thông bổ trợ U
5: Ảnh phân đoạn
2.1.4 Phân tích và đánh giá thuật toán phân cụm bán giám sát mờ lai ghép
Thuật toán được đề xuất trong mục này là một sự kết hợp giữa phương pháp tách ngưỡng Otsu, thuật toán phân cụm mờ FCM và phân cụm bán giám sát mờ (eSFCM) Thuật toán Otsu dùng để tách phần nền với phần chính của ảnh nha khoa Những thông tin bổ trợ dùng trong eSFCM được xác định là kết quả của ma trận độ thuộc trong phân cụm FCM Thuật toán eSFCM được sử dụng để phân cụm trong phân đoạn ảnh cuối cùng
Tuy nhiên thuật toán này có một số nhược điểm: chưa sử dụng các đặc trưng của ảnh nha khoa và khi phân cụm chưa sử dụng thành phần không gian trong hàm mục tiêu để tăng độ chính xác
2.2 Thuật toán phân cụm bán giám sát mờ có đặc trƣng không gian
2.2.1 Lƣợc đồ tổng quát
Hình 2.2 dưới đây xác định cơ chế chính của mô hình đề xuất Đầu vào là một ảnh X-quang nha khoa và với một vài tham số do người dùng xác định Thuật toán xác định các thông tin bổ trợ của ảnh và đồng thời tiến hành phương pháp phân cụm FCM cũng được sử dụng để phân đoạn các ảnh X-quang nha khoa đầu vào thành cùng một số cụm Ma trận độ thuộc nhận được từ FCM cùng với các thông tin đặc trưng không gian được sử dụng cho việc tính toán các thông tin bổ trợ cho thuật toán phân cụm bán giám sát mờ mới Sử dụng thông tin này, việc xây dựng và giải quyết bài toán phân đoạn ảnh nha khoa bằng các thuật toán phân cụm bán giám sát mờ mới (SSFC-SC) được thiết lập Sau đó thuật toán SSFC-SC lặp lại để sử dụng xác định các tâm cụm và ma trận độ thuộc, xác định ảnh phân đoạn Cuối cùng, các chỉ số hiệu năng được áp dụng để đánh giá chất lượng của các kết quả đạt được
Trang 10Hình 2.2 Lược đồ hoạt động của thuật toán mới 2.2.2 Xây dựng đặc trƣng ảnh nha khoa
Luận án giới thiệu 5 đặc trưng cơ bản của một ảnh nha khoa bao gồm:
2.2.2.1 Entropy, giá trị Edge và cường độ(EEI)
Những đặc trưng này được sử dụng để mô tả cấu trúc của một ảnh X-quang có thể được phân thành ba vùng tách biệt: vùng nền, vùng cấu trúc răng và các vùng răng [27]
2.2.2.2 Local Patterns Binary (LBP)
Đặc trưng này là một trường hợp đặc biệt của Texture Spectrum [8] Model, được sử dụng để xác định sự khác biệt giữa các phân vùng trong một ảnh X-quang Đó là bất biến đối với bất kỳ chuyển đổi cường độ ánh sáng và bảo đảm trật tự của mật độ điểm ảnh trong một khu vực nhất
2.2.2.4 Đặc trưng Gradient (GRA)
Đặc trưng này có thể được sử dụng để phân biệt khác nhau nhỏ giữa các bộ phận răng như
men, cementum, xi măng, ống tủy, v v [18]
2.2.2.5 Đặc trưng mức Patch (Patch)
Đặc trưng này được sử dụng để tính toàn bộ vector gradient với từng điểm ảnh ở mức patch, được biểu thị bởi δ(z) [20]
2.2.3 Xác định thông tin bổ trợ
Cách xác định các thông tin bổ trợ cho thuật toán mới SSFC-SC:
- Bước 1: Từ ma trận độ thuộc tối ưu của FCM, xác định giá trị độ thuộc tối thiểu cho mỗi điểm dữ liệu và các thiết lập u1
Áp dụng FCM để xác định ma trận
độ thuộc xác định trước
Xây dựng một mô hình phân cụm bán giám sát mờ
và thuật toán SSFC-SC
Đánh giá các kết quả bằng các tiêu chuẩn khác nhau
Ảnh đã được phân đoạn
Trích chọn đặc trưng nha khoa
Xác định thông tin bổ trợ
Cơ sở dữ liệu đặc
trưng
Tri thức chuyên gia Ảnh đầu vào và các tham số
Trang 11- Bước 2: Dựa vào các đặc trưng của ảnh nha khoa tại mục 2.2.2, khi đó ta ký hiệu là pw1, pw2, pw3,
pw4, pw5 để tính toán giá trị đặc trưng của ảnh nha khoa tương ứng (pwi là giá trị đặc trứng thứ i mỗi điểm ảnh) Chuẩn hóa các đặc trưng của ảnh nha khoa ta xác định được trọng số đặc trưng của từng điểm ảnh:
i
i i
pw
pw w
l i i
w
w u
1
1 2
2 1 1
u u when u
u u when u
2.2.4 Thuật toán phân cụm bán giám sát mờ SSFC-SC
2.2.4.1 Mô hình hóa phân đoạn ảnh nha khoa
min 1
2 1
1 1
2 1
2 1
j
m kj kj ik
m kj N
k C
j kj m kj N
k
j k C
j
m
l u R
u V
X u
C là số cụm, N là số phần tử dữ liệu, r là số chiều của dữ liệu;
u kj 0,1 là độ thuộc của phần tử dữ liệu Xk từ cụm j, ;
Rkj: hàm xác định khoảng cách không gian từ điểm Xk đến tâm Vj
2.2.4.2 Giải bài toán bằng phương pháp nhân tử Lagrange
Để giải bài toán (2.4-2.5), ta sử dụng phương pháp nhân tử Lagrange như sau: Lấy đạo hàm của (2.4) theo V, ta được được nghiệm của bài toán:
k
j k m kj j
V X u u u V
X u V
J
1 1
) (
2 ) (
N
k
k kj kj m kj j
u u u
x u u u V
J U L
1
)
Trang 12 k j k
m kj kj l
i ik m
kj kj m kj j
k m
kj
kj
V X u
u m w l mu R mu V
1 2
(2.9) Khi m=2, ta xác định công thức tính độ thuộc:
j k
j k kj k kj
w l R V X
V X u u
1 2 2
2
12
*2
j k
C
i ik kj
j k
j k kj K
w l R V X w
l R V X
V X u
1
1 2 2 1
1 2 2
2
1 2
2
1 1
1 2
(2.11)
Kết hợp (2.10) và (2.11), ta xác định ma trận thành viên Các nghiệm thu được khi giải bằng phương pháp nhân tử Lagrange của mô hình này là các tâm cụm trong phương trình (2.7) và ma trận độ thuộc xác định trong phương trình (2.10), (2.11)
2.2.5 Phân tích và đánh giá thuật toán SSFC-SC
Trong mục này ta đã đưa ra thuật toán SSFC-SC mới Khi đó thuật toán mới có sử dụng các thông tin đặc trưng không gian của ảnh nha khoa, phân cụm mờ Thuật toán SSFC-SC có một số ưu điểm: i) Thuật toán SSFC-SC sử dụng các thông tin bổ trợ từ những kết quả của FCM và thông tin đặc trưng không gian của ảnh để có chất lượng tốt hơn so với phân cụm bán giám sát mờ eSFCM hay phân cụm mờ FCM Các đánh giá dựa trên các kết quả thực nghiệm với các đo đo của phân cụm được trình bày ở chương 3
ii) Thuật toán SSFC-SC không mở rộng số lượng các thông số Một số thông số khác của SSFC-SC như kích thước cửa sổ không gian thích ứng trong mục 2.2.4.1 cũng được tự động xác định trong quá trình phân cụm Vì vậy, điều này làm cho thuật toán hiệu quả hơn trong điều kiện của tham số kiểm soát
iii) Thuật toán SSFC-FC có thể kết hợp giữa kiến thức của chuyên gia nha khoa để thu được kết quả tốt nhất
Tuy nhiên thuật toán vẫn còn có một số nhược điểm: Việc sử dụng thông tin bổ trợ không phải lúc nào cũng tốt với các ảnh khác nhau, cần cung cấp cách lựa chọn để sao cho hàm mục tiêu luôn tốt nhất với từng ảnh phân đoạn; Nghiệm thu được bằng cách giải tối ưu đa mục tiêu theo phương pháp nhân tử Lagrange mức hội tụ không ổn định, có một số trường hợp sự hội tụ chậm dẫn đến nghiệm thu được chưa hội tụ về nghiệm tối ưu toàn cục
2.3 Thuật toán phân cụm bán giám sát mờ dựa trên thỏa dụng mờ
2.3.1 Thuật toán phân cụm bán giám sát mờ (SSFC-FS)
Trên cơ sở bài toán (2.4)-(2.5), một thuật toán mới được đề xuất có tên là thuật toán phân cụm bán giám sát mờ với ràng buộc không gian dùng phương pháp thỏa dụng mờ (Semi-Supervised Fuzzy Clustering algorithm with Spatial Constraints using Fuzzy Satisficing hay SSFC-FS)
Phân tích bài toán
Theo công thức (2.4), hàm mục tiêu của bài toán có dạng
min3
j
m
u J
1
2 1
l i ik m
kj N
k C j jk m
l u R
u J
1 1
2 2
1
(2.14) 2
Trang 13Với các thành phần hàm mục tiêu được viết tường minh trong các công thức (2.13), (2.14), (2.15)
Áp dụng định lý Weierstrass, sự tồn tại nghiệm tối ưu của bài toán trên được thể hiện trong bổ đề dưới đây:
Bổ đề 2.1 Bài toán tối ưu đa mục tiêu (2.4)-(2.5) có hàm mục tiêu liên tục trên một tập compact
khác rỗng Do đó bài toán có phương án tối tu toàn cục liên tục và bị chặn
Trên cơ sở bổ đề 2.1 và phương pháp thỏa dụng mờ tương tác, việc tìm nghiệm tối ưu của bài toán được thực hiện như sau:
Xác định nghiệm tối ƣu của bài toán:
Bước khởi tạo: Giải các bài toán con bằng phương pháp nhân tử Lagrange, nghiệm tương ứng nhận
1 1 1
1( )
z z
z J J
2 2 2
2( )
z z
z J J
3 3 3
3( )
z z
z J J
()
()
( 1 2 2 2 3 3 31
1b b
Bổ sung ràng buộc dưới đây:
.3,2,1,)(x a( ) i
3 3 2 2
2 2 1 1
1 1 3 3 3
3 2 2 2
2 1 1 1
1
z z
z b z z
z b z z
z b J
z z
b J
z z
b J
z z
b
Lấy đạo hàm của Y trong (2.22) theo u kj
C j N k u
J z z
b u
J z z
b u
J z z
b u
Y
k kj kj
kj kj
,1,,1,
3 3 3
3 2
2 2
2 1
1 1
Bước 2:
- Nếu minmini(J i),i1, ,3, với là một ngưỡng do người dùng chọn thì u(t)
không là phương án chấp nhận được Ngược lại, ta kiểm tra xem nếu u(t)S p
thì bổ sung u(t) vào
p
S
- Nếu cần mở rộng tập S p thì ta tăng t (t=t+1) và kiểm tra điều kiện sau:
Nếu t > L 1 hoặc là sau L2 lần lặp liên tiếp (L1, L2 là các giá trị tùy ý) mà tập S p không kết nạp thêm nghiệm nào thì đặt a i t z i,i1, 2, 3 và lấy 1 chỉ số h bất kỳ từ tập {1, 2, 3} để gán
t
a , rồi lặp lại bước 1
- Nếu không cần mở rộng tập S p thì chuyển sang bước 3
Bước 3:
- Kết thúc thuật toán
Công thức nghiệm của bài toán được chỉ ra trong bổ đề sau:
Bổ đề 2.2 Với bộ tham số b1,b2,b3 đã cho, nghiệm u (r) của bài toán cực tiểu hóa hàm mục tiêu Y trong (2.65) được xác định thỏa mãn đẳng thức: