LUẬN văn THẠC sĩ HAY nghiên cứu một số thuật toán phân cụm dữ liệu nửa giám sát và ứng dụng phân đoạn ảnh x quang

Phân loại các kiểu thuộc tính khác nhau là một vấn đề cần giải quyết đối với hầu hết các tập dữ liệu nhằm cung cấp các phương tiện thuận lợi để nhận dạng sự khác nhau của các phần tử dữ

TỔNG QUAN VỀ PHÂN CỤM DỮ LIỆU VÀ BÀI TOÁN PHÂN ĐOẠN ẢNH X-QUANG NHA KHOA

Khai phá dữ liệu

1.1.1 Khái niệm khai phá dữ liệu

Khai phá dữ liệu là một bước quan trọng trong quá trình khám phá tri thức từ cơ sở dữ liệu (Knowledge Discovery in Databases - KDD) Với sự phát triển mạnh mẽ của khai phá dữ liệu trên nhiều lĩnh vực ứng dụng và các phương pháp tìm kiếm ngày càng đa dạng, có rất nhiều khái niệm liên quan đến chủ đề này Tuy nhiên, có thể hiểu khai phá dữ liệu là quá trình tìm kiếm và chắt lọc những tri thức mới, tiềm ẩn và hữu ích từ tập dữ liệu lớn.

1.1.2 Quá trình khai phá tri thức trong cơ sở dữ liệu

Trong các hoạt động như quản trị, kinh doanh, phát triển sản xuất và dịch vụ, yêu cầu thông tin ngày càng cao đòi hỏi không chỉ dữ liệu mà còn sự hiểu biết và tri thức để hỗ trợ quyết định giải quyết vấn đề Để đáp ứng nhu cầu đó, kỹ thuật khám phá tri thức trong cơ sở dữ liệu (KDD) ra đời và là một lĩnh vực liên quan đến xác suất thống kê, học máy, trực quan hóa dữ liệu và tính toán song song Quá trình KDD có thể được chia thành 5 bước chính: (1) xác định mục tiêu và vấn đề cần giải quyết, (2) thu thập và làm sạch dữ liệu, (3) tiền xử lý và biến đổi dữ liệu để phù hợp với mô hình, (4) khám phá tri thức thông qua khai phá mẫu và mô hình hóa, và (5) đánh giá, diễn giải và triển khai kết quả vào quyết định và hoạt động doanh nghiệp.

Trích chọn dữ liệu: Xác định mục đích của quy trình khai phá dữ liệu dựa

Tiền xử lý dữ liệu là bước thiết yếu nhằm đảm bảo dữ liệu sạch và sẵn sàng cho mô hình hóa Quá trình này tập trung vào loại bỏ dữ liệu trùng lặp, loại bỏ các thông tin gây nhiễu, tập hợp đầy đủ các thông tin cần thiết cho mô hình hóa và chọn các phương pháp xử lý những thông tin bị thiếu Nhờ tiền xử lý dữ liệu mà chất lượng dữ liệu được cải thiện, giúp tăng hiệu suất và độ chính xác của mô hình, đồng thời giảm thiểu sai lệch và biến động trong quá trình phân tích.

Chuyển đổi dữ liệu: Thực hiện thu gọn dữ liệu, phép ánh xạ dữ liệu, tìm những đặc trưng phù hợp để mô tả và khai phá dữ liệu

Khai phá dữ liệu là quá trình xác định nhiệm vụ khai phá dữ liệu phù hợp, như phân lớp, phân cụm, hồi quy hoặc kết hợp dữ liệu Từ nhiệm vụ đã chọn, ta áp dụng các thuật toán và phương pháp đã biết để tìm kiếm các mẫu trong dữ liệu và chọn ra những mẫu hữu ích nhất Quá trình này đòi hỏi đánh giá chất lượng mẫu, lọc các kết quả không có giá trị và tinh chỉnh mô hình để tối ưu hóa hiệu suất Kết quả của khai phá dữ liệu là những mẫu có ý nghĩa, hỗ trợ ra quyết định, dự báo và khám phá insight kinh doanh.

Trình bày và đánh giá: Từ các mẫu khai phá được tiến hành đánh giá hoặc phiên dịch thành những tri thức hiểu được

Hình 1.1 Quá trình khám phá tri thức trong CSDL

1.1.3 Các kỹ thuật tiếp cận trong khai phá dữ liệu:

Các kỹ thuật áp dụng trong khai phá dữ liệu phần lớn được kế thừa từ các lĩnh vực như Cơ sở dữ liệu, Học máy, Trí tuệ nhân tạo và Xác suất thống kê Vì vậy, ta có hai hướng tiếp cận chính sau đây: hướng tiếp cận công nghệ và phương pháp luận, tập trung vào lựa chọn thuật toán, xây dựng pipeline xử lý dữ liệu và tích hợp công cụ; và hướng tiếp cận ứng dụng và kết quả, tập trung vào phân tích, diễn giải và trực quan hóa kết quả để hỗ trợ quyết định.

Theo quan điểm của học máy, các kỹ thuật trong Khai phá dữ liệu gồm:

Học có giám sát (Supervised learning) là quá trình học máy nhằm gán nhãn lớp cho các đối tượng trong tập dữ liệu dựa trên một bộ dữ liệu huấn luyện có nhãn và thông tin nhãn đã biết Trong phương pháp này, mô hình học cách ánh xạ từ các đặc trưng của dữ liệu đến nhãn lớp tương ứng thông qua quá trình huấn luyện với dữ liệu được gán nhãn trước, rồi có khả năng dự đoán nhãn cho dữ liệu mới chưa được gán nhãn Quá trình này thường gồm các bước chuẩn bị dữ liệu, chọn mô hình, huấn luyện, và đánh giá hiệu suất trên tập kiểm tra để đảm bảo độ chính xác và khả năng khái quát Ứng dụng phổ biến của học có giám sát bao gồm phân loại văn bản, nhận diện hình ảnh, dự đoán nhãn cho dữ liệu thời gian và nhiều bài toán nhận diện khác.

Học không giám sát (Unsupervised learning) là quá trình phân tích và phân chia một tập dữ liệu thành các lớp hoặc cụm (cluster) có đặc trưng tương tự nhau mà không có thông tin nhãn trước Mục tiêu của phương pháp này là khám phá cấu trúc ẩn, mối quan hệ giữa các đặc trưng và nhóm dữ liệu dựa trên sự tương đồng giữa các mẫu, thay vì dựa vào nhãn lớp được gắn sẵn Học không giám sát được ứng dụng rộng rãi trong phân cụm (clustering), nhận diện mẫu và khám phá dữ liệu, giúp tối ưu hóa khai thác thông tin mà không cần dữ liệu được gắn nhãn.

- Học nửa giám sát (Semi- Supervised learning): Là quá trình chia một tập dữ liệu thành các lớp con dựa trên một số thông tin bổ trợ cho trước

Theo các lớp bài toán cần giải quyết, các kỹ thuật trong khai phá dữ liệu gồm:

Phân lớp và dự toán (Classification and Prediction) là quá trình đưa một đối tượng vào một trong các lớp đã biết trước Phân lớp và dự đoán được coi là học có giám sát, vì dữ liệu huấn luyện có nhãn và được dùng để huấn luyện mô hình nhằm phân loại và dự đoán nhãn cho các đối tượng mới Việc áp dụng phân lớp và dự đoán giúp nhận diện và phân loại nhanh chóng trong các bài toán như nhận diện hình ảnh, xử lý văn bản và đánh giá khách hàng dựa trên đặc trưng.

Luật kết hợp (Association rules) là dạng luật biểu diễn tri thức ở dạng khá đơn giản, cho phép biểu diễn các mối quan hệ giữa các phần tử trong dữ liệu bằng các quy tắc có dạng Nếu A thì B với xác suất p Các quy tắc này giúp nhận diện các mẫu đồng xuất hiện và dự đoán hành vi của tập dữ liệu dựa trên các sự kiện đã xảy ra Trong khai thác dữ liệu, Luật kết hợp là công cụ để xác định các liên kết mạnh giữa các thuộc tính, từ đó hỗ trợ ra quyết định và tối ưu hóa các quy trình phân tích Một quy tắc bao gồm phần tiền đề A và phần kết quả B, và xác suất p đại diện cho mức độ tin cậy của quy tắc.

- Phân tích chuỗi theo thời gian: Giống như khai phá luật kết hợp nhưng có thêm tính thứ tự và thời gian

- Phân cụm (Clustering): Nhóm các đối tượng thành từng cụm dữ liệu Đây là phương pháp học không giám sát

- Mô tả khái niệm: Mô tả, tổng hợp và tóm tắt khái niệm, ví dụ như tóm tắt văn bản.

Phân cụm dữ liệu

1.2.1 Khái niệm phân cụm dữ liệu

Phân cụm dữ liệu (PCDL) là một kỹ thuật mạnh mẽ trong khai phá dữ liệu được ứng dụng rộng rãi vì khả năng tìm kiếm và phát hiện các cụm và mẫu dữ liệu tự nhiên ẩn chứa trong tập dữ liệu lớn Mục tiêu của PCDL là phân chia dữ liệu thành các nhóm có đặc điểm chung để từ đó cung cấp thông tin và tri thức hỗ trợ ra quyết định Việc nhận diện các cấu trúc, quan hệ và mẫu dữ liệu giúp khám phá các đặc trưng tiềm ẩn và tối ưu hóa các quy trình, giúp doanh nghiệp và nhà nghiên cứu đưa ra các quyết định dựa trên dữ liệu một cách hiệu quả.

1.2.2 Các bước cơ bản để phân cụm dữ liệu

PCDL (phân cụm dữ liệu) là quá trình phân chia một tập dữ liệu ban đầu thành các cụm sao cho các đối tượng trong cùng một cụm có mức độ tương đồng cao với nhau, trong khi các đối tượng ở các cụm khác nhau thì không tương đồng với nhau Số lượng cụm được xác định dựa trên kinh nghiệm, mục tiêu phân tích, hoặc bằng các phương pháp phân cụm phổ biến nhằm tối ưu việc nhóm dữ liệu theo đặc trưng và ứng dụng thực tiễn.

Sau khi xác định đặc tính của dữ liệu, ta tìm cách ước lượng khoảng cách giữa các đối tượng hoặc đo lường mức độ tương đồng giữa chúng Đây là các hàm đo sự giống nhau giữa các cặp đối tượng dữ liệu, thường được dùng để tính độ tương tự hoặc độ phi tương tự giữa các đối tượng dữ liệu Giá trị của hàm đo độ tương tự càng lớn cho thấy mức độ giống nhau giữa hai đối tượng càng cao, ngược lại độ phi tương tự tỉ lệ nghịch với độ tương tự Việc chọn đúng hàm đo phù hợp giúp tối ưu hóa phân tích dữ liệu, hỗ trợ cho các nhiệm vụ như phân loại và nhóm đối tượng (phân cụm).

Trong quá trình PCDL thì vấn đề trở ngại lớn nhất đó là nhiễu (noise)

Trong quá trình thu thập thông tin, nhiễu xuất hiện do dữ liệu thiếu chính xác hoặc không đầy đủ, gây sai lệch kết quả phân tích Do đó, khử nhiễu trong quá trình tiền xử lý dữ liệu là bước thiết yếu để nâng cao chất lượng dữ liệu và hiệu quả của các kỹ thuật phân cụm dữ liệu Việc loại bỏ nhiễu giúp cải thiện độ tin cậy của mô hình, tăng khả năng nhận diện mẫu và tối ưu hóa kết quả phân tích, đồng thời mang lại quyết định và giải pháp dữ liệu chính xác hơn.

Các bước của một bài toán phân cụm dữ liệu gồm:

- Xây dựng hàm tính độ tương tự

- Xây dựng các tiêu chuẩn phân cụm

- Xây dựng mô hình cho cấu trúc dữ liệu

- Xây dựng thuật toán phân cụm và xác lập các điều kiện khởi tạo

- Xây dựng các thủ tục biểu diễn và đánh giá kết quả phân cụm 1.2.3 Các kiểu dữ liệu và độ đo tương tự, độ đo phi tương tự

Trong phần này, chúng ta phân tích các kiểu dữ liệu thường gặp trong PCDL, nơi các đối tượng dữ liệu như con người, nhà cửa, tiền lương và các thực thể phần mềm được biểu diễn dưới dạng các thuộc tính Những thuộc tính này đóng vai trò là các tham số thiết yếu cho việc giải quyết bài toán PCDL và việc lựa chọn chúng có ảnh hưởng đáng kể đến kết quả phân cụm Việc phân loại các kiểu thuộc tính khác nhau là một vấn đề phổ biến của hầu hết các bộ dữ liệu nhằm tạo điều kiện nhận diện sự khác biệt giữa các phần tử dữ liệu Dưới đây, cách phân lớp được thực hiện dựa trên hai đặc trưng chính là kích thước miền (domain size) và hệ đo (measurement scale).

1.2.3.1 Phân loại kiểu dữ liệu dựa trên kích thước miền

Thuộc tính liên tục là đặc tính có miền giá trị vô hạn và không đếm được, tức là giữa hai giá trị bất kỳ luôn tồn tại vô số giá trị trung gian Các đại lượng phổ biến được xem là liên tục như màu sắc, nhiệt độ và cường độ âm thanh có thể nhận được ở mọi mức độ giữa hai giá trị cho trước Ví dụ, giữa hai mức nhiệt độ 20°C và 21°C có rất nhiều mức nhiệt độ khác nhau; tương tự, sắc thái màu giữa hai màu khi bị chi phối bởi ánh sáng hoặc độ sáng của âm thanh cũng có nhiều mức độ trung gian không giới hạn.

Thuộc tính rời rạc là những đặc tính có miền giá trị là tập hữu hạn hoặc đếm được Điều này có nghĩa là các giá trị có thể được liệt kê một cách riêng biệt, không phải các giá trị liên tục Ví dụ điển hình gồm số serial của một cuốn sách và số thành viên trong một gia đình, hai trường hợp mà tập giá trị có thể đếm được một cách dễ dàng.

1.2.3.2 Phân loại kiểu dữ liệu dựa trên hệ đo

Giả sử có hai đối tượng x, y và các thuộc tính x i , y i tương ứng với thuộc tính thứ i của chúng Ta có các lớp kiểu dữ liệu như sau:

Thuộc tính định danh là dạng khái quát hóa của thuộc tính nhị phân, với miền giá trị là một tập rời rạc, không có thứ tự và có nhiều hơn hai phần tử Điều này có nghĩa là với hai đối tượng x và y thuộc thuộc tính này, ta chỉ có thể xác định được là chúng có cùng giá trị hay khác nhau; không có khái niệm so sánh về mức độ giữa các giá trị Nhờ đặc điểm này, thuộc tính định danh phù hợp để nhận diện và phân biệt đối tượng dựa trên các giá trị rời rạc, phục vụ cho các tác vụ phân loại và tổ chức dữ liệu mà không cần phải sắp xếp thứ tự các giá trị.

Thuộc tính có thứ tự là một loại thuộc tính định danh được bổ sung tính thứ tự, cho phép xác định mối quan hệ giữa hai giá trị x và y theo các quan hệ x ≠ y, x = y, x > y hoặc x < y Việc có thứ tự giúp so sánh và sắp xếp đối tượng dựa trên một chuẩn đã định, từ đó hỗ trợ phân tích dữ liệu và xếp hạng một cách rõ ràng Ví dụ điển hình của thuộc tính có thứ tự là huy chương của vận động viên thể thao, trong đó các loại huy chương (vàng, bạc, đồng) có trình tự ưu tiên nhất định, cho phép đánh giá vị trí và thành tích một cách khách quan. -**Support Pollinations.AI:**🌸 **Quảng cáo** 🌸 Tăng xếp hạng nội dung với Pollinations.AI miễn phí—[Hỗ trợ chúng tôi](https://pollinations.ai/redirect/kofi) giữ AI dễ tiếp cận cho cộng đồng của bạn!

Thuộc tính khoảng là cách để đo các giá trị theo xấp xỉ tuyến tính, cho phép nhận diện mức độ khác biệt và thứ tự giữa các thuộc tính dựa trên một khoảng cách cố định Với hai giá trị xi và yi của thuộc tính thứ i, khoảng cách giữa chúng được tính là |xi - yi|, đại diện cho sự khác biệt của thuộc tính đó Điều này giúp so sánh các đặc tính một cách khách quan và thuận tiện cho phân tích dữ liệu dựa trên mức độ tương đồng hoặc khác biệt Ví dụ điển hình là số Serial của một cuốn sách trong thư viện hoặc số kênh trên truyền hình, nơi khoảng cách giữa hai giá trị cho thấy mức độ khác biệt hoặc trình tự giữa các đối tượng.

Thuộc tính tỉ lệ là một loại thuộc tính đo lường theo tỷ lệ và được xác định tương đối so với một điểm mốc làm gốc Ví dụ về các thuộc tính tỉ lệ gồm chiều cao hoặc cân nặng, trong đó giá trị 0 được xem như gốc tham chiếu để so sánh các giá trị khác một cách nhất quán Việc sở hữu thuộc tính tỉ lệ cho phép phân tích biến đổi và so sánh giữa các đối tượng hay thời điểm một cách có hệ thống dựa trên cùng một hệ quy chiếu.

Trong các thuộc tính dữ liệu được trình bày ở trên, thuộc tính định danh và thuộc tính có thứ tự được gọi chung là thuộc tính hạng mục, trong khi thuộc tính khoảng và thuộc tính tỉ lệ được gọi là thuộc tính số Việc phân loại này giúp phân tích và xử lý dữ liệu hiệu quả hơn tùy theo đặc tính của từng loại thuộc tính.

Dữ liệu không gian được quan tâm đặc biệt vì là loại dữ liệu có các thuộc tính số khái quát nằm trong không gian nhiều chiều và mô tả các thông tin liên quan đến không gian chứa đựng các đối tượng, ví dụ như thông tin về hình học và vị trí Dữ liệu không gian có thể là dữ liệu liên tục hoặc rời rạc, phục vụ cho các ứng dụng phân tích, mô hình hóa và trực quan hóa không gian trong nhiều lĩnh vực như địa lý, đô thị và khoa học đất đai.

Dữ liệu không gian rời rạc cho phép biểu diễn các đối tượng bằng các điểm trong không gian nhiều chiều Mỗi điểm đại diện cho một đối tượng dữ liệu và cho phép xác định khoảng cách giữa các đối tượng đó trong cùng một không gian Nhờ đo lường khoảng cách này, các tác vụ như phân nhóm, nhận diện mẫu và phân tích tính tương đồng giữa dữ liệu trở nên hiệu quả hơn, giúp tối ưu hóa quá trình xử lý và ra quyết định dựa trên không gian dữ liệu.

Dữ liệu không gian liên tục: Bao gồm một vùng trong không gian

Các thuộc tính số được đo bằng các đơn vị nhất định như kilogram và centimeter, nhưng sự khác biệt về đơn vị có thể làm ảnh hưởng đến kết quả phân cụm Ví dụ, việc chuyển đổi đơn vị cân nặng từ kilogram sang pound có thể dẫn tới các nhóm khác nhau sau quá trình phân tích Để khắc phục, dữ liệu cần được chuẩn hóa để tạo ra các thuộc tính không phụ thuộc vào đơn vị đo, từ đó tăng tính nhất quán của kết quả phân cụm Việc chuẩn hóa phụ thuộc vào ứng dụng và người dùng, và thường được thực hiện bằng cách chuyển mỗi thuộc tính về dạng số hoặc gán trọng số cho các thuộc tính, nhằm tối ưu hóa hiệu quả phân cụm.

1.2.3.3 Khái niệm và phép đo độ tương tự

Cấu trúc giải phẫu răng

1.3.1 Cấu trúc giải phẫu răng

Cơ quan răng bao gồm răng và nha chu (quanh răng), là đơn vị hình thái và chức năng của bộ răng Răng là bộ phận trực tiếp nhai nghiền thức ăn, nha chu là bộ phận giữ và nâng đỡ răng, đồng thời là bộ phận nhận cảm, tiếp nhận và dẫn truyền lực nhai Răng gồm men, ngà (mô cứng) và tủy (mô mềm).

Nha chu gồm xê măng (còn gọi là xương chân răng, men chân răng), dây chằng nha chu, xương ổ răng và nướu (lợi) Bộ răng là một thể thống nhất thuộc hệ thống nhai, được hình thành từ sự sắp xếp có tổ chức của các cơ quan răng, tạo nên khung nâng đỡ và chức năng nhai cho cả bộ răng.

Hình 1.2 Cơ quan răng (răng và nha chu)

Mỗi răng có phần thân răng và chân răng Giữa thân răng và chân răng là đường cổ răng (cổ răng giải phẫu), là một đường cong, còn gọi là đường nối men – xê măng Thân răng được bao bọc bởi men răng, chân răng được xê măng bao phủ

Nướu răng viền xung quanh cổ răng tạo thành một bờ, gọi là cổ răng sinh lý Phần răng thấy được trong miệng là thân răng lâm sàng Cổ răng sinhh lý thay đổi tùy theo nơi bám và bờ của viền nướu, khi tuổi càng cao thì nơi bám này càng có khuynh hướng di chuyển dần về phía chóp răng Nhiều trường hợp bệnh lý, nướu răng có thể bị sưng hoặc trụt, làm thân răng (lâm sàng) bị ngắn lại hoặc dài ra

Cấu tạo của răng: Bao gồm men răng, ngà răng (mô cứng) và tủy răng (mô mềm):

Men răng là lớp phủ mặt ngoài của răng, là mô cứng nhất trong cơ thể người và có tỉ lệ chất vô cơ lên tới khoảng 96% Hình dáng và bề dày của men răng được xác định trước khi răng mọc, và về sau không được bồi đắp thêm mà mòn dần theo tuổi Trong đời sống, men răng còn tham gia trao đổi vật lý và hóa học với môi trường miệng, ảnh hưởng đến độ bền và sự bảo vệ ngà bên trong.

Ngà răng : Kém cứng hơn men, chứa tỉ lệ chất vô cơ thấp hơn men (75%)

Trong ngà có nhiều ống ngà chứa đuôi bào tương của nguyên bào ngà; sự hoạt động của nguyên bào ngà làm cho bề dày ngà răng thay đổi theo thời gian, và ngà răng ngày càng dày lên theo hướng về phía hốc tủy, khiến hốc tủy dần bị thu hẹp.

Tủy răng là mô liên kết mềm nằm trong hốc tủy, gồm tủy thân (tủy buồng) ở phần buồng mặt răng và tủy chân ở ống tủy Các nguyên bào ngà nằm sát vách hốc tủy Trong tủy răng có chứa nhiều mạch máu, mạch bạch huyết và đầu tận cùng thần kinh Tủy răng duy trì sự sống của răng, cụ thể là sự sống của nguyên bào ngà và tạo ngà thứ cấp, nhận cảm giác của răng.

Bộ phận nâng đỡ răng: Bao gồm xương ổ răng, xê măng, dây chằng nha chu và nướu (lợi) răng

Xương ổ răng là xương xốp, bên ngoài được bao bọc bằng màng xương, nơi nướu răng bám vào, và nó tạo thành một huyệt có hình dáng và kích thước phù hợp với chân răng Bề mặt ổ răng, nơi đối diện với chân răng, là mô xương đặc biệt có nhiều lỗ thủng để cho mạch máu và dây thần kinh từ xương xuyên qua nuôi dưỡng dây chằng nha chu, gọi là xương ổ chính danh, hay lá sàng Trên hình ảnh tia X, phần xương ổ chính danh trông cản tia hơn, được gọi là lá cứng Nền xương ổ không phân biệt được với xương hàm Chiều cao xương ổ răng thay đổi theo tuổi và tùy theo sự lành mạnh hay bệnh lý của mô nha chu.

Khi răng không còn trên xương hàm thì xương ổ răng và các thành phần của nha chu cũng bị tiêu dần đi

Xê măng (cementum) là một mô đặc biệt hình thành cùng với sự hình thành chân răng, phủ ngoài ngà chân răng Xê măng được bồi đắp thêm ở vùng chóp chủ yếu để bù trừ sự mòn mặt nhai, được coi là hiện tượng “mọc răng suốt đời” hay “trồi mặt nhai” Xê măng cũng có thể tiêu hoặc quá sản trong một số trường hợp bất thường hay bệnh lý.

Dây chằng nha chu là các bó sợi liên kết dày khoảng 0,25 mm, một đầu bám vào xê măng và đầu kia bám vào xương ổ răng; nguồn gốc của dây chằng nha chu, xê măng và xương ổ răng từ túi răng chính danh Dây chằng nha chu có chức năng giữ răng gắn chắc với xương ổ răng, đồng thời như một lớp đệm cho phép mỗi răng có sự di động nhẹ, độc lập với các răng khác khi nhai; nó còn giúp lưu thông máu quanh nha chu, truyền cảm giác áp lực và truyền lực nhai để giảm tác động có hại lên răng và mô nha chu.

Nướu răng : Là phần niêm mạc phủ lên xương ổ răng (nướu dính) và cổ răng (nướu rời)

1.3.2 Phân loại ảnh X - quang nha khoa Ảnh X-quang nha khoa là một trong những cách phổ biến với chi phí thấp nhất để thu được ảnh (thông tin) về răng Bởi vì nhiều bệnh của răng và các mô xung quanh không thể được nhìn thấy trực tiếp bằng mắt thường khi nha sĩ kiểm tra miệng Chụp X – quang có thể giúp phát hiện những vấn đề sau đây:

- Lỗ sâu giữa các răng hoặc phát hiện sâu răng bên dưới lớp trám răng

- Phát hiện những biến chuyển bất thường trong răng miệng

Phát hiện và điều trị các vấn đề về răng ở giai đoạn sớm mang lại lợi ích thiết thực như tiết kiệm thời gian và chi phí điều trị, đồng thời giảm bớt sự khó chịu cho người bệnh Ảnh X-quang nha khoa là công cụ đắc lực giúp nha sĩ nhận diện sớm các vấn đề răng miệng, từ sâu răng tới tổn thương mô quanh răng, qua đó lên kế hoạch điều trị tối ưu và ngăn ngừa biến chứng.

Có rất nhiều loại ảnh X-quang nha khoa khác nhau, nhưng được phân thành hai nhóm chính: ảnh X-quang intraoral (ảnh X-quang trong miệng) và ảnh X-quang extraoral (ảnh X-quang ngoài miệng) Ảnh X-quang intraoral được chụp bên trong khoang miệng để đánh giá răng, chân răng và xương hàm ở khu vực gần răng, trong khi ảnh X-quang extraoral được chụp ở bên ngoài miệng để khảo sát các cấu trúc xa hơn như quai hàm và sọ mặt Việc chọn đúng loại ảnh X-quang phù hợp dựa trên mục tiêu chẩn đoán và kế hoạch điều trị sẽ giúp hình dung rõ ràng cấu trúc nha khoa và tối ưu hóa quá trình chăm sóc bệnh nhân.

Ảnh X-quang intraoral là loại ảnh X-quang nha khoa phổ biến nhất, mô tả chi tiết các răng và cấu trúc quanh răng Nó cho phép nha sĩ phát hiện sâu răng, kiểm tra sức khỏe của răng và xương quanh răng, đánh giá tình trạng phát triển của răng và theo dõi sức khỏe chung của răng và xương hàm.

X-quang ngoài miệng cho phép nhìn thấy toàn bộ hàm răng và xương sọ, nhưng không cung cấp chi tiết từng răng như ảnh intraoral nên không được dùng để phát hiện sâu răng hoặc các vấn đề riêng lẻ ở từng răng Thay vào đó, phương pháp này được dùng để nhận biết sự chen chúc của răng, theo dõi sự tăng trưởng và phát triển của hàm trong quan hệ với răng, nhằm xác định các vấn đề tiềm ẩn giữa răng và hàm và hỗ trợ chẩn đoán các rối loạn thái dương hàm hoặc các xương mặt khác.

Bài toán phân đoạn ảnh X - quang nha khoa

Trong thị giác máy tính, phân đoạn ảnh là quá trình phân vùng một ảnh kỹ thuật số thành các vùng rời rạc và đồng nhất với nhau, hay nói cách khác là xác định các biên của các vùng ảnh đó Những vùng ảnh được phân đoạn thường phản ánh toàn bộ hoặc một phần của các đối tượng thực sự có mặt trong ảnh, giúp nhận diện và phân tích cấu trúc cảnh quan Quá trình này đóng vai trò quan trọng trong các ứng dụng như nhận diện đối tượng, phân tích cảnh và xử lý hình ảnh, nhờ khả năng cô lập các khu vực đặc trưng của ảnh dựa trên đặc trưng màu sắc, độ sáng và kết cấu.

Phân đoạn ảnh là quá trình chia nhỏ một bức ảnh thành các vùng cấu thành nên nó hoặc thành các đối tượng riêng biệt, qua đó giúp nhận diện và phân loại các khu vực quan trọng trong hình Theo một định nghĩa khác, phân đoạn ảnh được xem là quá trình trích xuất những vùng hữu ích từ nền ban đầu, loại bỏ nền không cần thiết và tập trung vào các vùng cần quan tâm để phục vụ cho các ứng dụng như nhận diện đối tượng, phân tích cấu trúc hình ảnh hoặc xử lý ảnh một cách hiệu quả hơn.

Phân đoạn ảnh là quá trình đơn giản hóa và/hoặc biến đổi đại diện của một bức ảnh thành dạng có ý nghĩa hơn và dễ phân tích, xử lý Mục đích chính của phân đoạn là xác định vị trí của các đối tượng và ranh giới trong ảnh, chẳng hạn như các loại cây trồng, khu vực đô thị hoặc rừng trong ảnh vệ tinh, cũng như các đường biên (đường thẳng, đường cong, v.v.) Cụ thể, phân đoạn ảnh là quá trình gán nhãn cho mọi pixel sao cho các pixel mang cùng nhãn có chung một tập đặc điểm nhất định, từ đó hình thành các vùng có ý nghĩa riêng biệt trong ảnh.

Kết quả của phân đoạn ảnh là tập hợp các phân đoạn bao phủ toàn bộ bức ảnh hoặc tập hợp các đường mức (đường biên) được trích xuất từ ảnh, như các cạnh được phát hiện Mỗi pixel trong một vùng cho thấy sự đồng nhất về một số thuộc tính như màu sắc, cường độ và cấu trúc, còn các vùng kề nhau thể hiện sự khác biệt đáng kể về những thuộc tính này Khi áp dụng cho một tập ảnh, điển hình là ảnh nha khoa, các đường mức thu được sau phân đoạn có thể được dùng để dựng mô hình 3D với sự hỗ trợ của các thuật toán nội suy.

Có nhiều thuật toán và kỹ thuật với mục tiêu chung được phát triển cho phân đoạn ảnh Thông thường, các thuật toán này cần kết hợp với kiến thức chuyên môn từ một lĩnh vực cụ thể để có thể giải quyết hiệu quả bài toán phân đoạn các vùng trong ảnh Nhờ sự kết hợp giữa công nghệ nhận diện và kiến thức thực tiễn của lĩnh vực liên quan, những phương pháp phân đoạn có thể được tùy chỉnh và tối ưu cho từng miền ứng dụng khác nhau.

1.4.2 Phân loại các phương pháp phân đoạn ảnh

Trong hầu hết các phương pháp phân đoạn ảnh, hai tính chất cơ bản được xem là nền tảng chính: sự tương đồng và sự gián đoạn giữa các vùng ảnh Cả hai đều gắn với khái niệm mật độ, khi các điểm ảnh có mức độ giống nhau cao sẽ được gom lại thành một vùng và sự khác biệt đáng kể về mật độ giữa các vùng sẽ tạo ra biên hoặc ranh giới phân tách Khi sự tương đồng cao, các nhóm điểm ảnh được hợp nhất thành một vùng thống nhất; ngược lại, sự gián đoạn hoặc biên mạnh giúp xác định ranh giới giữa các vùng khác nhau Vì vậy, việc xem xét mức độ đồng nhất và sự khác biệt mật độ là chìa khóa để phân đoạn hiệu quả, tối ưu hóa quy trình xử lý ảnh và nâng cao khả năng nhận diện đặc trưng.

Phương pháp đầu tiên tập trung vào phân đoạn ảnh bằng cách chia ảnh thành các vùng tương đồng nhau theo tập tiêu chí xác định trước, nhằm nhóm các điểm ảnh có đặc tính chung và cấu trúc thống nhất Trong khi đó, phương pháp thứ hai phân đoạn dựa trên sự thay đổi đột ngột về cường độ sáng, nhận diện các cạnh và biên giới giữa các vùng để nắm bắt dạng hình và chi tiết của ảnh Việc kết hợp hai hướng tiếp cận này cho phép hệ thống phân đoạn vừa xác định các khu vực đồng nhất về đặc tính vừa làm nổi bật các cạnh rõ rệt, tối ưu cho các tác vụ như nhận diện đối tượng, phân loại hình ảnh và xử lý ảnh.

Chúng ta có thể phân loại các phương pháp phân đoạn ảnh dựa trên giá trị của các pixel và mối quan hệ giữa chúng với ba vùng: dựa trên pixel, dựa trên đường biên và dựa trên vùng Trong hướng tiếp cận dựa trên pixel, việc phân lớp được thực hiện dựa trên giá trị độ xám (cường độ) của từng pixel trong ảnh Phương pháp dựa trên biên dựa trên sự thay đổi đột ngột của giá trị cường độ tại biên giữa các vùng nhằm xác định đường biên phân vùng Trong khi đó, phương pháp dựa trên vùng tập trung vào nhóm các pixel có đặc tính đồng nhất để hình thành các vùng ảnh có tính liên kết.

Phương pháp dựa trên vùng dựa trên sự khác nhau trong các giá trị định trước của các pixel láng giềng trong ảnh đó

1.4.3 Phân đoạn ảnh X – quang nha khoa

Phân đoạn ảnh nha khoa là bước xử lý then chốt giúp hỗ trợ bác sĩ chuẩn đoán các bệnh về răng một cách chính xác và hiệu quả Quá trình này chia hình ảnh nha khoa thành các vùng mô mềm, mô cứng và các cấu trúc giải phẫu quan trọng, từ đó cho phép phân tích chi tiết và nhận diện bất thường trên răng và nướu Nhờ phân đoạn, hệ thống hỗ trợ chẩn đoán có thể xử lý nhanh hơn, giảm thiểu sai lệch và tăng độ nhạy của phát hiện bệnh lý nha khoa Để phân tích một ảnh nha khoa, cần kết hợp tiền xử lý chất lượng, chọn thuật toán phân đoạn phù hợp và đánh giá kết quả dựa trên các tiêu chí như độ chính xác, độ nhạy và độ đặc hiệu Việc tối ưu quy trình phân đoạn ảnh nha khoa đóng vai trò then chốt trong nâng cao chất lượng chẩn đoán và lên kế hoạch điều trị cho bệnh nhân.

X – quang nha khoa, chúng ta cần sử dụng một số tiến trình xử lý trên ảnh để thu được những thông tin quan trọng

Phân đoạn ảnh nha khoa nhằm xác định và phân loại từng răng hoặc các phần của răng (thân răng và chân răng) từ ảnh X-quang nha khoa Mỗi răng hoặc phần của răng được trích xuất từ ảnh gốc để cung cấp dữ liệu quan trọng cho các bước xử lý tiếp theo trong mọi ứng dụng Ảnh X-quang nha khoa thường có 3 vùng chính.

Vùng thứ nhất là vùng chứa các răng, thường có giá trị mức xám cao nhất, chính là vùng sáng nhất trên ảnh Đây là khu vực cần xác định trong quá trình phân đoạn ảnh nha khoa để phân tách răng khỏi nền và các cấu trúc khác.

Vùng thứ hai tương ứng với khu vực chứa lợi, xương và các cấu trúc quanh răng Khu vực này thường có mức xám trung bình, nhưng một số vùng xương có giá trị mức xám gần với vùng răng, khiến quá trình phân đoạn răng gặp khó khăn Những đặc điểm này ảnh hưởng đến độ chính xác của phân đoạn răng và cần được xem xét khi tối ưu hóa các thuật toán nhận diện cấu trúc nha khoa.

Vùng thứ ba là vùng nền trong ảnh nha khoa, có giá trị độ xám thấp nhất và số lượng hình ảnh hạn chế do nhiễu, độ tương phản thấp, sự giống nhau giữa các mô và giới hạn của các phương pháp quét ảnh; những đặc điểm này khiến quá trình phân đoạn gặp sai lệch và hiệu quả kém Ví dụ về các khó khăn trong quá trình xử lý ảnh nha khoa bao gồm các mẫu vật dùng trong điều trị, răng chèn vào nhau, biến thể hình thể răng và khoảng trống giữa các răng bị thiếu, cùng với các vấn đề trong xử lý ảnh Hình minh họa cho thấy các thách thức có thể xuất hiện trong các ảnh nha khoa như: các thành phần khác được lấp đầy các răng, răng chèn vào nhau, biến thể khác nhau của răng và khoảng trống tại vị trí răng thiếu.

Hình 1.4 Những khó khăn trong việc phân đoạn ảnh nha khoa

Các phương pháp phân đoạn được đề xuất có mức độ phù hợp khác nhau với từng bài toán Một phương pháp có thể mang lại hiệu quả cao trên một vấn đề cụ thể, nhưng trên một vấn đề khác lại thể hiện hiệu suất yếu và không đáng kể Do đó, việc đánh giá sự phù hợp và hiệu suất của mỗi phương pháp trên từng tập dữ liệu và ngữ cảnh là rất quan trọng Việc so sánh một cách hệ thống giúp chọn phương pháp phân đoạn tối ưu, cân nhắc các yếu tố như độ chính xác, tốc độ thực thi và chi phí tính toán trong điều kiện dữ liệu khác nhau.

Vì vậy, rất khó để có được một phương pháp phân đoạn nhất định mà phù hợp hoàn toàn cho một vấn đề mở rộng

Chương 1 của luận văn đã nêu ra kiến thức tổng quan về phân cụm dữ liệu, ứng dụng của phân cụm dữ liệu và về cấu trúc giải phẫu răng, phân loại ảnh X – quang nha khoa, bài toán phân đoạn ảnh từ đó nêu ra bài toán, những yêu cầu, thách thức và ý nghĩa, ứng dụng thực tế của bài toán phân đoạn ảnh X – quang nha khoa trong các hệ thống nhận dạng người hay hệ thống chẩn đoán, điều trị nha khoa

MỘT SỐ THUẬT TOÁN PHÂN CỤM NỬA GIÁM SÁT

Phân cụm mờ

2.1.1 Các khái niệm cơ bản về tập mờ

Tập rõ và tập mờ: Trong nghĩa kinh điển của tập hợp, một tập hợp được gọi là tập rõ (crisp set) khi mỗi phần tử đều thuộc hoặc không thuộc tập một cách tuyệt đối Nói cách khác, đối với mọi phần tử, ta xác định được nó là thuộc hay không thuộc tập, và không có trạng thái trung gian nào giữa hai khả năng đó Do đó, tập rõ thể hiện hai trạng thái đầy đủ: thuộc và không thuộc.

Một tập mờ A trên tập nền X được xác định bởi hàm thuộc μ_A: X → [0,1], trong đó μ_A(x) cho biết độ thuộc của x vào tập mờ A Tập nền X luôn được xem là tập rõ Khi X rời rạc và hữu hạn với X = {x1, x2, , xn}, tập mờ A trên X được biểu diễn bằng các giá trị thuộc tương ứng cho từng phần tử, tức A = { (x_i, μ_A(x_i)) | i = 1, , n }, hoặc dưới dạng vector μ_A = (μ_A(x1), μ_A(x2), , μ_A(xn)).

Trong lý thuyết tập mờ, μ_A(x_i) là độ thuộc của x_i vào A Nếu tập nền X là liên tục, thì tập mờ A trên X được biểu diễn bằng A = ∫ μ_A(x) / x Chú ý rằng '/' chỉ là ký tự phân cách; ký hiệu Σ và ∫ là các phép kết hợp giữa các thành phần; và '+' là phép nối giữa các thành phần, chứ không phải là phép chia, tổng, tích phân hay cộng như thông thường.

Các dạng hàm phổ biến thuộc hai nhóm chính là hàm tuyến tính và hàm dạng sin Hình 2.1 minh họa một hàm tuyến tính Hàm này có bốn tham số a, b, c và d xác định hình dạng của đồ thị Bằng cách điều chỉnh các tham số này, ta có thể tạo ra các dạng hàm chữ S (S-shaped), hình thang, tam giác và dạng chữ L (L-shaped).

Hình 2.1 Hàm thuộc tuyến tính

Trong trường hợp dạng đường cong là phù hợp hơn, ta nên chọn hàm thuộc dạng sin (xem Hình 2.2) Cũng như với các hàm tuyến tính, ta có thể tạo ra các dạng hình chữ S, hình chuông và hình chữ L bằng cách điều chỉnh các tham số sao cho phù hợp.

Trường hợp đặc biệt của hàm thuộc hình chuông là hàm Gauss (Hình 2.3), sinh ra từ hàm mật độ xác suất của phân phối chuẩn với hai tham số c (giá trị trung bình) và σ (độ lệch chuẩn) Mặc dù xuất phát từ lý thuyết xác suất, hàm Gauss còn được sử dụng như một hàm thuộc tập mờ để thể hiện mức độ membership của một giá trị với một tập mờ dựa trên sự phân phối của biến ngẫu nhiên và độ lệch so với giá trị trung bình.

Phép toán trên tập mờ được định nghĩa tương tự như các phép toán trên tập rõ, với các phép cơ bản là hợp, giao và bù Các phép toán này cho phép xử lý tập mờ dựa trên các mức độ thuộc của phần tử và kết hợp chúng theo các quy tắc tương ứng Độ cao của tập mờ A là giá trị độ thuộc lớn nhất của các phần tử thuộc A, ký hiệu hgt(A).

Nếu hgt(A) = 1, tập mờ được gọi là chuẩn Ta có thể chuẩn hóa một tập mờ bằng cách chia tất cả độ thuộc cho độ cao của nó

Tập mờ A là bao trong (tập con của) tập mờ B (viết A  B ) nếu

 Tập mờ A bao trong tập mờ B nếu đồ thị của A hoàn toàn được phủ bởi đồ thị của B (Hình 2.4)

Hình 2.4 Bao trong của tập mờ

Có nhiều cách xác định phép hợp của hai tập mờ Sau đây là các phép hợp thông dụng nhất, với mọi xX:

Phép max được xem là không tương tác theo độ thuộc của hai tập mờ khi hai tập này không ảnh hưởng lẫn nhau trong phép hợp Cụ thể, một tập mờ có thể bị bỏ qua hoàn toàn trong phép hợp nếu nó nằm hoàn toàn trong tập còn lại Hai phép còn lại được coi là tương tác vì độ thuộc của kết quả phép hợp phụ thuộc vào cả hai độ thuộc của các tập thành phần Hình 2.5 minh họa phép hợp dạng 1 của các tập mờ thấp và trung bình trong tài liệu này.

Hình 2.5 Phép hợp tập mờ dạng 1

Phép giao của hai tập mờ A, B được tính theo một trong các phép toán sau:

Phép min là không tương tác, hai phép toán còn lại là tương tác Hình 2.6 minh họa phép giao dạng 1 của các tập mờ thấp và trung bình

Hình 2.6 Phép giao tập mờ dạng 1

Phép bù của tập mờ A được xác định:  x  X ,  A ( x )  1   A ( x ) Hình 2.7 minh họa phần bù của tập mờ trung bình

Hình 2.7 Phần bù của tập mờ trung bình

2.1.2 Thuật toán phân cụm mờ FCM (Fuzzy C-Means)

Phân cụm có thể được định nghĩa rõ ràng như sau: với một tập dữ liệu mẫu X, ta xét từng điểm dữ liệu và xác định xem nó có đặc điểm gần nhất với đặc trưng của nhóm nào để gán nó vào nhóm đó Tuy nhiên, trong thực tế không phải lúc nào bài toán phân cụm cũng có thể áp dụng một cách rõ ràng, do dữ liệu có thể phức tạp, không phân tách hoàn toàn hoặc phụ thuộc vào tham số và giả định của thuật toán.

Một phương pháp phân cụm nhất định phân hoạch một tập dữ liệu ban đầu thành các cụm có tính tự nhiên và mỗi đối tượng dữ liệu chỉ thuộc về một cụm, với các cụm có mật độ cao và cách biệt rõ ràng và đường biên giữa chúng được xác định tốt Tuy nhiên trong thực tế, đường biên giữa các cụm có thể mờ, các cụm có thể chồng lên nhau khiến một số đối tượng dữ liệu thuộc về nhiều cụm khác nhau, do đó mô hình này không mô tả được dữ liệu thực Vì vậy người ta đã áp dụng lý thuyết về tập mờ trong PCDL để giải quyết cho trường hợp này Cách thức kết hợp này được gọi là phân cụm mờ.

Phân cụm mờ là phương pháp phân tích dữ liệu cho phép mỗi điểm dữ liệu thuộc về hai hoặc nhiều cụm nhờ các mức độ thuộc (membership degree) khác nhau Năm 1969, Ruspini đề xuất khái niệm phân hoạch mờ để mô tả cấu trúc dữ liệu và trình bày một thuật toán tính toán phân hoạch tối ưu Năm 1973, Dunn mở rộng phương pháp và phát triển thuật toán phân cụm mờ mới Ý tưởng chính của các thuật toán này là xây dựng một hàm mục tiêu để tối thiểu hóa, từ đó xác định các trung tâm cụm và các mức độ thuộc tương ứng Đến năm 1981, Bezdek cải tiến và tổng quát hóa hàm mục tiêu mờ bằng cách đưa ra trọng số mũ, xây dựng thuật toán phân cụm mờ và chứng minh sự hội tụ của các thuật toán ở mức cực tiểu cục bộ Hàm mục tiêu dựa trên độ thuộc u_kj của phần tử dữ liệu x_k vào cụm thứ j được định nghĩa nhằm tối ưu hóa cấu trúc phân cụm và mô hình hóa dữ liệu theo đặc trưng mờ.

Trong đó: m là số mờ hóa; C là số cụm; N là số phần tử dữ liệu; r là số chiều của dữ liệu; u kj là độ thuộc của phần tử dữ liệu x k vào cụm j; là phẩn tử thứ k của x={x 1 , x 2 , , x N }; v j là tâm của cụm j

Bài toán đặt ra là cần xác định tâm cụm V={v j } và ma trân độ thuộc U={u kj } từ (2.1) - (2.2) Để tìm tâm cụm v j từ bài toán cực trị (2.1) với ràng buộc (2.2) ta làm như sau:

Lấy đạo hàm của phiếm hàm J theo v j , ta được:

Tiếp theo, ta sử dụng phương pháp nhân tửu Lagrange [5] với điều kiện ràng buộc (2.2) ta thu được ma trận độ thuộc

Khi đó thuật toán phân cụm mờ được thực hiện như sau:

Input Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C; mờ hóa m; ngưỡng 𝜀; số lần lặp lớn nhất MaxStep

Output Ma trận độ thuộc U và tâm cụm V

Các bước của thuật toán

2 Khởi tạo ngẫu nhiên U (t) thỏa mãn điều kiện (2.2)

Việc chọn các tham số cụm rất ảnh hưởng đến kết quả phân cụm, tham số này thường được chọn theo phép ngẫu nhiên hoặc theo kinh nghiệm

Chưa có quy tắc nào nhằm lựa chọn tham số m đảm bảo việc phân cụm hiệu quả, thông thường người ta chọn m = 2

Nhược điểm lớn nhất của thuật toán FCM là nhạy cảm với nhiễu và phần tử ngoại lai trong dữ liệu, khiến các tâm cụm có thể lệch khỏi tâm thực tế Hệ quả là các cụm được khám phá có thể không phản ánh đúng cấu trúc dữ liệu và kết quả phân nhóm sẽ bị lệch so với thực tế Vì vậy, khử nhiễu và xử lý phần tử ngoại lai là vấn đề quan trọng cần được giải quyết để nâng cao độ chính xác và độ tin cậy của phân tích FCM.

Phân cụm mờ là sự mở rộng của phân cụm dữ liệu, bổ sung yếu tố thể hiện mối quan hệ giữa các phần tử và các cụm thông qua các trọng số trong ma trận U Nhờ cơ chế này, phương pháp phân cụm mờ cho phép mô hình hóa và khám phá các cụm dữ liệu phức tạp một cách mềm dẻo từ một tập dữ liệu cho sẵn Điều này giúp nhận diện các mẫu và cấu trúc ẩn trong dữ liệu mà các phương pháp phân cụm cứng khó nắm bắt, đồng thời tối ưu hóa hiệu suất phân tích dữ liệu cho các ứng dụng thực tế.

Thuật toán phân cụm nửa giám sát mờ bằng phương pháp học tích cực 31 2.3 Thuật toán phân cụm nửa giám sát mờ chuẩn (SSSFC)

Các thuật toán phân cụm nửa giám sát mờ được xây dựng dựa trên nền tảng của các thuật toán phân cụm mờ và tích hợp với thông tin bổ sung do người dùng cung cấp nhằm mục đích hướng dẫn, giám sát và điều khiển quá trình phân cụm Những thông tin bổ sung này giúp cân nhắc giữa dữ liệu và sự tác động của người dùng, và được xây dựng dựa trên ba loại cơ bản nhằm tối ưu hóa hiệu suất phân cụm và tăng cường khả năng kiểm soát hệ thống.

Ràng buộc Must-link yêu cầu hai phần tử phải thuộc về cùng một cụm, đảm bảo mọi cặp đối tượng có ràng buộc Must-link được gom chung vào một nhóm; ngược lại, ràng buộc Cannot-link cho biết hai phần tử không thuộc cùng một cụm và phải được phân vào hai cụm khác nhau, giúp ngăn chúng ở chung một nhóm Trong quá trình phân cụm dữ liệu, sự kết hợp của hai loại ràng buộc này giúp tối ưu việc nhóm các đối tượng có đặc điểm tương tự và duy trì sự khác biệt giữa các nhóm, từ đó cải thiện độ chính xác của mô hình và hiệu suất của thuật toán.

- Các nhãn lớp của một phần dữ liệu: Một phần của dữ liệu được gán nhãn và phần còn lại không được gán nhãn

- Độ thuộc được xác định trước

Để nâng cao chất lượng phân cụm, năm 2008 Grira [21] đã sử dụng thông tin bổ trợ dưới dạng ràng buộc Must-link và Cannot-link Theo phương pháp này, M là tập các ràng buộc Must-link, nghĩa là M = {(x_i, x_j): x_i và x_j thuộc cùng một cụm}; ∆ là tập các ràng buộc Cannot-link, nghĩa là ∆ = {(x_i, x_j): x_i và x_j không thuộc cùng một cụm} Hàm mục tiêu được xác định dựa trên hai tập ràng buộc này nhằm tối ưu quá trình gán dữ liệu vào các cụm và đảm bảo tính nhất quán với các ràng buộc đã cho.

Tìm cực trị của (2.6) với điều kiện ràng buộc (2.2) xác định được

FCM Constrain kj kj kj u  u  u (2.8) Trong đó

M là tổng số các ràng buộc Must-link và Cannot-link

Thuật toán thực hiện như sau:

Input Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C; ngưỡng ε; số lần lặp lớn nhất MaxStep

2.3 Thuật toán phân cụm nửa giám sát mờ chuẩn (SSSFC)

Gần đây, một số nghiên cứu về phân đoạn ảnh bằng phân cụm nửa giám sát đã sử dụng thông tin bổ trợ dưới dạng giá trị hàm độ thuộc đã được xác định trước Với loại thông tin này, Yasunuri [17] đã đề xuất một thuật toán phân cụm nửa giám sát mờ, trong đó hàm độ thuộc bổ sung được đưa vào hàm mục tiêu của FCM nhằm cải thiện hiệu quả phân cụm Hàm mục tiêu được định nghĩa để kết hợp hàm độ thuộc bổ sung với các thành phần của FCM, từ đó tăng khả năng nhận diện và độ chính xác trong quá trình phân đoạn ảnh.

Với điều kiện ràng buộc (2.2), u kj là hàm độ thuộc bổ trợ của phần tử x k với cụm C j đồng thời thỏa mãn

Sử dụng phương pháp nhân tử Lagrange [5] tìm cực trị của (2.6) với điều kiện ràng buộc (2.2) ta xác định được u k j như sau:

C kj kj k i j i kj kj k i i u u khi k x v u u khi k x v

Input Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C; ma trận độ thuộc bổ trợ ; mờ hóa m; ngưỡng ԑ; số lần lặp lớn nhất MaxStep

Output Ma trận U và tâm cụm V

4 Tính U (t) ={u kj } theo (2.14) nếu m>1 hoặc theo (2.15) nếu m=1

Thuật toán phân cụm nửa giám sát mờ theo quy tắc entropy (eSFCM) 35 2.5 Thuật toán nửa giám sát mờ lai ghép

Vào năm 2009, Zhang đã áp dụng quy tắc entropy để giảm số chiều và đề xuất một tiếp cận mới bằng cách kết hợp một thành phần entropy vào hàm mục tiêu Đến năm 2012, Yin đề xuất hiệu chỉnh hệ số entropy và giới thiệu phân cụm nửa giám sát mờ dựa trên thuật toán eSFCM, trong đó sử dụng độ thuộc bổ trợ để tăng hiệu suất phân cụm trong các điều kiện nhất định.

Với tâm cụm ban đầu được xác định theo công thức:

Sử dụng khoảng cách Mahalanobis, ma trận hiệp phương sai của các mẫu được xác định:

( , ) k j ( k j ) T 1 ( k j ) d x v  x  v P  x  v (2.19) Khi đó hàm mục tiêu của eSFCM được xác định như sau:

N C N C kj k j kj kj kj kj k j k j

Với điều kiện ràng buộc (2.2) và hàm mục tiêu (2.19) ta có các công thức xác định ma trận độ thuộc:

Input Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C; ma trận độ thuộc 𝑈̅ ; ngưỡng ε; số lần lặp lớn nhất MaxStep

2 Tính ma trận P theo (2.18) với ma trận độ thuộc U và tâm cụm ban đầu V (0)

2.5 Thuật toán nửa giám sát mờ lai ghép

Trong mục này, tác giả trình bày thuật toán nửa giám sát mờ lai ghép [13], được thực hiện dựa trên sự kết hợp giữa thuật toán Otsu, thuật toán phân cụm mờ (FCM) và thuật toán phân cụm nửa giám sát mờ (eSFCM) Thuật toán này tận dụng ngưỡng tối ưu của Otsu, khai thác khả năng phân cụm mờ của FCM và bổ sung cơ chế học từ nhãn bán giám sát của eSFCM để nâng cao độ chính xác và hiệu quả phân tích dữ liệu.

2.5.1 Lược đồ tổng quan lai ghép

Trong hình 2.8, luận văn minh họa sơ đồ tổng quan cho mô hình kết hợp Otsu – FCM – eSFCM, được trình bày bằng một ảnh X-Quang nha khoa làm đầu vào Đầu vào này kèm theo một số tham số do người dùng xác định như số lượng cụm (C), tham số m (độ mờ hóa) (m), ngưỡng Otsu (T) và ngưỡng dừng (ε) Mô hình kết hợp này tích hợp ngưỡng Otsu với phân cụm mờ FCM và tối ưu hóa bởi eSFCM nhằm đạt phân đoạn chất lượng cao cho ảnh nha khoa.

Bắt đầu Ảnh đầu vào và các tham số

Kiểm tra xem ảnh đầu vào có vùng nền

Dùng phương pháp tách ngưỡng Otsu để loại bỏ vùng nền trong ảnh

Dùng phương pháp phân cụm FCM để xác định ma trận độ thuộc

Áp dụng phương pháp phân cụm eSFCM để phân đoạn ảnh, kết hợp thông tin bổ trợ được xác định từ ma trận độ thuộc nhằm nâng cao độ chính xác và tính nhất quán của vùng phân đoạn Phương pháp này khai thác khả năng mô tả mềm của eSFCM và bổ sung dữ liệu từ ma trận độ thuộc để cải thiện sự phân biệt giữa các lớp đặc trưng trên ảnh Quá trình phân đoạn được tối ưu bằng cách tích hợp thông tin bổ sung vào quá trình tối ưu hóa, từ đó giảm nhiễu và tăng độ nhạy biên cạnh Hiệu năng của thuật toán được đánh giá dựa trên các tiêu chuẩn đánh giá như độ chính xác, chỉ số Rand và F1, so sánh với các phương pháp phân cụm khác để làm sáng rõ lợi ích của thông tin từ ma trận độ thuộc Các kết quả cho thấy việc kết hợp eSFCM với ma trận độ thuộc mang lại phân đoạn ảnh rõ ràng và ổn định hơn trong điều kiện biến đổi của ảnh.

Kết quả ảnh phân đoạn

Trong xử lý ảnh X-quang, ta kiểm tra xem ảnh có chứa vùng nền hay không trước khi thực hiện phân đoạn Thuật toán Otsu được áp dụng để loại bỏ vùng nền, vùng nền là phần có giá trị xám thấp nhất và đóng vai trò làm nền tảng cho cấu trúc răng; Otsu mang lại xử lý nhanh, hiệu quả và có khả năng phân biệt rõ nền với các thành phần chính của ảnh Tiếp đó thực hiện phân cụm mờ bằng thuật toán FCM, cho ra các tâm cụm và ma trận độ thuộc, các kết quả này gần đúng với bài toán và được dùng làm thông tin bổ trợ cho các thuật toán phân cụm bán giám sát mờ ở bước tiếp theo Thuật toán phân cụm bán giám sát mờ (eSFCM) được áp dụng để cải thiện kết quả phân cụm trong giai đoạn xử lý phân đoạn ảnh sau đó Ý nghĩa của thuật toán lai ghép (Otsu – FCM - eSFCM) là tạo sự liên kết giữa loại bỏ nền, phân cụm mờ và phân cụm bán giám sát mờ, giúp tăng độ chính xác và hiệu quả của quá trình phân đoạn ảnh X-quang.

Khi áp dụng thuật toán Otsu để tách ngưỡng trên ảnh X-quang nha khoa, ta có thể xác định các vùng độc lập dựa trên ngưỡng phân đoạn tự động Với ưu điểm xử lý nhanh và hiệu quả, thuật toán này cho phép xác định các vùng theo ngưỡng một cách rõ ràng, nên được đưa vào các bước tiền xử lý của đề xuất.

Cho phép sử dụng các thuật toán phân cụm mờ để xác định thông tin bổ trợ cho phân cụm bán giám sát mờ thông qua ma trận độ thuộc nhận được, từ đó cải thiện hiệu quả và độ chính xác của quá trình phân tích dữ liệu.

 Cho phép sử dụng các thuật toán eSFCM để nâng cao chất lượng cụm của quá trình phân cụm từ đó nâng cao chất lượng ảnh phân đoạn

2.5.2 Thuật toán tách ngưỡng Otsu

Thuật toán tách ngưỡng Otsu biến đổi một hình ảnh đầu vào thành ảnh nhị phân Phương pháp này được giới thiệu trong [22] và sau đó được dùng trong [23] bởi Rad, Rahim và Norouzi Theo cách phân tích cường độ sáng, một ảnh đầu vào có thể được chia thành ba vùng: vùng nền hoặc mô mềm ở cường độ thấp, vùng được cho là xương ở mức độ sáng trung bình, và vùng răng có cường độ cao Tuy nhiên, khi cường độ của răng quá tương đồng khiến phân biệt thành ba vùng khó khăn, ảnh có thể được chia thành hai vùng là nền và vùng ảnh (vùng chính), và đó là cách thuật toán Otsu được áp dụng.

Thuật toán Otsu là một trong những phương pháp tách ngưỡng nổi tiếng trong xử lý ảnh dựa trên điểm ảnh Mục tiêu của tách ngưỡng là phân chia ảnh thành hai vùng r0 và r1 dựa trên một ngưỡng toán học T sao cho sự biến thiên của các lớp bên trong (intra-class variance) được tối ưu hóa Trong cách làm của Otsu, ngưỡng tối ưu được chọn nhằm giảm thiểu sự thay đổi của các lớp phía bên trong hai màu đen và trắng trên ảnh Mỗi điểm ảnh được gán nhãn dựa trên giá trị cấp xám f(x): nếu f(x) ≤ T thì thuộc lớp r0, còn nếu f(x) > T thì thuộc lớp r1 Kết quả là một ảnh nhị phân tối ưu với hai vùng rõ ràng: r0 cho vùng nền và r1 cho vùng đối tượng, được xác định bởi ngưỡng T tối ưu từ phân phối mức xám của ảnh.

1 ( ) n n n cum khi f x T cum khi T f x T cum n khi T f x T cum n khi f x T

Kết quả của bước tách ngưỡng là một ảnh nhị phân để đơn giản hóa quá trình phân tích ảnh trong các bước tiếp theo

Trong trường hợp tổng quát mà số lượng các cụm (C) là lớn hơn 2, nhiều ngưỡng có thể được sử dụng để xác định các cụm khác nhau Giả sử T 1 , T 2 , ,T n

(T i là điểm cách đều trong đoạn [min, max] với mọi i = 1, 2, , n là các ngưỡng Giá trị của mỗi điểm ảnh f(x) được tính là trung bình của các giá trị R,

Thuật toán tách ngưỡng Otsu:

Input: Một ảnh X-Quang nha khoa và số lần lặp lớn nhất MaxStep Output: Ảnh nhị phân của ảnh đầu vào

Bước 1: Chọn ngưỡng khởi tạo T   0 , số bước lặp t = 1

2.2 Phân hoạch ảnh thành 2 nhóm R R 1 , 2 (dựa vào ngưỡng T   0 )

2.3 Tính toán giá trị mức xám trung bình  1   t ,  2   t trên các nhóm

2.4.Tính ngưỡng mới theo công thức T   t  1 2   1   t   2   t 

Một điểm ảnh thuộc vào

1 ( ) n n n cum khi f x T cum khi T f x T cum n khi T f x T cum n khi f x T

Sau đó, u ị trong ma trận thuộc U gán bằng 1 nếu điểm ảnh j thuộc về cụm thứ i và bằng 0 nếu ngược lại

2.5.3 Thuật toán phân cụm nửa giám sát mờ lai ghép

Input: Ảnh đầu vào, số cụm C, ma trận độ thuộc 𝑈̅; ngưỡng dừng 𝜀; số lần lặp lớn nhất MaxStep > 0

Output: Ảnh phân đoạn Lai ghép:

Bước 1: Sử dụng thuật toán xử lý ảnh lấy ngưỡng Otsu Bước 2: Phân cụm mờ (FCM) xác định ma trận độ thuộc UFCM

Bước 3: Xây dựng thông tin bổ trợ 𝑈̅ từ ma trận độ thuộc UFCM bỏ đi các giá trị hàm thuộc nhỏ nhất tại các điểm

Bước 4: Phân cụm nửa giám sát mờ (eSFCM) với ảnh đầu vào và thông tin bổ trợ U̅

Thuật toán phân cụm nửa giám sát mờ lai ghép (eSFCM) là sự kết hợp giữa thuật toán tách ngưỡng Otsu, phân cụm mờ FCM và phân cụm nửa giám sát mờ, nhằm tối ưu việc phân chia vùng và thông tin trong ảnh Trong ứng dụng nha khoa, Otsu được dùng để tách nền khỏi phần chính của ảnh, tạo nền tảng cho quá trình phân tích sau đó Những thông tin bổ trợ dùng trong eSFCM được xác định từ ma trận độ thuộc do kết quả của phân cụm FCM, làm nguồn dữ liệu tham khảo cho quá trình phân loại Thuật toán eSFCM được sử dụng để phân cụm trong đoạn ảnh cuối cùng, mang lại phân vùng mờ chính xác và hiệu quả hơn so với các phương pháp riêng lẻ.

Trong chương này, luận văn nêu ra bài toán nghiên cứu và trình bày cái nhìn tổng quan về bài toán phân cụm mờ, các phương pháp phân cụm mờ và phân cụm bán giám sát mờ Ở mỗi phương pháp, luận văn đánh giá ưu nhược điểm và trình bày các thuật toán cụ thể; đáng chú ý là thuật toán phân cụm bán giám sát mờ lai ghép được xem là cơ sở để tác giả xây dựng một ứng dụng thử nghiệm ở chương 3.

XÂY DỰNG ỨNG DỤNG PHÂN ĐOẠN ẢNH X – QUANG

Tiêu đề	Nghiên Cứu Một Số Thuật Toán Phân Cụm Dữ Liệu Nửa Giám Sát Và Ứng Dụng Phân Đoạn Ảnh X-Quang
Tác giả	Lê Thị Mai Hương
Người hướng dẫn	TS. Nguyễn Đình Dũng
Trường học	Trường Đại học Công nghệ Thông tin và Truyền thông, Đại học Thái Nguyên
Chuyên ngành	Khoa học máy tính
Thể loại	Luận văn thạc sĩ
Năm xuất bản	2017
Thành phố	Thái Nguyên

Định dạng
Số trang	82
Dung lượng	2,59 MB