DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC THUẬT NGỮ Panoramic Ảnh X - quang panoramic toàn hàm Automated Dental dentification Hệ thống nhận dạng người tự động dựa vào các đặc điểm nha khoa Denta
Trang 1LỜI CẢM ƠN
Đầu tiên, em xin được gửi lời cảm ơn chân thành sâu sắc nhất tới thầy Trần Mạnh Tuấn, người đã đưa em đến với đề tài này, tạo điều kiện thuận lợi cho em có thể hoàn thành đồ án tốt nghiệp một cách tốt nhất
Em cũng xin được gửi lời cảm ơn đến các thầy cô trong khoa Công nghệ thông tin trường Đại học Công nghệ thông tin và truyền thông Thái Nguyên đã giúp đỡ, tạo điều kiện cho em trong thời gian em đã học tập tại trường
Xin được gửi lời cảm ơn tới gia đình đã động viên, tạo điều kiện cho em thực hiện đồ án tốt nghiệp, lời cảm ơn tới bạn bè đã giúp đỡ em học tập trong những năm vừa qua
Vì thời gian thực tập có hạn, trình độ bản thân còn nhiều hạn chế Cho nên trong đề tài không tránh khỏi những thiếu sót, em rất mong được sự góp ý quý báu của các thầy cô cũng như các bạn để đề tài của em được hoàn thiện hơn
Em xin chân thành cảm ơn!
Sinh viên Diêm Thị Trà My
Trang 2DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC THUẬT NGỮ
Panoramic Ảnh X - quang panoramic toàn hàm
Automated Dental dentification
Hệ thống nhận dạng người tự động dựa vào các đặc điểm nha khoa Dental diagnosis systems Hệ thống chẩn đoán nha khoa Dental treatment systems Hệ thống điều trị nha khoa
Computer vision Thị giác máy tính
Image segmentation Phân đoạn ảnh
Region of interest ROI Vùng hữu ích/cần quan tâm
tượng trong ảnh
Thresholding methods Phương pháp lấy ngưỡng
Level set methods Phươngg pháp tập mức
Region growing Phương pháp xây dựng vùng
Trang 3MỤC LỤC
MỞ ĐẦU 1
CHƯƠNG 1: BÀI TOÁN PHÂN ĐOẠN ẢNH X – QUANG 4
1.1 Tổng quan về cấu trúc giải phẫu răng và các loại ảnh X - quang nha khoa 4
1.1.1 Cấu trúc giải phẫu răng 4
1.1.2 Phân loại ảnh X - quang nha khoa 7
1.2 Bài toán phân đoạn ảnh X - quang nha khoa 9
1.2.1 Phân đoạn ảnh 9
1.2.2 Phân loại các phương pháp phân đoạn ảnh 11
1.2.3 Phân đoạn ảnh X - quang nha khoa 12
1.3 Tổng kết chương 14
CHƯƠNG 2: NGHIÊN CỨU VỀ CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH X- QUANG NHA KHOA MỜ BÁN GIÁM SÁT 15
2.1 Phương pháp lấy ngưỡng 15
2.1.1 Ý tưởng 15
2.1.2 Kỹ thuật lấy ngưỡng thích nghi 17
2.1.3 Kỹ thuật lấy ngưỡng lặp 18
2.1.4 Nhận xét phương pháp lấy ngưỡng lặp 19
2.2 Phương pháp tập mức 20
2.2.1 Ý tưởng 20
2.2.2 Thuật toán 21
2.2.3 Nhận xét phương pháp tập mức 21
2.3 Phương pháp xây dựng vùng 22
2.3.1 Ý tưởng 22
2.3.2 Thuật toán 22
2.3.3 Nhận xét phương pháp xây dựng vùng 23
2.4 Phương pháp phân cụm 23
2.4.1 Ý tưởng 23
2.4.2 Thuật toán K - Means 24
2.4.3 Thuật toán FCM 26
2.4.4 Nhận xét phương pháp phân cụm 28
2.5 Các độ đo đánh giá 28
Trang 42.6 Tổng kết chương 30
CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG PHÂN ĐOẠN ẢNH X - QUANG NHA KHOA 31
3.1 Đặc tả yêu cầu 31
3.1.1 Yêu cầu thực tế 31
3.1.2 Mục đích của ứng dụng 32
3.2 Đặc tả dữ liệu 32
3.3 Kết quả chạy chương trình 33
3.3.1 Giao diện chính của ứng dụng: 33
3.3.2 Chọn ảnh cần phân đoạn: 34
3.3.3 Chọn tham số và phân đoạn ảnh bằng FCM 34
3.4 Tổng kết chương 37
KẾT LUẬN 38
TÀI LIỆU THAM KHẢO 39
Trang 5DANH MỤC HÌNH
Hình 1.1: Cơ quan răng (răng và nha chu) 4
Hình 1.2.: Bộ răng sữa và kí hiệu bộ răng sữa 6
Hình 1.3: Bộ răng vĩnh viễn và ký hiệu 7
Hình 1.4: Một số loại ảnh X - quang nha khoa .9
Hình 1.5: Các Phương pháp phân đoạn ảnh 12
Hình 1.6: Những khó khăn trong việc phân đoạn ảnh nha khoa 13
Hình 2.1: Histograms mức xám mà giá trị ngưỡng có thể được chọn 15
Hình 2.2: Ảnh X - quang nha khoa sau khi lấy ngưỡng toàn cục .17
Hình 2.3: Ảnh X - quang nha khoa mẫu sau khi lấy ngưỡng thích nghi 17
Hình 2.4: Ảnh X - quang nha khoa sau khi lấy ngưỡng lặp 19
Hình 2.5: Kết quả phân đoạn sử dụng Phương pháp tập mức 21
Hình 2.6: Kết quả phân đoạn sử dụng Phương pháp xây dựng vùng 23
Hình 2.7: Kết quả phân đoạn sử dụng thuật toán K-means 25
Hình 3.1: Ảnh dữ liệu đầu vào của ứng dụng 33
Hình 3.2 Giao diện chương trình 33
Hình 3.3 Hình ảnh minh họa kết quả phân cụm k = 5 36
Hình 3.4 Hình ảnh minh họa kết quả phân cụm k = 3 37
Trang 6MỞ ĐẦU
Cùng với sự phát triển ngày càng mạnh mẽ của khoa học kỹ thuật trong một vài thập kỉ gần đây, xử lý ảnh ngày càng thu hút sự quan tâm đặc biệt từ các nhà khoa học bởi vai trò quan trọng của nó trong nhiều ứng dụng thực tế về khoa học kĩ thuật cũng như trong cuộc sống thường ngày như: sản xuất và kiểm tra chất lượng, sự di chuyển của Robot, các phương tiện đi lại tự trị, công cụ hướng dẫn cho người mù, an ninh và giám sát, nhận dạng đối tượng, nhận dạng khuôn mặt, sản xuất, hiệu chỉnh video, v.v Trong đó có một lĩnh vực khá mới
và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung, v.v Do đó, sự thành công của một hệ thống phân tích hình ảnh phụ thuộc rất nhiều vào chất lượng phân đoạn hình ảnh
Ngày nay, việc xử lý các hình ảnh y tế có vai trò vô cùng quan trọng trong việc tự động hóa phân tích, hỗ trợ chẩn đoán và điều trị các bệnh khác nhau Trong đó, quá trình phân đoạn thường được yêu cầu như là giai đoạn sơ bộ Tuy nhiên các phân vùng trong hình ảnh y tế rất phức tạp nên việc phân đoạn chính xác là rất quan trọng Trong công nghệ về hình ảnh y tế, một công cụ vô cùng phổ biến cho việc chẩn đoán đó chính là ảnh X - quang Chính vì thế, khóa luận
đã đề cập tới phân đoạn ảnh X - quang nha khoa như là một bước xử lý không thể thiếu đối với các hệ thống chẩn đoán và điều trị bệnh nha khoa, hệ thống nhận dạng người dựa vào các đặc điểm nha khoa, v.v
Trang 7Trong các phương pháp phân đoạn ảnh hiện có, phân cụm là một phương pháp được sử dụng rộng rãi bởi tính đơn giản và hiệu quả mà nó mang lại Phân cụm là phân chia một tập dữ liệu ban đầu vào các cụm Trong đó, các đối tượng của cùng một cụm thì giống nhau (tương tự nhau), còn các đối tượng thuộc các cụm khác nhau thì khác nhau (ít tương tự nhau) theo một nghĩa nào đó Phân cụm không đòi hỏi các thông tin về thuộc tính của cụm nên nó đặc biệt hiệu quả khi chúng ta không có hoặc có rất ít thông tin về các cụm Phân cụm gồm có phân cụm cứng (mỗi đối tượng chỉ thuộc về duy nhất một cụm) và phân cụm mờ (mối đối tượng có thể thuộc về nhiều cụm) Do trong thực tế ranh giới giữa các cụm thường không rõ ràng, một đối tượng dữ liệu có thể thuộc về nhiều cụm khác nhau, nên phương pháp phân cụm mờ ngày càng thể hiện được hiệu quả của nó trong khai phá, phân tích dữ liệu Khóa luận đã áp dụng thuật toán phân cụm mờ mà cụ thể là thuật toán Fuzzy C - Means để xây dựng ứng dụng phân đoạn ảnh X - quang nha khoa
Nội dung chính của đồ án gồm có 3 chương:
Chương 1 – TỔNG QUAN VÀ LÝ THUYẾT VỀ PHÂN ĐOẠN ẢNH
X – QUANG NHA KHOA
Chương này đưa ra những kiến thức tổng quan về cấu trúc giải phẫu răng, phân loại ảnh X - quang nha khoa, bài toán phân đoạn ảnh từ đó nêu ra bài toán phân đoạn ảnh X - quang nha khoa, những yêu cầu, thách thức và ý nghĩa, ứng dụng thực tế trong các hệ thống nhận dạng người hay hệ thống chẩn đoán, điều trị nha khoa
Chương 2 - NGHIÊN CỨU VỀ CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH X- QUANG NHA KHOA MỜ
Nội dung của chương 3 nhằm đưa ra một cái nhìn tổng quan về các phương pháp phân đoạn ảnh nha khoa hiện có: lấy ngưỡng, tập mức, xây dựng vùng và đặc biệt là phương pháp phân cụm Ở mỗi phương pháp đều đưa ra các thuật toán cụ thể và đánh giá ( độ phức tạp, ưu, nhược điểm) của các thuật toán đó
Trang 8Chương 3 – XÂY DỰNG ỨNG DỤNG PHÂN ĐOẠN ẢNH X - QUANG NHA KHOA
Chương này mô tả quá trình xây dựng ứng dụng phân đoạn ảnh X - quang nha khoa bằng phương pháp phân cụm mờ, cụ thể là thuật toán Fuzzy C - Means: từ đặc tả yêu cầu, thiết kế đến triển khai cài đặt Từ đó minh họa một cách rõ ràng cách hoạt động, ứng dụng cũng như hiệu quả của thuật toán phân cụm mờ trong phân đoạn ảnh X - quang nha khoa
Trang 9CHƯƠNG 1: BÀI TOÁN PHÂN ĐOẠN ẢNH X – QUANG
1.1 Tổng quan về cấu trúc giải phẫu răng và các loại ảnh X - quang nha khoa 1.1.1 Cấu trúc giải phẫu răng
Cơ quan răng bao gồm răng và nha chu (quanh răng), là đơn vị hình thái
và chức năng của bộ răng Răng là bộ phận trực tiếp nhai nghiền thức ăn, nha chu là bộ phận giữ và nâng đỡ răng, đồng thời là bộ phận nhận cảm, tiếp nhận và dẫn truyền lực nhai Răng chính danh gồm men, ngà (mô cứng) và tủy (mô mềm) Nha chu gồm xê măng (còn gọi là xương chân răng, men chân răng), dây chằng, xương ổ răng, nướu (lợi) Bộ răng là một thể thống nhất thuộc hệ thống nhai, tạo thành bởi sự sắp xếp có tổ chức của các cơ quan răng [1]
Hình 1.1: Cơ quan răng (răng và nha chu)
Mỗi răng có phần thân răng và chân răng Giữa chân răng và chân răng là đường cổ răng (cổ răng giải phẫu), là một đường cong, còn gọi là đường nối men - xê măng Thân răng được bao bọc bởi men răng, chân răng được xê măng bao phủ
Nướu răng viền xung quanh cổ răng tạo thành một bờ, gọi là cổ răng sinh lý Phần răng thấy được trong miệng là thân răng lâm sàng Cổ răng sinhh lý thay đổi tùy theo nơi bám và bờ của viền nướu, khi tuổi càng cao thì nơi bám này càng có khuynh hướng di chuyển dần về phía chóp răng Nhiều trường hợp
Trang 10bệnh lý, nướu răng có thể bị sưng hoặc trụt, làm thân răng (lâm sàng) bị ngắn lại hoặc dài ra [1]
Cấu tạo của răng: Bao gồm men răng, ngà răng (mô cứng) và tủy răng (mô mềm) [1]:
- Men răng: Men răng phủ mặt ngoài ngà thân răng, là mô cứng nhất trong
cơ thể, có tỉ lệ chất vô cơ cao (96%) Hình dáng và bề dày của men được xác định từ trước khi răng mọc ra, trong đời sống, men răng không có sự bồi đắp thêm mà chi mòn dần theo tuổi, nhưng có sự trao đổi về vật lý và hóa học trong môi trường với miệng
- Ngà răng: Kém cứng hơn men, chứa tỉ lệ chất vô cơ thấp hơn men (75%) Trong ngà có nhiều ống ngà, chứa đuôi bào tương của nguyên bào ngà Bề dày ngà răng thay đổi trong đời sống do hoạt động của nguyên bào ngà Ngà răng ngày càng dày theo hướng về phía hốc tủy răng, làm hẹp dần hốc tủy
- Tủy răng: Là mô liên kết mềm, nằm trong hốc tủy gồm tủy chân và tủy thân Tủy răng trong buồng tủy gọi là tủy thân, tủy buồng, tủy răng trong ống tủy gọi là tủy chân Các nguyên bào ngà nằm sát vách hốc tủy Tủy răng có nhiệm vụ duy trì sự sống của răng, cụ thể là sự sống của nguyên bào ngà và tạo ngà thứ cấp, nhận cảm giác của răng Trong tủy răng có chứa nhiều mạch máu, mạch bạch huyết và đầu tận cùng thần kinh
Bộ phận nâng đỡ răng: Bao gồm xương ổ răng, xê măng, dây chằng nha chu và nướu (lợi) răng [1]
- Xương ổ răng: Là mô xương xốp, bên ngoài được bao bọc bằng màng xương, nơi nướu răng bám vào Xương ổ răng tạo thành một huyệt, có hình dáng
và kích thước phù hợp với chân răng Bề mặt ổ răng, nơi đối diện với chân răng,
là mô xương đặc biệt và có nhiều lỗ thủng để cho các mạch máu và dây thần kinh từ xương xuyên qua để nuôi dây chằng nha chu, gọi là xương ổ chính danh, hay lá sàng Trên hình ảnh tia X, phần xương ổ chính danh trông cản tia hơn, gọi
là lá cứng Nền xương ổ không phân biệt được với xương hàm Chiều cao xương
ổ răng thay đổi theo tuổi và tùy theo sự lành mạnh hay bệnh lý của mô nha chu
Trang 11Khi răng không còn trên xương hàm thì xương ổ răng và các thành phần của nha chu cũng bị tiêu dần đi
- Xê măng: Là mô đặc biệt, hình thành cùng với sự hình thành chân răng, phủ ngoài ngà chân răng Xê măng được bồi đắp thêm ở phía chóp chủ yếu để
bù trừ sự mòn mặt nhai, được coi là hiện tượng "mọc răng suốt đời" hay "trồi mặt nhai" Xê măng cũng có thể tiêu hoặc quá sản trong một số trường hợp bất thường hay bệnh lý
- Dây chằng nha chu: Là những bó sợi liên kết dày khoảng 0.25mm, một đầu bám vào xê măng, còn đầu kia bám vào xương ổ chính danh Cả xê măng, dây chằng nha chu và xương ổ chính danh đều có nguồn gốc từ túi răng chính danh Dây chằng nha chu có nhiệm vụ giữ cho răng gắn vào xương ổ răng và đồng thời có chức năng làm vật đệm, làm cho mỗi răng có sự xê dịch nhẹ độc lập với nhau trong khi nhai, giúp lưu thông máu, truyền cảm giác áp lực và truyền lực để tránh tác dụng có hại của lực nhai đối với răng và nha chi
- Nướu răng: Là phần niêm mạc phủ lên xương ổ răng (nướu dính) và cổ răng (nướu rời)
Bộ răng sữa: là bộ răng tạm thời, bắt đầu mọc lúc sáu tháng tuổi, mọc đầy
đủ lúc 24 - 36 tháng Bộ răng sữa có 20 răng, không có răng tiền hàm (răng cối nhỏ) [1]
Hình 1.2.: Bộ răng sữa và kí hiệu bộ răng sữa
Trang 12Bộ răng vĩnh viễn [1]:
Khi trẻ bắt đầu được khoảng 6 tuổi, các răng vĩnh viễn đầu tiên sẽ bắt đầu mọc, đó là răng "số 6" (răng 6 tuổi, răng cối lớn thứ nhất, răng cối lớn 1), sau đó các răng khác của bộ răng vĩnh viễn sẽ lần lượt mọc lên để thay thế các răng sữa Bộ răng vĩnh viễn mọc đầy đủ ở tuổi 18-25
Giai đoạn từ 6-7 tuổi đến 11-12 tuổi, trong miệng trẻ có hai loại răng cùng tồn tại, được gọi là bộ răng hỗn hợp
Hình 1.3: Bộ răng vĩnh viễn và ký hiệu
1.1.2 Phân loại ảnh X - quang nha khoa
Ảnh X-quang nha khoa là một trong những cách phổ biến với chi phí thấp nhất để thu được ảnh (thông tin) về răng Bởi vì nhiều bệnh của răng và các mô xung quanh không thể được nhìn thấy trực tiếp bằng mắt thường khi nha sĩ kiểm tra miệng Chụp X - quang có thể giúp phát hiện những vấn đề sau đây:
- Lỗ sâu giữa các răng hoặc phát hiện sâu răng bên dưới lớp trám răng
- Nhiễm trùng trong xương
- Bệnh nha chu
- Áp - xe hoặc u nang
- Phát hiện những biến chuyển bất thường trong răng miệng
- Phát hiện khối u
Trang 13Phát hiện và điều trị các vấn đề về răng ở giai đoạn sớm có thể tiết kiệm thời gian, tiền bạc và giảm những khó chịu không cần thiết Ảnh X - quang có thể giúp nha sĩ phát hiện các vấn đề đó
Có rất nhiều loại ảnh X - quang nha khoa khác nhau, trong đó được chia thành hai kiểu ảnh X - quang nha khoa chính: intraoral (ảnh X - quang phạm vi trong miệng) và extraoral (ảnh X - quang phạm vi cả ngoài miệng) [8]
- Intraoral: là loại ảnh X - quang nha khoa phổ biến nhất Nó mô tả các răng một cách chi tiết và cho phép nha sĩ tìm sâu răng, kiểm tra sức khỏe của các răng và xương xung quanh răng, kiểm tra tình trạng phát triển của răng và theo dõi sức khỏe chung của răng và xương hàm
- Extraoral: cũng cho chúng ta thấy các răng nhưng mục đích chính là cho thấy toàn bộ hàm răng và xương sọ Nó không cung cấp đặc điểm chi tiết về từng răng như ảnh intraoral và do đó, nó không được sử dụng để phát hiện sâu răng hoặc một số vấn đề khác với từng chiếc răng Thay vào đó, nó được sử dụng để tìm các răng nêm vào nhau, theo dõi sự tăng trưởng và phát triển hàm trong quan hệ với răng, để xác định các vấn đề tiềm ẩn giữa răng và hàm, hội chứng rối loạn thái dương hàm hoặc các xương mặt khác
- Các ảnh X - quang thuộc kiểu extraoral như: panoramic, tomograms, cephalometric projections, sialography, computed tomography Trong đó phổ biến nhất là ảnh X - quang panoramic Ảnh này cho thấy toàn bộ khoang miệng: tất cả các răng trong xương hàm trên và dưới Nó hữu ích trong việc phát hiện các vùng răng mới nổi, xác định sự liên quan của hàm răng và các cấu trúc xương xung quanh, hỗ trợ trong việc chẩn đoán các khối u, v.v [8]
- Ảnh X - quang thuộc kiểu intraoral: bitewing, periapical, occlusal Mỗi loại cho thấy những khía cạnh khác nhau của răng:
- Ảnh X - quang Bitewing (ảnh cắn cánh): cho thấy mô tả về hàm trên và dưới trong một vùng của miệng Mỗi ảnh bitewing cho thất một chiếc răng từ đỉnh đến phần xương hỗ trợ nó Ảnh bitewing thường được sử dụng để phát hiện sâu răng giữa các răng và sự thay đổi mật độ răng gây ra bởi các bệnh về nướu răng Nó cũng rất hữu ích trong việc xác định các điều trị chỉnh nha phù hợp
Trang 14- Ảnh X - quang Periapical (ảnh quanh chóp) cho thấy toàn bộ răng từ đỉnh đến dưới cả chân răng - nơi răng được neo ở xương hàm Mỗi ảnh quanh chóp cho thấy kích thước đầy đủ của một số chiếc răng trong một phần của hàm trên hoặc dưới Loại ảnh này được sử dụng để phát hiện các bất thường trong cấu trúc của chân răng và xung quanh cấu trúc xương
- Ảnh X - quang Occlusal: lớn hơn hai loại trên, nó cho thấy vị trí và sự phát triển răng một cách đầy đủ Nó cho thấy toàn bộ vòm răng ở hàm trên hoặc dưới
- Ảnh X - quang này có thể được sử dụng trong các ứng dụng máy tính như hệ thống nhận dạng người hoặc hỗ trợ về khía cạnh lâm sàng như hệ thống chẩn đoán nha khoa hoặc hệ thống điều trị nha khoa
Trong báo cáo này, ở chương hai, chúng ta sẽ sử dụng ba loại ảnh: ảnh cắn cánh, ảnh quanh chóp và ảnh pano toàn hàm để minh họa các thuật toán Ở chương ba, chúng ta sẽ sử dụng ảnh quanh chóp và cắn cánh làm dữ liệu đầu vào cho ứng dụng phân đoạn ảnh nha khoa dựa vào thuật toán phân cụm mờ
a) Ảnh cắn cánh b) ảnh quanh chóp c) ảnh pano toàn hàm
Hình 1.4: Một số loại ảnh X - quang nha khoa
1.2 Bài toán phân đoạn ảnh X - quang nha khoa
1.2.1 Phân đoạn ảnh
Trong thị giác máy tính, phân đoạn ảnh là quá trình phân vùng một ảnh kĩ thuật số thành các vùng rời rạc và đồng nhất với nhau hay nói cách khác là xác định các biên của các vùng ảnh đó Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộ hay từng phần của các đối tượng thật sự bên trong ảnh [7] "Phân đoạn ảnh chia nhỏ một ảnh thành các vùng cấu thành nên nó hoặc các đối tượng" [6] Trong một định nghĩa khác, phân đoạn ảnh được định nghĩa như
là quá trình trích chọn những vùng hữu ích/cần quan tâm từ ảnh nền ban đầu
Trang 15Mục đích của phân đoạn là để đơn giản hóa và/hoặc thay đổi đại diện của một ảnh thành thứ có ý nghĩa hơn và dễ dàng để phân tích/xử lý Phân đoạn ảnh thường được sử dụng để xác định vị trí đối tượng (chẳng hạn như các loại cây trồng, khu vực đô thị, rừng của một hình ảnh vệ tinh, v.v.) và các đường biên/ranh giới (đường thẳng, đường cong, v.v.) trong ảnh Chính xác hơn, phân đoạn ảnh là quá trình gán nhãn cho mọi pixel trong ảnh mà những pixel có cùng nhãn thì có chung một số đặc điểm nhất định nào đó
Kết quả của phân đoạn ảnh là một tập các phân đoạn mà nó bao trùm toàn
bộ ảnh hoặc một tập các đường mức trích chọn được từ ảnh (như phát hiện cạnh trong ảnh) Mỗi một pixel trong một vùng là tương đồng nhau về mốt số thuộc tính hoặc tính chất tính toán, ví dụ như màu sắc, cường độ hoặc cách cấu tạo, v.v Những khu vực liền kề là có sự khác nhau đáng kể về (những) thuộc tính giống nhau [14]
Khi áp dụng với một tập các ảnh, điển hình là trong hình ảnh nha khoa, các đường mức thu được sau khi phân đoạn ảnh có thể được sử dụng để tạo dựng thành 3D với sự giúp đỡ của các thuật toán nội suy
Phân đoạn ảnh có rất nhiều ứng dụng thực tế như:
- Phục hồi ảnh dựa trên nội dung
Trang 16+ Xác định vị trí khối u và các bệnh lý khác
+ Đo dung tích mô
+ Chẩn đoán, nghiên cứu về cấu trúc giải phẫu
+ Mô phỏng phẫu thuật ảo
+ Định vị phẫu thuật nội
Có nhiều thuật toán và kĩ thuật với mục đích chung đã được phát triển cho phân đoạn ảnh Thường thì những thuật toán này phải kết hợp với kiến thức của một lĩnh vực cụ thể thì mới giải quyết hiệu quả bài toán phân đoạn của các miền
1.2.2 Phân loại các phương pháp phân đoạn ảnh
Có hai tính chất cơ bản mà nói chung các phương pháp phân đoạn ảnh đều dựa vào, đó là một trong hai giá trị của mật độ: sự tương đồng và sự gián đoạn Hướng tiếp cận chủ yếu trong phương pháp đầu tiên dựa trên việc phân đoạn một ảnh thành các vùng tương đồng nhau theo một tập các tiêu chí xác định trước Hướng tiếp cận của phương pháp thứ hai là phân đoạn ảnh dựa trên
sự thay đổi đột ngột về cường độ (như cạnh trong ảnh)
Chúng ta có thể phân loại các phương pháp phân đoạn ảnh dựa trên giá trị của các pixel và mối quan hệ giữa chúng với 3 vùng: dựa trên pixel, dựa trên đường biên và dựa trên vùng Trong hướng tiếp cận dựa trên pixel, sự phân lớp dựa trên giá trị độ xám (cường độ) của pixel trong ảnh Phương pháp dựa trên biên dựa trên sự thay đổi đột ngột của giá trị cường độ trong một vùng ảnh Phương pháp dựa trên vùng dựa trên sự khác nhau trong các giá trị định trước của các pixel láng giềng trong ảnh đó Thêm vào đó, chúng ta có thể phân loại một nhóm như là "lai" mà nó dựa trên sự kết hợp của các phương pháp khác Sự phân loại các phương pháp phân đoạn ảnh được thể hiện ở hình dưới đây [12]:
Trang 17Hình 1.5: Các Phương pháp phân đoạn ảnh
1.2.3 Phân đoạn ảnh X - quang nha khoa
Để phân tích một ảnh X - quang nha khoa, chúng ta cần sử dụng một số tiến trình xử lý trên ảnh để thu được những thông tin quan trọng Trong đó, thủ tục xử lý ảnh thiết yếu, quan trọng nhất được sử dụng để phân tích hình ảnh y khoa cũng như các hệ thống chẩn đoán/điều trị y khoa, nhận dạng người, v.v với sự trợ giúp của máy tính là phân đoạn ảnh [7]
Theo góc nhìn đối với ảnh nha khoa, phân đoạn là để xác định và phân loại các răng riêng lẻ trong ảnh X- quang nha khoa hoặc các phần của răng như thân răng và chân răng Mỗi một răng hoặc mỗi phần của mỗi răng trích chọn được từ ảnh ban đầu cho thấy một ROI mà có chứa những dữ liệu quan trọng sẽ được sử dụng trong những bước tiếp theo ở bất kì một ứng dụng nào
Ảnh X - quang nha khoa thường có 3 vùng chính:
- Vùng thứ nhất tương ứng với vùng chứa các răng Vùng này thường có giá trị mức xám lớn nhất (vùng sáng nhất trên ảnh) Đây chính là vùng mà ta cần xác định được trong quá trình phân đoạn
Trang 18- Vùng thứ hai tương ứng với vùng chứa lợi, xương và các cấu trúc quanh răng Vùng này thường có mức xám trung bình, tuy nhiên một số vùng xương có giá trị mức xám khá gần với vùng răng Điều này gây khó khăn không nhỏ cho quá trình phân đoạn răng
- Vùng thứ ba tương ứng với vùng nền trong ảnh, có giá trị độ xám thấp nhất (vùng tối nhất)
Phân đoạn những ảnh nha khoa có nhiều khó khăn hơn trong quá trình xử
lý bởi vì sự đa dạng, phức tạp trong cấu trúc liên kết giữa các bộ phận, và chất lượng hình ảnh thấp (do nhiễu, độ tương phản thấp, sự giống nhau của các mô
cơ thể, sự giới hạn trong các phương pháp quét ảnh, v.v) Chính bởi những điều
đó khiến quá trình phân đoạn cho những kết quả sai/kém hiệu quả Ví dụ như: những mẫu vật được sử dụng trong quá trình điều trị, các răng nêm/chèn vào nhau, sự biến thể của các răng, khoảng trống giữa những răng bị thiếu, cũng như các vấn đề trong quá trình xử lý ảnh Hình sau cho thấy những khó khăn có thể xuất hiện trong các ảnh nha khoa:
a) Những thành phần khác được sử dụng b) Các răng chèn vào nhau để lấp đầy các răng
c) Những biến thể khác nhau của răng d) Khoảng trống ở những vị trí răng
bị thiếu Hình 1.6: Những khó khăn trong việc phân đoạn ảnh nha khoa
Trang 19Các phương pháp phân đoạn ảnh đã được cải thiện trong vài thập kỉ qua, nhưng nó vẫn còn là một quá trình phức tạp và đầy thử thách do sự khác biệt trong các hình ảnh Một phương pháp phân đoạn được đề xuất cho một vấn đề này có thể thực hiện tốt nhưng trên một vấn đề khác có thể thực hiện yếu kém và không đáng kể Vì vậy, rất khó để có được một phương pháp phân đoạn nhất định mà phù hợp hoàn toàn cho một vấn đề mở rộng [4] Một phương pháp phù hợp và chính xác là một phần quan trọng trong phân tích ảnh y khoa và nó là cần thiết để thu được kết quả chính xác và chắc chắn trong bất kì một ứng dụng nào
ở lĩnh vực y khoa
1.3 Tổng kết chương
Chương 1 đã đưa ra những kiến thức tổng quan về cấu trúc giải phẫu răng, phân loại ảnh X - quang nha khoa, bài toán phân đoạn ảnh từ đó nêu ra bài toán, những yêu cầu, thách thức và ý nghĩa, ứng dụng thực tế của bài toán phân đoạn ảnh X - quang nha khoa trong các hệ thống nhận dạng người hay hệ thống chẩn đoán, điều trị nha khoa
Trong chương tiếp theo sẽ đưa ra một cái nhìn tổng quan về các Phương pháp phân đoạn ảnh nha khoa hiện có Ở mỗi phương pháp đều đưa ra các thuật toán cụ thể và đánh giá (độ phức tạp, ưu, nhược điểm) của các thuật toán đó
Trang 20CHƯƠNG 2: NGHIÊN CỨU VỀ CÁC PHƯƠNG PHÁP PHÂN ĐOẠN
ẢNH X- QUANG NHA KHOA MỜ
Do những vấn đề đã nêu trên, việc tìm được những phương pháp phân đoạn ảnh X - quang nha khoa hiệu quả vẫn còn là thách thức Những phương pháp phân đoạn ảnh điển hình đã được thực hiện trên ảnh X - quang nha khoa là:
- Phương pháp lấy ngưỡng
Lấy ngưỡng là phương pháp dựa trên pixel đơn giản nhất và nhanh nhất
Có rất nhiều kĩ thuật trong lấy ngưỡng Kĩ thuật lấy ngưỡng đơn giản nhất là phân hoạch histogram của ảnh thành hai vùng khác nhau bởi việc đưa ra một ngưỡng đơn toàn cục "T"
Ngưỡng đơn Nhiều ngưỡng
Hình 2.1: Histograms mức xám mà giá trị ngưỡng có thể được chọn
Quá trình phân đoạn sau đó được thực hiện bằng cách đọc tuần tự mỗi điểm ảnh và gán nhãn mỗi pixel như vùng chính hoặc vùng nền Gán nhãn dựa vào giá trị độ xám của mỗi pixel, xem nó lớn hơn giá trị của "T" hay nhỏ hơn nó [6] Nếu giá trị của nó cao hơn giá trị ngưỡng, thì pixel đó sẽ được xem như là vùng chính, ngược lại sẽ là vùng nền Những pixel thuộc vùng chính sẽ được đặt
Trang 21là các pixel trắng và các pixel thuộc vùng nền sẽ được đặt là các pixel đen trong ảnh [5]
Phương pháp lấy ngưỡng đơn giản và phù hợp cho những ảnh mà chứa các đối tượng đồng nhất và độ sáng đồng đều trên nền Việc chọn giá trị ngưỡng thích hợp rất quan trọng đối với sự thành công của quá trình lấy ngưỡng [6] Để đơn giản và không mất tính tổng quát, ta giả sử một ngưỡng đơn toàn cục được
sử dụng để phân đoạn ảnh thành hai vùng: 1 = vùng chính và 0 = vùng nền Hàm
vị từ P có thể được định nghĩa như sau:
P(Ro)=true, nếu ∀ x ∈ Ro, f(x) ≥ T (2.1)
P(R1) = false, nếu ∀ x ∈ R1, f(x) < T ( 2.2)
Khi đó những pixel gán nhãn 1 thuộc về vùng chính và những pixel gán nhãn 0 thuộc về vùng nền của ảnh.Hình 2.2 cho thấy kết quả sau khi áp dụng Phương pháp lấy ngưỡng toàn cục
(2.3) Phương pháp lấy ngưỡng toàn cục đơn giản, độ phức tạp thấp: O(n) với n
là số lượng điểm ảnh
Trang 22Hình 2.2: Ảnh X - quang nha khoa sau khi lấy ngưỡng toàn cục
2.1.2 Kỹ thuật lấy ngưỡng thích nghi
Đôi khi chúng ta không thể phân đoạn một ảnh với một ngưỡng đơn toàn cục Điều này có thể xảy ra với những ảnh có vùng nền biến đổi và độ sáng không đồng nhất
Thay cho việc sử dụng một ngưỡng đơn toàn cục cho mọi pixel trong ảnh,
kỹ thuật lấy ngưỡng thích nghi thay đổi giá trị của ngưỡng trên ảnh (ngưỡng động) Trong ngưỡng thích nghi địa Phương TL, mỗi pixel được coi là có một láng giềng nx n xung quanh nó mà giá trị ngưỡng được tính từ đó (mean hoặc median của những giá trị này) và pixel này đặt là đen hay trắng phụ thuộc xem giá trị của nó thấp hơn hay cao hơn giá trị của ngưỡng địa phương TL Kích thước của làng giềng, n, phải đủ lớn để bao trùm được những pixel thuộc cả vùng chính và vùng nền sao cho hiệu ứng của nhiễu là thấp nhất, nhưng cũng không được quá lớn mà độ sáng không đồng đều trở nên đáng kể trong láng giềng Thường thì kĩ thuật này đạt hiệu quả cao hơn khi ngưỡng địa phương TL được chọn như sau:
TL= {mean or median}-C, C là hằng số (2.4)
Hình 2.3: Ảnh X - quang nha khoa mẫu sau khi lấy ngưỡng thích nghi
Trang 232.1.3 Kỹ thuật lấy ngưỡng lặp
Phương pháp này cho phép phép lượng tự động giá trị của ngưỡng cho mỗi ảnh Thuật toán của phương pháp lấy ngưỡng lặp như sau:
1 Chọn giá trị khởi tạo T
2 Phân đoạn ảnh dựa trên giá trị của T Thu được hai nhóm pixel G1 gồm các pixel có giá trị > T và G2 gồm các pixel có giá trị < T
3 Tính giá trị mean m1, m2 cho mỗi nhóm G1 và G2
) (
Trang 244 Tính giá trị ngưỡng mới như sau:
5 Lặp lại bước 2 tới 4 cho đến khi sự khác biệt giữa các giá trị của T trong vòng lặp thành công nhỏ hơn một tham số định trước T (biến T được sử dụng để điều khiển số lượng vòng lặp)
Nếu T lớn, thì số lượng vòng lặp của thuật toán thấp Giá trị ngưỡng khởi tạo phải lớn hơn giá trị nhỏ nhất và nhỏ hơn giá trị lớn nhất của giá trị mức xám trong ảnh Do đó, để chọn giá trị ngưỡng khởi tạo tốt hơn, ta lấy trung bình giá trị các pixel trong ảnh
Hình 2.4: Ảnh X - quang nha khoa sau khi lấy ngưỡng lặp
2.1.4 Nhận xét phương pháp lấy ngưỡng lặp
- Ưu điểm: Sự đơn giản của phương pháp ngưỡng giúp chúng ta dễ dàng cài đặt và chi phí tính toán (thời gian, bộ nhớ) thấp
+ Thuật toán lấy ngưỡng chung toàn cục có độ phức tạp thấp: O(n) với n
là số lượng điểm ảnh
+ Thuật toán lấy ngưỡng thích nghi: độ phức tạp O(nk), với n là số điểm ảnh của ảnh ban đầu, k là số điểm ảnh vùng láng giềng cho mỗi điểm ảnh đang xét
+ Thuật toán lấy ngưỡng lặp có độ phức tạp là: O(nt), với n là số điểm ảnh của ảnh đầu vào, t là số lần lặp
- Nhược điểm: Cần phải chọn giá trị ngưỡng thích hợp và các giá trị này ảnh hưởng rất nhiều đến kết quả phân đoạn ảnh Phương pháp này rất nhạy cảm với những ảnh nhiễu và phù hợp cho những ảnh mà chứa các đối tượng đồng nhất và độ sáng đồng đều trên nền Kết quả thu được rời rạc, không liên tục [3]
Trang 25Ta có thể hạn chế một số nhược điểm như: các giá trị ngưỡng có thể được lựa chọn bằng cách phân tích hình dạng histogram của hình ảnh; sử dụng một số
kỹ thuật tiền xử lý như nâng ảnh để có được kết quả tốt hơn trong phân đoạn
Thông thường, phương pháp lấy ngưỡng ít khi được sử dụng đơn lẻ trong phân đoạn ảnh Nó thường được sử dụng phối hợp với các phương pháp khác như trong [13], tác giả đã sử dụng lấy ngưỡng như một giai đoạn trong cả quá trình phân đoạn ảnh gồm: lọc nhiễu, lấy ngưỡng, và gán nhãn các pixel vào các vùng liên thông Từ đó có thể thu được kết quả một cách tốt nhất
2.2 Phương pháp tập mức
Phương pháp tập mức được đưa ra bởi Osher and J Sethian cho sự lan truyền phía trước, được áp dụng cho mô hình sóng biển và ngọn lửa [11] Và Malladi áp dụng nó cho mục đích ảnh y khoa [10] Các phương pháp tập mức ngày càng thu hút sự quan tâm của các nhà nghiên cứu trên nhiều lĩnh vực khác nhau
2.2.1 Ý tưởng
Ý tưởng của phương pháp tập mức là bao quanh một bề mặt bởi một đường cong Do có thể phát hiện hiệu quả các đặc điểm hình ảnh như các góc/cạnh, các phương pháp tập mức đã được sử dụng một cách rộng rãi
Đường biên của phân đoạn có thể được định nghĩa như một phần của bề mặt mà có tập mức bằng 0 Đặt φ là bề mặt ẩn (implicit surface) như sau:
Trong đó X là một vị trí trong vùng đang xét (ảnh), t là thời gian và d là khoảng cách giữa X và tập mức 0 Dấu trước d là dương nếu X bên ngoài mặt mức 0, ngược lại nó mang dấu âm
(2.6)
Để di chuyển mặt mức, ta cần định nghĩa trường vận tốc F mà nó chỉ rõ cách mà các điểm biên di chuyển theo thời gian Dựa trên các biến vật lý cụ thể
Trang 26như thời gian, vị trí, lượng trung bình, độ cong, gradient của ảnh, cường độ sẽ được chỉ rõ
Sau đó, giá trị khởi tạo cho hàm tập mức φ( x, y, t) dựa trên biên khởi tạo
sẽ được tính toán Giá trị của φ sẽ được điều chỉnh theo thời gian và đường biên hiện tại được định nghĩa bởi: φ(x(t), y(t))=0 Tiếp theo, vòng lặp sẽ được lặp lại cho đến khi có sự hội tụ trên biên của đường cong Đường cong cuối cùng thu được là vùng đã được phân đoạn và level cuối cùng trong tập mức được tính
- Nhược điểm: Hàm mức độ khá là bị giới hạn khi chỉ phân tách được hai vùng Khi xem xét hai vùng trở lên, ý tưởng của phương pháp tập mức mất đi
Trang 27tính hiệu quả của nó Những kết quả khác nhau thu được do khởi tạo vị trí đường biên ban đầu khác nhau [9]
2.3 Phương pháp xây dựng vùng
2.3.1 Ý tưởng
Ý tưởng của kĩ thuật xây dựng vùng là để tách được một vùng ảnh mà kết nối với nhau dựa trên một số điều kiện xác định trước Những điều kiện này có thể dựa trên thông tin về các cạnh hoăc mức xám của các điểm ảnh Một cách tổng quát, phương pháp xây dựng vùng yêu cầu một điểm hạt giống (seed point) ban đầu mà được lựa chọn bởi người sử dụng và triết tách tất cả các pixel kết nối với điểm ban đầu đó dựa trên một số điều kiện định trước Giống như lấy ngưỡng, phương pháp xây dựng vùng hiếm khi được sử dụng đơn lẻ nhưng thường xuyên được sử dụng cùng với một tập cách phép toán xử lý ảnh, đặc biệt cho những hình
mô tả nhỏ, cấu trúc đơn giản như khối u và những thương tổn [12]
2.3.2 Thuật toán
Thuật toán tổng quát của phương pháp xây dựng vùng được mô tả như bên dưới:
- Input: ảnh, điểm hạt giống seed
- Output: vùng r được xây dựng từ seed
1 Vùng r = {seed}
2 Trong khi r.neighbours {}:
Với mỗi ξ trong r.neighbours, nếu P(x, r) = true thì thêm ξ vào r
3 Trả lại vùng r (kết thúc)
Trong thuật toán này, r là vùng cần trích chọn Dựa trên các tiêu chuẩn đông nhất, một số phương pháp dựa trên phương pháp xây dựng vùng đã được đưa ra Trong thuật toán này, phương pháp xây dựng vùng cơ sở đã được trình bày bởi việc đánh giá khoảng cách giữa điểm ảnh ξ và mean của vùng đó và được đại diện bởi hàm P [59]:
P{x,r}=|f(x)-μr |<T Trong đó, μr là mean của r, T là một ngưỡng Ngưỡng này có thể được xác định bằng tay hoặc phương pháp tự động
Trang 28Hình 2.6: Kết quả phân đoạn sử dụng Phương pháp xây dựng vùng
Nhược điểm chính của phương pháp này là điểm điểm hạt giống ban đầu phải được xác định bởi người sử dụng Phương pháp xây dựng vùng rất nhạy cảm với nhiễu và nó có thể làm ảnh hưởng đến vùng trích chọn bởi việc xuất hiện các hố hoặc sự không kết nối (liên thông)
2.3.3 Nhận xét phương pháp xây dựng vùng
- Ưu điểm: Phương pháp xây dựng vùng ít nhạy cảm với ảnh nhiễu hơn phương pháp lấy ngưỡng bởi vì việc sử dụng các tính chất của vùng và kết quả của phân đoạn là liên tục từng khúc [12].Một số tiêu chí đồng nhất vùng bao gồm cả ngưỡng khá tốt Tuy nhiên, nếu mean của vùng được sử dụng như độ đo đồng nhất, nếu nó có thể được tính một cách hiệu quả, ngưỡng có thể được tác động để thu được một phân đoạn phù hợp Phương pháp này thực thi khá tốt khi phân đoạn các cơ quan như răng hoặc các cấu trúc xương - mà có một định nghĩa các đường biên tốt
- Nhược điểm của phương pháp này như sau: (1) Phân đoạn duy nhất xảy
ra trong hơn một vị trí không gian sẽ không được xác định một cách chính xác; (2) điểm ảnh không chính xác có thể được thêm vào vùng trong khi nó vẫn còn nhỏ; và (3) Các mức ý nghĩa, , phải được xác định bởi người sử dụng
2.4 Phương pháp phân cụm
2.4.1 Ý tưởng
Tương tự như phân đoạn ảnh, phân cụm cũng đòi hỏi phải chia một tập các đối tượng thành các nhóm (clusters - cụm), mà các đối tượng trong cùng một nhóm có sự tương đồng với nhau nhiều hơn các đối tượng ở các nhóm khác
Trang 29Thường thì sự tương đồng này được xác định bởi một độ đo khoảng cách, ví dụ như khoảng cách Euclidean
Cho một số cụm biết trước K và N điểm dữ liệu X1, ,XN có D chiều, ma trận:
(2.8) Đại diện cho phân hoạch của tập dữ liệu thành K cụm C1, ,CK , trong đó
Uki mô tả mức độ thành viên của điểm dữ liệu Xi vào cụm Ck Phân cụm được coi là phân cụm cứng nếu Uki chỉ có thể bằng 1 (là thành viên) hoặc 0 (không là thành viên)
Nếu Uki có giá trị nằm trong đoạn [0,1] thì được gọi là phân cụm mờ Đặt
Vk là tâm của cụm Ck Khi đó Vk có thể được tính như sau:
N
i i ki V
u
X u
k
1
1
2.4.2 Thuật toán K - Means
K - mean là thuật toán phân cụm không giám sát, nó còn được gọi là phân cụm C - Means cứng Giá trị của hàm thành viên Uki phải thỏa mãn:
0 , 1 ,
u i
1
1,0,
Khi đó, ta cần tìm U thỏa mãn các điều kiện về hàm thành viên (2.11) và tối thiểu hàm mục tiêu sau [2]:
d V
U J
1
2
min)
,
Trang 30Thuật toán K - Means được mô tả như bên dưới:
- Input: N điểm dữ liệu X1, , XN trên không gian D chiều, số cụm K
- Output: Ma trận độ thuộc U xác định độ thuộc của mỗi điểm dữ liệu vào các cụm sao cho hàm mục tiêu (2.12) đạt giá trị nhỏ nhất
1 Khởi tạo:
Chọn K đối tượng làm trọng tâm ban đầu của K cụm một cách ngẫu nhiên hoặc theo kinh nghiệm
2 Tính mỗi giá trị Uki trong ma trận U
Uki=1 nếu Xi gần với cụm k nhất dựa theo độ đo khoảng cách d, ngược lại
Uki= 0
3 Tính toán lại tâm cụm từ ma trận U
4 Lặp lại bước 2-3 cho đến khi tất cả các tâm cụm (hoặc ma trận U) là không đổi kể từ vòng lặp cuối cùng
Thuật toán K - Means đã được chứng minh là hội tụ và có độ phức tạp O(NKmt), trong đó N là số đối tượng dữ liệu, K là số cụm, m là số chiều, t là số vòng lặp (K<< N,t<< N)
Hình 2.7: Kết quả phân đoạn sử dụng thuật toán K-means
Ưu điểm của thuật toán K - Means là đơn giản, dễ cài đặt, độ phức tạp tính toán nhỏ nên có thể áp dụng với tập dữ liệu lớn
Tuy nhiên, nhược điểm của K - Means là chỉ áp dụng với dữ liệu có thuộc tính số và khám phá ra các cụm có dạng hình cầu, K - Means còn rất nhạy cảm với nhiễu và các phần tử ngoại lai trong dữ liệu Hơn nữa, chất lượng phân cụm
dữ liệu của thuật toán K - Means phụ thuộc nhiều vào các tham số đầu vào như:
số cụm K và K trọng tâm khởi tạo ban đầu [2] Trong trường hợp các trọng tâm khởi tạo ban đầu mà quá lệch so với các trọng tâm cụm tự nhiên thì kết quả phân
Trang 31cụm của K - Means là rất thấp, nghĩa là các cụm dữ liệu được khám phá rất lệch
so với các cụm trong thực tế Trên thực tế chƣa có một giải pháp tối ưu nào để chọn các tham số đầu vào, giải pháp thường được sử dụng nhất là thử nghiệm với các giá trị đầu vào K khác nhau rồi sau đó chọn giải pháp tốt nhất
2.4.3 Thuật toán FCM
Thuật toán phân cụm dữ liệu mờ FCM giống như K - Means đều sử dụng chung một chiến lược phân cụm FCM phân hoạch tập dữ liệu ban đầu thành K cụm mờ, trong đó mỗi đối tượng dữ liệu thuộc về các cụm được xác định bởi một hệ số là độ phụ thuộc Uki∈[0,1] (k là chỉ số của cụm và i biểu thị số thứ tự của đối tượng dữ liệu trong tập dữ liệu ban đầu), hệ số uki này để chỉ quan hệ giữa các đối tượng với cụm dữ liệu trong quá trình tính toán, hay còn gọi là mức
độ phụ thuộc của đối tượng dữ liệu thứ i vào trung tâm của cụm thứ k
Trong phân cụm mờ, tất cả các phân hoạch mờ có C cụm dữ liệu của tập
dữ liệu có N đối tượng trong không gian D chiều được xác định như sau:
ki N i K
N K M U E
1
1 [0,1], 1,0 }
|),(
Trong đó M(K, N) là không gian của tất cả các ma trận thực cấp K*N, uki
là các phần tử của ma trận U
Hàm mục tiêu của thuật toán FCM được định nghĩa như sau [4]:
Trong đó: U E, V=[V1, , VK] M(D, K) là ma trân biểu diễn các giá trị [1,∞), đối tượng tâm của cụm, m là trọng số mũ nằm trong d ki là khoảng cách giữađiểm dữ liệu Xi và tâm cụm Vk
Dựa vào phương pháp Langrange, từ hàm mục tiêu Bezdek [4] đã tính được độ thuộc và tâm của các cụm như sau:
N
i
i m ki k
u
X u V
1
1
(2.15)
N i
K k
d d
u K
j
m
ji ki