Các bài toán phân vùng ảnh y khoa hướng đến mục đích cung cấp những giải pháp hỗ trợ chẩn đoán tổn thương, bệnh lý. Có nhiều ứng dụng thực tế của bài toán phân vùng ảnh y khoa như: Truy xuất hình ảnh dựa trên nội dung, xác định vị trí khối u và bệnh lý , đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc giải phẫu.
Trang 1THUẬT TOÁN DBSCAN TRONG PHÂN VÙNG ẢNH CHỤP CT VÀ ỨNG DỤNG TRONG TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI
Nguyễn Thị Bích Điệp1*, Bùi Thị Hương Thơm1, Đỗ Duy Cốp2
Tóm tắt: Các bài toán phân vùng ảnh y khoa hướng đến mục đích cung cấp
những giải pháp hỗ trợ chẩn đoán tổn thương, bệnh lý Có nhiều ứng dụng thực tế của bài toán phân vùng ảnh y khoa như: Truy xuất hình ảnh dựa trên nội dung, xác định vị trí khối u và bệnh lý , đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc giải phẫu Đối với bài toán này, thuật toán DBSCAN tối ưu hơn so với các thuật toán phân cụm dùng trong phân vùng ảnh Dựa trên thuật toán phân vùng này, tác giả lựa chọn các thông số để trích xuất đặc trưng não như: mô não, cấu trúc xương, mạch máu Cấu trúc xương và mạch máu có trị số đậm độ tương đương nên khi thu nhận ảnh sẽ có mức xám tương đương, do đó việc xây dựng bài toán phân biệt hai cấu trúc này thông qua kích thước và độ tròn là cần thiết cho việc xây dựng các ứng dựng hỗ trợ chẩn đoán hình ảnh
Từ khóa: Xử lý ảnh y tế, Phân vùng ảnh, Thuật toán phân cụm, Ảnh chụp cắt lớp điện toán
1 ĐẶT VẤN ĐỀ
Xử lý ảnh là một lĩnh vực khoa học công nghệ khá mới so với nhiều ngành khoa học khác Phân vùng ảnh là một bài toán cơ bản trong toàn bộ quá trình xử lý ảnh Có nhiều ứng dụng thực tế của bài toán phân vùng ảnh như: Truy xuất hình ảnh dựa trên nội dung; Hình ảnh y khoa: xác định vị trí khối u và bệnh lý khác, đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc giải phẫu; Phát hiện và nhận dạng: Nhận dạng vân tay, nhận dạng khuôn mặt… Ảnh y học thường chụp các bộ phận bên trong cơ thể người bằng các thiết bị chuyên dụng như máy X-Quang chụp hộp sọ, máy chụp cắt lớp vi tính, máy chụp cộng hưởng từ, máy chụp mạch não nên ảnh thường không rõ, không sắc nét, gây khó khăn cho các chuyên gia y học trong việc chẩn đoán bệnh Mặc dù các thiết bị y tế với công nghệ ngày càng nâng cao để hỗ trợ cho các chuyên gia y tế phân tích và xử lý thông tin từ ảnh nhưng vấn đề đặt ra cần phải giải quyết song song là việc nâng cao chất lượng ảnh Nếu phân vùng ảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng ảnh, bởi vậy người ta xem công đoạn phân vùng ảnh là quá trình then chốt trong quá trình xử lý ảnh nói chung Bài báo này đề cập tới việc ứng dụng thuật toán DBSCAN trong phân vùng ảnh vào việc phân tách ảnh chụp CT não người Qua đó, tách các vùng ảnh dựa trên các cấu trúc xương, mô não, mạch máu… để hỗ trợ chẩn đoán tổn thương và bệnh lý
Những vấn đề liên quan đến phân vùng ảnh trong y tế hiện được nhiều nhà nghiên cứu trên thế giới quan tâm Những nghiên cứu mới đây có thể kể đến như “Phân vùng ảnh MRI não người sử dụng thuật toán DBSCAN mở rộng” [1], “Phân vùng u não từ hình ảnh cộng hưởng từ (MRI), sử dụng phân nhóm với KMeans và DBSCAN” [2], “Phân đoạn ảnh sử dụng thuật toán dựa trên mật độ” [3],v.v các nghiên cứu này đã đạt được một số kết quả phân tách vùng ảnh tự động và bán tự động dựa trên giám sát của các chuyên gia Tuy nhiên, phần lớn các nghiên cứu hướng đến việc phân tách ảnh chụp MRI Ảnh MRI có ưu điểm là hình ảnh sắc nét hơn ảnh CT do cơ chế tạo ảnh Tuy nhiên, với một số chẩn đoán
cụ thể hiện nay, ảnh CT được chỉ định nhiều hơn từ các bác sĩ trong các thăm khám cận lâm sàng Do những ưu điểm như: chụp nhanh chóng, không gây tiếng ồn như MRI, giá thành rẻ
Bởi vậy, sử dụng một thuật toán phù hợp cho phân tách vùng ảnh CT, từ đó đưa ra một phương pháp trích xuất đặc trưng não người, là một tiền đề quan trọng cho các hướng
Trang 2nghiên cứu về trợ giúp chẩn đoán các tổn thương bệnh lý trong não Với mục đích đó, nghiên cứu này tập trung vào một số nội dung chính sẽ được trình bày cụ thể dưới đây:
- Đánh giá ưu điểm của thuật toán phân cụm DBSCAN cho phân vùng ảnh y tế
- Vấn đề về trích xuất đặc trưng dựa trên trị số đậm độ Housfiled – một trị số cơ bản trong các vấn đề liên quan đến ảnh CT
- Đề xuất thuật toán trích xuất đặc trưng não người ứng dụng DBSCAN
2 THUẬT TOÁN DBSCAN VÀ VẤN ĐỀ TRÍCH XUẤT ĐẶC TRƯNG
2.1 Thuật toán DBSCAN
Thuật toán DBSCAN [5] (Density Based Spatial Clustering of Applications with Noise) do Martin Ester và các tác giả khác đề xuất là thuật toán gom cụm dựa trên mật độ, hiệu quả với cơ sở dữ liệu lớn, có khả năng xử lý nhiễu
Ý tưởng chính của thuật toán là vùng lân cận mỗi đối tượng trong một cụm có số đối tượng lớn hơn ngưỡng tối thiểu Hình dạng vùng lân cận phụ thuộc vào hàm khoảng cách giữa các đối tượng (nếu sử dụng khoảng cách Manhattan trong không gian 2 chiều thì vùng lân cận có hình chữ nhật, nếu sử dụng khoảng cách Eucler trong không gian 2 chiều thì vùng lân cận có hình tròn)
Thuật toán sử dụng khái niệm mật độ của các đối tượng để xây dựng các cluster DBSCAN sử dụng hai tham số là MinPts và Eps
Trong quá trình xây dựng các cluster, DBSCAN sẽ kết nối trực tiếp các “siêu cầu” có bán kính Eps mà ở đó nó chứa ít nhất MinPts đối tượng
Vùng lân cận Eps: của đối tượng p (kí hiệu NEps(p)) là tập hợp các đối tượng q
sao cho khoảng cách giữa p và q nhỏ hơn Eps
NEps(p) = {q∈D | dist(p,q) ≤ Eps}
Minpts: mật độ - số đối tượng tối thiểu trong 1 cụm
Hình 1 Quan hệ kết nối theo mật độ trong thuật toán DBSCAN
2.2 Đánh giá thuật toán DBSCAN so với các thuật toán phân cụm khác
Với các ảnh đầu vào “image input”, kết quả phân chia vùng ảnh với các thuật toán phân cụm K-means (k=2 và k=3), Fuzzy-Cmeans (k=3, m=2), DBSCAN (eps=1, min=3), ta thấy DBSCAN không cần biết trước số cụm mà kết quả đầu ra khám phá được các cụm có hình dáng bất kỳ Ngoài ra, một số điểm được coi là nhiễu chỉ bị loại ở thuật toán phân cụm DBSCAN Đó là ưu điểm nổi bật của thuật toán này
Trang 3Hình 2 Sơ đồ thuật toán DBSCAN
Hình 3 Đánh giá các thuật toán phân cụm
Trang 4Với ảnh chụp cắt lớp điện toán não người, các cấu trúc mô não, xương, mạch máu,… trong ảnh thường có dạng hình tròn Đặc biệt cấu trúc xương sọ trong ảnh cắt lớp điện toán
có hình dạng khối tròn bao quanh các cấu trúc khác Ngoài ra, khi phân tách vùng trong ảnh cắt lớp điện toán thường ảnh hưởng bởi nhiễu Bởi vậy, việc lựa chọn thuật toán DBSCAN với ưu điểm nổi bật là khử được nhiễu sẽ là một lựa chọn phù hợp cho bài toán
này
2.3 Vấn đề trích xuất đặc trưng
Trong ảnh chụp CT não người, các cấu trúc xương, mô não, mạch máu… trong ảnh CT được đặc trưng bởi trị số độ đậm Housfiled (HU):
- Đậm độ của khí: -1000 HU (mức xám 0)
- Đậm độ của xương:+1000 HU (mức xám 255)
- Đậm độ của mỡ: -1000 HU
- Đậm độ của mô não: 20-40 HU
- Đậm độ của nước: 0 HU
Khi xử lý các ảnh CT, để phân biệt được những cấu trúc cơ bản, ta quy ra mức xám của các cấu trúc từ đậm độ
Ngoài ra, vì cấu trúc xương và mạch máu có mức xám tương đương Chỉ thông qua tiêu chí này, ta không thể phân biệt hai cấu trúc Ta cần dựa trên các tiêu chí sau để phân biệt:
Kích thước (vùng diện tích) của mạch máu nhỏ hơn so với xương
Độ tròn: mạch máu có dạng gần tròn, còn xương thì hầu như không
Vị trí mạch máu và xương ở một số vùng nhất định trên ảnh
Độ tương phản ở biên của mạch máu lớn hơn đô tương phản ở biên của xương (nghĩa là biên của mạch máu không rõ ràng như của xương)
Áp dụng hai tiêu chuẩn trong số này cho việc phân loại
Đối với kích thước: Đếm số pixel tạo nên vùng để xác định kích thước Loại
bỏ cùng nào có số pixel quá vượt trội
Đối với độ tròn: được tính bằng cách so sánh diện tích và chu vi của đối tượng đó
Công thức tính độ tròn:
Với S là diện tích đối tượng; P là chu vi đối tượng
3 MÔ PHỎNG, TÍNH TOÁN VÀ KẾT QUẢ 3.1 Trích xuất đặc trưng não người dựa trên DBSCAN:
Hình 4 Trích xuất đặc trưng ảnh chụp CT não người
Bước 1: Tiền xử lý
Một bức ảnh CT được scan ở dưới định dạng DCM (chuẩn DICOM) Đây là định dạng file ban đầu chưa qua một thao tác xử lý nào hết Các file này đều không được hỗ trợ đọc hoặc ghi trong các công cụ xử lý ảnh thông thường Do vậy, luôn có một bước chuyển .dcm file để tiện cho việc xử lý
Ảnh đa mức xám
Ảnh có các vùng gán nhãn theo trị số đậm
độ
Ảnh
CT
Ảnh có các vùng gán nhãn theo cấu trúc
Trang 5Quan sát các ảnh chụp CT ta đều dễ nhận thấy khoảng màu hầu như nằm trong mức xám nhiềụ Nên quá trình chuyển đổi tiếp từ các ảnh RGB sang ảnh xám vẫn đảm bảo cho
ta các thông tin đầy đủ cho các thao tác phân chia vùng ảnh
Bước 2: Phân chia ảnh theo cấu trúc dựa trên trị số đậm độ
Hình định vị trong ảnh CT là hình dùng để xác định các vị trí lát cắt Ở hình định vị có các đường được đánh số và đặt chồng lên vùng cơ thể khảo sát Các số được đánh dấu cúa các đường này sẽ tương ứng với các số của các hình hay lát cắt trình bày trên phim CT Ta
có thể dùng hình định vị để quan sát nhanh các lát cắt nào cần xem trên phim CT Hoặc ngược lại, xác định bất thường trên lát cắt CT nằm ở vị trí nào trên hình định vị
Dữ liệu ảnh của nghiên cứu là 500 ảnh chụp CT được cung cấp bởi khoa Chẩn đoán hình ảnh, bệnh viện Đa khoa Trung ương Thái Nguyên Ta nhận thấy rằng mỗi bệnh nhân
có khoảng 20 đến 50 ảnh tương ứng với số lát cắt Tương ứng với mỗi lát cắt, ta xác định trị số độ đậm tương ứng với các mức xám đặc trưng của các cấu trúc: Xương, mô não, mạch máu, Qua đó ta xác định được cấu trúc cần phân vùng Mục đích của phân chia vùng ảnh là chia ảnh thành nhiều vùng dựa trên một đặc tính nào đó Ở đây ta chọn tiêu chí mức xám làm điều kiện phân chia vùng ảnh
Bước 3: Phân chia vùng ảnh bằng thuật toán DBSCAN
Các thuật toán phân cụm làm việc trên tập dữ liệu là các điểm rời rạc, trong khi đó dữ liệu đầu vào cần xử lý của ta là một file ảnh Vậy ta cần có bước chuyển đổi dữ liệu phù hợp với bài toán đặt rạ
Khi đọc một file ảnh trong matlab ta dùng lệnh: X= imread (‘ file path’); Khi đó X sẽ nhận được giá trị là một mảng 3 chiều (với ảnh RGB) Mỗi một điểm ảnh bao gồm 3 thông
số R, G,B Ta chuyển đổi X thành ảnh xám, X sẽ nhận giá trị là mảng 2 chiều, mỗi tọa độ biểu diễn một mức xám Sau đó, với mỗi nhóm đã chia ở bước 2, ta dựa trên vị trí (tọa độ) của nó trên ảnh mà thực hiện phân chia mỗi điểm ảnh này vào nhóm mớị
Việc lựa chọn các thông số MinPts và Epscho thuật toán DBSCAN có thể được xác định bằng tay hoặc thông qua thuật toán heuristics xác định thông số Eps và MinPts cho cụm có mật độ ít dày đặc nhất Qua thực nghiệm, chúng tôi nhận thấy cấu trúc nhỏ nhất trong ảnh CT chụp não là mạch máu với số điểm ảnh tối thiểu là 10 Kích thước ảnh cho việc xử lý cũng là cố định Vậy, chúng tôi tính toán thông số Eps thông qua thuật toán heuristics [5] với giá trị Minpts =10
[Eps]=epsilon(x,Minpts)
Eps=((prod(max(x)-min(x))*Minpts*gammặ5*n+1))/(m*sqrt(pị^n))).^(1/n);
Bước 4: Phân biệt xương và mạch máu
Sau bước 3, ta đã thu được một vùng đặc trưng của não thông qua phân cụm theo mức xám Tuy nhiên, chưa phân biệt được cấu trúc xương và mạch máụ Dựa vào mức xám chung của xương và mạch máu, ta áp dụng phần nghiên cứu về trích xuất đặc trưng phân biệt xương và mạch máu ở trên Dựa vào chu vi và diện tích mỗi đối tượng thu được, ta tính toán độ tròn của đối tượng để phân biệt hai cấu trúc nàỵ
3.2 Các kết quả
Nhóm tác giả sử dụng 500 hình ảnh chụp cắt lớp điện toán được cung cấp bởi Khoa chẩn đoán hình ảnh, bệnh viện Đa khoa Trung ương Thái Nguyên cho nghiên cứu nàỵ Với chương trình cài đặt trên matlab, thuật toán đã thực hiện được việc phân tách vùng đối với xương và mô não, phân biệt được cấu trúc xương và mạch máụ
Trang 6Bảng 1 Số liệu tổng hợp cho mô phỏng
ID tệp
file ảnh
CT
Số hình
định
vị
Số lượng ảnh mang thông tin các cấu trúc não
Số lượng ảnh được phân vùng cấu trúc xương
Số lượng ảnh được phân vùng cấu trúc mô não
Số lượng ảnh được phân tách
tự động cấu trúc xương và mạch máu
Hình 4 Phân tách cấu trúc mô não bằng phương pháp phân vùng
dựa trên thuật toán phân cụm DBSAN
Trang 7Hình 5 Phân tách cấu trúc xương và mạch máu
4 KẾT LUẬN
Phương pháp phân chia vùng ảnh dựa trên thuật toán phân cụm DBSCAN hiệu quả với ảnh chụp CT não người Ngoài ra, việc phân tích sau phân cụm về trích xuất đặc trưng dựa trên chỉ số đậm độ của ảnh CT giúp phân tách các vùng thịt và cấu trúc xương, mạch máu Hướng phát triển của nghiên cứu này hướng đến mục tiêu có thể phân tích một tệp các ảnh đầu vào, trích xuất đặc trưng ảnh CT não người, sau đó phân tích và đưa ra các ảnh có thể có tổn thương giúp cho các bác sĩ nhanh chóng đưa ra được những chẩn đoán chính xác
Lời cảm ơn: Nhóm tác giả cảm ơn sự giúp đỡ của lãnh đạo Khoa chẩn đoán hình ảnh,
bệnh viên Đa khoa Trung ương Thái Nguyên đã hỗ trợ và cung cấp hình ảnh cho nghiên cứu này
Trang 8TÀI LIỆU THAM KHẢO
[1] Mir Morteza Mousavi, Ali Farzan “Brain MRI segmentation by using extended heuriatic DBSCAN”, Journalsci, Volume 3, Issue 12, 2014, Pages:589-592
[2] Prof Samir Kumar Bandyopadhyay, Tuhin Utsab Paul “Segmentation of Brain Tumour from MRI image – Analysis of Kmeans and DBSCAN Clustering” IJRES,
Volume 1, Issue 1, May 2013, Pages: 48-57
[3] Atrayee Dhua, Debjani Nath Sarma, Sneha Singh, Bijoyeta Roy.“Segmentation of Images using Density-Based Algorithms” IJARCCE, Volume 4, Issue 5, 2015
Pages: 273-277
[4] R C Gonzalez and R E Woods Digital Image Processing, 3rd ed, Prentice Hall, New Jersey, 2008
[5] M Ester, H Peter Kriegel, J Sander, X Xu, “A Density-Based Algorithm for Discovering Clustersin Large Spatial Databases with Noise”,Proceedings of 2nd
Internation Conference on Knowledge Discovery and Data Mining,1996
[6] J Shi and J Malik, “Normalized cuts and image segmentation”, IEEE Transactions
on Pattern Analysis and Machine Itelligence,2000
[7] Sunita Jahirabadkar, Parag Kulkarni,“Algorithm to determine” - distance parameter
in density based clustering”, Expert System with Applications, 2013
[8] V.V Vu, N Labroche, and B Bouchon-Meunier, “Active learning for semi supervised k-means clustering”, Proceedings of the 22nd International Conference
on Tools with Artificial Intelligence, IEEE ICTAI, pages 12–15, 2010
ABSTRACT
DBSCAN ALGORITHM IN CT IMAGE SEGMENTATION
AND APPLICATIONS IN THE BRAIN EXTRACT FEATURE
The problem of medical image segmentation aims to provide solutions that support the diagnosis of lesions, pathological There are many practical applications of math, such as medical image segmentation: Retrieve images based
on content, locate the tumor and pathology, diagnostic tissue volume measured, studied anatomy DBSCAN optimization algorithm than the clustering algorithms used in image segmentation Based on this partition algorithm, the authors selected parameters specific to extract the brain, such as brain tissue, bone structure, bone structure of blood vessels and vascular attenuation equivalent value should when receiving grayscale images will be equal, so you need to build math distinguish two structures through size and roundness are two of the four criteria to distinguish
Keywords: DBSCAN; Feature extraction; Brain; Clustering; CT
Nhận bài ngày 20 tháng 5 năm 2017 Hoàn thiện ngày 10 tháng 07 năm 2017 Chấp nhận đăng ngày 20 tháng 07 năm 2017
2
Đại học Kỹ thuật Công nghiệp, Đại học Thái Nguyên
* Email (Corresponding author): ntbdiep@ictu.edu.vn