MỞ ĐẦU Cùng với sự phát triển ngày càng mạnh mẽ của khoa học kỹ thuật trong những năm gần đây, xử lý ảnh số ngày càng được nhiều người quan tâm, một phần là do sự phát triển nhanh chóng
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này là trung thực và không trùng lặp với các đề tài khác Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và
các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc
Thái Nguyên, ngày 12 tháng 04 năm 2016
Người cam đoan
Nguyễn Thị Thu
Trang 2LỜI CẢM ƠN
Luận văn này được hoàn thành với sự hướng dẫn tận tình của Thầy giáo PGS.TS Ngô Quốc Tạo - Viện Công nghệ thông tin -Viện Hàn Lâm Khoa học Việt Nam Trước tiên, học viên xin chân thành bày tỏ lòng biết ơn sâu sắc tới PGS.TS Ngô Quốc Tạo người đã tận tình hướng dẫn, động viên giúp đỡ tôi trong suốt thời gian thực hiện luận văn Học viên cũng xin chân thành cảm ơn các thầy cô trong trường Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên đã tạo điều kiện thuận lợi cho học viên hoàn thành tốt khóa học
Xin chân thành cảm ơn các anh chị và các bạn học viên lớp Cao học CK13A, các bạn đồng nghiệp Bệnh viện Đa khoa huyện Phú Bình đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ với tôi những kinh nghiệm học tập, công tác trong suốt khoá học
Cảm ơn đề tài: “Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho
người khiếm thị” Mã số VAST01.07/15 - 16 hỗ trợ trong thực hiện luận văn.
Cuối cùng, tôi xin gửi lời cảm ơn sâu sắc đến gia đình, người thân, bạn
bè đã động viên, khuyến khích và hỗ trợ cần thiết để tôi hoàn thành luận văn này
Mặc dù rất cố gắng, song luận văn này không thể tránh khỏi những thiếu sót, kính mong được sự chỉ dẫn của các quý thầy cô và các bạn
Trang 3MỤC LỤC
Ơ
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ ẢNH, ẢNH Y HỌC 3
VÀ ĐỐI TƯỢNG BẤT THƯỜNG TRONG ẢNH Y HỌC 3
1.1 Một số khái niệm cơ bản 3
1.1.1 Điểm ảnh 3
1.1.2 Mức xám 3
1.1.3 Biên 3
1.1.3.2 Các kỹ thuật phát hiện biên: 3
1.1.4 Láng giềng 6
1.1.5 Vùng liên thông 6
1.1.6 Biểu diễn ảnh 6
1.1.7 Tăng cường khôi phục ảnh 6
1.1.8 Biến đổi ảnh 6
1.1.9 Phân tích ảnh 7
1.1.10 Nhận dạng ảnh 7
1.1.11 Nén ảnh 7
1.1.12 Phân đoạn ảnh 7
1.2 Ảnh y học 11
1.2.1 Giới thiệu 11
1.2.2 Chẩn đoán dựa trên hình ảnh 12
1.2.3 Một số các chuẩn hình ảnh ứng dụng trong y tế 14
1.3 Đối tượng bất thường trong ảnh y học 17
CHƯƠNG 2: CÁC KỸ THUẬT PHÁT HIỆN ĐỐI TƯỢNG 18
BẤT THƯỜNG TRONG ẢNH 18 2.1 Kỹ thuật sử dụng đặc trưng HOG (Histogram of Oriented Gradient) 18
Trang 42.2 Kỹ thuật phân loại SVM 22
2.2.1 Siêu phẳng phân cách: 22
2.2.2 Support vectors 25
2.2.3 Biên độ 27
2.2.4 Phân lớp dữ liệu 27
2.3 Kỹ thuật lọc Hessian 28
2.4 Kỹ thuật lọc Hough 37
2.4.1 Thuật toán An Insight Toolkit: 37
2.4.2 Sử dụng hàm Imfindcircles: 44
2.5 Kỹ thuật lọc trung bình 47
2.6 Kỹ thuật phân loại dựa trên phương pháp KNN 48
CHƯƠNG 3: ỨNG DỤNG VÀ THỬ NGHIỆM 60
3.1 Giới thiệu bài toán 60
3.2 Thu thập dữ liệu 60
3.3 Giao diện của chương trình 61
3.4 Kết quả thử nghiệm 61
* Ý kiến của chuyên gia bác sỹ 64
3.5 So sánh đánh giá các kỹ thuật 64
KẾT LUẬN 66
TÀI LIỆU THAM KHẢO 68
Trang 5BẢNG KÝ HIỆU CHỮ VIẾT TẮT
TT Ký hiệu viết tắt Giải thích
Trang 6DANH MỤC BẢNG BIỂU
Bảng 2.1: Kết quả phân loại (So sánh) 36
Bảng 2.2: Tỷ lệ phát hiện 58
Bảng 3.1: Tỷ lệ % ý kiến nhận xét của chuyên gia 64
DANH MỤC HÌNH ẢNH Hình 1.1: Quá trình xử lý ảnh 9
Hình 1.2: Các giai đoạn chính trong hệ thống xử lý ảnh 9
Hình 1.3: Hình ảnh chụp X- Quang bàn tay 12
Hình 1.4: Hình ảnh dạ dày 12
Hình 1.5: Hình ảnh chụp CT sọ não 12
Hình 1.6: Hình ảnh siêu âm 12
Hình 1.7: Hình ảnh polyp dạ dày 17
Hình 1.8: Hình ảnh viêm dạ dày 17
Hình 1.9: Hình ảnh gãy ngón chân 17
Hình 1.10: Hình ảnh tụ máu não 17
Hình 2.1: Ví dụ minh họa một Block gồm 9 cell 19
Hình 2 2: Các khối được xếp chồng lên nhau 19
Hình 2 3: Đường màu vàng trên hình là đường phân chia đối với tập dữ liệu gồm hai thuộc tính 23
Hình 2.4: Một bộ dữ liệu hai chiều được phân chia tuyến tính 24
Hình 2.5: Mô tả 2 siêu phẳng phân chia tuyến tính cùng với biên độ của nó 24 Hình 2.6: Đường biểu diễn H1 và H2 26
Hình 2.7: Các support vector trong SVM (đường viền đậm) 26
Hình 2.8: Ảnh gốc 30
Hình 2.9: Ảnh được tăng cường 31
Trang 7Hình 2.10: Ảnh được phân đoạn 31
Hình 2.11: Vùng ứng cử 32
Hình 2.12: Ảnh thử nghiệm 35
Hình 2.13: Kích thước của polyp trong Bộ dữ liệu 35
Hình 2.14 Vùng được vạch ra bởi một hình elip như là những khu vực phân loại giống polyp 36
Hình 2.15 Vùng được vạch ra bởi một hình elip như là những khu vực phân loại giống polyp 37
Hình 2 16: Hough phân khúc ví dụ về một hình ảnh phôi cá ngựa 43
Hình 2 17: Hough phân đoạn một hình ảnh nhân cá ngựa 44
Hình 2.18 : Mô hình cổ điển việc lựa chọn CHT 45
Hình 2.19: Chế độ lựa chọn: nhiều bán kính, cùng hướng gradient 46
Hình 2.20: Hình minh họa kỹ thuật lọc trung bình 48
Hình 2.21: Mặt cắt ngang quy mô không gian cây blob 50
Hình 2.22: Phân loại Blob dựa trên tính năng ổn định 51
Hình 2.23: Phân loại Blob trên một hình ảnh tổng hợp 53
Hình 2 24: Phân loại Blob dựa trên tính năng 53
Hình 2.25: Một đại diện của thuật toán KNN 56
Hình 2.26: Một ví dụ về hình ảnh trên võng mạc 56
Hình 2.27 : Một blob cá nhân được gán cho mỗi đối tượng 57
Hình 3.1: Giao diện chương trình 61
Hình 3.2: Hình ảnh thực nghiệm ảnh dạ dày 1 62
Hình 3.3: Hình ảnh thực nghiệm ảnh dạ dày 2 63
Trang 9MỞ ĐẦU
Cùng với sự phát triển ngày càng mạnh mẽ của khoa học kỹ thuật trong những năm gần đây, xử lý ảnh số ngày càng được nhiều người quan tâm, một phần là do sự phát triển nhanh chóng của các thiết bị đồ họa cũng như dung lượng của các thiết bị lưu trữ ngày càng tăng nhanh Đó cũng chính là những nhân tố tích cực thúc đẩy nghiên cứu các ứng dụng thực tế từ công nghệ xử
lý ảnh
Tự động phát hiện các đối tượng trong ảnh là nhu cầu cấp thiết của nhiều hệ thống giám sát an ninh, nhận dạng đối tượng, nhận dạng mặt, kiểm soát giao thông, và đặc biệt là chẩn đoán bệnh trong y học dựa trên hình ảnh, kết quả phát hiện sẽ là khâu tiên quyết trong việc chẩn đoán Bên cạnh
đó, đa phần các ảnh thu được từ các thiết bị thu nhận ảnh thông thường nên các yếu tố về mầu sắc, cường độ ánh sáng, hình dạng, kích thước, đối tượng, cần xử lý trên phạm vi thay đổi đa dạng
Phương pháp biến đổi ảnh được sử dụng trong việc xử lý các ảnh chụp
từ không trung hoặc xử lý các ảnh trong Y học (ảnh nội soi, ảnh chụp cắt lớp, ) Một ứng dụng khác của biến đổi ảnh đó là mã hóa ảnh, trong đó các ảnh được xử lý để lưu trữ hoặc truyền đi Thực chất của công việc nhận dạng chính là sự phân loại đối tượng thành các lớp đối tượng đã biết hoặc thành những lớp đối tượng chưa biết Bài toán nhận dạng ảnh Y học là bài toán có rất nhiều ý nghĩa thực tiễn và có thể thấy rằng để công việc nhận dạng trở lên
dễ dàng thì ảnh phải được tách thành các đối tượng riêng biệt, đây là mục đích chính của phân đoạn ảnh Nếu phân đoạn ảnh không tốt sẽ ảnh hưởng sai đến quá trình nhận dạng ảnh hay việc phát hiện các đối tượng bất thường trong ảnh
Theo kết quả khảo sát thực trạng tại các bệnh viện trong tỉnh Thái Nguyên năm 2015 thì hầu hết các thiết bị dùng để chụp ảnh như máy chụp cắt
Trang 10lớp Scanner(Computed Tomography Scanner-CT), máy chụp X – Quang số, máy nội soi dạ dày, máy siêu âm màu(3D, 4D), Tuy nhiên, chức năng của các thiết bị này chỉ dừng lại ở việc chụp ảnh, còn chức năng chẩn đoán được thực hiện bởi các chuyên gia y tế Chính vì vậy cần tích hợp các hệ thống hỗ trợ chẩn đoán vào các thiết bị này để tự động phát hiện các đối tượng như polyp, Blob, hình ảnh viêm, loét, xuất huyết, trong ảnh y tế, nhằm hỗ trợ các chuyên gia y tế trong chẩn đoán bệnh
Chính vì lý do trên mà tôi mong muốn tìm hiểu, đánh giá các phương pháp đã có để đi tìm lời giải cho bài toán đã nêu trên chính là nội dung của đề
tài “Một số kỹ thuật phát hiện đối tượng bất thường trong ảnh y học” mà tôi
sẽ nghiên cứu, thử nghiệm một số phương pháp để xây dựng một chương trình để phát hiện đối tượng bất thường trong ảnh y học Chương trình sẽ trợ giúp cho các chuyên gia Y học chẩn đoán bệnh cho bệnh nhân và mong muốn một phần đóng góp trong sự nghiệp Y học
Ngoài phần mở đầu và kết luận, luận văn được được chia làm 3 chương, cụ thể nội dung các chương như sau:
Chương1: Tổng quan về ảnh, ảnh y học và đối tượng bất thường trong ảnh y học
Chương 2: Các kỹ thuật phát hiện đối tượng bất thường trong ảnh y học Chương 3: Xây dựng chương trình thử nghiệm
Khi viết báo cáo này em đã cố gắng hết sức để hoàn thành công việc được giao, song điều kiện thời gian và năng lực còn hạn chế nên không tránh khỏi thiếu xót Em mong nhận được sự đóng góp của thầy giáo hướng dẫn, thầy cô giáo và bạn bè để em có được những kinh nghiệm thực tế và bổ ích để sau này có thể xây dựng được một chương trình hoàn thiện hơn
Trang 11CHƯƠNG 1: TỔNG QUAN VỀ ẢNH, ẢNH Y HỌC
VÀ ĐỐI TƯỢNG BẤT THƯỜNG TRONG ẢNH Y HỌC
Trong chương này, các vấn đề cơ bản của hệ xử lý ảnh được nghiên cứu [1][2], bao gồm:
1.1 Một số khái niệm cơ bản
1.1.1 Điểm ảnh
Ảnh trong thực tế là liên tục về không gian và giá trị độ sáng, để có thể
xử lý ảnh bằng máy tính cần phải tiến hành số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu và lượng hóa thành phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau Trong quá trình này người ta
sử dụng khái niệm Picture element mà ta quen gọi là Pixel – phần tử ảnh Như
1.1.3.2 Các kỹ thuật phát hiện biên:
1) Kỹ thuật phát hiện biên Gradient
Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ
thay đổi giá trị của điểm ảnh, ta có:
y x f
dx
y x f y dx x f fx x
y x f
, ,
,
, ,
,
Trang 12Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hướng x và y Tuy ta nói là lấy đạo hàm nhưng thực chất chỉ là mô phỏng và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập vì ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại
x f y f
y x f y x f x f
, 1 ,
, ,
Kỹ thuật sử dụng hai mặt nạ nhập chập xấp xỉ đạo hàm theo hai hướng
1 0 1
1 0 1
0 0 0
1 1 1
Hy
Các bước tính toán của kỹ thuật Prewitt
+ Bước 1: Tính I Hx và I Hy
+ Bước 2: Tính I Hx + I Hy
+ Bước 3: Phân ngưỡng theo θ để có ảnh biên
3) Kỹ thuật Sobel: Tương tự như kỹ thuật Prewitt kỹ thuật Sobel sử dụng hai mặt nạ nhân chập theo hai hướng x, y là
2 0 2
1 0 1
Hx
Trang 130 0 0
1 2 1
5) Kỹ thuật phát hiện biên Laplace
Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai Laplace
Ba kiểu ma trận mặt nạ thường được sử dụng:
1 4 1
0 1 0 1
1 8 1
1 1 1 2
2 4 2
1 2 1 3
H
6) Kỹ thuật Canny: Đây là một thuật toán được phát triển khá sớm nhưng cho đến nay vẫn là một trong những kỹ thuật được sử dụng rộng rãi, cho các kết quả tương đối tốt, có khả năng đưa ra đường biên mảnh, phân biệt
được điểm biên với điểm nhiễu
Trang 141.1.4 Láng giềng
Có 02 loại láng giềng đó là 4 láng giềng và 8 láng giềng (4 láng giềng:
4 láng của 1 điểm (x,y) là một tập hợp bao gồm láng giềng dọc và láng giềng ngang của nó; 8 láng giềng của (x,y) là một tập cha của 4 láng giềng và bao gồm láng giềng ngang, dọc và chéo)
1.1.5 Vùng liên thông
Một vùng R liên thông nếu bất kỳ 2 điểm (xA,yA) và (xB,yB) thuộc vào
R có thể được nối bởi một đường (xA,yB) … (xi-1,yi-1), (xi,yi),(xi+1,yi+1)… (xy,yB), mà các điểm (xi,yi) thuộc vào R và bất kỳ điểm (xi,yi) nào đều kề sát với điểm trước (xi-1,yi-1) và điểm tiếp theo (xi+1,yi+1) trên đường đó Một điểm (xk,yk) được gọi là kề với điểm (x1,y1) nếu (x1,y1) thuộc vào láng giềng trực tiếp của (xk,yk)
1.1.6 Biểu diễn ảnh
Người ta dùng các phần tử đặc trưng của ảnh là pixel, có thể xem một hàm hai biến chứa các thông tin như biểu diễn của ảnh, việc xử lý ảnh số yêu cầu ảnh phải được mã hóa và lượng tử hóa Việc lượng tử hóa ảnh là chuyển đổi tín hiệu tương tự sang tín hiệu số của một ảnh đã lấy mẫu sang một số hữu hạn mức xám
1.1.7 Tăng cường khôi phục ảnh
Tăng cường ảnh là bước quan trọng tạo tiền đề cho xử lý ảnh, gồm một loạt các kỹ thuật như: lọc bộ tương phản, khử nhiễu, nổi màu,…
Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh
1.1.8 Biến đổi ảnh
Trong thuật ngữ biến đổi ảnh thường được dùng để nói đến một lớp các
ma trận đơn vị và các kỹ thuật dùng để biến đổi ảnh Một số loại biến đổi được dùng như: biến đổi Fourier, Cosin, tích Kronecker, biến đổi Karhumen Loeve,…
Trang 151.1.9 Phân tích ảnh
Liên quan đến việc xác định các tọa độ đo định lượng của một ảnh để đưa ra một mô tả đầy đủ về ảnh Các kỹ thuật được sử dụng ở đây nhằm mục đích xác định biên của ảnh
1.1.10 Nhận dạng ảnh
Là quá trình mô tả các đối tượng mà người ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng đó là: mô tả tham số và mô tả theo cấu trúc
1.1.11 Nén ảnh
Dữ liệu ảnh cũng như các loại dữ liệu khác cần phải lưu trữ hay truyền
đi trên mạng, lượng thông tin để biểu diễn cho một ảnh là rất lớn Do đó để làm giảm thông tin hay nén dữ liệu là một nhu cầu cần thiết
1.1.12 Phân đoạn ảnh
Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc và đồng nhất với nhau hay cách khác là xác định các biên của các vùng ảnh đó
* Phân đoạn ảnh bằng Otsu: Thuật toán phân ngưỡng Otsu được tác giả
Nobuyuki Otsu giới thiệu năm 1979 Phương pháp phân ngưỡng Otsu dựa trên biểu đồ histogram Trước tiên, tác giả xét biểu đồ histogram chuẩn hóa dựa trên hàm mật độ (PDF – Probability density function) theo công thức (1) dưới đây:
Trang 16Giả sử có ngưỡng k được chọn sao cho C0là tập hợp các pixel có ngưỡng
1 k 0 q q q
0
1 k 0 q
q q
q q T
1
1 L k q
q q
1.1.13 Xử lý ảnh
Là một lĩnh vực mang tính khoa học và công nghệ, nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh, phân đoạn ảnh và phân tích ảnh Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 1920 Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955 Điều đó có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, phân đoạn ảnh, nhận dạng ảnh phát triển không ngừng
Trang 17Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera sau đó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo
- Quá trình xử lý ảnh: được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận
Hình 1.1 Quá trình xử lý ảnh
Ảnh trong xử lý ảnh có thể xem như ảnh n chiều Bởi vì, ảnh có thể xem là tập hợp các điểm ảnh Trong đó, mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và do đó nó có thể xem như một hàm n biến P (c1, c2,
…, cn)
Camera
Thu nhận ảnh
Sensor
Số hóa ảnh
Xử lý
số
Hệ quyết định
Nhận dạng
Hiển thị
Truyền thông
……
Lưu trữ
Lưu trữ
Trang 18+ Thu nhận ảnh: - Qua các camera (tương tự, số)
- Từ vệ tinh qua các bộ cảm ứng (Sensors)
- Qua các máy quét ảnh (Scaners)
+ Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rạc để xử lý bằng máy tính: Thông qua quá trình lấy mẫu (rời rạc về mặt không gian) và lượng
tử hóa (rời rạc về mặt biên độ)
+ Xử lý số: là một tiến trình gồm nhiều công đoạn nhỏ: Tăng cường ảnh (Enhancement), khôi phục ảnh (Restoration), phát hiện biên (Egde Detection), phân đoạn ảnh (Secmenttation), trích chọn các đặc trưng (Feature Extraction)…
+ Hệ quyết định: Tùy mục đích của ứng dụng mà chuyển sang giai đoạn khác là hiển thị, nhận dạng, phân lớp, truyền thông,…
- Các định dạng cơ bản trong xử lý ảnh:
Trong quá trình xử lý ảnh, một ảnh thu nhận vào máy tính phải được
mã hóa Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa Một số dạng
đã được chuẩn hóa như: ảnh JPEG (Joint Photographic Expert Group), GIF(Graphic Interface Format), PNG (Portable Network Graphics), TIFF (Tagged Image File Format), …
* Ảnh JPEG (Joint Photographic Experts Group): Đây là định dạng tập tin hầu hết các loại máy ảnh số và phần mềm xử lý ảnh đều hỗ trợ tương thích File JPEG cũng là định dạng file ảnh phổ biến nhất trên Internet.Định dạng JPEG có dung lượng nhỏ, nhẹ
* Ảnh PNG (Portable Network Graphics): cũng là định dạng file bảo
lưu dữ liệu, không làm mất chất lượng ảnh trong lưu trữ và nén file Tương tự như file TIFF, hình ảnh định dạng PNG thích hợp để lưu trữ tư liệu lâu dài
* Ảnh TIFF (Tagged Image File Format): Đây là định dạng tập tin
“không làm mất dữ liệu” của hình ảnh trong quá trình lưu trữ hay nén file
Trang 19Khuyết điểm duy nhất của file TIFF chính là dung lượng cồng kềnh
Uy tín trong việc bảo lưu chất lượng hình ảnh giúp TIFF là định dạng mẫu mực trong việc lưu trữ tư liệu hình ảnh.TIFF là lựa chọn mặc định của dân nhiếp ảnh chuyên nghiệp và giới thiết kế đồ họa Họ sử dụng chủ yếu định dạng file này trong số các loại định dạng file ảnh
* Ảnh GIF (Graphics Interchanger Format): Với định dạng ảnh GIF
những vướng mắc mà các định dạng khác gặp phải khi số trong ảnh tăng lên không còn nữa Dạng ảnh GIF cho chất lượng cao độ phân giải đồ họa cũng đạt cao, cho phép hiển thị trên hầu hết các phần cứng
1.2 Ảnh y học
Y học hiện đại chẩn đoán bệnh dựa vào các triệu chứng lâm sàng (chẩn đoán lâm sàng) và các triệu chứng cận lâm sàng (chẩn đoán cận lâm sàng) Trong chẩn đoán cận lâm sàng thì chẩn đoán dựa trên hình ảnh thu được từ các thiết bị, máy y tế (chẩn đoán hình ảnh) ngày càng chiếm một vai trò quan trọng, nhất là ngày nay với sự trợ giúp của các thiết bị, máy y tế hiện đại, công nghệ cao có các phần mềm tin học hỗ trợ khiến cho hình ánh rõ nét và chính xác hơn
1.2.1 Giới thiệu
Ảnh y học là kỹ thuật và quá trình được sử dụng để tái tạo ra hình ảnh
cơ thể con người, một bộ phận hoặc một phần bộ phận cơ thể con người phục
vụ cho mục đích lâm sàng và cận lâm sàng như chẩn đoán, kiểm tra bệnh hoặc khoa học y tế (bao gồm cả giải phẫu và sinh lý) Ảnh y học theo nghĩa rộng thì nó là một phần của hình ảnh sinh học và kết hợp X – quang, nội soi, siêu âm, CT (Computed Tomography)… dùng trong chẩn đoán điều trị bệnh
lý của con người
Trang 20Hình 1.3 Hình ảnh dạ dày
Một số hình ảnh y học:
1.2.2 Chẩn đoán dựa trên hình ảnh
Y học hiện đại chẩn đoán bệnh dựa vào các triệu chứng lâm sàng (chẩn đoán lâm sàng) và các triệu chứng cận lâm sàng (chẩn đoán cận lâm sàng) Trong chẩn đoán cận lâm sàng thì chẩn đoán dựa trên hình ảnh thu được từ các thiết bị, máy y tế (máy siêu âm, máy x quang, máy nội soi, máy chụp cắt lớp vi tính, máy chụp cộng hưởng từ, …) ngày càng chiếm một vai trò quan trọng, nhất là ngày nay với sự trợ giúp của các thiết bị, máy y tế hiện đại,
Hình 1.4 Hình ảnh chụp X- Quang bàn tay
Hình 1.6 Hình ảnh siêu âm Hình 1.5 Hình ảnh chụp CT sọ não
Trang 21công nghệ cao có các phần mềm tin học hỗ trợ khiến cho hình ảnh rõ nét và chính xác hơn
Các phương pháp chẩn đoán hình ảnh rất phong phú, như chẩn đoán qua hình ảnh X quang, hình ảnh siêu âm, siêu âm - Doppler màu, hình ảnh nội soi (mà thông dụng là nội soi tiêu hoá và nội soi tiết niệu) hình ảnh chụp cắt lớp vi tính (Computed Tomography Scanner- CT Scanner), hình ảnh chụp cộng hưởng từ hạt nhân (Magnetic Resonance Imaging-mrl)
Chẩn đoán hình ảnh đã góp phần quan trọng nâng cao tính chính xác, kịp thời và hiệu quả cao trong chẩn đoán bệnh Như dựa trên hình ảnh siêu
âm, người thầy thuốc có thể đo được tương đối chính xác kích thước các tạng đặc trong ổ bụng (gan, lách, thận, ) và phát hiện các khối bất thường nếu có
Từ hình ảnh siêu âm tim có thể xác định cấu trúc, kích thước các buồng tim, van tim và các mạch máu lớn Trong sản khoa, siêu âm giúp xác định và theo dõi sự phát triển của thai nhi trong bụng mẹ; hình ảnh CT Scanner giúp thầy thuốc xác định được một số bệnh lý ở sọ não, đặc biệt là xác định máu tụ nội
sọ, khối u não; chụp cộng hưởng từ hạt nhân xác định chính xác hơn các hình thái và các khối bất thường trong cơ thể (nếu có)
Các thiết bị và máy y tế về chẩn đoán hình ảnh ngày càng ứng dụng nhiều hơn về CNTT, các phần mềm cho các máy Y tế ngày càng được nâng cấp, nhất là khi kỹ thuật số ra đời và phát triển đã ghi nhận và phân tích tín hiệu rất tốt, cho hình ảnh sâu hơn, chất lượng ảnh tốt hơn
Hơn nữa việc giao diện giữa các thiết bị và máy y tế kỹ thuật cao với hệ thống máy tính dùng trong quản lý tại bệnh viện và giữa các bệnh viện với nhau ngày một nhiều, nên các giao thức truyền ảnh trên mạng được đưa ra (có một chuẩn chung thống nhất, chất lượng ảnh đủ để chẩn đoán, giảm nhẹ gánh
nặng đường truyền), tạo nên phòng “hội chẩn ảo" giữa các chuyên gia y tế ở
xa nhau
Trang 221.2.3 Một số các chuẩn hình ảnh ứng dụng trong y tế
Các máy thiết bị và máy y tế chẩn đoán hình ảnh đầu tiên khi mới ra đời chỉ là tín hiệu dạng sóng (Analog) đưa lên màn hình VIDEO của máy Theo thời gian, máy được chế tạo ngày càng có cấu hình cao hơn và chuyển dần sang tín hiệu số, các phần mềm xử lý tín hiệu lưu trữ thông tin số ngay tại các máy đó (ví dụ máy siêu âm có thể lưu được 5000 ảnh của bệnh nhân gần đây nhất) Tuy nhiên, dần từng bước khi có các điều kiện đặt ra và nhu cầu giao tiếp giữa các máy với nhau (ví dụ: máy CT Scanner chuyển cho máy chiếu tia Coban ) và truyền ảnh số giữa các vùng với nhau để trợ giúp chẩn đoán thì các chuẩn dữ liệu chung về hình ảnh của y tế dần ra đời Vì vậy, các máy y tế ngày nay có gắn thiết bị tin học thì đã sẵn sàng đưa ra các tín hiệu thông qua các D-Shell chuẩn như COM, LPT, HDMI hoặc USB port Tuy nhiên, phần tín hiệu đưa ra các cổng này tuỳ nhà cung cấp trang bị phần mềm khi người sử dụng yêu cầu
Tuy nhiên có nhiều chuẩn để truyền ảnh trên mạng như chuẩn PACS (Picture Archiving and Communication System) là hệ thống lưu trữ, xử lý và truyền ảnh động, hoặc mạng xử lý và truyền ảnh số hoá DICOM (Digital Imaging and Communications in Medicine) Tất cả các chuẩn này có chung một tiêu chí là nén ảnh ở mức độ tối đa để giảm kích thước lưu trữ, giảm kích thước khi truyền trên mạng, có các mức độ phân giải khác nhau khi truyền Nếu hình ảnh không cần chất lượng cao thì có thể truyền ở độ phân giải thấp
và khi cần độ nét để chẩn đoán với chất lượng cao thì truyền ảnh với các độ phân giải cao hơn, nhưng tốc độ truyền trên mạng sẽ chậm đi nhiều Các ảnh truyền thường là các ảnh về X quang, ảnh siêu âm, ảnh nội soi, ảnh CT Scanner Việc truyền ảnh này giúp cho hỗ trợ chẩn đoán từ xa, cho các thầy thuốc, học viên, sinh viên học tập và nghiên cứu
Trang 23Hiện tại việc ứng dụng lưu trữ ảnh theo các chuẩn nhất định ở Việt Nam vẫn chỉ dược lưu trữ trên một máy mà không có sự giao lưu giữa các máy với nhau, như vậy dung lượng lưu trữ không cao và không có khả năng trợ giúp trong chẩn đoán và không thể là dữ liệu dùng chung trong bệnh viện Việc ứng dụng rộng rãi trợ giúp từ xa qua Telemedicine ở Việt Nam còn hầu như chưa được ứng dụng, trong khi đó các nước đã và đang ứng dụng tương đối rộng rãi kỹ thuật này nhất là các nước phát triển
Việc ứng dụng CNTT trong các thiết bị và máy y tế với các phần mềm chuyên dụng đã tạo ra bước phát triển đột phá trong việc ghi hình ảnh có chất lượng cao các cơ quan bị bệnh của cơ thể con người, giúp cho các chuyên gia y
tế chẩn đoán bệnh khách quan hơn, nhanh chóng hơn và chính xác hơn nhiều Với việc lưu trữ và truyền ảnh giữa các khoa, phòng trong bệnh viện và giữa các bệnh viện với nhau đã tạo ra phòng “Hội chẩn ảo”, góp phần quan trọng vào việc sử dụng trí tuệ tập thể, đặc biệt là trí tuệ của các chuyên gia y
tế giỏi, chuyên gia đầu ngành trong chẩn đoán và điều trị bệnh cho mọi người bệnh ở nhiều vùng đất nước khác nhau, thậm chí giữa các nước khác nhau trên thế giới Ứng dụng và phát triển Công nghệ thông tin Y tế đang là một đòi hỏi bức xúc của Ngành Y tế Việt Nam, nhằm xây dựng nền y tế Việt Nam hiện đại, có công nghệ và kỹ thuật y học cao, đáp ứng được yêu cầu chăm sóc sức khoẻ cho nhân dân
Khoa học kỹ thuật ngày càng phát triển, các trang thiết bị chẩn đoán hình ảnh ngày càng hiện đại, nhiều kỹ thuật cao đã và đang được ứng dụng rộng rãi trong y học nhằm phát hiện bệnh sớm, chẩn đoán chính xác, tăng hiệu quả của điều trị và dự phòng tích cực Do vậy bên cạnh lực lượng bác sỹ chẩn đoán hình ảnh thì vai trò của KTV kỹ thuật hình ảnh y học trong các cơ sở khám chữa bệnh lại càng trở nên quan trọng hơn KTV kỹ thuật hình ảnh y học là người được đào tạo để tạo ra hình ảnh của các bộ phận trong cơ thể
Trang 24bằng các kỹ thuật khác nhau như chụp xquang, chụp cắt lớp vi tính, cộng hưởng từ, siêu âm, ghi hình đồng vị phóng xạ… giúp cho các thầy thuốc lâm sàng chẩn đoán, theo dõi, điều trị bệnh có hiệu quả
* Chuẩn PACS
Hệ thống PACS lưu trữ hình ảnh và dữ liệu thu thập được và tương tác với hệ thống con trong cùng mạng PACS có thể chỉ đơn giản là một máy lấy ảnh với cơ sở dữ liệu nhỏ hay hệ thống quản trị ảnh trong y khoa phức tạp để
từ đó các máy lấy ảnh về và xử lý Hiện nay, hầu hết hệ thống PACS phát triển theo hệ thống kiến trúc mở theo đó là việc truyền thông hình ảnh, định dạng ảnh và quản lý ảnh theo chuẩn DICOM
Người sử dụng dùng các máy trạm để hiển thị hình ảnh như là một giao tiếp chính cho việc truy cập hình ảnh trên hệ thống PACS Từ các máy trạm hiển thị hình ảnh đó, người sử dụng có thể chẩn đoán, xem xét, phân tích Các chuyên gia về ngành X – Quang sử dụng các máy trạm chẩn đoán như là một công cụ chính Máy trạm chẩn đoán cần có phần cứng mạnh trong việc xử lý như cần có một màn hình với độ phân giải cao, máy tính mạnh với bộ nhớ lớn
và tốc độ CPU nhanh… các phần mềm được thiết kế cho việc quản lí nhiều các máy bắt hình ảnh (như máy chụp X-Quang, máy chụp cắt lớp, máy nội soi,….), trao đổi hình ảnh giữa chúng với nhau, xem xét ảnh, hiển thị ảnh động, xử lí ảnh và quản lý luồng công việc của bệnh nhân và những thông tin
có liên quan
Trong PACS điều trị bệnh, ảnh được thu thập từ các máy lấy ảnh dùng trong y khoa (modality) rồi gửi tới máy chủ PACS thông qua DICOM Gateway sau đó được đưa tới máy trạm chẩn đoán với dịch vụ truyền thông DICOM
Trang 251.3 Đối tượng bất thường trong ảnh y học
* Bài toán phát hiện đối tượng bất thường trong ảnh y học
Phát hiện đối tượng bất thường ảnh trong thị giác máy tính là công việc tìm kiếm các vật thể trong ảnh hoặc trong video Con người có thể dễ dàng nhận biết các đối tượng trong ảnh dù sự khác nhau của các đối tượng là rất đa dạng Nhưng đối với hệ thống thị giác máy tính thì công việc này vẫn còn là thách thức lớn Nguyên nhân chủ yếu là do hình dáng, kích thước, vị trí,… của mỗi đối tượng là hết sức đa dạng và phong phú, ảnh hưởng về điều kiện ánh sáng, sự che lấp lẫn nhau của những đối tượng khác trong ảnh, chất lượng ảnh,…
Một số đối tượng bất thường trong ảnh y học:
Hình 1.7 Hình ảnh polyp dạ dày Hình 1.8 Hình ảnh viêm dạ dày
Hình 1.9 Hình ảnh gãy ngón chân Hình 1.10 Hình ảnh tụ máu não
Trang 26CHƯƠNG 2: CÁC KỸ THUẬT PHÁT HIỆN ĐỐI TƯỢNG
Trong phần này tôi trình bày phương pháp hiện nhanh đối tượng của Dalat
và Triggs đề xuất năm 2005[3] Tập đặc trưng phân bố gradient có hướng (HOG) được đề xuất nhằm giảm thời gian tính toán đặc trưng Sau khi tập đặc trưng HOG được trích rút, phương pháp SVM được sử dụng để huấn luyện hệ thống
* Trích rút đặc trưng HOG trong ảnh
HOG là đặc trưng được sử dụng rất nhiều trong lĩnh vực phát hiện đối tượng Kỹ thuật này được đề xuất bởi Bill Triggs và Navel Dalal vào năm
2005 tại viện nghiên cứu INRIA Ý tưởng chính trong đặc trưng HOG là hình dạng và trạng thái của vật có thể được đặc trưng bằng sự phân bố về gradient
và hướng của cạnh Đặc trưng này được phát triển dựa trên phương pháp SIFT (phương pháp biến đổi đặc trưng bất biến với tỷ lệ) và đặc trưng HOG được tính trên cả một vùng Do sự biến thiên về mầu sắc trong các vùng khác nhau là khác nhau, kết quả là mỗi vùng sẽ cho ta một vector đặc trưng của nó
Vì vậy để có được đặc trưng của toàn bộ cửa sổ (window) ta phải kết hợp nhiều vùng liên tiếp lại với nhau
Từ một ảnh cho trước, qua việc trích rút đặc trưng trên ảnh đó cho ta được một vector đại diện cho đối tượng đó Việc rút ra được các vector đặc trưng như vậy giúp chúng ta chuyển không gian ảnh sang không gian vector
để có thể xử lí và tính toán đơn giản hơn trên máy tính
Trang 27Hình 2.2 Các khối được xếp chồng lên
- Các khối này được đặt chồng lên nhau, khoảng cách giữa hai khối con liên tiếp nhau phải là một hằng số
- Sau khi đã phân chia cửa sổ cần tính toán HOG như trên, ta tiến hành trích rút đặc trưng như sau :
+ Tính toán đặc trưng trên từng
vùng :
Tính toán đặc trưng trên từng
ô nhỏ (cell)
Tính toán đặc trưng trên từng
khối (block) bằng cách kết hợp các ô lại
với nhau
+ Thu thập đặc trưng của các
vùng trên ảnh
Tính và chuẩn hóa vector đặc
trưng cho từng block
Thu thập các đặc trưng HOG cho các cửa sổ
Để minh họa thuật toán, chúng ta giả sử cần tính vector đặc trưng HOG và số lượng thành phần vector đó trên một ảnh kích thước 64x128 Chúng ta chia ảnh
Cell
Block
Hình 2.1 Ví dụ minh họa một Block
gồm 9 cell
Trang 28X- Gradient Orientation
Y-Gradient
Magnitude
thành các cell với kích thước 8 x 8 pixels Và chúng ta chọn kích thước của block là
2 x 2 cell Thuật toán trích rút đặc trưng HOG được mô tả như sau :
+ Bước 1: chuyển ảnh trong không gian RGB sang ảnh dạng GRAY
SCALE, sau đó tiến hành cân bằng histogram trên ảnh GRAY SCALE để giảm đi ảnh hưởng của sự thay đổi ánh sáng
+Bước 2: tính sự biến thiên màu sắc tại tất cả các pixel của ảnh GRAY
SCALE theo chiều X[-1,0] và theo chiều Y
1
và thu được 2 ảnh gradient – x và
gradient –y có kích thước bằng kích thước ảnh GRAY SCALE và cho thấy được sự biến thiên màu sắc nói trên
+ Bước 3: tiến hành tính góc và hướng biến thiên màu sắc từ 2 ảnh gradient
– x và gradient – y như hình vẽ bên dưới :
Việc lưu trữ chính xác từng giá trị góc
(orientation) của từng vị trí (x,y) không
mang lại nhiều kết quả, do vậy ta sẽ
chia không gian góc ra thành các pin
Việc phân chia pin càng nhỏ sẽ càng làm
tăng độ chính xác, kết quả thực nghiệm
cho thấy kích thước pin khoảng 200 cho
kết quả tốt nhất Hình 2.7 Tính góc và biên độ theo
X-gradient và Y-X-gradient
Do đó từ 0 -180 ta chia thành 9 pin như sau 0 - 20, 21 - 40, 41 - 60, 61 - 80,
81 - 100, 101 - 120, 121 -140, 141 - 160, 161 - 180
+ Bước 4: Ứng với mỗi pin trên ta tiến hành thống kê biên độ (magnitude) tại
từng vị trí Với mỗi pin, tại vị trí (x,y) nếu như góc (orientation) thuộc về pin đó thì
Trang 29giá trị của pin đó tại vị trí (x,y) bằng giá trị biên độ (magnitude), ngược lại giá trị pin tại vị trí (x,y) bằng 0
+ Bước 5: tính toán vector đặc trưng cho từng cell (8x8) Vector đặc trưng
của mỗi cell sẽ gồm 9 thành phần tương ứng với 9 pin, và giá trị tại thành phần i
bằng tổng giá trị của các điểm trong pin i mà có tọa độ nằm trong cell đó
+ Bước 6: tính toán vector đặc trưng cho từng block (16x16) Ta chỉ cần
ghép các vector đặc trưng của từng cell trong block lại với nhau để được vector đặc trưng của một block và chuẩn hóa lại vector đặc trưng của block này Việc chuẩn hóa đặc trưng trong block sẽ được bàn chi tiết ở phần sau Như vậy vector đặc trưng của block sẽ gồm 9 x 4 = 36 thành phần
+ Bước 7: Tính toán vector đặc trưng cho toàn bộ ảnh (6x128) Ta chỉ
cần các vector đặc trưng của từng block lại với nhau để được vector đặc trưng của cả window Lưu ý rằng các block không đặt tách biệt nhau mà gối lên nhau, cách nhau một khoảng bằng kích thước của cell theo mỗi chiều (hoặc bằng phân nửa kích thước của cell)
Như vậy vector đặc trưng của window = số block trong window * 36 = ((64-16)/8+1)*((128-16)/8+1)*36=7*15*36=3780 thành phần
+ Bước 8: Sau cùng chúng ta chuẩn hóa lại vector đặc trưng của cả
window
Nhìn vào thuật toán chúng ta thấy số các đặc trưng cần tính cho từng ô
là rất lớn Do vậy, ở đây có thể sử dụng kỹ thuật biểu diễn Integral image để tăng tốc độ tính toán
* Chuẩn hóa vector đặc trưng cho từng block
Để chuẩn hóa vector đặc trưng cho cả window, ta chuẩn hóa đặc trưng cho từng vector của từng block Theo Wei Jiang, ta sử dụng các phương pháp sau để chuẩn hóa vector đặc trưng của từng block
Trang 30+ L2 - norm:
+ L1 - norm:
+ L1 - sqrt:
Trong đó:
v: vector đặc trưng ban đầu của một block (chưa chuẩn hóa);
||v k ||: k - norm của v với k=1,2;
e: Hằng số nhỏ
Theo Dalal và Triggs, L2 - norm và L1 -spt cho cùng kết quả Trong khi
đó L1-norm cho kết quả kém hơn Tuy vậy việc chuẩn hóa bằng một trong các phương pháp trên vẫn cho kết quả tốt hơn đối với những vector không chuẩn hóa
Tập đặc trưng HOG tìm được sẽ sử dụng để huấn luyện bộ phân loại
Có nhiều phương pháp phân loại dữ liệu như: phân lớp dựa vào cây quyết định, phân lớp dựa vào luật, phân lớp Bayesian, phân lớp theo lan truyền ngược, Tuy nhiên, để đơn giản và nhanh chóng, ta sử dụng phương pháp SVM tuyến tính để huấn luyện tập dữ liệu
2.2 Kỹ thuật phân loại SVM
SVM là một phương pháp trong việc phân loại dữ liệu tuyến tính và không tuyến tính Trước khi mô tả chi tiết phương pháp này chúng ta cùng nhắc lại một số khái niệm về siêu phẳng và phân chia tuyến tính, vector hỗ trợ,
* Các khái niệm cơ bản:
2.2.1 Siêu phẳng phân cách:
Cho trước tập dữ liệu D gồm (x1, y1), (x2, y2), , (x|D|,y|D|)
Trang 31Trong đó xi là một tập các bộ huấn luyện tương ứng với nhãn lớp yi Mỗi yi sẽ nhận một trong hai giá trị hoặc là 1 (object) hoặc là 0(background) (yi {1,0})
Phương pháp phân lớp SVM sẽ tìm ra đường phân lớp tốt nhất để phân chia tập dữ liệu này thành từng lớp cách biệt ra với nhau Phương trình tổng quát của một đường phân chia được biểu diễn dưới dạng sau:
W.x + b = 0
Trong đó:
W: Vector trọng số
W={w1,w2, ,wn};
n: số thuộc tính (hay còn gọi là số chiều của dữ liệu);
b: Một đại lượng vô hướng, thường được xem như là một đường nghiêng Đối với trường hợp dữ liệu hai chiều (hai thuộc tính) thì phương trình trên biểu diễn của đường thẳng phân chia
Nếu dữ liệu của chúng ta là
ba chiều thì đường phân chia giữa
hai tập sẽ là một mặt phẳng phân
cách Tổng quát cho dữ liệu n chiều
thì sẽ được phân cách bởi một siêu
Hình 2.3 Đường màu vàng trên hình là đường phân chia đối với tập dữ liệu
gồm hai thuộc tính
Trang 32Do đó mục tiêu của phương pháp phân lớp SVM là tìm một siêu phẳng phân cách giữa hai lớp sao cho khoảng cách
lề (margin) giữa hai lớp đạt cực đại Siêu
phẳng có biên độ lớn nhất sẽ được chọn như
là siêu phẳng phân chia tập dữ liệu một
cách tốt nhất Trong hình bên dưới, ta thấy
có hai siêu phẳng có thể phân chia được và
những biên độ của nó
Trước khi đi vào định nghĩa của
biên độ (margin), hãy nhìn vào hình trên một cách trực quan Cả hai siêu phẳng đều phân tách tất cả những bộ dữ liệu cho trước Một cách trực quan, siêu phẳng với biên độ lớn hơn sẽ chính xác hơn trong việc phân loại các bộ
dữ liệu trong tương lai so với siêu phẳng có biên độ nhỏ hơn Điều này là lý
do tại sao (trong suốt giai đoạn học hay huấn luyện), SVM tìm những siêu phẳng có biên độ lớn nhất gọi là MMH Siêu phẳng có biên độ lớn nhất là siêu phẳng có khoảng cách từ nó tới hai mặt bên của nó thì bằng nhau (mặt bên song song với siêu phẳng) Khoảng cách đó thật ra là khoảng cách ngắn nhất từ MMH tới bộ dữ liệu huấn luyện gần nhất của mỗi lớp Siêu phẳng có biên độ lớn nhất này cho chúng ta một sự phân loại tốt nhất giữa các lớp
Hình 2.5 Mô tả 2 siêu phẳng phân chia tuyến tính cùng với biên độ của nó
Hình 2.4 Một bộ dữ liệu hai chiều được phân chia tuyến tính
Trang 33Siêu phẳng phân cách có vai trò quan trọng trong việc phân lớp, nó quyết định xem một bộ dữ liệu sẽ thuộc về lớp nào Để thực hiện việc phân lớp, SVM chỉ cần xác định xem một bộ dữ liệu nằm về phía nào của siêu phẳng phân cách
X(x) = sign(D.x + b)
D(x) < 0: bộ dữ liệu sẽ nằm phía dưới siêu phẳng phân cách
D(x) = 0: bộ dữ liệu sẽ nằm trên siêu phẳng phân cách
D(x) > 0: bộ dữ liệu sẽ nằm phía trên siêu phẳng phân cách
2.2.2 Support vectors
Ta có phương trình tổng quát của siêu phẳng
x.W + b =0
Ta xét trên ví dụ sau:
Với bộ dữ liệu huấn luyện có hai thuộc tính A1 và A2: X={x1, x2}, với
x1, x2 là giá trị của thuộc tính A1, A2 W = {w1, w2} Phương trình siêu phẳng
Trang 34Hình 2.6 Đường biểu diễn H 1 và H 2 , đường màu đỏ là khoảng cách Euclidean của hai điểm 1 và 2 Đường màu xanh là khoảng cách Euclidean nhỏ nhất
Điều này có nghĩa là nếu bất kì bộ nào nằm tại hoặc trên H1 đều thuộc
về lớp 1, và bất kì bộ nào nằm tại hoặc dưới H2 đều thuộc về lớp 0 Kết hợp hai bất đẳng thức trên ta có:
yi( w0 + w1x1 + w2x2 )≥ 1, i Mỗi bộ huấn luyện nằm tại các mặt biên H1 hay H2 thỏa mãn phương trình trên được gọi là support vectors Support vectors là những bộ gần với siêu phẳng phân chia tuyến tính (MMH) nhất
Trong hình bên dưới, support vectors là hình tròn có viền dày hơn Ta thấy rằng các support vectors là những bộ khó phân lớp nhất và cung cấp nhiều thông tin nhất cho việc phân lớp
Hình 2.7 Các support vector trong SVM (đường viền đậm)
Trang 352.2.4 Phân lớp dữ liệu
Việc huấn luyện SVM với mục đích là để tìm ra các support vectors và MMH MMH là ranh giới phân chia tuyến tính giữa các lớp và vì thế SVM tương ứng có thể được sử dụng để phân lớp dữ liệu mà dữ liệu đó có thể phân chia tuyến tính Chúng xem SVM được huấn luyện là SVM tuyến tính
Sau khi huấn luyện SVM, chúng sẽ phân loại các bộ mới Theo Jiawei Han and Micheline Kamber, ta dựa trên công thức Lagrangian như sau:
d(XT) = Trong đó:
+ yi là nhãn lớp của support vector xi
+ XT là một bộ test
+ α (nhân tử Lagrangian)
+ b0 là biến số được xác định bởi sự tối ưu hóa hay các thuật toán SVM
+ l là số lượng các support vectors
MMH có thể được xem như “ranh giới quyết định” trong việc quyết định xem một bộ test bất kỳ sẽ thuộc vào lớp nào Cho một bộ test XT, chúng
Trang 36ta gắn nó vào phương trình trên, và sau đó kiểm tra dấu của kết quả Từ đó ta
sẽ biết được bộ test sẽ rơi vào mặt nào của siêu phẳng Nếu dấu là dương, thì
XT rơi vào phía trên của MMH, và SVM đoán rằng XT thuộc về lớp 1 Nếu dấu là âm, thì XT nằm tại hoặc dưới MMH và nhãn lớp được đoán là 0
Nhận xét: Giống như các phương pháp máy học khác, để phương pháp
SVM hoạt động tốt nó phải được huấn luyện trên một bộ dữ liệu lớn, bao quát đầy đủ các trường hợp Ưu điểm của phương pháp này là có độ chính xác cao Tuy nhiên nó gặp phải khuyết điểm là tốn thời gian và chi phí cho việc huấn luyện
2.3 Kỹ thuật lọc Hessian
Y học là một lĩnh vực quan trọng của ứng dụng cho thị giác máy tính Nội soi cho phép các học viên y tế có thể quan sát bên trong nội tạng rỗng và các khoang cơ thể khác một cách ít xâm lấn Chẩn đoán liên quan đến việc phát hiện hình dáng và đánh giá các mô nước Ví dụ, một polyp là một tình trạng bệnh lý liên quan trực tiếp đến dạng hình học Chẩn đoán thường đòi hỏi phải cắt polyp và sinh thiết Ở đây, chúng ta xem xét nội soi nói chung là phương pháp được sử dụng phổ biến nhất trong thực hành y tế[4]
Polyp thường được tìm thấy qua nội soi nhưng polyp vẫn có thể bị bỏ qua Tự động phát hiện các khối u, với độ chính xác cao, là một sự trợ giúp quan trọng để hành nghề y Nghiên cứu trước đây đã được sử dụng bằng cách tiếp cận dựa trên miếng vá, tính năng miếng vá chính là những màu Wavelet Hiệp phương sai (CWC) và mẫu nhị phân cục bộ (LBP) Miếng vá mẫu được phân loại bằng cách sử dụng một SVM Tính năng kích thước tăng trong các giá trị màu RGB và tọa độ vị trí XY đang được sử dụng hàng đầu để nâng cao hiệu suất phân loại
Trang 37Hiệu quả trong phương pháp tiếp cận dựa trên bản ghép trước đó tuỳ thuộc vào kích thước bản ghép Nó không phải là dễ dàng để có thể phát hiện
ra polyp với các kích thước khác nhau trong một hình ảnh Hơn nữa, polyp nhỏ trở nên khá nhạy cảm với các tính năng được sử dụng để phát hiện Đó là khó khăn để tưởng tượng làm thế nào để đạt được độ chính xác với kích thước miếng dán không đổi Trong nội dung luận văn này, lựa chọn cách phát hiện các vùng polyp ứng cử viên dựa trên giả thiết một polyp là lồi SVM phân loại được sử dụng để phát hiện các polyp với độ chính xác cao
Tính toán màu sắc và cạnh các tính năng cho từng vùng ứng viên Trong [4], các tính năng hình ảnh dạng ống phát sinh từ các mạch máu được gia tăng theo các giá trị đặc trưng, λ1, λ2, của ma trận Hessian liên quan được
thể hiện trong Bảng 1 Tuy nhiên, mục tiêu là để trích xuất các đặc tính giống
như blob Các thủ tục để nâng cao cấu trúc giống blob như sau:
+ Bước 1: Tạo một bộ lọc Gaussian G(x,y) với chiều rộng là s
+ Bước 2: Tạo bộ lọc cho các đạo hàm riêng Gx (x, y), Gy (x, y), và các đạo hàm riêng thứ hai, Gxx (x, y), Gxy(x, y) và Gyy(x, y)
+ Bước 3: Tính Lxx (x, y), Lxy (x, y) và Lyy (x, y) là tích chập của ảnh đầu vào, L(x,y), với Gxx (x, y), Gxy (x, y) và Gyy (x, y) tương ứng Đó là:
Lxx(x,y)=Gxx(x,y) L(x,y) (1)
Lxy(x,y)=Gxy(x,y) L(x,y) (2)
Lyy(x,y)=Gyy(x,y) L(x,y) (3)
Lưu ý: *là ký hiệu chập
Bước 4:
Tính toán các hình ảnh ma trận (2 × 2) Hessian H,
Trang 38H-, H- Blob giống như cấu trúc sáng
H +, H + Blob giống như cấu trúc tối
+ Bước 5: Tính giá trị riêng, λ1, λ2, (λ1 ≤ λ2) của H
+ Bước 6: Tính hình ảnh, I (x, y), tại: