Phân tích một số thuộc tính ảnh y khoa não người...39 3.1.2.Các bước tiến hành trích xuất đặc trưng não người dựa trên phương pháp gom nhóm Kmeans ...41 3.1.3.Các bước tiến hành trích xu
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trần Anh Tuấn
Đề tài : TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI DỰA
TRÊN BIẾN ĐỔI CONTOURLET
LUẬN VĂN THẠC SĨ TOÁN HỌC
Thành Phố Hồ Chí Minh 09-2009
Trang 2ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
TRẦN ANH TUẤN
TÊN ĐỀ TÀI LUẬN VĂN
TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI DỰA
TRÊN BIẾN ĐỔI CONTOURLET
Chuyên ngành: Đảm Bảo Toán Học Cho Máy Tính và Hệ Thống Tính Toán
Mã số: 60.46.35
LUẬN VĂN THẠC SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS Trần Nam Dũng
Thành phố Hồ Chí Minh - 2009
Trang 3LỜI GIỚI THIỆU
Ngày nay việc chuẩn đoán bệnh đóng một vai trò quan trọng trong quá trình điều trị bệnh cho các bệnh nhân Việc chuẩn đoán bệnh càng chính xác bao nhiêu thì quá trình chữa bệnh càng dễ dàng và thuận lợi bấy nhiêu Có rất nhiều kỹ thuật chụp ảnh các bộ phận cơ thể nhưng phổ biến nhất vẫn là kỹ thuật scanning CT Qua đó các ảnh đầu ra là những ảnh có chất lượng rất cao
và dung lượng cũng tương đối lớn Tuy nhiên với khoảng 200 CT ảnh trong mỗi lần chụp và phải chụp nhiều lần để theo dõi bệnh tình thì dữ liệu ảnh chuẩn đoán sẽ trở nên khá lớn Một bệnh viện với hàng ngàn bệnh nhân thì vấn đề lưu trữ chắc chắn sẽ càng trở nên khó khăn hơn nhiều Do vậy bài toán về trích xuất các đặc trưng cần thiết để chuẩn đoán bệnh trước khi lưu trữ luôn được các bệnh viên quan tâm như là một giải pháp hữu hiệu
Trước yêu cầu thực tế đó và hiện cũng đang là một chương trình hợp tác khoa học của khoa Toán trường Đại Học Khoa Học Tự Nhiên với bệnh viện Chonnam Hàn Quốc Bài toán “Trích xuất đặc trưng não người trong ảnh y khoa“ là một yêu cầu thực tế của bệnh viện đưa ra cho chúng tôi tìm các giải pháp thực hiện Như được biết ảnh não người là ảnh chụp các thông tin về xương và mạch máu não mà trong đó thông tin về mạch máu não là cực kỳ quan trọng để chuẩn đoán các bệnh liên quan đến não Có nhiều phương pháp
để trích đặc trưng mạch máu não như phân ngưỡng ,hay K-mean, nhưng kết quả thực nghiệm cho thấy các phương pháp này chỉ cho kết quả tương đối
Bên cạnh việc thực nghiệm các phương pháp cơ bản, chúng tôi tiến hành áp dụng biến đổi Contourlet trên các ảnh y khoa Và chúng tôi nhận thấy với biến đổi Contourlet không chỉ trích xuất được các thông tin mạch máu với thông tin các biên rõ ràng hơn so với phương pháp phân ngưỡng mà còn qua
đó các thông tin mạch máu được xác định nhiều hơn
Trong luận văn chúng tôi sẽ tiếp cận cả hai phương pháp trích xuất bằng K-mean , với biến đổi Contourlet và sau đó là so sánh các kết quả thực nghiệm
về kết quả thu được từ hai phương pháp
Trang 4MỤC LỤC
Trang phụ bìa
Mục lục
Danh mục các hình vẽ
LỜI GIỚI THIỆU
Chương 1 – TỔNG QUAN 10
1.1 Các vấn đề về ảnh y khoa 10
1.1.1 Tổng quan về lợi ích của ảnh Y Khoa 10
1.1.2 Việc tổ chức lưu trữ ảnh Y Khoa 12
1.1.3 Việc phục hồi ảnh và chuẩn đoán bệnh 14
1.2 Ảnh Y Khoa Não Người 14
1.2.1 Giới thiệu các thành phần của ảnh khoa não người 14
1.2.2 Các bài toán liên quan đến ảnh y khoa não người 15
1.3 Các hướng giải quyết cho bài toán 16
Chương 2 – CƠ SỞ LÝ THUYẾT 17
2.1 Phương pháp Kmeans 17
2.1.1 Giới thiệu 17
2.1.2 Sơ đồ thuật toán 17
2.1.3 Áp dụng 19
2.1.4 Một số ứng dụng và hạn chế của thuật toán K-mean 22
2.2 Biến đổi Contourlet 23
2.2.1 Giới thiệu sơ lược về Contourlet 23
2.2.2 Mô hình xây dựng biến đổi Contourlet 25
2.2.2.1 Các tính chất của biến đổi Contourlet 26
2.2.2.2 Mô hình xây dựng 26
Trang 52.2.2.3 Laplace Pyramids - Multiscale Decompostion 27
2.2.2.4 Directional Filter Banks - Directional Decomposition 29
2.2.2.5 Multiscale and directional Decomposition ( Contourlet ) 2.2.3 Mô hình xây dựng biến đổi Contourlet cải tiến 35
2.2.3.1 Nonsubsampled Pyramids 35
2.2.3.2 Nonsubsampled Directional Filter Banks 37
2.2.3.3 Nonsubsampled Contourlet 38
Chương 3 – XÂY DỰNG THUẬT GIẢI 39
3.1 Tổng quan về các phương pháp áp dụng 39
3.1.1 Phân tích một số thuộc tính ảnh y khoa não người 39
3.1.2.Các bước tiến hành trích xuất đặc trưng não người dựa trên phương pháp gom nhóm Kmeans 41
3.1.3.Các bước tiến hành trích xuất đặc trưng não người dựa trên biến đổi Nonsubsampled Contourlet 42
3.2 Thuật toán trích xuất đặc trưng não người dựa trên Kmeans 44
3.2.1 Tiền xử lý 44
3.2.2 Gom nhóm và phân loại vùng 44
3.2.3 Phân loại xương và mạch máu 47
3.2.4 Xuất ảnh kết quả 50
3.3 Thuật toán trích xuất đặc trưng não người dựa trên biến đổi Nonsubsampled Contourlet 50
3.3.1 Xây dựng cấu trúc dữ liệu lưu trữ bộ ảnh CT não người 50
3.3.2 Xây dựng bộ hệ số trích xuất ảnh dựa trên biến đổi Nonsubsampled Contourlet 51
3.3.3 Lựa chọn và trích xuất đặc trưng mạch máu dựa trên mối quan hệ 2D và 3D mạch máu 54
3.3.4 Xuất ảnh kết quả 58
Chương 4 – KẾT LUẬN 59
4.1 Kết quả thực nghiệm trích xuất đặc trưng 59
Trang 64.1.1 Môi trường thực nghiệm 59
4.1.2 Phương pháp Phân ngưỡng 59
4.1.3 Phương pháp Contourlet 59
4.1.4 So sánh và đánh giá kết quả 60
4.2.Hướng Phát Triển 63
TÀI LIỆU THAM KHẢO 64
Trang 7DANH MỤC CÁC HÌNH VẼ TRONG LUẬN VĂN
Hình 1.1 Ảnh chụp CT các bộ phận trong cơ thể người 10
Hình 1.2 Máy CT Scanner 11
Hình 1.3 Chuẩn đoán bệnh dựa theo ảnh chụp CT 11
Hình 1.4 Lớp các ảnh CT chụp vùng đầu của người 12
Hình 1.5 Xây dựng ảnh 3D từ một dãy các ảnh CT chụp 12
Hình 1.6 Mô hình tổ chức lưu và xử lý ảnh y khoa 13
Hình 1.7 Ảnh y khoa chụp não người theo chiều ngang 14
Hình 1.8 Phần thịt , xương và mạch máu trong ảnh CT 15
Hình 1.9 Các dạng phức tạp của mạch máu người 16
Hình 2.1 Thuật toán gom nhóm K-mean 17
Hình 2.2 Sơ đồ thuật toán K-mean 18
Hình 2.3 Bước hội tụ của thuật toán K-mean 19
Hình 2.4 Các bước lặp của thuật toán K-mean (abcdef) 22
Hình 2.5 Sự phân rã hình tháp 24
Hình 2.6 So sánh khả năng lưu trữ thông tin biên của Contourlet với Wavelet 24
Hình 2.7 Mô hình cấu trúc của phép biến đổi Contourlet 25
Hình 2.8 Vẽ đường cong bằng Wavelet và nằng phương pháp tiếp cận mới 25
Hình 2.9 Bộ lọc Laplacian Pyramid và bộ lọc Directional Filter Bank 27
Hình 2.10 Ví dụ về phân tích ảnh dùng Laplacian Pyramids 28
Hình 2.11 Ví dụ về tổng hợp ảnh dùng Laplacian Pyramids 29
Hình 2.12 Bộ lọc tổng hợp tín hiệu 29
Hình 2.13 Mặt phẳng chia miền tần số theo các hướng 30
Hình 2.14 Two-channel quincunx filter bank 30
Hình 2.15 Phép toán Shearing ảnh 31
Hình 2.16 Cấu trúc cây của DFB chia ảnh làm các hướng 31
Hình 2.17 Biên ảnh khôi phục trơn hơn so với wavelet 32
Hình 2.18 : Mô hình chia 4 và 8 hướng dùng Contourlet 33
Trang 8Hình 2.19 Cấu trúc phân tích hình cây của Contourlet 33
Hình 2.20 Ví dụ về biến đổi Contourlet 34
Hình 2.21 Bộ lọc nonsubsampled hai kênh 35
Hình 2.22 Nonsubsampled pyramid 36
Hình 2.23 Mặt phẳng miền tần số được phân tích 36
Hình 2.24 Nonsubsampled DFB 37
Hình 2.25 Đáp ứng tần số cỏa hai bộ lọc sau khi đã lấy mẫu lên 37
Hình 2.26 Vi dụ 4 hướng miền tần số 38
Hình 2.27 Nonsubsampled Contourlet 38
Hình 3.1 Cấu trúc xương và mạch máu 39
Hình 3.2 Vùng Nhiễu 40
Hình 3.3 Vùng mạch máu 40
Hình 3.4 Phân ngường mức xám 200 đến 255 41
Hình 3.5 Biến đổi Contourlet thông thường 43
Hình 3.6 Tiền Xử Lý 44
Hình 3.7 Phân biệt các vùng Xương , Thịt , Mạch máu trên ảnh 45
Hình 3.8 Ví dụ về gom nhóm K-mean 46
Hình 3.9 Phân biệt xương và mạch máu trong ảnh CT 47
Hình 3.10 Vì dụ vể công thức tính độ tròn của các vật thể 49
Hình 3.11 Tổng quan thật toán trích xuất dùng K-mean 49
Hình 3.12 Ảnh xuất kết quả 50
Hình 3.13 Tiền xử lý 51
Hình 3.14 Ảnh đầu vào 52
Hình 3.15 Hệ số mức 2 của Contourlet 53
Hình 3.16 Hệ số mức 3 của Contourlet 53
Hình 3.17 Hệ số mức 4 của Contourlet 54
Hình 3.18 Hệ số mức 2 được chọn để trích xuất đặc trưng 55
Hình 3.19 Trích xuất đối tượng nhỏ mức xám cao 56
Hình 3.20 Trích xuất đối tượng lớn mức xám vùng biên cao 56
Hình 3.21 Mô hình Cấu Trúc Dữ Liệu 2D 57
Hình 3.22 Mô hình Cấu Trúc Dữ Liệu 3D 58
Trang 9Hình 3.23 Ảnh trích xuất kết quả 58 Hình 4.1 So sánh kết qủa giữa Ảnh gốc - Ảnh trích xuất bằng Contourlet 60 Hình 4.2 Số liệu trên 20 ảnh so sánh độ lệnh giữa hai phương pháp K-means và Contourlet 61
Hình 4.3 So sánh độ chính xác dựa trên tiêu chuẩn mạch máu theo đánh giá và số mạch máu được trích xuất……….63
Trang 10Chương 1 – TỔNG QUAN
1.1 Các vấn đề về ảnh y khoa
1.1.1 Tổng quan về lợi ích của ảnh Y Khoa
Ảnh y khoa là ảnh các dạng ảnh chụp về các bộ phận của con người như não , tim , xương , phổi v.v giúp cho việc chuẩn đoán bệnh và tìm ra các phương pháp điều trị bệnh
Hình 1.1 Ảnh chụp CT các bộ phận trong cơ thể người
Kỹ thuật chụp , lưu ảnh và chuẩn đoán bệnh hiện hay đều dưới dạng ảnh
CT (hay còn gọi là Computed Tomography) CT Scan là một quá trình ghi nhận ảnh của bệnh nhân bằng cách kết hợp x-rays với các chức năng tạo ảnh nhiều tầng lớp theo chiều ngang và dọc
Trong CT Scanning , các tia X quang sẽ di chuyển theo quỹ đạo tròn quanh cơ thể Nhờ vậy cho ta rất nhiều hướng quan sát khi chuẩn đoán bệnh Các thông tin X quang đó sẽ được gửi cho máy tính phân tích dữ liệu và hiển thị nó dưới dạng ảnh hai chiều Ngày nay có nhiều kỹ thuật hiện đại hơn được
áp dụng để có thể hiển thị dưới dạng trực quan hơn là ba chiều
Trang 11Hình 1.2 Máy CT Scanner
Nhờ có các ảnh CT , các bác sĩ có thể chuẩn đoán bệnh, xác định chảy máu trong , kiểm tra các chấn thương hay các bộ phận bị hủy hoại trong cơ thể
Hình 1.3 Chuẩn đoán bệnh dựa theo ảnh chụp CT Với một tập các ảnh thu được từ ảnh chụp CT, có rất nhiều các nhà khoa học tìm cách mô hình hóa chúng dưới dang 3D sao cho đạt được độ chính xác tốt nhất để giúp cho việc chuẩn đoán hiệu quả các loại bệnh Hiện đây còn là
Trang 12vấn đề mở để các nhà khoa học và các bác sĩ làm việc với nhau tìm các giải pháp
Hình 1.4 Lớp các ảnh CT chụp vùng đầu của người
Hình 1.5 Xây dựng ảnh 3D từ một dãy các ảnh CT chụp
1.1.2 Việc tổ chức lưu trữ ảnh Y Khoa
Ngày nay các ảnh CT chụp đều có kích thước lớn trên mỗi bức ảnh Trong khi mỗi lần chụp để chuẩn đoán bệnh cần rất nhiều slides ảnh Như vậy đối với một bệnh nhân mỗi lần chụp và lưu trữ thông tin để xem xét bệnh mất hết khoảng vài trăm MB
Trang 13Con số này nếu đem xem xét trên cả trăm ngàn bệnh nhân và luôn luôn các bác sĩ phải chụp để chuẩn đoán bệnh và lưu trữ thông tin qua nhiều năm thì chắc chắn các bệnh viện sẽ gặp phải hai vấn đề chính sau :
1 Làm sao để lưu trữ hết tất cả ảnh cho các bệnh nhân ?
2 Liệu có tốn kém không khi thông tin cần chuẩn đoán bệnh chỉ nằm trên các đặc trưng có trong ảnh còn các thông tin khác thì không? (Ví dụ :chuẩn đoán bệnh liên quan đến mạch máu não thì không cần lắm thông tin về xương
sọ v.v )
Ngày nay việc tổ chức lưu ảnh y khoa hầu như vẫn là lưu trữ trên các máy vi tính riêng có dung lượng nhớ lớn Từ máy vi tính này nếu Bác sĩ muốn xem lại bệnh án thì phải in ra hay gửi dữ liệu ảnh đi nếu muốn chuẩn đoán bệnh từ xa Với một nguồn dữ liệu ngày càng lớn như vậy của các bệnh nhân rõ ràng việc cải tiến cách lưu trữ (nén ảnh) không chỉ giúp giảm dung lượng ảnh
mà con giúp cho việc truy vấn ảnh nhanh hơn , chuẩn đoán bệnh chính xác hơn
Hình 1.6 Mô hình tổ chức lưu và xử lý ảnh y khoa Như vậy bài toán nén ảnh y khoa dựa theo đặc trưng là một bài toán rất cấp thiết đối với các bệnh viện ngày nay
Trang 141.1.3 Việc phục hồi ảnh và chuẩn đoán bệnh
Việc chuẩn đoán bệnh của các bác sĩ hiện nay hầu hết là nhìn vào các bức ảnh Rồi từ đó theo kinh nghiệm họ sẽ tự phân tích , chuẩn đoán bệnh Nghĩa là chưa có sự giúp đỡ nào được máy tính tự động làm để hỗ trợ các bác
sĩ Vì vậy ngoài việc nén ảnh y khoa dựa trên các đặc trưng , bài toán khôi phục lại ảnh sao cho hiển thị lại đầy đủ các tiêu chuẩn đánh giá bệnh và mô hình hóa lại các bộ phân cơ thể cũng là một vấn đề cần giải quyết
1.2 Ảnh Y Khoa Não Người
1.2.1 Giới thiệu các thành phần của ảnh y khoa não người
Ảnh y khoa về não người gồm nhiều lớp chụp cắt lớp từ cuống họng cho đến đỉnh đầu của một bệnh nhân
Hình 1.7 Ảnh y khoa chụp não người theo chiều ngang Các ảnh này có thứ tự và thể hiện được mối liên hệ giữa các mạch máu , xương và phần cơ Phần thịt là phần có màu tương đối xám trong ảnh Phần mạch máu và xương cũng như và viền hộp sọ đều có màu trắng Nhưng bằng mắt thường ta có thể dễ sàng nhận ra các mạch máu não Mạch máu não sẽ có hình tương đối tròn và diện tích miền nhỏ hơn so với xương
Trang 15Hình 1.8 Phần thịt , xương và mạch máu trong ảnh CT
1.2.2 Các bài toán liên quan của ảnh y khoa não người
Đối với việc chuẩn đoán bệnh liên quan đến não như viêm màng não , chảy máu não hay nghẽn mạch máu v.v thì thông tin về các mạch máu (gồm hình dạng , màu sắc , vị trí ) là rất quan trọng Các yếu tố khác như cơ và xương là những yếu tố kém quan trọng hơn
Do vậy bài toán yêu cầu về trích ra các mạch máu trong một lớp các ảnh
CT , nén chúng lại để lưu trữ cũng như phục hồi dễ dàng là yêu cầu cần thiết
Nó không những giúp giảm chi phí lưu trữ , truy vấn và chuẩn đoán dễ dàng
mà còn giúp cho việc mô hình hóa đối tương 3D mà nhờ đó các bác sĩ sẽ có cai nhìn trực quan hơn
Bài toán sẽ trở nên phức tạp và khó khăn hơn nhiều khi có thêm các yêu cầu sau : phân biệt và trích các mạch máu lẫn trong xương , các mạch máu kết hợp với nhau hay nội suy các mạch máu còn thiếu v.v
Trang 16Hình 1.9 Các dạng phức tạp của mạch máu người 1.3 Các hướng giải quyết cho bài toán
Bài toán nén ảnh y khoa dựa trên đặc trưng não người được chia làm các yêu cầu cụ thể sau : Trích xuất các thông tin về mạch máu não , lựa chọn phương pháp nén hiệu quả ảnh với các thông tin đặc trưng này , khôi phục lại ảnh gốc và mô hình hóa mạch máu giúp cho việc chuẩn đoán bệnh
Trong thông tin của các mạch máu thì đường biên của chúng đóng một vai trò quan trọng trong chuẩn đoán bệnh Vì vậy chúng tôi áp dụng phép biến đổi Contourlet để có thể trích xuất các đối tượng mạch máu rõ ràng hơn so với các thuật toán phân ngưỡng thông thường
Cũng phép biến đổi Contourlet chúng tôi thực hiện nén các ảnh dựa trên các đặc trưng vừa trích xuất được Hiệu xuất nén và phục hồi ảnh bằng contourlet cũng như wavelet nhưng các thông tin lưu trữ có tính chất đa hướng
Do vậy khi phục hồi ảnh các đường biên được rõ nét hơn so với biến đổi wavelet
Cuối cùng sẽ là những kết quả thực nghiệm để so sánh hiệu quả giữa trích xuất đặc trưng mạch máu não dựa trên phép biến đổi contourlet với phương pháp Kmeans, so sánh tỉ lệ nén và phục hồi giữa phép biến đổi wavelet
và contourlet,
Trang 17Chương 2 – CƠ SỞ LÝ THUYẾT
2.1 Phương pháp Kmeans
2.1.1 Giới thiệu
Thuật toán gom nhóm K-mean được phát triển bởi J.MacQueen (1967)
và sau đó là J A Hartigan and M A Wong khoảng những năm 1975
Thuật toán Kmeans dùng để phân loại hay nhóm các đối tượng dựa trên các thuộc tính hay các đặc điểm riêng thành K nhóm các đối tượng
Việc gom nhóm dựa trên nguyên tắc cực tiểu hóa tổng bình phương khoảng cách giữa dữ liệu và trọng tâm của các nhóm tương ứng Do đó mục đích của việc gom nhóm K-mean chính là phân loại dữ liệu
Hình 2.1 Thuật toán gom nhóm K-mean 2.1.2 Sơ đồ thuật toán
Thuật toán K-mean là một quá trình lặp cho đến khi nào phân hoạch được dữ liệu thành K nhóm theo một cấu trúc hoặc sự phân bố nào đó
Trang 18Hình 2.2 Sơ đồ thuật toán K-mean Sau đây là đoạn mã giả của thuật toán K-mean
Bước 1 : Xác định giá trị K sẽ phân chia số nhóm dữ liệu Trong đó K phải là
một số nguyên dương
Trang 19Bước 2 : Ban đầu bạn sẽ đặt chia bất kỳ một số điểm dữ liệu nào đó để phân
loại thành K nhóm bất kỳ Ở bước này bạn có thể nhóm các điểm dữ liệu một cách ngẫu nhiên hoặc có thể dùng phương pháp sau :
1 Lấy k điểm dữ liệu đầu tiên đặt làm k nhóm
2 Đối với N-k điểm còn lại so sánh để đưa vào k nhóm ban đầu nếu dữ liệu đó gần trọng tâm nhóm nhất Rồi sau đó tính lại trọng tâm của k nhóm đã thu được
Bước 3 : Lần lượt lấy từng điểm dữ liệu và tính toán khoảng cách của chúng
đến trọng tâm mỗi nhóm Nếu điểm dữ liệu vừa tính toán mà gần trọng tâm của một nhóm khác nhất, ta sẽ chuyển điểm dữ liệu này đến nhóm đó và tính toán lại trọng tâm của các nhóm dữ liệu nhận và mất dữ liệu
Bước 4 : Lập lại bước 3 cho đến khi nào điều kiện hội tụ đạt được Nghĩa là khi
bước 3 được lặp lại mà vẫn không có sự thay đổi nhóm của các điểm dữ liệu
Hình 2.3 Bước hội tụ của thuật toán K-mean 2.1.3 Áp dụng
Cho tám điểm trong mặt phẳng 2D gồm
Trang 20A1(2, 10) A2(2, 5) A3(8, 4) A4(5, 8) A5(7, 5) A6(6, 4) A7(1, 2) A8(4, 9)
Áp dụng thuật toán K-mean để phân chia tám điểm này thành 3 nhóm
Bước 1 : Chọn K = 3 (nhóm)
Bước 2 : Ta chọn ngẫu nhiên 3 điểm làm 3 nhóm đại diện là A1(2, 10),
A4(5, 8) and A7(1, 2)
Sau đó ta lập một bảng như sau
(2, 10) (5, 8) (1, 2) Điểm Trọng Tâm 1 Trọng Tâm 2 Trọng Tâm 3 Nhóm A1 (2, 10)
Nhìn vào bảng này ta thấy tám điểm được liệt kê thành 8 dòng trong cột
1 Và các trọng tâm của 3 nhóm là ba cột ở dòng 1 Cột cuối cùng sẽ dùng để phân loại 8 điểm sẽ thuộc nhóm nào trong 3 nhóm
Áp dụng công thức tính khoảng cách ρ(a, b) = |x2 – x1| + |y2 – y1| Ta
sẽ tính toán được các ô còn trống trong bảng như sau :
Trang 21(6, 4) (4, 9)
Trang 22Hình 2.4 Các bước lặp của thuật toán K-mean (abcdef)
Kết quả của thuật toán :
Về cơ bản bất cứ bài toán nào dạng , dữ liệu gồm nhiều loại và mỗi loại
có nhiều thuộc tính riêng Nếu muốn phân loại chúng dựa trên các thuốc tính
Trang 23này thì bạn có thể áp dụng thuật toán K-mean với K là số nhóm (loại) bạn muốn phân chia
2 Số lượng các nhóm K phải được xác định trước bằng tay
3 Với số lượng dữ liệu ít thì với cùng một nguồn dữ liệu nếu thứ tự nhập vào khác sẽ có thể cho kết quả gom nhóm khác nhau
4 Các thuộc tính của mỗi điểm dữ liệu đều có mức đánh giá là như nhau không phân biệt được thuộc tính nào quan trọng hơn thuộc tính nào
5 Đối với các điểm dữ liệu mà khoảng cách quá xa trọng tâm nếu gom nhóm sẽ dẫn đến việc tính lại trọng tâm không còn chính xác
2.2 Biến đổi Contourlet
2.2.1 Giới thiệu sơ lược về Contourlet
Nén ảnh thì rất cần thiết cho các ảnh y khoa và các hệ thống liên lạc trong việc lưu trữ và truyền dữ liệu y khoa Mục đích chính của nén ảnh là giảm bit rate cho việc thông tin liên lạc mà vẫn đảm bảo được chất lượng ảnh chấp nhận được
Rất nhiều các phương pháp nén đã được đề xuất cho các ảnh y khoa dựa trên JPEG và DCT Tuy nhiên kết quả nén tốt nhất vẫn là sử dụng biến đổi wavelet DWT Biến đổi Wavelet rời rạc 2D là một phép biến đổi tối ưu trong việc trích xuất ra được các điểm không liên tục trên các cạnh theo trục ngang
và dọc
Trong biến đổi DWT, một tín hiệu được đi qua hai bộ lọc thông thấp và thông cao lần lượt dọc theo các trục x và y Sau quá trình này ảnh được phân
Trang 24tích thành 4 ảnh subbands LL, HL, LH, HH Quá trình này có thể được tiếp tục
và được gọi là sự phân rã hình tháp
Hình 2.4 Sự phân rã hình tháp
Mặc dù biến đổi wavelet là một công cụ rất mạnh trong việc biểu diễn ảnh có các vùng trơn được tách biệt bởi các cạnh Tuy nhiên nó lại không xử lý tốt khi các cạnh là những đường cong trơn
Hình 2.5 So sánh khả năng lưu trữ thông tin biên của Contourlet với Wavelet
Để đáp ứng yêu cầu về các cạnh có độ cong trơn ( đây là một thông tin quan trọng cần phải giữ trong các ảnh y khoa) Một phép biến đổi mới có tên là Contourlet được giới thiệu gần đây bởi Minh Do và Vetterli Đó là một biến đổi ảnh có tính chất hình học để biểu diễn ảnh mà trong đó các thông tin về ngữ cảnh và biên được bảo toàn
Phép biến đổi contourlet có tính chất xấp xỉ tốt đối với các hàm 2D và xây dựng được một cấu trúc không gian rời rạc tốt giúp cho việc tính toán một cách hiệu quả Biến đổi là sự phân rã tín hiệu có hướng và đa phân dải dựa trên
sự kết hợp giữa hai phương pháp : Laplace Pyramid (LP ) và Directional Filter
Trang 25Bank (DFB) Trong đó LP sẽ có nhiệm vụ phân chia ảnh thành các subbands và DFB sẽ phân tích ảnh chi tiết để giữ lại các thông tin về hướng của ảnh
Hình 2.6 Mô hình cấu trúc của phép biến đổi Contourlet
2.2.2 Mô hình xây dựng biến đổi Contourlet [2]
Một bức ảnh tự nhiên luôn chứa đựng trong nó các cấu trúc hình học như là các thông tin đặc trưng chính mà mắt người có thể nhìn thấy được Biến đổi Wavelet 2D tách các điểm không liên tục trên các cạnh rất tốt nhưng lại không nhìn thấy được tính trơn dọc theo biên Hơn nữa wavelet chỉ có thể nắm bắt được thông tin về hướng một cách có giới hạn
Chúng ta có thể xem một ví dụ để so sánh wavelet với contourlet Giả sử
có một đường cong cần hai người vẽ dùng kỹ thuật tinh chế sao cho tăng độ phân giải từ thô đến tinh Một người vẽ đường theo hướng wavelet còn người còn lại theo hướng contourlet
Hình 2.7 Vẽ đường cong bằng Wavelet và nằng phương pháp tiếp cận mới
Trang 26Tính hiệu quả của hai người vẽ được đánh giá dựa trên cách làm nhanh nhất và ít nét vẽ nhất mà vẫn có thể xây dựng đường cong một cách chân thực nhất.Theo tiêu chuẩn đánh giá này, người vẽ tiếp cận theo hướng wavelet sẽ dùng các nét vẽ hình vuông dọc theo biên với nhiều các kích cỡ khác nhau dùng theo cấu trúc đa phân giải của wavelet Còn người áp dụng contourlet thì ngược lại tận dụng khai thác một cách hiệu quả tính trơn của biên bằng các nét
vẽ với các hình dạng hình chữ nhật dẹp khác nhau và quay các hướng khác nhau là có thể hoàn thành công việc
2.2.2.1 Các tính chất của biến đổi Contourlet
Biến đổi Contourlet có những thuộc tính riêng của nó Trong đó
có những tính chất tương tự như biến đổi contourlet nhưng cũng có những tính chất đặc trưng và nổi trội của nó so với các phép biến đổi khác
1 Đa phân giải: biểu diễn ảnh bắng contourlet cho phép ảnh được xấp xỉ qua nhiều mức từ thô cho đến đô phân giải tinh
2 Địa phương hóa:Các yếu tố cơ bản trong các biểu diễn ảnh địa phương hóa trong cả miền không gian và tần số
3 Lấy mẫu tới hạn: Trong một vài ứng dụng (như nén ảnh) biểu diễn ảnh có được từ các yếu tố cơ bản mà ít có sự dư thừa
4 Có hướng: Sự biểu diễn ảnh chứa các yếu tố có các hướng khác nhau nhiều hơn so với các phép biến đổi khác
5 Không đẳng hướng: Để có thể lấy được các biên trơn, sự biểu diễn chứa các yếu tố cơ bản dùng các cấu trúc hình học dẹp với các tỉ lệ khác nhau
Nhận xét ta thấy ba tính chất đầu tiên đã có trong phép biến đổi wavelet trong khi hai tính chất còn lại thì cách tiếp cận mới contourlet đáp ứng tốt hơn rất nhiều
2.2.2.2 Mô hình xây dựng
Xây dựng biến đổi contourlet cần một cấu trúc bộ lọc đôi mà qua
đó ảnh được phân tích thành các sparse expansions với các thông tin về hướng của biên Trong bộ lọc đôi này biến đổi Laplace Pyramid được áp dụng để có thể lấy được các điểm không liên tục Tiếp theo đó bộ lọc có hướng Directional
Trang 27filter bank kết nối các điểm này thành một cấu trúc tuyến tính Kết quả thu được sẽ là sự phân tích ảnh có dùng các yếu tố giống như trích biên nên được
lấy tên là Contourlet
2.2.2.3 Laplace Pyramids - Multiscale Decompostion
Một cách để ta thực hiện phân tích đa phân giải là dùng Laplacian Pyramid (LP) được Burt và Adelson đưa ra năm 1983 Việc phân tích LP ở mỗi mức sẽ cho ta phiên bản lấy mẫu xuống và miền tần số thấp của ảnh gốc và ảnh bandpass (là ảnh hiệu giữa ảnh gốc và ảnh lọc)
Hình 2.8 Bộ lọc Laplacian Pyramid và bộ lọc Directional Filter Bank Hình sau mô tả quá trình phân tích ảnh Trong đó H vả G là các
bộ lọc phân tích và tổng hợp và M là ma trận lấy mẫu Quá trình phân tích được tiến hành lặp nhiều lần trên tín hiệu thô
Trang 28Hình 2.9 Ví dụ về phân tích ảnh dùng Laplacian Pyramids
Trong các ứng dụng nén ảnh hay làm nhiễu, các hệ số trong miền biến đổi phải được xử lý nhiều hơn và chính điều này sẽ gây ra lỗi khi lượng tử hóa hay phân ngưỡng hệ số Các hệ số này sau khi xử lý sẽ dùng để khôi phục ảnh gốc Trong khi đó với LP thuật toán khôi phục ảnh đơn giản hơn nhiều – cộng ảnh prediction từ mức thô với ảnh bandpass ở mức đó – sẽ giúp khôi phục ảnh một cách hoàn thiện hơn
Trang 29Hình 2.10 Ví dụ về tổng hợp ảnh dùng Laplacian Pyramids Laplacian Pyramid lại có một hạn chế là implicit oversampling Vì vậy trong các ứng dụng nén ảnh, thường người ta dùng kỹ thuật mã hóa băng con hay biến đổi wavelet mà mô hình lấy mẫu chính xác hơn và việc phân tích có tính trực giao
Tuy nhiên Laplacian Pyramid có nhiều lợi điểm so với cách dùng wavelet để phân tích ảnh ở một số điểm sau :
1 LP ở mỗi mức chỉ tạo ra một ảnh bandpass đễ dễ dàng thực hiện các thao tác tiếp theo
2 Ảnh bandpass không có tần số “scrambled” như wavelet Tần số scramled có là do ảnh sau khi qua Bộ lọc thông cao và lấy mẫu xuống lại được chuyển ngược vào bộ lọc tần số thấp và vì vậy phổ của nó sẽ bị ảnh hưởng.Trong khi ở LP ảnh hưởng này không xảy ra vì chỉ lấy mẫu xuống trên kênh bộ lọc thông thấp
LP được xây dựng dựa trên lý thuyết về frames và oversampled filter banks Trong đó G và H là các bộ lọc trực gao với nhau nghĩa là bộ lọc phân tích và tổng hợp là sự đảo ngược thời gian h[n] = g[-n] , g[n] thì trực giao với chuyển vị của nó dựa trên sampling lattice M Trong trường hợp này , chúng ta
sẽ sử dụng khôi phục tuyến tính tối ưu dùng các phép toán frame đối ngẫu
Hình 2.11 Bộ lọc tổng hợp tín hiệu
2.2.2.4 Directional Filter Banks - Directional Decomposition
Bamberger and Smith đã xây dựng bộ lọc có hướng 2D (2D directional filter bank) (DFB) có thể phân tích ảnh tối đa trong khi vẫn đảm bảo khôi phục lại đầy đủ DFB được tiến hành qua một cây phân tích nhị phân l cấp
để cho ra 2l
ảnh subbands với các miền tần số được phân chia như sau :
Trang 30Hình 2.12 Mặt phẳng chia miền tần số theo các hướng Một DFB được xây dựng thông qua hai blocks Block đầu tiên dùng bộ lọc quincunx hai kênh với dạng hình quạt (two-channel quincunx filter bank)
để chia phổ 2D thành hai hướng : hướng dọc và ngang
Hình 2.13 Two-channel quincunx filter bank
Tiếp đến là block thứ hai dùng phép toán shearing tương đương với việc sắp xếp lại các mẫu của ảnh.Hình sau là một ứng dụng của phép toán shearing biến đổi các cạnh có hướng góc -45othành các cạnh dọc
Trang 31Hình 2.14 Phép toán Shearing ảnh
Bằng việc thêm một cặp gồm phép toán shearing và phép toán ngược của nó trước và sau bộ lọc hai kênh chúng ta có thể thu được các miền tần số với hướng khác nhau trong khi vẫn đảm bảo khả năng phục hồi lại ảnh gốc
Vậy yếu tố chính yếu trong DFB là sự kết hợp chính xác của phép toán shearing với các thành phần hai hướng của bộ lọc quincunx ở mỗi node trong
bô lọc cấu trúc cây nhị phân và kết quả là ta thi được các phần chia mong muốn trong phổ 2D
Hình 2.15 Cấu trúc cây của DFB chia ảnh làm các hướng
2.2.2.5 Multiscale and directional Decomposition ( Contourlet ) Bằng việc kết hợp giữa Laplacian Pyramid và Directional Filter Bank , chúng ta có một phương pháp biễu diễn và phân tích ảnh mới mà với ưu điểm nổi trội sao với phương pháp trước là wavelet ở chỗ thông tin các hướng được