12 Bảng 2: Thời gian xử lý của các phương pháp trích chọn đặc trưng đối với một số ảnh được lấy trong bộ dữ liệu thử nghiệm... 48Hình 23: Minh họa histogram 150bin tương ứng của vector đ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Ờ Ớ Ẫ K A Ọ :
TS nh Anh h
h ng i
à ội – 2014
Trang 2MỤC LỤC
MỤC LỤC 1
LỜI CAM ĐOAN 3
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT 4
DANH MỤC CÁC BẢNG 5
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ 6
MỞ ĐẦU 8
1 Lý do chọn đề tài 8
2 Mục đích nghiên cứu 9
3 Đối tượng và phạm vi nghiên cứu 9
4 Phương pháp nghiên cứu 9
5 Bố cục luận văn 10
CHƯƠNG 1: TỔNG QUAN BÀI TOÁN PHÁT HIỆN BỆNH Ở LỢN QUA HÌNH ẢNH 10
1.1 Mô hình bài toán phát hiện bệnh ở lợn qua hình ảnh bằng sử dụng phương pháp phân loại hình ảnh 11
1.1.1 Chuẩn bị dữ liệu cho quá trình phân loại 12
1.1.2 Trích chọn đặc trưng 13
1.1.3 Phân loại ảnh 13
1.2 Giới thiệu một số loại bệnh ở lợn 13
1.2.1 Bệnh tai xanh (hội chứng rối loạn sinh sản và hô hấp trên lợn – Porcine Reproductive and Respiratory Syndrome - PRRS) 13
1.2.2 Bệnh lở mồm long móng 14
1.2.3 Bệnh đóng dấu lợn 15
1.2.4 Bệnh ghẻ ở lợn 17
1.2.5 Bệnh đậu mùa ở lợn 18
CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP XỬ LÝ ẢNH 20
2.1 Phân bố đặc trưng biên (Edge Histogram Descriptor) 20
2.2 Tương quan màu sắc (Color Correlograms) 23
Trang 32.3 Đặc trưng kết cấu sử dụng bộ lọc Gabor (Gabor Wavelets) 25
2.4 SIFT (Scale Invariant feature transform) 26
CHƯƠNG 3: PHƯƠNG PHÁP PHÂN LỚP SVM (SUPPORT VECTOR MACHINE) 36
3.1 SVM cho bài toán phân lớp tuyến tính 36
3.1.1 SVM với dữ liệu khả tách tuyến tính 39
3.1.2 SVM với dữ liệu không khả tách tuyến tính 41
3.2 SVM cho bài toán phi tuyến 43
3.3 SVM cho bài toán phân loại đa lớp (Multiclass Classification) 45
3.3.1 Chiến lược one – vs – all 46
3.3.2 Chiến lược one – vs – one 47
CHƯƠNG 4: KẾT QUẢ ĐẠT ĐƯỢC 48
4.1 Dữ liệu thử nghiệm 48
4.2 Xây dựng hệ thống 49
4.3 Kết quả thực nghiệm 49
4.3.1 Giai đoạn trích chọn đặc trưng 49
4.3.2 Giai đoạn phân loại tự động bằng SVM 55
4.4 Nhận xét 57
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 59
5.1 Các kết quả đạt được 59
5.2 Hạn chế 59
5.3 Hướng phát triển của đề tài 60
TÀI LIỆU THAM KHẢO 61
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan những nội dung trong luận văn này là công trình nghiên cứu của cá nhân tôi Mọi tham khảo dùng trong luận văn đều đƣợc trích dẫn rõ ràng tên tác giả, tên công trình, thời gian, địa điểm công bố Các nội dung nghiên cứu, số liệu và kết quả trình bày trong luận văn là trung thực và rõ ràng
Tác giả luận văn (Ký và ghi rõ họ tên)
Trang 5DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
1 SIFT Scale Invariant feature
transform
2 SVM Support vector machines Máy học vec-tơ hỗ trợ
3 EHD Edge Histogram Descriptor Phân bố đặc trưng biên
4 PRRS Porcine Reproductive and
Respiratory Syndrome
Hội chứng rối loạn sinh sản
và hô hấp trên lợn
5 WTO World Trade Organization Tổ chức thương mại thế giới
6 DoG Deffirence of Gaussisan Hàm sai khác Gaussian
7 RBF Radial Basis Function
Trang 6DANH MỤC CÁC BẢNG
Bảng 1: Số lượng ảnh về các loại bệnh ở lợn thu thập được 12
Bảng 2: Thời gian xử lý của các phương pháp trích chọn đặc trưng đối với một số ảnh được lấy trong bộ dữ liệu thử nghiệm 53
Bảng 3: Kết quả phân loại khi sử dụng nhân RBF với tham số t=2 56
Bảng 4: Kết quả phân loại khi sử dụng nhân tuyến tính với tham số t=0 56
Bảng 5: Kết quả phân loại khi sử dụng nhân đa thức với tham số t=1 56
Bảng 6: Kết quả phân loại khi sử dụng nhân sigmoid với tham số t=3 57
Trang 7DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1: Mô hình bài toán phát hiện bệnh của lợn qua ảnh chụp 12
Hình 2: Bệnh tai xanh ở lợn 14
Hình 3: Ảnh chụp một triệu chứng phổ biến của bệnh long móng lở mồm ở lợn là loét móng dẫn đến móng chân lợn bị bật ra ngoài 15
Hình 4: Ảnh chụp con lợn mắc bệnh đóng dấu trên sàn chuồng xi măng 16
Hình 5: Ảnh chụp bệnh ghẻ của lợn ở vị trí mông 18
Hình 6: Ảnh chụp biểu hiện bệnh đậu ở lợn 19
Hình 7: Năm loại bộ lọc biên 20
Hình 8: Ảnh được chia thành 16 sub-image, mỗi sub-image lại được chia thành N image-block 21
Hình 9: Phân cụm để tìm phân bố biên bán toàn cục 22
Hình 10: Biểu đồ thể hiện phân bố đặc trưng biên của ảnh 23
Hình 11: Hai ảnh khác nhau nhưng có histogram màu toàn cục giống nhau 23
Hình 12: Quá trình tính không gian đo (L) và hàm sai khác D 28
Hình 13: Quá trình tìm điểm cực trị trong các hàm sai khác DoG 30
Hình 14: Mô phỏng sử dụng công thức mở rộng của Taylor cho hàm DoG 31
Hình 15: Minh họa các bước của quá trình lựa chọn các điểm keypoints (a) là ảnh gốc (b) mô tả 832 điểm keypoints tìm được, các điểm keypoints được vẽ ở dạng một vector thể hiện 3 thông tin : vị trí, hướng và độ dài (c) sau khi đặt ngưỡng tương phản tổi thiểu ta giữ lại được 729 điểm (d) Giữ lại 536 điểm sau khi áp một ngưỡng nữa về hệ số độ cong 32
Hình 16: Mô tả tạo bộ mô tả cục bộ 34
Hình 17: Một đường thẳng tuyến tính phân chia 2 lớp điểm (hình vuông và hình tròn) trong không gian hai chiều [11] 37 Hình 18: Lề lớn nhất được tính toán bởi một SVMs tuyến tính Khu vực giữa hai đường mảnh xác định miền biên với -1 ≤ <w x> + b ≤ 1 Những điểm nằm trên hai đường đứt nét gọi là các điểm support vectors, đó là những điểm gần biên quyết
Trang 8định nhất Ở đây, có năm support vectors trên các cạnh của vùng biên (f(x) = -1 hoặc f(x)=1) 38Hình 19: Biên quyết định cho một SVM với một giá trị rất cao của C (bên trái) mà bắt chước hành vi của SVM biên cứng và do đó dẫn tới lỗi huấn luyện Một giá trị C nhỏ hơn (bên phải) cho phép bỏ qua điểm gần ranh giới, và làm lề lớn hơn[11] 42Hình 20: Mức độ tác động của kernel đa thức Kernel đa thức dẫn đến một sự phân tách tuyến tính (A) Kernel đa thức cho phép một ranh giới quyết định linh hoạt hơn (B - C)[11] 44Hình 21: Ảnh hưởng của số chiều Gaussian kernel (σ) cho một giá trị cố định của các hằng số biên mềm Đối với giá trị của σ (A) lớn quyết định ranh giới là gần như tuyến tính Khi giảm σ tính linh hoạt của ranh giới quyết định tăng (B) Giá trị σ nhỏ dẫn đến học quá (overfitting) (C)[11] 45Hình 22: Một số hình ảnh được lựa chọn làm dữ liệu thử nghiệm cho ứng dụng 48Hình 23: Minh họa histogram 150bin tương ứng của vector đặc trưng 150 chiều tìm được khi áp dụng phương pháp Phân bố đặc trưng biên trên một ảnh 49Hình 24: Minh họa histogram 144bin tương ứng của vector đặc trưng 144 chiều tìm được khi áp dụng phương pháp tương quan màu sắc trên một ảnh 50Hình 25: Minh họa histogram 48bin tương ứng của vector đặc trưng 48 chiều tìm được khi áp dụng phương pháp Gabor trên một ảnh 50Hình 26: Sử dụng Sift tìm được 525 điểm hấp dẫn (525 vector đặc trưng 28 chiều)
từ ảnh gốc ban đầu với ảnh đã được tách nền 51Hình 27: Sử dụng Sift tìm được 1462 điểm hấp dẫn (1462 vector đặc trưng 128 chiều) từ ảnh gốc ban đầu với ảnh chưa được tách nền, phần lớn các điểm đặc trưng tìm được lại thể hiện nền của ảnh 52Hình 28: Đồ thị so sánh thời gian xử lý của các phương pháp trích chọn đặc trưng ảnh 54Hình 29:Đồ thị so sánh thời gian xử lý của 3 phương pháp trích chọn đặc trưng ảnh 55
Trang 9MỞ ĐẦU
1 Lý do chọn đề tài
Việt Nam là một nước có nền nông nghiệp lâu đời Nông nghiệp giữ một vị trí hết sức quan trọng trong nền kinh tế quốc dân Cùng với đó nền kinh tế Việt Nam hiện nay đang từng bước hội nhập mạnh mẽ với nền kinh tế thế giới Năm 2006 nước ta đã chính thức trở thành thành viên thứ 150 của tổ chức thương mại quốc tế WTO, khi tham gia vào sân chơi chung này cơ hội mang đến cho nền kinh tế Việt Nam là rất lớn, nhưng bên cạnh đó WTO cũng đặt ra những thách thức không nhỏ cho nền kinh tế nhỏ bé của nước ta Thách thức ấy càng thể hiện sâu sắc với những ngành nghề nhạy cảm và khó điều chỉnh Có thể nói rằng: Nông nghiệp nói chung
và chăn nuôi nói riêng sẽ là ngành phải chịu áp lực to lớn khi chúng ta gia nhập WTO
Chăn nuôi hiện nay ở nước ta đang ngày càng được chú trọng phát triển, đặc biệt là ngành chăn nuôi lợn [1], bởi nhu cầu về thịt ngày càng tăng và truyền thống chăn nuôi lợn ở các hộ gia đình đã có từ lâu đời Sự phát triển của nền kinh tế hàng hóa càng tạo điều kiện thuận lợi thúc đẩy ngành chăn nuôi lợn phát triển mạnh mẽ hơn Do vậy, chăn nuôi lợn có vai trò rất quan trọng trong phát triển kinh tế nông nghiệp, nông thôn, cũng như nền kinh tế nói chung
Mặt khác với lợi thế so sánh về điều kiện tự nhiên, xã hội, chăn nuôi lợn đang khẳng định cơ cấu chăn nuôi, góp phần nâng cao thu nhập cho người sản xuất
Xu hướng phát triển chăn nuôi lợn là một tất yếu khách quan, đáp ứng nhu cầu tiêu dùng của toàn xã hội Phát triển chăn nuôi lợn sẽ góp phần đẩy mạnh quá trình thực hiện công nghiệp hóa – hiện đại hóa nông nghiệp, nông thôn
Hiện nay, chăn nuôi lợn ở các hộ gia đình đang phát triển theo hướng tiến bộ
cả về chất lượng và số lượng Hầu hết người chăn nuôi đã biết áp dụng một số tiến
bộ khoa học kỹ thuật vào chăn nuôi để nâng cao năng suất chất lượng sản phẩm Bên cạnh những thành công trong chăn nuôi đó thì sự hiện diện của một số bệnh
Trang 10dịch vẫn thường xuyên gây ra những tổn thất đáng kể Vì thế việc chẩn đoán đúng bệnh để kịp thời đưa ra phương pháp phòng tránh và điều trị bệnh là việc làm vô cùng quan trọng Muốn vậy người chăn nuôi không thể chỉ dựa vào kinh nghiệm bản thân mà còn cần một đội ngũ chuyên môn hỗ trợ giàu kinh nghiệm Tuy nhiên ở nước ta hiện nay vẫn còn thiếu các đội ngũ chuyên môn này Điều này dẫn đến cần tìm hiểu và đưa ra phương pháp thích hợp để xây dựng một phần mềm ứng dụng tự động nhằm chẩn đoán bệnh trong lĩnh vực chăn nuôi
Luận văn này sẽ nghiên cứu các phương pháp xử lý ảnh số và phương pháp phân loại ảnh tự động, từ đó xây dựng cơ sở dữ liệu ảnh và hệ thống phần mềm giúp chẩn đoán một số bệnh trong lĩnh vực chăn nuôi lợn
2 Mục đích nghiên cứu
Trong lĩnh vực Nông nghiệp, chăn nuôi là ngành có vị trí quan trọng, nên việc chẩn đoán đúng bệnh để có các biện pháp phòng tránh và điều trị kịp thời là việc làm hết sức cần thiết Vì thế luận văn tập trung tìm hiểu và nghiên cứu các phương pháp xử lý ảnh số và phương pháp phân loại ảnh tự động, đồng thời tìm hiểu một số loại bệnh thường gặp ở lợn nhằm xây dựng cơ sở dữ liệu và phần mềm ứng dụng giúp chẩn đoán một số bệnh trong lĩnh vực chăn nuôi lợn
3 Đối tượng và phạm vi nghiên cứu
- Đề tài tập trung tiến hành tìm hiểu các biểu hiện trên da của một số loại bệnh hay gặp ở lợn
- Nghiên cứu các phương pháp xử lý ảnh số và phân loại ảnh tự động, sau khi sưu tập các dữ liệu ảnh chụp cá thể lợn bị bệnh
- Đánh giá kết quả, hiệu quả của các phương pháp trên đối với việc chẩn đoán bệnh ở lợn
4 Phương pháp nghiên cứu
- Phương pháp thu thập dữ liệu
Trang 11- Phương pháp chuẩn hóa, phân tích và xử lý dữ liệu
- Phương pháp mô đun hoá trong lập trình
5 Bố cục luận văn
Bố cục của luận văn được chia thành 5 chương như sau:
Chương 1: Tổng quan bài toán phát hiện bệnh ở lợn qua hình ảnh
- Chương 1 trình bày về mô hình bài toán phát hiện bệnh ở lợn qua hình ảnh
và các bước để giải quyết bài toán Đồng thời giới thiệu đặc điểm một số loại bệnh ở lợn mà luận văn sẽ dùng để thử nghiệm
Chương 2: Một số phương pháp xử lý ảnh
- Chương 2 trình bày bốn phương pháp xử lý (trích chọn đặc trưng) ảnh số: phân bố đặc trưng biên (Edge Histogram Descriptor), tương quan màu sắc (Color Correlograms), đặc trưng kết cấu sử dụng bộ lọc Gabor (Gabor Wavelets), SIFT (Scale Invariant feature transform)
Chương 3: Phương pháp phân lớp SVM (Support vector machines)
- Chương 3 giới thiệu bài toán phân lớp, trình bày phương pháp SVM cho bài toán phân lớp tuyến tính, SVM cho bài toán phân lớp phi tuyến và SVM cho bài toán phân loại đa lớp
Chương 4: Kết quả đạt được
- Chương 4 trình bày các kết quả đạt được, đưa ra nhận xét, đánh giá khi áp dụng phương pháp SVM trên các đặc trưng trích chọn trên ảnh từ bốn phương pháp xử lý ảnh số nêu ở chương 2
Chương 5: Kết luận và hướng phát triển
- Chương 5 bàn về những vấn đề đã giải quyết được và những vấn đề còn chưa giải quyết được trong phạm vi của đề tài và đề xuất hướng phát triển tiếp theo cho đề tài
Trang 12CHƯƠNG 1: TỔNG QUAN BÀI TOÁN PHÁT HIỆN BỆNH Ở LỢN
QUA HÌNH ẢNH
Trong quá trình phát triển của ngành chăn nuôi lợn thì người chăn nuôi cũng phải đối mặt với không ít khó khăn , đặc biệt là những bệnh ảnh hưởng trực tiếp đến thành tích sinh sản và tăng trưởng của lợn như bệnh tại xanh, bệnh dấu đỏ, bệnh lở mồm long móng, bệnh đậu mùa, và nhiều bệnh dịch nguy hiểm khác Để phát hiện
và điều trị các bệnh ở lợn được kịp thời, đa số các trang trại cần phải được những người có kinh nghiệm, các bác sĩ thú y đến kiểm tra xem xét các triệu chứng, biểu hiện lâm sàng của bệnh Trong nhiều trường hợp người chăn nuôi có thể gửi các ảnh chụp những biểu hiện ở lợn bệnh (như các biểu hiện bên ngoài như trên da, chân, móng, các bệnh tích trên nội tạng của lợn…) để được các chuyên gia phân tích và chẩn đoán đúng bệnh Tuy nhiên nếu tiến hành như vậy sẽ tốn rất nhiều thời gian trong việc chẩn đoán bệnh để phát hiện kịp thời đưa ra phương pháp điều trị Chính
vì thế mà bài toán phát hiện bệnh ở lợn qua ảnh chụp sao cho nhanh chóng thuận tiện đang ngày càng được quan tâm
1.1 Mô hình bài toán phát hiện bệnh ở lợn qua hình ảnh bằng sử dụng phương pháp phân loại hình ảnh
Nhiệm vụ của mô hình bài toán này đặt ra là xử lý tự động các thông tin trên ảnh chụp (các dấu hiệu bệnh tích trên da, trên móng, lưỡi của lợn…) từ đó phát hiện
ra các điểm tương tự của một loại bệnh nhằm đưa ra quyết định chính xác bệnh đó
là bệnh gì Cấu trúc của mô hình này sẽ gồm các bước như sau (tham khảo hình 1):
- Chuẩn bị dữ liệu cho quá trình phân loại
- Trích chọn đặc trưng
- Phân loại ảnh
Trang 13Hình 1: Mô hình bài toán phát hiện bệnh của lợn qua ảnh chụp
Sau đây là trình bày chi tiết, ý nghĩa, vai trò của từng bước trong mô hình bài toán trên
1.1.1 Chuẩn bị dữ liệu cho quá trình phân loại
Quá trình này chúng ta sẽ phải thu thập, lựa chọn các ảnh chụp thích hợp có nội dung là các triệu chứng, biểu hiện của bệnh tại các vị trí dễ thấy như tại da, tai, chân, móng, mồm, lưỡi của các cá thể lợn nhiễm bệnh Để thực hiện được công việc này tôi đã đến trang trại chăn nuôi, nơi có các đàn lợn nhiễm bệnh để thu thập hình ảnh, đồng thời tham khảo thêm các tài liệu, sách báo chuyên môn để có được các bức ảnh chụp biểu hiện bệnh của lợn Sau quá trình sưu tầm tôi đã tập hợp được một
cơ sở dữ liệu ảnh bao gồm 163 tấm ảnh của 5 loại bệnh thường gặp trên lợn, cụ thể như trình bày trong bảng 1:
Bảng 1: Số lượng ảnh về các loại bệnh ở lợn thu thập được
Phân loại Kết quả phân
Trang 141.1.2 Trích chọn đặc trưng
Để thực hiện quá trình phân lớp, bước trích chọn đặc trưng ảnh có vai trò rất quan trọng Đặc trưng ảnh ở đây chính là đặc trưng nội dung ảnh, là phân tích nội dung thực sự của các bức ảnh Nội dung ảnh được thể hiện bằng nhiều khía cạnh ví
dụ như màu sắc, hình dạng, kết cấu (texture), các đặc trưng cục bộ (local features) hay bất cứ thông tin nào có từ chính nội dung ảnh Trong đề tài này sử dụng một vài phương pháp trích chọn đặc trưng ảnh [9] như:
- Phân bố đặc trưng biên (Edge Histogram Descriptor)
- Tương quan màu sắc (Color Correlograms)
mở LibSVM (Chang and Lin (2011)[12]
1.2 Giới thiệu một số loại bệnh ở lợn
1.2.1 Bệnh tai xanh (hội chứng rối loạn sinh sản và hô hấp trên lợn – Porcine Reproductive and Respiratory Syndrome - PRRS)
Là bệnh truyền nhiễm [15] [16] do virus thuộc họ Arteviridae gây ra, được phát hiện năm 1986 ở Mỹ
Triệu chứng: Lợn bệnh bị sốt với nhiệt độ dao động từ 39 – 400C, thở nhanh
và sâu, sung huyết dưới da sau đó chuyển sang tím xanh ở phía tai, mũi, ở vú và âm
hộ đối với lợn nái Lợn bỏ ăn, ủ rũ ngoài ra còn có thể có các triệu chứng khác như thần kinh rối loạn vận động, đi vòng tròn, té ngã
Trang 15- Lợn nái: trong giai đoạn cấp tính hầu hết lợn bệnh bị sảy thai, khoảng 80%
bị sảy thai vào giai đoạn cuối Nếu lợn mắc bệnh và qua khỏi thì lợn chậm lên giống, con đẻ ra chết yểu hoặc sảy thai
- Lợn đực: lờ đờ có thể có biểu hiện tái xanh ở tai, giảm khả năng sinh dục, tinh trùng bị giảm cả về lượng và chất
- Lợn con: bị nhiều trước và sau cai sữa, lợn con có thể có viêm kết mạc mắt, phù thũng mí mắt, da có màu xanh tái lông xù khô, tiêu chảy kéo dài, phân vàng, phân nâu, thở khó nhưng không ho
Hình 2: Bệnh tai xanh ở lợn
1.2.2 Bệnh lở mồm long móng
Virus gây bệnh là Aphthovisus, thời gian ủ bệnh 2 – 7 ngày Tình trạng bệnh phụ thuộc vào chủng, độc lực của virus và phụ thuộc vào khả năng đề kháng của cơ thể [15][17]
Trang 16Triệu chứng: Lợn bệnh sốt dưới 410C, các mụn nhỏ mọng nước ở lưỡi, trong miệng, mõm, đường kính từ 0,5 – 1 cm, sau vỡ ra thành vết loét đỏ rồi chuyển màu xám có phủ bựa trắng Đặc biệt ở chân, quanh móng mọc các mụn loét, ở con cái, mụn loét còn ở xung quanh vú, loét miệng làm lợn khó ăn, loét móng làm lợn đi lại khó khăn hoặc không đi được
Lợn trưởng thành có thể chết khoảng 5% và lợn con chết khoảng 50% Virus typ O còn gây viêm cơ tim làm lợn chết tỷ lệ cao hơn
Hình 3: Ảnh chụp một triệu chứng phổ biến của bệnh long móng lở mồm ở lợn là
loét móng dẫn đến móng chân lợn bị bật ra ngoài
Trang 17- Thể quá cấp tính: Thường gặp ở đầu ổ dịch bệnh, phát rất nhanh, con vật biểu hiện điên cuồng lồng lộn, sốt cao 41 – 420C sau đó dãy rụa rồi chết
- Thể cấp tính: Lợn sốt cao kéo dài 2 – 3 ngày, kém ăn hoặc bỏ ăn chui vào chỗ tối hay các ổ rơm Lợn ỉa phân táo bón, nhiều phân đóng cục đen có màng nhày bao bọc Vài ba ngày sau trên da lợn hình thành những đám tụ máu có hình dạng nhất định dễ nhận biết: vuông, tròn, bầu dục, trám…Đám tụ máu có giới hạn nhất định so với các tổ chức xung quanh, dấu nổi cộm ở trên bề mặt da Lợn có biểu hiện khó thở nhưng không đặc trưng, với lợn nái chửa thường có đấu hiệu sảy thai
- Thể mãn tính: Thể này xuất hiện ở lợn 3 – 4 tháng tuổi, con vật có biểu hiện
ăn uống kém, gầy còm thiếu máu niêm mạc nhợt nhạt, thân nhiệt sốt nhẹ, đi ỉa dai dẳng Có biểu hiện què, viêm khớp Da hoại tử bong lên cuộn lại giống như tấm bìa
Hình 4: Ảnh chụp con lợn mắc bệnh đóng dấu trên sàn chuồng xi măng
Trang 181.2.4 Bệnh ghẻ ở lợn
- Là bệnh ký sinh trùng ngoài da của lợn do loại ghẻ ngứa Sarcoptes suis gây nên, kèm theo viêm da mãn tính với triệu chứng ngứa, hình thành các nếp nhăn và vẩy dầy [15]
- Chu kỳ phát triển của ghẻ diễn ra trong vòng 10-20 ngày Vòng đời của ghẻ kéo dài từ 6-8 tuần
- Bệnh lây trực tiếp từ lợn ghẻ sang lợn khoẻ hoặc qua các dụng cụ chăn nuôi Trong điều kiện vệ sinh, môi trường bị ô nhiễm, tỷ lệ mắc bệnh ghẻ rất cao
* Triệu chứng
- Nơi ghẻ đào hang biểu hiện ngứa, da bị đỏ, thân nhiệt tăng
- Lúc đầu ghẻ thường thấy ở vùng da quanh mắt, má và trong tai, sau đó lây sang các phần khác ở những vùng bị ghẻ nặng, có nhiều mụn nhỏ và sau khi cọ sát
Trang 19Hình 5: Ảnh chụp bệnh ghẻ của lợn ở vị trí mông
1.2.5 Bệnh đậu mùa ở lợn
Bệnh do 1 trong 2 loại virut hoặc là Vaccinia virut, hoặc virut đậu lợn (Suipoxvirut) Truyền bệnh do tiếp xúc trực tiếp, chấy, bọ chét, rận hút máu (Haematopinus Suis), côn trùng (ruồi, muỗi) truyền từ lợn bệnh sang lợn cảm
nhiễm.Virut thâm nhập vào da qua những vết xước, sinh sôi lên nhanh chóng và tấn công da sau khi nhiễm virut máu [15]
Trang 20khuẩn thứ cấp Bệnh thứ phát khi nhiễm Streptococci, Staphylococci dẫn đến viêm
da, viêm phổi, ỉa chảy
Hình 6: Ảnh chụp biểu hiện bệnh đậu ở lợn
Trang 21CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP XỬ LÝ ẢNH
Để thực hiện quá trình phân loại hình ảnh, bước trích chọn đặc trưng ảnh có vai trò rất quan trọng Đặc trưng ảnh ở đây chính là đặc trưng nội dung ảnh, là phân tích nội dung thực sự của các bức ảnh Nội dung ảnh được thể hiện bằng màu sắc, hình dạng, kết cấu (texture), các đặc trưng cục bộ (local features)… hay bất cứ thông tin nào có từ chính nội dung ảnh Trong rất nhiều đặc trưng có thể trích chọn trên ảnh số, luận văn lựa chọn 4 phương pháp trích chọn đặc trưng để đánh giá: Phân bố đặc trưng biên (Edge Histogram Descriptor), tương quan màu sắc (Color Correlograms), đặc trưng kết cấu sử dụng bộ lọc Gabor (Gabor Wavelets), đặc trưng SIFT (Scale Invariant feature transform)
2.1 Phân bố đặc trưng biên (Edge Histogram Descriptor)
Phân bố đặc trưng biên là một đặc trưng được định nghĩa trong chuẩn MPEG – 7 [2][3][9] Có 5 loại biên được định nghĩa: dọc, ngang, góc 45 độ, 135 độ, và vô hướng được sử dụng để tính các phân bố đặc trưng biên
c)biên góc 450(45 degree edge)
d)biên góc 1350(135 degree edge)
e) biên vô hướng (non directional edge)
Hình 7: Năm loại bộ lọc biên
Phân bố đặc trưng biên được chia làm 4 loại: phân bố đặc trưng biên cục bộ, phân bố đặc trưng biên toàn cục, phân bố đặc trưng biên bán toàn cục, và phân bố đặc trưng biên được kết hợp từ ba loại trên
a) Đầu tiên là cách tính phân bố đặc trưng biên cục bộ:
- Chia ảnh ra thành 4x4 vùng ảnh (sub-image), tại mỗi sub-image này ta sẽ tính được 1 histogram thể hiện phân bố biên
Trang 22- Cách tính phân bố đặc trƣng biên cho từng vùng ảnh nhỏ (sub-image):
Áp dụng năm bộ lọc biên đã nêu ở hình 7 ta tính đƣợc 5 biên của một khối ảnh (image-block) theo công thức sau:
Trang 23Tuy nhiên chỉ sử dụng Histogram đặc trƣng biên cục bộ là chƣa đủ, chúng ta nên
sử dụng kết hợp với đặc trƣng biên toàn cục và bán toàn cục
b) Đặc trƣng biên toàn cục đƣợc tính nhƣ sau:
Ta tính phân bố 5 biên đặc trƣng cho toàn ảnh đƣợc 1 histogram với 5 bin ứng với 5 loại biên
c) Đặc trƣng biên bán toàn cục đƣợc tính nhƣ sau:
Ta chia ảnh ra thành 13 cụm nhƣ sau
Hình 9: Phân cụm để tìm phân bố biên bán toàn cục
Tính phân bố 5 loại biên cho mỗi cụm trên cuối cùng ta sẽ có 1 Histogram với 65 (13x5) bin
Nhƣ vậy ta sẽ tìm đƣợc một Histogram cho toàn bộ bức ảnh với 150 bin (80bin cục bộ + 5 bin toàn cục +65 bin bán toàn cục)
Ví dụ: với hình ảnh đƣợc chỉ ra ở hình 8 ta tính đƣợc phân bố đặc biên nhƣ biểu đồ sau:
Trang 24Hình 10: Biểu đồ thể hiện phân bố đặc trưng biên của ảnh
2.2 Tương quan màu sắc (Color Correlograms)
Như chúng ta đã biết Histogram màu được sử dụng rất nhiều để tính vector đặc trưng cho ảnh, đây là 1 đặc trưng toàn cục rất dễ tính và không phụ thuộc hoặc
ít phụ thuộc vào 1 số phép biến đổi hình học như phép quay, phép tịnh tiến, phép zoom Tuy nhiên nó lại thiếu thông tin liên quan đến việc phân bố không gian màu sắc nên rất dễ bị sai khi đối sánh ảnh, hình 10 thể hiện hai ảnh B và ảnh C hoàn toàn khác nhau mặc dù có hai histogram màu sắc toàn cục giống nhau
Trang 25Vì thế chúng ta nên nghĩ đến một cách tiếp cận mới là tương quan màu sắc (color correlograms)[4][5][9] Các điểm nổi bật của đặc tính này là không chỉ mô tả phân phối màu của các điểm ảnh mà còn thể hiện được mối quan hệ về không gian giữa các cặp màu theo khoảng cách Phương pháp này rất dễ tính toán, tạo ra vector đặc trưng có kích thước nhỏ Cách tính như sau:
Ta đặt I là ảnh có kích thước n x n, trong ảnh này có m màu ký hiệu là c1, c2,…, cm
Với mỗi pixel p =(x,y) thuộc I, gọi I(p) là màu của pixel p
Đặt Ic={p | I(p)=c} Khi đó kí hiệu p Ic tương đương với pI, I(p)=c
Ta định nghĩa khoảng cách p1 với p2 như sau:
Với mỗi pixel có màu ci trong ảnh I, ( ) là xác suất tìm thấy một pixel có màu cj cách pixel ban đầu một khoảng cách bằng k
Để giảm chi phí tính toán và số chiều của vector đặc trưng ta cũng có thể chỉ tính tương quan cho các cặp màu giống nhau
Trang 26Lưu ý : Khi chọn khoảng cách d, nếu chọn giá trị d lớn thì cần nhiều chi phí tính toán và không gian lưu trữ, nếu chọn giá trị d nhỏ có thể làm giảm giá trị của đặc trưng
Tùy thuộc vào việc chọn số bin màu và số khoảng cách d ta sẽ có được các vector đặc trưng, giả sử ta chọn 36 bin màu và khoảng cách d={1,3,5,7} ta sẽ thu được vector đặc trưng với 36x4 =144 chiều
2.3 Đặc trưng kết cấu sử dụng bộ lọc Gabor (Gabor Wavelets)
Trong xử lý ảnh, bộ lọc Gabor [7][6][8][9]là một bộ lọc tuyến tính thường được sử dụng để phát hiện biên, phân vùng ảnh, phân tích đặc trưng ảnh, phân lớp ảnh Hàm sóng con Gabor trong miền không gian có dạng như sau:
( )
* ( ) + ( ) Với và là các độ lệch chuẩn của phân bố Gaussian theo hướng x và y Sau đó một tập các lọc Gabor có thể thu được bởi các tỉ lệ và hướng quay thích hợp của g(x,y) :
x’=a-m(-xcosθ +ysinθ)
y’= a-m
(-xsinθ +ycosθ) Trong đó: θ=nπ/K, n=0,1,…K-1 và m=0,1,…S-1, K là số hướng quay, S là tỷ lệ co giãn
Trang 272.4 SIFT (Scale Invariant feature transform)
Một thuật toán tiêu biểu và có hiệu quả khá cao là dựa theo các đặc trưng cục
bộ bất biến trong ảnh: SIFT (Scale-invariant Feature Transform) do David Lowe đưa ra từ năm 2004 và đến nay đã có nhiều cải tiến trong thuật toán [10] Đặc trưng được trích chọn trong SIFT là các điểm đặc biệt (keypoint), các điểm này kèm theo các mô tả về nó và một véc tơ có lấy keypoint làm điểm gốc
Có bốn giai đoạn chính được thực hiện trong thuật toán để trích xuất các điểm đặc biệt và các đặc trưng của nó bao gồm:
a Dò tìm cực trị trong không gian đo (Scale-space Extrema Detection): Bước
đầu tiên này sẽ áp dụng hàm sai khác Gaussian (DoG - Deffirence of Gaussisan) để tìm ra các điểm có khả năng làm điểm đặc trưng tiềm năng (candidate keypoints), đó là những đểm rất ít phụ thuộc (bất biến) vào sự thu phóng ảnh và xoay ảnh
b Lọc và trích xuất các điểm đặc biệt (Keypoint localization): Từ những điểm
tiềm năng ở trên sẽ lọc và lấy ra tập các điểm đặc trưng tốt nhất (keypoints)
c Gán hướng cho các điểm đặc trưng (Oriented Assignment): Mỗi điểm đặc
trưng sẽ được gán cho một hoặc nhiều hướng dựa trên hướng gradient của ảnh Mọi phép toán xử lý ở các bước sau này sẽ được thực hiện trên những
Trang 28dữ liệu ảnh mà đã được biến đổi tương đối so với hướng đã gán, kích cỡ và
vị trí của mỗi điểm đặc trưng Nhờ đó, tạo ra một sự bất biến trong các phép
xử lý này
d Bộ mô tả điểm đặc trưng (Keypoint Description): Các hướng gradient cục bộ
được đo trong ảnh có kích cỡ cụ thể nào đó trong vùng lân cận với mỗi điểm đặc trưng Sau đó, chúng sẽ được biễu diễn thành một dạng mà cho phép mô
tả các tầng quan trọng của quá trình bóp méo hình dạng cục bộ và sự thay đổi
về độ sáng
Tập các điểm đặc biệt thu được thường phụ thuộc rất ít vào các phép biến đổi
cơ bản như xoay, phóng to, thu nhỏ, tăng giảm cường độ sáng, vì vậy có thể xem
đây là các đặc trưng mang tính cục bộ của ảnh
2.4.1 Dò tìm cực trị cục bộ
Như đã nêu ở trên, bước đầu tiên sẽ tìm các điểm tiềm năng có thể trở thành điểm đặc trưng bằng phương pháp lọc theo tầng dựa vào việc thay đổi tham số bộ lọc Gaussisan Trong bước này, ta cần dò tìm các vị trí và các số đo (kích cỡ) mà chúng bất biến trong các khung nhìn khác nhau của cùng một đối tượng Các vị trí
đó bất biến về số đo có thể được dò tìm bằng cách tìm kiềm các đặc trưng ổn định trên toàn bộ các số đo có thể, sử dụng một hàm liên tục về số đo vốn rất nổi tiếng có tên là hàm không gian đo (Witkin 1983)
Theo các công bố của Koenderink (1984) và Lindeberg(1994) thì hàm Gaussian là hàm tốt nhất để biễu diễn không gian đo của ảnh 2 chiều Vì vậy, không gian đo của một ảnh sẽ được định nghĩa như là một hàm L(x,y,σ) được tạo ra bằng cách nhân chập ảnh gốc I(x,y) với môt hàm Gaussian G(x,y,σ) có tham số về số đo thay đổi
L(x,y,σ) = G(x,y, ) * I(x,y) (14)
Trong đó toán hạng * là phép nhân chập các ma trận 2 chiều x,y Và G(x,y, σ) hàm Gaussian :
Trang 29Để tìm những điểm đặc trưng có tính bất biến cao, thuật toán được sử dụng là tìm cực trị cục bộ của hàm sai khác DoG (Difference-of-Gaussian), kí hiệu là D(x,y,σ ) Hàm này được tính toán từ sự sai khác giữa 2 không gian đo cạnh nhau của một ảnh với tham số đo lệch nhau một hằng số k
D(x,y,σ) = L(x,y,kσ) – L(x,y,σ) = (G(x,y,kσ) – G(x,y, σ)) * I(x,y) (16)
Các lý do lựa chọn hàm Gaussian là vì nó là kỹ thuật rất hiệu quả để tính toán
L (cũng như làm tăng độ mịn của ảnh), mà L thì luôn phải được tính rất nhiều để
mô tả đặc trưng trong không gian đo, và sau đó, D sẽ được tính một cách đơn giản chỉ với phép trừ ma trận điểm ảnh với chi phí thực hiện thấp
Hình 12: Quá trình tính không gian đo (L) và hàm sai khác D
Hơn nữa, hàm sai khác DoG có thể được sử dụng để tạo ra một sự xấp xỉ gần với đạo hàm bậc hai Laplace có kích thước chuẩn của hàm Gaussian (σ22
G) do tác giả Lindeberg đề xuất năm 1994 Ông đã chỉ ra rằng việc chuẩn hóa đạo hàm bậc hai với hệ số σ2
là cần thiết cho bất biến đo trở nên đúng Cụ thể, ông đã công bố rằng các giá trị cực đại và cực tiểu của σ22G chính là những giá trị có tính ổn định
Trang 30nhất (bất biến cao) so với một loạt các hàm đánh giá khác như : gradient, Hessian hay Harris
Mối quan hệ giữa D và σ22G được biễu diễn như sau :
( ) Như vậy, 2
G có thể được tính thông qua việc xấp xỉ sự sai khác hữu hạn ⁄ tại các tham số đo gần nhau kσ và σ :
Sau khi áp dụng hàm DoG ta thu được các lớp kết quả khác nhau (scale) từ ảnh gốc, bước tiếp theo là tìm các cực trị trong các lớp kết quả theo từng miền cục
bộ Cụ thể là tại mỗi điểm trên các lớp kết quả sẽ được so sánh với 8 điểm lân cận trên cùng lớp và 9 điểm lân cận trên mỗi lớp khác (hình dưới)
Trang 31Hình 13: Quá trình tìm điểm cực trị trong các hàm sai khác DoG
Trong hình trên: điểm đánh dẫu x sẽ được so sánh với 26 điểm lân cận (đánh dấu vòng tròn xanh) Điểm này sẽ được lấy làm điểm tiềm năng (điểm có thể làm điểm đặc biệt – candidate keypoint) nếu nó có giá trị lớn nhất hoặc nhỏ nhất so với
26 điểm lân cận như trên Giải pháp cho việc tìm các điểm tiềm năng này là sử dụng
thuật toán blob detection (dò tìm điểm) do Lindeberg đề xuất
Vì số lượng các cực trị là rất lớn, vì vậy để tăng sự hiệu quả khi dò tìm các điểm cực trị (dò các điểm cực trị tốt nhất thay vì phải dò hết), ta cần xác định tần số lấy mẫu trong không gian đo và tần số lấy mẫu trong không gian quan sát (không gian ảnh) Thật không may là ta không thể xác định cả 2 loại tần số này một cách động trong mỗi tiến trình dò tìm Thay vì vậy, các tần số này sẽ được xác định offline thông qua phương pháp thử nghiệm Sau khi thử nghiệm với nhiều nguồn dữ liệu ảnh khác nhau, tác giả đã chỉ ra tần số lấy mẫu trong không gian đo tốt nhất là 3 (giữ lại 3 lớp trong mỗi bộ 8 lớp), và tần số lấy mẫu σ = 1.6
2.4.2 Trích xuất keypoint
Sau bước 1 sẽ thu được rất nhiều điểm tiềm năng có thể làm điểm đặc biệt, tuy nhiên một số trong chúng là không cần thiết ở bước tiếp theo này sẽ loại bỏ các điểm có độ tương phản kém (nhạy cảm với nhiễu) hoặc tính đặc trưng cục bộ ít hơn các điểm khác hoặc có xu hướng là đường biên đối tượng Bước thực hiện này gồm
3 công đoạn :
Trang 32a Phép nội suy lân cận cho vị trí đúng của điểm tiềm năng:
Phép nội suy lân cận () sử dụng mở rộng Taylor (Taylor expansion) cho hàm Difference-of-Gaussian D(x,y,σ) :
( )
( ) Trong đó : D và đạo hàm của nó đƣợc tính tại một điểm tiềm năng và X = (x,y,σ) là khoảng cách từ điểm đó Vị trí của điểm cực trị đƣợc xác định bằng cách lấy đạo hàm của hàm trên với đối số X và tiến dần đến 0 :
Hình 14: Mô phỏng sử dụng công thức mở rộng của Taylor cho hàm DoG
̂
( ) Nếu > 0.5 theo một chiều nào đó thì nó có chỉ số cực trị không gần với các điểm tiềm năng khác, nó sẽ bị thay đổi và phép nội suy sẽ thay thế vai trò của nó bằng điểm khác gần nó