1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây xoài

26 320 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 1,03 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ý tưởng của nó là ánh xạ tuyến tính hoặc phi tuyến dữ liệu vào không gian các vector đặc trưng mà ở đó một siêu phẳng tối ưu được tìm ra để tách dữ liệu thuộc hai lớp khác nhau.. • SVM g

Trang 1

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA



NGUYỄN THỪA PHÁT TÀI

ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng – Năm 2018

Trang 2

Công trình được hoàn thành tại TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: TS HUỲNH HỮU HƯNG

Phản biện 1:

PGS TS HUỲNH CÔNG PHÁP

Phản biện 2:

TS NGUYỄN THÁI SƠN

Luận văn sẽ được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Khoa học máy tính tại Trường Đại học Bách khoa vào ngày

03 tháng 02 năm 2018

Có thể tìm hiểu luận văn tại:

 Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại học Bách

khoa

 Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa – ĐHĐN

Trang 3

MỞ ĐẦU

1 Lý do chọn đề tài

Hiện nay nông dân tại các tỉnh đồng bằng sông Cửu Long nói chung và tỉnh Trà Vinh nói riêng chỉ canh tác và trồng trọt chủ yếu chỉ dựa vào kinh nghiệm mà chưa biết ứng dụng khoa học và công nghệ vào trong sản xuất để nâng cao chất lượng sản phẩm, hiệu quả kinh tế nhằm giảm chi phí sản xuất

Chính vì vậy việc triển khai nghiên cứu các ứng dụng nhận dạng và xử lý ảnh để chẩn đoán bệnh trên cây Xoài, một loại cây trồng có giá trị kinh tế cao, nhằm giải phóng sức lao động, tiết kiệm thời gian, nâng cao năng suất là một việc làm hết sức có ý nghĩa trong giai đoạn này

Từ hiện trạng và những lý do trên tôi xin đề xuất đề tài: “Ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài”

2 Mục tiêu và nhiệm vụ nghiên cứu

2.1 Mục tiêu nghiên cứu

Nghiên cứu ứng dụng máy vectơ hỗ trợ trong việc chẩn đoán bệnh trên cây Xoài thông qua hình ảnh

2.2 Nhiệm vụ nghiên cứu

- Nghiên cứu tổng quan về xử lý ảnh số, nhận dạng mẫu, thuật

toán SVM

- Tìm hiểu và thu thập hình ảnh các loại bệnh trên Xoài ngoài

thực địa

- Phương pháp huấn luyện, nhận dạng và xử lý ảnh số

3 Đối tượng và phạm vi nghiên cứu

3.1 Đối tượng nghiên cứu

- Hình ảnh, các đặc trưng của cây Xoài bị bệnh và không bị

bệnh ngoài thực địa

- Nghiên cứu và áp dụng thuật toán SVM trong phân lớp và

nhận dạng

Trang 4

3.2 Phạm vi nghiên cứu

- Dùng thuật toán SVM trong phân tích mẫu và chẩn đoán

bệnh trên cây Xoài

4 Phương pháp nghiên cứu

4.1 Phương pháp nghiên cứu lý thuyết

- Tham khảo các đề tài, bài báo liên quan đến lĩnh vực nhận

dạng trái cây

- Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trưng

ảnh, xác định biên, nghiên cứu các kỹ thuật nhận dạng mẫu

4.2 Phương pháp nghiên cứu thực nghiệm

- So sánh và phân tích hình ảnh trái, lá cây Xoài có bệnh và

không bệnh ngoài thực địa

- Triển khai và cài đạt chương trình

5 Ý nghĩa khoa học và thực tiễn của luận văn

5.1 Ý nghĩa khoa học

Nghiên cứu nhằm ứng dụng khoa học và công nghệ vào sản xuất nông nghiệp, đưa ra giải pháp nhằm góp phần ứng dụng kỹ thuật nhận dạng và xử lý ảnh vào sản xuất nông nghiệp tại tỉnh Trà Vinh

5.2 Ý nghĩa thực tiễn

Góp thêm một giải pháp mới để nông dân chẩn đoán bệnh trên cây Xoài tại tỉnh Trà Vinh, góp phần giải phóng sức lao động, tiết kiệm chi phí và nâng cao năng suất cây trồng, tăng thu nhập cho nông dân

Trang 5

CHƯƠNG 1 -TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH 1.1 Các bước cơ bản trong xử lý ảnh số:

Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và

đồ hoạ đóng một vai trò quan trọng trong tương tác người máy

Trang 6

1.3.2 Tăng độ tương phản

Hình 1 3 Ảnh khi tăng tương độ phản

1.3.3 Biến đổi âm bản

1.3.6 Kỹ thuật cải thiện ảnh nhị phân

Hình 1 7 Minh hoạ của phép giãn ảnh

Trang 7

Quá trình nhận dạng dựa vào những mẫu học biết trước gọi là

nhận dạng có thầy hay học có thầy, trong những trường hợp ngược lại gọi là học không có thầy

Trang 8

1.5.2 Support vector machine (SVM)

SVM là một phương pháp phân lớp xuất phát từ lý thuyết học thống kê SVM sẽ cố gắng tìm cách phân lớp dữ liệu sao cho có lỗi xảy ra trên tập kiểm tra là nhỏ nhất

Ý tưởng của nó là ánh xạ (tuyến tính hoặc phi tuyến) dữ liệu vào không gian các vector đặc trưng mà ở đó một siêu phẳng tối ưu được tìm ra để tách dữ liệu thuộc hai lớp khác nhau

Hình 1 10 H2 là siêu phẳng tốt nhất

1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors)

1.5.4 Mô hình Markov ẩn (Hidden Markov Models)

1.5.5 Mạng nơ-ron nhân tạo

1.6 Đánh giá ưu điểm của thuật toán SVM

• SVM rất hiệu quả để giải quyết bài toán dữ liệu có số chiều lớn

• SVM giải quyết vấn đề overfitting rất tốt (dữ liệu có nhiễu và tách dời nhóm hoặc dữ liệu huấn luyện quá ít)

• Là phương pháp phân lớp nhanh

• Có hiệu suất tổng hợp tốt và hiệu suất tính toán cao

KẾT CHƯƠNG

Chương 1 tác giả đã trình bày tổng quan về các vấn đề liên quan tới nhận dạng và xử lý ảnh số Tiếp theo chương 2, tác giả sẽ trình bày chi tiết về nhận dạng và phân tích mẫu, ứng dụng thuật toán SVM để chẩn đoán bệnh trên cây Xoài

Trang 9

CHƯƠNG 2 – PHƯƠNG PHÁP NHẬN DẠNG

VÀ PHÂN LOẠI 2.1 Các công trình nghiên cứu liên quan

2.2 Trích xuất đặc trưng trong đánh và phân loại trái cây:

2.2.1 ử dụng đặc trưng màu sắc

2.2.2 Trích chọn đặc trưng màu cho bài toán so màu lá lúa

Hình 2 1 Minh họa trích đặc trưng màu với moment thứ nhất

Hình 2.2 Minh họa trích đặc trưng màu với 3 moment màu

2.2.3 ử dụng đặc trưng kết cấu

2.2.4 ử dụng đặc trưng Gist và Gist descriptor

2.3 Các phương pháp phân loại trái cây:

2.3.1 Phân biệt phần cuống và khiếm khuyết thực tế trên trái cây

Trang 10

Hình 2.3 Mô hình phân biệt phần cuống với các khiếm khuyết trên

trái cây

2.3.2 Kết hợp các thống kê màu sắc và đặc trưng kết cấu để nhận biết bệnh táo

Trang 11

2.3.3 Nghiên cứu xây dựng hệ thống h trợ nông dân so màu

Trang 12

CHƯƠNG 3 – ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG

CHẨN ĐOÁN BỆNH TRÊN XOÀI 3.1 Phương pháp phân lớp dữ liệu máy vector hỗ trợ SVM

3.1.1 Giới thiệu

SVM thực hiện chuyển tập mẫu từ không gian biểu diễn Rn

của ch ng sang một không gian Rd

có số chiều lớn hơn Trong không gian Rd tìm một siêu phẳng tối ưu để phân hoạch tập mẫu này dựa trên phân lớp của ch ng

3.1.2 Ý tưởng của phương pháp

Cho trước một tập huấn luyện, được biểu diễn trong không gian vector, trong đó mỗi tài liệu là một điểm, phương pháp này tìm

ra một siêu phẳng f quyết định tốt nhất có thể chia các điểm trên

không gian này thành hai lớp riêng biệt tương ứng là lớp + và lớp - Chất lượng của siêu phẳng này được quyết định bởi khoảng cách (gọi

là biên) của điểm dữ liệu gần nhất của mỗi lớp đến mặt phẳng này Khi đó khoảng cách biên càng lớn thì mặt phẳng quyết định càng tốt, đồng thời việc phân loại càng chính xác

Trang 13

3.1.3 Các bước chính của phương pháp

Phương pháp SVM yêu cầu dữ liệu được diễn tả như các vector của các số thực Như vậy nếu đầu vào chưa phải là số thì ta cần phải tìm cách chuyển ch ng về dạng số của SVM

• Tiền xử lý dữ liệu: Thực hiện biến đổi dữ liệu phù hợp cho quá trình tính toán, tránh các số quá lớn mô tả các thuộc tính Thường nên co giãn (scaling) dữ liệu chuyển về đoạn [-1,1] hoặc [0,1]

• Chọn hàm hạt nhân: Lựa chọn hàm hạt nhân phù hợp tương ứng cho từng bài toán cụ thể để đạt độ chính xác cao trong quá trình phân lớp

• Thực hiện việc kiểm tra chéo để xác định các tham số cho ứng dụng: Điều này cũng quyết định đến tính chính xác của quá trình phân lớp

• Sử dụng các tham số cho việc huấn luyện với tập mẫu: Trong quá trình huấn luyện sẽ sử dụng thuật toán tối ưu hóa khoảng cách giữa các siêu phẳng trong quá trình phân lớp, xác định hàm phân lớp trong không gian đặc trưng nhờ việc ánh xạ dữ liệu vào không gian đặc trưng bằng cách mô tả hạt nhân và cuối cùng là kiểm thử tập dữ liệu

3.1.4 Cơ sở lý thuyết

Hình 3 1 Minh họa cho bài toán phân hai lớp

3.2 Chẩn đoán bệnh trên xoài với máy vetor hỗ trợ SVM: 3.2.1 Mô tả bài toán

Trang 14

Để nhận dạng và chẩn đoán bệnh trên xoài, tác giả đề xuất thực hiện các bước xử lý như sau:

Bước 1: thu nhận tạp ảnh huấn luyện và ảnh kiểm tra

Bước 2: thực hiện các bước tiền xử lý, nâng cao chất lượng

ảnh, chuyển ảnh màu RGB sang ảnh màu HSV, tách các kênh H,

S, V riêng biệt

Bước 3: Trích xuất đặc trưng, tính giá trị trung của mỗi kênh

màu HSV và độ lệch chuẩn của mỗi kênh màu trong không gian màu HSV làm tham số cho màu sắc, Ảnh màu kênh màu V được dùng trích lọc đặc trưng kết cấu, ảnh V làm tham số đầu vào kết hợp sóng con Gabor và lược đồ mức xám được tính toán bằng ma trận GLCM để trích lọc đặc trưng kết cấu đưa vào huấn luyện

Bước 4: thuật toán SVM được sử dụng để thực hiện phân lớp,

so khớp các tham số đặc trưng của mẫu xoài cần kiểm tra với tập CSDL các đặc trưng của lá/trái xoài đã được phân lớp, kết quả trả về là/trái xoài bị bệnh gì hoặc không bệnh

3.2.2 Mô hình giải quyết bài toán

Hình 3 2 Mô hình chẩn đoán bệnh trên cây xoài

3.3 Tiền xử lý

3.3.1 Tăng/giảm độ tương phản của ảnh

Trang 15

Nếu ảnh có độ tương phản kém so với nền, ta có thể thay đổi theo các hàm

Trong Matlab, để thực hiện nâng cao độ tương phản của ảnh

đầu vào in_img ta sử dụng câu lệnh sau:

Out_img = imadjust(in_img);

Hình 3 3 Độ tương phản của ảnh

3.3.2 Thực hiện phép co/giãn ảnh

Hình 3 4 Co giãn ảnh

3.3.3 Chuyển và tách ảnh màu RGB sang các kênh H-S-V

Chuyển ảnh màu RGB sang ảnh màu HSV và tách cách

kênh màu

Hình 3 5 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các

kênh màu

Trang 16

Giá trị của S và V nằm trong khoảng 0 (màu đen) và 1 (màu trắng), giá trị của H nằm trong khoảng 0 đến 360

Phương pháp tính độ lệch chuẩn (Standard Deviation) từ một dãy

n giá trị cho trước x1, x2, xn:

Bước 1: Tìm mean của dãy số đã cho (x1+x2+ +xn) / n

Bước 2: Với mỗi x trong dãy số đã cho, tính độ lệch (deviation)

của nó so với mean bằng phép tính (x - mean)

Bước 3: Tính bình phương của các giá trị thu được ở bước 2 Bước 4: Tìm mean của các bình phương độ lệch tìm được ở bước

3 Giá trị này được biết đến như là phương sai (Variance) σ2

Trang 17

màu V nổi rõ kết cấu nhất Sau đưa vào sóng con Gabor một ảnh đơn kênh mới có kết cấu rõ nhất được tạo ra (ảnh V’), ảnh V’ này được đưa vào ma trận đồng hiện mức xám để đo lường các giá trị kết cấu của ảnh V’ Kết quả từ ma trận đồng hiện mức xám được dùng làm

dữ liệu đầu xây dựng tập CSDL huấn luyện hoặc làm tham số đầu vào để phân lớp đối tượng

3.4.2.1 Sóng con Gabor – Gabor Wavelet

Trong xử lý ảnh, sóng con Gabor là một bộ lọc tuyến tính thường được sử dụng để phát hiện biên, phần vùng ảnh, phân tích đặc trưng ảnh, phân lớp ảnh, Tần số và hướng được thể hiện trong các sóng con Gabor tương tự như hệ thống thị giác của con người Tập hợp các sóng con Gabor với tần số và hướng khác nhau có thể trợ gi p cho việc trích lọc đầy đủ các đặc trưng trong ảnh Sóng con Gabor hai chiều (2-D Gabor) được áp dụng trong ảnh với tỉ lệ và tần

số khác nhau Hàm Gabor 2-D được biến đổi từ đường hình sin phức tạp của hàm Gaussian 2-D Hàm sóng con Gabor trong miền không gian có dạng như sau:

Bước sóng (λ - lamda) đại diện cho sóng của các tác nhân cosine của hàm Gaussian, hướng (θ - theta) đại diện cho hướng của các đường gạch sọc song song của hàm Gabor tại một góc nào đó (độ), độ lệch pha – phase offset (φ - phi) theo góc, và tỉ lệ hướng (γ - gamma) là tỷ

Trang 18

lệ co giãn trong không gian và nó xác định tính đơn giản của hàm Gabor, và độ lệch chuẩn σ xác định kích thước của hàm Gaussian

tuyến tính Băng thông (b) bán đáp ứng (half-response) trong không

gian tần số và tỉ lệ giữa σ/có quan hệ như sau:

Bảng 3 1 Tham số hàm Gabor Wavelet và đặc trưng kết cấu ảnh V Ảnh màu RGB Gabor Wavelet Ảnh kết cấu

36 , 10 , 1

, 5 0 ], 2 0 [ , 8

72 , 10 , 1

, 5 0 ], 2 0 [ , 8

108 , 10 , 1

, 5 0 ], 2 0 [ , 8

144 , 10 , 1

, 5 0 ], 2 0 [ , 8

180 , 10 , 1

, 5 0 ], 2 0 [ , 8

Trang 19

3.4.2.2 Ma trận đồng hiện mức xám Co-occurrence

GLCM là một trong những phương pháp trích lọc đặc trưng quan trọng trong lĩnh vực phân tích kết cấu ảnh được đề xuất từ rất sớm bởi Haralick vào năm 1973 GLCM của ảnh f(x,y) có kích thước MxM và có G mức độ xám là một ma trận hai chiều C(i, j) Mỗi phần

tử của ma trận thể hiện xác suất xảy ra cùng giá trị cường độ sáng i

và j tại một khoảng cách d và một góc θ xác định Do đó, có thể có nhiều ma trận GLCM khác nhau phụ thuộc vào cặp giá trị d và θ Một số đặt trưng quan trọng có thể kể đến như năng lượng (energy), độ tương phản (contrast), entropy, độ tương đồng (Correlation), tính đồng nhất (homogeneity)

Bảng 3 2 Các giá trị tham số của GLCM

Ảnh màu RGB Gabor Wavelet Các giá trị tham số của

GLCM

36 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.265715 Contrast: 0.143287 Correlation: 0.716450 Energy: 0.625673 Homogeneity: 0.632575

72 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.596124 Contrast: 0.343675 Correlation: 0.574691 Energy: 0.626423 Homogeneity: 0.451565

108 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.365885 Contrast: 0.241668 Correlation: 0.724789 Energy: 0.621576 Homogeneity: 0.594648

144 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.357885 Contrast: 0.341568 Correlation: 0.615239 Energy: 0.632326

Trang 20

Homogeneity: 0.548535

180 , 10 , 1

, 5 0 ], 0 [ , 8

Entropy: 0.432624 Contrast: 0.241714 Correlation: 0.527460 Energy: 0.621873 Homogeneity: 0.628845

3.5 Thực nghiệm

3.5.1 Một số hình ảnh tập mẫu huấn luyện trái xoài

3.5.1.1 Mẫu xoài không bệnh

Trang 21

Hình 3 10 lá bệnh ghẻ lồi

3.5.2.3 Mẫu lá bệnh thán thư

Hình 3 11 lá bệnh thán thư Yêu cầu của chương trình là thu nhận hình ảnh lá/quả xoài ở đầu vào, đầu ra của chương trình nhằm chẩn đoán lá/quả xoài có bệnh hay không, nếu có thì xác định là bệnh gì Hiện nay để xử lý ảnh ta có thể sử dụng các ngôn ngữ C#, Matlab,…Tôi lựa chọn ngôn ngữ lập trình Matlab vì trong thư viện của Matlab có nhiều hàm đã được hỗ trợ sẵn

3.5.3 Xử lý

Mở ảnh và thực hiện xử lý, trong giai đoạn này ta thực hiện cải thiện nhằm nâng cao chất lượng ảnh đầu vào, khử nền, lọc nhiễu, thay đổi độ phản,

Chuyển kênh màu ảnh RGB  HSV sử dụng bộ lọc Gabor để làm rõ đặc trưng kết cấu ảnh và thu nhận ảnh sóng con kết cấu với các đặc trưng rỏ nhất, sóng con Gabor dùng làm ảnh đầu vào cho GLCM để trích xuất được các tham số năng lượng (energy), độ tương phản (contrast), entropy, độ tương đồng (Correlation), tính đồng nhất (homogeneity),

Sau quá trình xử lý, kết quả ta thu được hình ảnh đã chuyển sang không gian màu HSV, các ảnh kênh H, kênh S, kênh V sẽ được lưu trữ làm dữ liệu đầu vào cho quá trình trích xuất các đặc trưng của ảnh, tính toán các tham số trung bình và độ lệch chuẩn giữa các kênh màu

Trang 22

Sau quá trình thực hiện ở các bước tiền xử lý ta được ảnh kết cấu và sóng con Gabor với các đặc trưng rõ nét nhất Ảnh này sẽ tiếp tục làm dữ liệu đầu vào cho GLCM để trích xuất các tham số đặc trưng Entropy, Contrast, Correlation, Energy, Homegeneity ứng với các giá trị λ , φ, γ, b, N, và hướng (góc) θ khác nhau

Hình 3 12 Giao diện trích xuất đặc trưng

Để lấy các tham số tạo ma trận đồng hiện trong Matlab ta dùng hàm:

I=imread(A) % đọc ảnh A

GLCM = graycomatrix(I) % tạo ra ma trận co-occurrence

cấp độ xám (GLCM) từ ảnh I

stats = graycoprops(GLCM, properties) % properties: thuộc

tính cần trích xuất Entropy, Contrast,…

Bảng 3 3 Các tham số đặc trưng được trích xuất từ tập ảnh huấn luyện

Ngày đăng: 02/04/2018, 21:44

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w