Đ I H C HU Ạ Ọ Ế
TR ƯỜ NG Đ I H C KHOA H C HU Ạ Ọ Ọ Ế KHOA CÔNG NGH THÔNG TIN Ệ
XÂY D NG H H TR QUY T Đ NH Ự Ệ Ỗ Ợ Ế Ị
D BÁO B NH KH M LÁ CÂY H TIÊU Ự Ệ Ả Ồ
GVHD: PGS.TS Lê M nh Th nh ạ ạ
H & Tên SV: Lê H ng Hà ọ ồ
Mã SV: 20CNQL002
L P: 20CNQL Ớ
TP HU , tháng 08 năm 2021 Ế
M C L C Ụ Ụ
Trang 2I Tìm hi u b nhể ệ kh m lá cây h tiêuả ồ
1 Tình hình cây h tiêuồ
2 Xây d ng h th ngự ệ ố
3 Đi u ki n xây d ng h th ngề ệ ự ệ ố
3.1 Tìm hi u nghi p v và d li uể ệ ụ ữ ệ
3.2 Chu n b d li uẩ ị ữ ệ
3.3 Mô hình hóa d li uữ ệ
3.4 H u x lý và đánh giá mô hìnhậ ử
3.5 Tri n khai mô hìnhể
4 Bài toán đ t raặ
4.1 Đi u ki n phát sinh, phát tri n c a b nh kh m láề ệ ể ủ ệ ả
4.2 Kh năng gây h iả ạ
II Phân tích d li u và xây d ng mô hình trong chu n đoán b nhữ ệ ự ẩ ệ
1 C u trúc h th ng ấ ệ ố
2 Các phương pháp thu th p d li uậ ữ ệ
3 Lược đ c s d li uồ ơ ở ữ ệ
4 T p d li uệ ữ ệ
5 Mô hình l a ch n – cây quy t đ nhự ọ ế ị
6 T p lu tậ ậ
III Giao di n h th ng h tr quy t đ nh d báo b nh kh m lá cây h tiêuệ ệ ố ỗ ợ ế ị ự ệ ả ồ Trình bày giao di n h th ngệ ệ ố
IV K t lu nế ậ
Trang 3I Tìm hi u kh m lá cây h tiêu ể ả ồ
1 Tình hình cây h tiêu ồ
Theo th ng kê c a T ng c c H i quan, tính đ n cu i tháng 6/2021, xu t kh u hố ủ ổ ụ ả ế ố ấ ẩ ồ tiêu c a Vi t Nam đ t 154.000 t n, kim ng ch 496 tri u USD, gi m 7% v lủ ệ ạ ấ ạ ệ ả ề ượng, tăng 39% v giá tr so v i cùng kỳ năm 2020, nh giá h tiêu tăng trong 5 thángề ị ớ ờ ồ liên ti p.ế
Đ i di n Hi p h i H tiêu qu c t (IPC) cho bi t, hi n t i, ngu n cung h tiêuạ ệ ệ ộ ồ ố ế ế ệ ạ ồ ồ toàn c u gi m do di n tích s n xu t h tiêu toàn c u gi m Đi u này đã đ y giá hầ ả ệ ả ấ ồ ầ ả ề ẩ ồ tiêu tăng cao b i nhu c u tiêu dùng không h gi m theo ngu n cung Thêm vào đó,ở ầ ề ả ồ
bi n đ i khí h u trong nh ng năm g n đây đã gây b t l i cho cây h tiêu phát tri n,ế ổ ậ ữ ầ ấ ợ ồ ể
b nh ch t nhanh, ch t ch m v n ra ra trên cây tiêu, chăm sóc h tiêu ngày càng khóệ ế ế ậ ẫ ồ khăn h n đã khi n cho năng su t h tiêu gi m.ơ ế ấ ồ ả
T i t nh Đ k L k, Đ k Nông giá tiêu ngày 25/8/2021 đạ ỉ ắ ắ ắ ược thu mua v i m cớ ứ 74.500 đ ng/kg, gi m 500 đ ng/kg.ồ ả ồ
2 Xây d ng h th ng ự ệ ố
Ngày nay v i s phát tri n c a công ngh thông tin, vi c ng d ng công nghớ ự ể ủ ệ ệ ứ ụ ệ thông tin vào vi c x lý thông tin và l u tr đệ ử ư ữ ược s d ng trong nhi u lĩnh v c, cử ụ ề ự ả trong nông nghi p Vi c m t lệ ệ ộ ượng l n d li u đớ ữ ệ ượ ưc l u tr và phân tích t o đi uữ ạ ề
ki n khai thác d li u ng d ng vào nông nghi p đ đem l i nh ng công c , b ngệ ữ ệ ứ ụ ệ ể ạ ữ ụ ả
bi u có ích và khai phá d li u.ể ữ ệ
K thu t phân l p d li u trong khai phá d li u nh m xây d ng h th ng h trỹ ậ ớ ữ ệ ữ ệ ằ ự ệ ố ỗ ợ
ch n đoán b nh kh m lá cây h tiêu Đ a ra m t s gi i thu t và các phẩ ệ ả ở ồ ư ộ ố ả ậ ương án cũng nh đ c đi m d li u thu th p đư ặ ể ữ ệ ậ ược v b nh kh m lá cây h tiêu.ề ệ ả ồ
V i s h tr c a máy tính, h th ng s h tr ngớ ự ỗ ợ ủ ệ ố ẽ ỗ ợ ười dân trong vi c ch n đoánệ ẩ
b nh kh m lá cây h tiêu K t qu , kinh nghi m thu đệ ả ồ ế ả ệ ược khi th c hi n c a hự ệ ủ ệ
th ng s giúp ích ít nhi u s giúp ngố ẽ ề ẽ ười dân bước đ u phát hi n s m b nh.ầ ệ ớ ệ
Ch n đoán b nh và phát hi n b nh là c m t quá trình, đòi h i ngẩ ệ ệ ệ ả ộ ỏ ười chăm sóc
c n n m v ng ki n th c chuyên môn đ ch n đoán chính xác b nh N u ch n đoánầ ắ ữ ế ứ ể ẩ ệ ế ẩ
Trang 4không chính xác s đ a đ n các quy t đ nh không đúng, không phát hi n k p th i vàẽ ư ế ế ị ệ ị ờ đúng b nh d n đ n thi t h i n ng v năng su t cây tiêu cho ngệ ẫ ế ệ ạ ặ ề ấ ười tr ng.ồ
3 Đi u ki n xây d ng h th ng: ề ệ ự ệ ố
Đ xây d ng h th ng c n th c hi n qua các bể ự ệ ố ầ ự ệ ước sau:
3.1 Tìm hi u nghi p v và d li u ể ệ ụ ữ ệ
Giai đo n này ta c n xác đ nh v n đ c n gi i quy t, tìm hi u ki n th c v bàiạ ầ ị ấ ề ầ ả ế ể ế ứ ề toán đang th c hi n bao g m các tri th c c a các chuyên gia trong lĩnh v c c nự ệ ồ ứ ủ ự ầ nghiên c u t đó xác đ nh chính xác ngu n d li u đ thu th p đ ng th i ph i hi uứ ừ ị ồ ữ ệ ể ậ ồ ờ ả ể
được c u trúc d li u, ý nghĩa và t m quan tr ng c a nó đ t đó ta đ a ra bài toánấ ữ ệ ầ ọ ủ ể ừ ư
c th đ gi i quy t v n đ ụ ể ể ả ế ấ ề
3.2 Chu n b d li u ẩ ị ữ ệ
Trên c s d li u đã đơ ở ữ ệ ược thu th p, chúng ta dùng các k thu t ti n x lý d li uậ ỹ ậ ề ử ữ ệ
đ x lý sao cho các gi i thu t khai phá d li u có th hi u để ử ả ậ ữ ệ ể ể ược Ti n x lý d li uề ử ữ ệ bao g m:ồ
X lý d li u b thi u ho c m t: các giá tr b thi u ho c m t s đử ữ ệ ị ế ặ ấ ị ị ế ặ ấ ẽ ược thay thế
b ng các giá tr thích h p ho c xóa nh ng d li u sai mi n giá tr và gi i quy t sằ ị ợ ặ ữ ữ ệ ề ị ả ế ự không nh t quán.ấ
Kh s trùng l p d li u: Lo i b nh ng d li u b trùng l p.ử ự ặ ữ ệ ạ ỏ ữ ữ ệ ị ặ
Gi m nhi u d li u: Các d li u b nhi u s đả ễ ữ ệ ữ ệ ị ễ ẽ ược đi u ch nh ho c lo i ra kh i c sề ỉ ặ ạ ỏ ơ ở
d li uữ ệ
Gi m chi u: Lo i b t các thu c tính ch a ít thông tin đ ti t ki m th i gian và tàiả ề ạ ớ ộ ứ ể ế ệ ờ nguyên c a máy tính.ủ
3.3 Mô hình hóa d li u ữ ệ
Dùng các gi i thu t c a khai phá d li u đ tìm ra các quy lu t c a d li u, quanả ậ ủ ữ ệ ể ậ ủ ữ ệ
tr ng nh t trong giai đo n này là tìm đọ ấ ạ ược gi i thu t phù h p đ gi i quy t v n đả ậ ợ ể ả ế ấ ề
đã đ t ra.ặ
3.4 H u x lý và đánh giá mô hình ậ ử
Bi n đ i t nh ng lu t đã rút ra t t p hu n luy n sang d ng phù h p v i nghi pế ố ừ ữ ậ ừ ậ ấ ệ ạ ợ ớ ệ
Trang 5v c a bài toán Đánh giá các mô hình th nghi m t t p d li u m u đ t đó cóụ ủ ử ệ ừ ậ ữ ệ ẫ ể ừ
th đi u ch nh k p th i các mô hình và l a ch n để ề ỉ ị ờ ự ọ ược mô hình s đẽ ượ ử ục s d ng
3.5 Tri n khai mô hình ể
Các mô hình đ t yêu c u s đạ ầ ẽ ược xây d ng thành chự ương trình ng d ng th c t ứ ụ ự ế
nh m h tr đ a ra quy t đ nh theo yêu c u ngằ ỗ ợ ư ế ị ầ ười dùng
4 Bài toán đ t ra ặ
V i đi u ki n t nhiên thu n l i cho cây công nghi p dài ngày phát tri n, cây hớ ề ệ ự ậ ợ ệ ể ồ tiêu là m t hàng có giá tr cao so v i các lo i cây nông s n khác, s n ph m cây hặ ị ớ ạ ả ả ẩ ồ tiêu được s d ng làm gia v , trong y dử ụ ị ược, trong công nghi p hệ ương li u, vì v yệ ậ
vi c tr ng cây h tiêu ph i đi kèm v i phòng và tr các b nh liên quan và b nhệ ồ ồ ả ớ ị ệ ệ
kh m lá cây h tiêu ti m n nguy c gi m năng su t và nh hả ồ ề ẩ ơ ả ấ ả ưởng đ n kinh t c aế ế ủ
người tr ng tiêu.ồ
4.1 Đi u ki n phát sinh, phát tri n c a b nh kh m lá ề ệ ể ủ ệ ả
B nh kh m lá tiêu nh hệ ả ả ưởng t i năng su t và s phát tri n c a cây h tiêu doớ ấ ự ể ủ ồ virus gây h i Hi n nay không có thu c tr đạ ệ ố ị ược B nh do côn trùng môi gi i, chíchệ ớ hút t cây b b nh truy n sang (r p, r y xanh…).ừ ị ệ ề ệ ầ
4.2 Kh năng gây h i ả ạ
+ Kh m lá không bi n d ng: ả ế ạ trên các lá b nh trệ ưởng thành xu t hi n tri u ch ngấ ệ ệ ứ
gi ng nh thi u vi lố ư ế ượng, nh ng không b bi n d ng.ư ị ế ạ
+ Kh m lá bi n d ng: ả ế ạ mép lá b xoăn, cu n vào trong, lá dày và giòn Khi b n ngị ố ị ặ
lá xu t hi n các kh m đ m vàng ho c s c tr ng do m t di p l c.ấ ệ ả ố ặ ọ ắ ấ ệ ụ
+ Xoăn lùn: Lá tiêu nh l i và bi n d ng, m t lá giòn, s n sùi Ng n và đ t tiêu nhỏ ạ ế ạ ặ ầ ọ ố ỏ
l i,gi m chi u cao tr tiêu, do đó đạ ả ề ụ ược g i là b nh tiêu điên Cây b nh v n cho quọ ệ ệ ẫ ả
nh ng năng su t và ch t lư ấ ấ ượng gi m H u h t bà con nông dân ch đ ý đ n d ngả ầ ế ỉ ể ế ạ tiêu điên, d ng kh m lá gi ng v i tri u ch ng thi u vi lạ ả ố ớ ệ ứ ế ượng nên r t d nh m l nấ ễ ầ ẫ khi l y gi ng.ấ ố
II Phân tích d li u và xây d ng mô hình trong ch n đoán b nh ữ ệ ự ẩ ệ
Trang 61 C u trúc h th ng ấ ệ ố
M t h tr giúp quy t đ nh g m có 3 thành ph n chínhộ ệ ợ ế ị ồ ầ
(1) Qu n lý d li uả ữ ệ
(2) Qu n lý mô hìnhả
(3) Qu n lý giao di n ngả ệ ười dùng
2 Các ph ươ ng pháp thu th p d li u ậ ữ ệ
Trong bước này d li u đữ ệ ược thu th p d ng thô (ngu n d li u thu th p có thậ ở ạ ồ ữ ệ ậ ể
là t các kho d li u hay ngu n thông tin khác t internet) Trong giai đo n này dừ ữ ệ ồ ừ ạ ữ
li u cũng đệ ược ti n x lý đ bi n đ i và c i thi n ch t lề ử ể ế ổ ả ệ ấ ượng d li u cho phù h pữ ệ ợ
v i phớ ương pháp khai phá d li u đữ ệ ược ch n l a trong bọ ự ước trên
Các d li u đữ ệ ượ ổc t ng h p t các bi u hi n b nh lâm sàng c a cây h tiêu thôngợ ừ ể ệ ệ ủ ồ qua các báo cáo trên m ng Internet, t các d li u tr ng tr t t i đ a phạ ừ ữ ệ ồ ọ ạ ị ương
3 L ượ c đ c s d li u ồ ơ ở ữ ệ
STT Tên thu c tính ộ Mô tả D li u ữ ệ
1 La_bien_dang
Lá tiêu nh l i và bi nỏ ạ ế
d ng, m t lá giòn, s nạ ặ ầ sùi
Co: có xu t hi n bi n d ng ấ ệ ế ạ trên lá, lá nh không đ ng ỏ ồ
đ u, s n sùi trên nhi u láề ầ ề
Ko: không xu t hi n các ấ ệ
bi n d ng trên lá ế ạ
Lá xu t hi n tri u ấ ệ ệ
ch ng nh thi u vi ứ ư ế
lượng, thi u ch t.ế ấ
Nhe: m t vài lá trên thân ộ cây nh héo úa, thi u vi ư ế
lượng
Nang: h u h t là trên cây ầ ế tiêu xu t hi n các kh m ấ ệ ả
đ m vàng ho c s c tr ng ố ặ ọ ắ
do m t di p l c.ấ ệ ụ Khong: lá không có bi u ể
hi n b t thệ ấ ường
Trang 73 Chieu_cao Chi u cao và kích ề
thước thân cây tiêu
binhthuong: cây tiêu phát tri n bình thể ường, thân
ch c ch n, lá nhi u đ ng ắ ắ ề ồ
đ uề cao: cây phát tri n dài ể
nh ng thân nh , lá ítư ỏ thap: cây th p, phát tri n ấ ể
ch m, ng n và đ t tiêu nhậ ọ ố ỏ
l iạ
4 T p d li u ệ ữ ệ
S m u trong file d li u g m 18 b n ghi bi u hi n lâm sàng c a cây h tiêu ố ẫ ữ ệ ồ ả ể ệ ủ ồ Các thu c tính (bao g m 3 thu c tính) c a b d li u nh sau:ộ ồ ộ ủ ộ ữ ệ ư
5 Mô hình l a ch n – cây quy t đ nh ự ọ ế ị
Cây quy t đ nh (decision tree) là m t phế ị ộ ương pháp r t m nh và ph bi n cho cấ ạ ổ ế ả hai nhi m v c a khai phá d li u là phân lo i và d báo M t khác, cây quy t đ nhệ ụ ủ ữ ệ ạ ự ặ ế ị còn có th chuy n sang d ng bi u di n tể ể ạ ể ễ ương đương dướ ại d ng tri th c là các lu t Ifứ ậ
Trang 8– Then.
Cây quy t đ nh là c u trúc bi u di n dế ị ấ ể ễ ưới d ng cây Trong đó, m i nút trongạ ỗ (internal node) bi u di n m t thu c tính, nhánh (branch) bi u di n giá tr có th cóể ễ ộ ộ ể ễ ị ể
c a thu c tính, m i lá (leaf node) bi u di n các l p quy t đ nh và đ nh trên cùng c aủ ộ ỗ ể ễ ớ ế ị ỉ ủ cây g i là g c (root) Cây quy t đ nh có th đọ ố ế ị ể ược dùng đ phân l p b ng cách xu tể ớ ằ ấ phát t g c c a cây và di chuy n theo các nhánh cho đ n khi g p nút lá Trên c sừ ố ủ ể ế ặ ơ ở phân l p này chúng ta có th chuy n đ i v các lu t quy t đ nh.ớ ể ể ổ ề ậ ế ị
Cây quy t đ nh đế ị ược s d ng đ xây d ng m t k ho ch nh m đ t đử ụ ể ự ộ ế ạ ằ ạ ược m c tiêuụ mong mu n Các cây quy t đ nh đố ế ị ược dùng đ h tr quá trình ra quy t đ nh Câyể ỗ ợ ế ị quy t đ nh là m t d ng đ c bi t c a c u trúc cây.ế ị ộ ạ ặ ệ ủ ấ
* T o cây quy t đ nh s d ng thu t toán C4.5 ạ ế ị ử ụ ậ
B ướ c 1: Kh i đ ng Weka → ch n Explorerớ ộ ọ
B ướ c 2: Chọn Open file… → Chọn file data_khamla.csv → Chọn Open
B ướ c 3: Chuy n sang Classify → Choose → Classifyers → Trees → J48 (Thu tể ậ toán J48 và C4.5 ho t đ ng gi ng nhau) → Tích ch n Use training set.ạ ộ ố ọ
Bước 4: Ch n tab Preprocess → Filter Choose → MergeNominalValues (Đ gomọ ể giá tr trùng l p)ị ặ
B ướ c 4: Chọn thuộc tính phân lớớp là thuộc tính chan_doan → Start
* K t qu sau khi th c hi n thu t toán chúng ta có cây quy t đ nh nh sau:ế ả ự ệ ậ ế ị ư
Trang 96 T p lu t ậ ậ
Trang 10Hình: Cây quy t đ nh bi n di n t p lu tế ị ễ ễ ậ ậ
R1: N u “la_bien_dang = khong” và “vet_kham = nhe” thì “chan_doan = ế kham_la”
Lu t R1 ậ : N u lá cây h tiêu b kh m nh thì cây tiêu đang có tri u ch ng c a b nhế ồ ị ả ẹ ệ ứ ủ ệ
kh m lá.ả
R2: N u “la_bien_dang = khong” và “vet_kham = nang” thì “chan_doan = ế kham_la”
Lu t R2 ậ : N u lá cây h tiêu b kh m lá n ng thì cây tiêu đang b b nh kh m lá.ế ồ ị ả ặ ị ệ ả
R3: N u “la_bien_dang = khong” và “vet_kham = khong” thì “chan_doan = ế khongbenh”
Lu t R3 ậ : N u lá cây h tiêu không bi n d ng cũng không có v t kh m lá thì cây hế ồ ế ạ ế ả ồ tiêu bình thường, không b b nh kh m lá.ị ệ ả
R4: N u “la_bien_dang = co” và “vet_kham = nhe” thì “chan_doan = ế kham_la_bien_dang”
Lu t R4 ậ : N u lá cây h tiêu có lá bi n d ng và b kh m lá nh thì cây tiêu đang cóế ồ ế ạ ị ả ẹ tri u ch ng c a b nh kh m lá bi n d ng.ệ ứ ủ ệ ả ế ạ
R5: N u “la_bien_dang = co” và “vet_kham = nang” thì “chan_doan = ế kham_la_bien_dang”
Lu t R5 ậ : N u lá cây h tiêu có lá bi n d ng và b kh m lá n ng thì cây tiêu đang bế ồ ế ạ ị ả ặ ị
b nh kh m lá bi n d ng.ệ ả ế ạ
R6: N u “la_bien_dang = co” và “vet_kham = khong” thì “chan_doan = ế khongbenh”
Lu t R6 ậ : N u lá cây h tiêu có lá bi n d ng nh ng không b kh m lá thì cây tiêuế ồ ế ạ ư ị ả không b b nh kh m lá mà có th b các b nh khác.ị ệ ả ể ị ệ
Trang 11III Giao di n h th ng h tr quy t đ nh d báo b nh kh m lá cây h tiêu ệ ệ ố ỗ ợ ế ị ự ệ ả ồ
Trang 13B ng d li u nh sau: ả ữ ệ ư
IV K t lu n ế ậ
Thông qua ti u lu n môn h c và hể ậ ọ ướng d n c a gi ng viên đã n m đẫ ủ ả ắ ược các k ỹ thu t c b n v khai phá d li u, ng d ng khai phá d li u trong đ i s ng N m ậ ơ ả ề ữ ệ ứ ụ ữ ệ ờ ố ắ
được k thu t khai phá d li u b ng cây quy t đ nh và các thu t toán liên quan.ỹ ậ ữ ệ ằ ế ị ậ
Bi t cách s d ng ph n m m Weka đ h tr khai phá và h th ng d li u Xây ế ử ụ ầ ề ể ỗ ợ ệ ố ữ ệ
d ng chự ương trình demo cho ng d ng khai phá d li u b ng cây quy t đ nh, ch n ứ ụ ữ ệ ằ ế ị ẩ đoán b nh kh m lá cây h tiêu.ệ ả ồ
Do th i gian nghiên c u và th c hi n ti u lu n có h n nên vi c xây d ng cây ờ ứ ự ệ ể ậ ạ ệ ự quy t đ nh v d li u c a đ tài còn h n ch Hế ị ề ữ ệ ủ ề ạ ế ướng phát tri n c a đ tài có th ể ủ ề ể nghiên c u chuyên sâu h n v d li u đ ra m t chứ ơ ề ữ ệ ể ộ ương trình có b d li u đ y đ ộ ữ ệ ầ ủ
và th c t h n.ự ế ơ