ĐẠI HỌC ĐÀ NẴNG NGUYỄN VĂN NHU ỨNG DỤNG CÔNG NGHỆ TRI THỨC XÂY DỰNG HỆ TRỢ GIÚP PHÒNG CHỐNG DỊCH BỆNH TRÊN CÂY LÚA TẠI TỈNH HẬU GIANG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01
Trang 1ĐẠI HỌC ĐÀ NẴNG
NGUYỄN VĂN NHU
ỨNG DỤNG CÔNG NGHỆ TRI THỨC XÂY DỰNG HỆ TRỢ GIÚP PHÒNG CHỐNG
DỊCH BỆNH TRÊN CÂY LÚA
TẠI TỈNH HẬU GIANG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2013
Trang 2Công trình được hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học: PGS.TS PHAN HUY KHÁNH
Phản biện 1: PGS.TS LÊ VĂN SƠN
Phản biện 2: TS TRƯƠNG QUỐC ĐỊNH
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp Thạc sĩ Kỹ thuật họp tại Đà Nẵng vào ngày 09 tháng 6 năm 2013
Có thể tìm hiểu luận văn tại:
- Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng
Trang 3MỞ ĐẦU
1 Tính cấp thiết của đề tài
Những năm gần đây nông dân ĐBSCL nói chung và tỉnh Hậu Giang nói riêng có tiến bộ trong canh tác, từ sản xuất 01 vụ mùa/năm, nay đã tăng lên 3vụ/năm, đáp ứng được nhu cầu lương thực trong nước và đã từng bước đưa Việt Nam trở thành nước xuất khẩu gạo đứng thứ 2 trên thế giới sau Thái Lan
Tuy nhiên những năm gần đây dịch rầy nâu hoàn hành cả 3 vụ Đông Xuân, Hè Thu, Thu Đông làm cho lúa bị bệnh vàng lùn và lùn xoắn lá gây hại với mức độ càng lúc càng nghiêm trọng, thời thiết biến đổi thất thường cũng làm cho lúa mắc thêm nhiều bệnh khác như đạo ôn, cháy lá…ảnh hưởng đến hàng trăm ha lúa bị giảm năng suất, nhiều nơi phải hủy bỏ
Để tránh sự gây hại của rầy nâu, bệnh vàng lùn, lùn xoắn lá, đạo ôn trên lúa… ngoài các biện pháp hướng dẫn canh tác của chuyên gia như: áp dụng IPM, 3 giảm 3 tăng, vệ sinh đồng ruộng, chuyển đổi mùa vụ thì việc chủ động tìm kiếm giải pháp hữu hiệu
và lâu dài cho người nông dân cần được chú trọng hơn Thực tiễn sản xuất đang đòi hỏi cấp bách phải nghiên cứu tìm ra phương pháp trợ giúp người nông dân có công cụ tốt phục vụ sản xuất, có như vậy mới tạo cho sản xuất lúa an toàn, bền vững lâu dài, giữ vững an toàn lương thực, đảm bảo xuất khẩu, từng bước nâng cao đời sống người nông dân ĐBSCL nói chung và nông dân Hậu Giang nói riêng Trên cơ sở kết quả phân tích thực trạng và nhu cầu phòng chống dịch bệnh trên cây lúa đề tài “Ứng dụng công nghệ tri thức xây dựng hệ trợ giúp phòng chống dịch bệnh trên cây lúa tại tỉnh
Trang 4Hậu Giang” nhằm nghiên cứu tạo ra một kho dữ liệu tri thức về nông nghiệp (lúa nước) với mục đích hỗ trợ bà con nông dân về cách phòng trị bệnh trên lúa, giúp bà con nắm bắt được lịch thời vụ, thời gian xuất hiện bệnh, thời điểm phun thuốc… để giúp sản xuất hiệu qủa giảm được chi phí
2 Mục tiêu nghiên cứu
- Tìm hiểu về các bệnh trên lúa, các thuốc phòng trị tương ứng…
- Nghiên cứu về công nghệ tri thức, công cụ lập trình, hệ thống
dữ liệu… để xây dựng hệ thống trợ giúp phòng trị bệnh trên lúa
- Đưa ra giải pháp và hoàn thiện hệ thống trợ giúp
- Xây dựng hệ thống và cài đặt thử nghiệm
- Đánh giá kết quả
3 Đối tượng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu
- Các bệnh về lúa liên quan tới giống, mật độ…
- Các phương pháp phòng trị bệnh trên lúa
- Các kỹ thuật, tập quán sản xuất
3.2 Phạm vi nghiên cứu
Đề tài được nghiên cứu và xây dựng chương trình nhằm đáp ứng các yêu cầu phòng chống bệnh lúa của người nông dân tại Hậu Giang
Nghiên cứu công cụ lập trình và tài liệu có liêu quan đến công nghệ tri thức
4 Phương pháp nghiên cứu
4.1 Phương pháp nghiên cứu lý thuyết
Trang 5Nghiên cứu về bệnh lúa, thuốc phòng trị, các phương pháp áp dụng hiệu quả
Nghiên cứu công cụ lập trình, hệ chuyên gia, hệ quản trị… Tổng hợp các tài liệu liên quan đến lĩnh vực nghiên cứu Phân tích, thiết kế hệ thống theo quy trình sao cho dễ sử dụng, hiệu quả, dễ nâng cấp, sửa chữa bỗ sung
4.2 Phương pháp nghiên cứu thực nghiệm
Khảo sát và phân tích so sánh với các phương pháp phòng trị bệnh trên lúa tại Hậu Giang
Lấy các mẫu bệnh trên lúa nhìn thấy được đưa vào máy đối sánh kết quả với chuyên gia
Xây dựng giải pháp hiệu quả và thiết kế phần mềm hỗ trợ
5 Bố cục của luận văn
MỞ ĐẦU
CHƯƠNG 1 TÌM HIỂU CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
- Tìm hiểu cơ sở tri thức, ứng dụng của tri thức vào một số lĩnh vực
- Tìm hiểu hệ chuyên gia, biểu diễn, suy luận, các đặc trưng của hệ chuyên gia
- Kho tri thức, quản lý và cập nhật kho tri thức, khai phá dữ liệu, hệ trợ giúp ra quyết định
CHƯƠNG 2 PHÂN TÍCH BÀI TOÁN PHÒNG CHỐNG BỆNH TRÊN CÂY LÚA
- Phát biểu bài toán
- Tìm hiểu tri thức về lúa nước
- Vận dụng công nghệ tri thức để giải quyết vấn đề
Trang 6- Mô tả ứng dụng và mô hình dữ liệu hoạt động
- Xây dựng các luật và câu truy vấn
CHƯƠNG 3 CÀI ĐẶT VÀ THỬ NGHIỆM HỆ TRỢ GIÚP PHÒNG CHỐNG BỆNH TRÊN LÚA TẠI HẬU GIANG
- Phân tích thiết kế hệ trợ giúp
- Môi trường công cụ cài đặt
- Đánh giá kết quả chương trình
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Đưa ra các nhận xét, đánh giá về hệ thống, các vấn đề đã giải quyết được, các vấn đề còn tồn tại Đồng thời đưa ra hướng phát triển của đề tài trong tương lai
6 Tổng quan tài liệu nghiên cứu
Để thực hiện đề tài “Ứng dụng công nghệ tri thức phòng chống dịch bệnh trên cây lúa tại tỉnh Hậu Giang”, chúng ta cần phải nắm được kiến thức tổng quan về lúa, công nghệ tri thức, tìm hiểu về điều kiện môi sinh….Vì vậy, các tài liệu được sử dụng để xây dựng
đề tài là: Các công trình nghiên cứu liên quan đến lúa, các tài liệu bệnh lúa, các công bố liên quan đến lúa, các hệ thống trợ giúp ra quyết định, kho dữ liệu, khai phá dữ liệu, các bài viết, các nguồn dữ liệu trên Internet…Hiện nay, với sự phát triển công nghệ thông tin, đặt biệt biệt là mạng Internet thì việc tìm kiếm một tài liệu nào đó thì thật là dễ dàng và nhanh chóng
Trang 7CHƯƠNG 1 TÌM HIỂU CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
Chương này giới thiệu cơ sở lý thuyết liên quan đến đề tài, việc
hỗ trợ xây dựng ứng dụng Trình bày các khái niệm về cơ sở tri thức, hệ chuyên gia Một số các ứng dụng cơ sở tri thức để xây dựng thành hệ chuyên gia Cách thức biểu diễn tri thức, xây dựng luật trong hệ chuyên gia thông qua các kỹ thuật suy luận trong hệ chuyên gia
1.1 TÌM HIỂU TRI THỨC
1.1.1 Khái niệm về tri thức
Tri thức là nhận thức và hiểu biết về một sự việc, sự vật hay thông tin được thu thập ở dạng kinh nghiệm, học tập hay thông qua suy luận, suy ngẫm Tri thức là sự đánh giá về sự sở hữu, xâu chuổi những chi tiết liên quan đến một vấn đề mà nếu để riêng lẽ chúng sẽ
có giá trị hơn [1]
Hình 1.1 Hệ thống giao tiếp
1.1.2 Phân loại và quản trị tri thức
Tri thức trong hệ chuyên gia phản ánh sự tinh thông được tích tụ từ sách vở, tạp chí, từ các chuyên gia, báo đài hay các nhà bác học Các hệ thống hay hệ chuyên gia đều dựa trên tri thức [1]
Người sử dụng
(User)
Hệ thống giao tiếp (User interface)
Cơ sở tri thức (knowledge base)
Máy suy diễn (Inference Engine)
Trang 8Tri thức được phân ra thành hai loại chính là tri thức hiện và tri thức ẩn [14]:
- Tri thức hiện: là những tri thức được giải thích và được mã hóa dưới dạng văn bản, tài liệu, âm thanh, phim ảnh thông qua ngôn ngữ có lời hoặc không có lời, nguyên tắc hệ thống, chương trình máy tính, chuẩn mực hay các phương tiện khác Tri thức này dễ dàng chuyển giao, thường được tiếp nhận qua hướng dẫn
- Tri thức ẩn: là những tri thức thu được từ trải nghiệm thực tế, tri thức dạng này nằm trong mỗi cá nhân bao gồm : niềm tin, kinh nghiệm, bí quyết, kỹ năng Ví dụ: các chuyên gia có thể biết phân tích đất đai, thời gian gây bệnh, thời tiết mùa vụ rất chuyên nghiệp,
họ có cảm nhận vấn đề này rất tốt cho nên tư vấn cho người trồng
l ú a nên gieo sạ giống gì? Thời điểm gieo sạ? Đây là một dạng tri thức ẩn nằm trong mỗi chuyên gia mà không thể mã hóa thành văn bản hay chuyển giao mà chỉ có thể có bằng cách tự luyện tập
1.1.3 Ứng dụng công nghệ tri thức vào phát triển một số hệ chuyên gia
1.1.4 Một số lĩnh vực ứng dụng của hệ chuyên gia
1.2 BIỂU DIỄN TRI THỨC
1.2.1 Biểu diễn tri thức trong hệ chuyên gia
a Tri thức được biểu diễn như thế nào
b Tri thức biểu diễn thông qua các luật
c Kỹ thuật suy luận trong hệ chuyên gia
1.2.2 Những sai sót thường gặp khi thiết kế hệ chuyên gia
Những sai sót trong khi phát triển hệ chuyên gia được phân ra thành nhiều giai đoạn:
Sai sót trong tri thức chuyên gia : Chuyên gia là nguồn tri thức của một hệ chuyên gia, nếu tri thức của chuyên gia không đúng và
Trang 9không đầy đủ, hậu quả sai sót sẽ ảnh hưởng suốt quá trình phát triển
hệ thống
Sai sót ngữ nghĩa: Xảy ra do tri thức đưa vào hệ chuyên gia Ví dụ một chuyên gia trồng lúa nói “Lúa bị vàng, lùn” (thiếu phân) và công nghệ tri thức lại hiểu nhầm câu này “ Lúa bị vàng lùn” (bị rầy nâu lây bệnh)
Sai sót cú pháp: do biểu diễn sai các dạng luật, các sự kiện hoặc do sai sót ngữ nghĩa hoặc sai sót trong tri thức chuyên gia ở các bước trước
Sai sót máy suy diễn: Là một chương trình nên máy suy diễn có thể gặp lỗi khi thực hiện và có thể xác định được nguyên nhân Tuy nhiên, việc xác định lỗi trong một số hệ chuyên gia vẫn gặp khó khăn do công cụ phần mềm sử dụng [1],[15]
1.2.3 Kiến trúc tổng quát của hệ chuyên gia
Một hệ chuyên gia mẫu cấu tạo bởi bảy thành phần cơ bản như sau :
Hình 1.5 Mô tả các thành phần cơ bản của một hệ chuyên gia
Bộ nhớ làm việc
Giao diện người sử dụng
MÁY SUY DIỄN
Trang 10Cơ sở tri thức (Knowledge base) Gồm các phần tử (hay đơn vị) tri thức, thông thường được gọi là luật, được tổ chức như một cơ
sở dữ liệu
Máy suy diễn (inference engine ) là công cụ (chương trình hay
bộ xử lý) tạo ra sự suy luận bằng cách quyết định xem những luật nào sẽ làm thỏa mãn các sự kiện, các đối tượng, chọn ưu tiên các luật thỏa mãn, thực hiện các luật có tính ưu tiên cao nhất
1.2.4 Các đặc trưng và ưu điểm ứng dụng
a Các đặc trưng cơ bản của hệ chuyên gia
b Một số ưu điểm của hệ chuyên gia
1.3 KHO TRI THỨC
1.3.1 Cấu trúc của kho tri thức
Hình 1.7: Mô hình cấu trúc kho tri thức
Trang 111.3.2 Hệ thống cập nhật, quản lý kho tri thức
Hình 1.8: Mô hình ca sử dụng - hệ thống cập nhật kho dữ liệu
Cập nhật dữ liệu : Chuyên gia sử dụng chức năng này để cập
nhật dữ liệu cho hệ thống
Cập nhật tri thức : chuyên gia sử dụng chức năng này để cập
nhật các luật và sự kiện cho cơ sở tri thức
Hình 1.9 Mô hình ca sử dụng - hệ thống cập nhật kho tri thức
Đặc tả tri thức: người quản trị tri thức dựa theo các luật và sự
kiện để đặc tả tri thức về dạng đang được qui định trong hệ thống
Kiểm tra tính đúng đắn của dữ liệu và tri thức: người quản trị
tri thức sử dụng để kiểm tra xác nhận giá trị của các tri thức được
nhập vào
Đặc tả tri thức
Kiểm tra tính đúng đắn của
dữ liệu
Quản trị
tri thức
Chuyên viên
Trang 121.3.3 Hệ thống quản lý và kho tri thức
1.4 KHAI PHÁ DỮ LIỆU
1.4.1 Khái niệm
1.4.2 Mục đích khai thác dữ liệu và khám phá tri thức 1.5 HỆ HỖ TRỢ RA QUYẾT ĐỊNH (Decision Support System – DSS)
CHƯƠNG 2 PHÂN TÍCH BÀI TOÁN PHÒNG CHỐNG DỊCH BỆNH
TRÊN CÂY LÚA
Chương này phân tích thực trạng về nông nghiệp Hậu Giang, phân tích về một số loại bệnh phổ biến trên lúa và đưa ra giải pháp
kỹ thuật trợ giúp người nông dân
2.1 PHÁT BIỂU VẤN ĐỀ
2.1.1 Đặt vấn đề:
Mô tả về cây lúa: “Lúa có nguồn gốc ở vùng nhiệt đới và cận nhiệt đới khu vực đông nam châu Á và châu Phi Chúng cung cấp hơn 1/5 toàn bộ lượng calo tiêu thụ bởi con người” lúa là thức ăn chính của người Việt Nam [13]
Trang 132.1.2 Giải pháp tư vấn quản lý cây lúa
năm 2009
năm 2010
năm 2011
Thành thị Nông thôn
Hình 2.4 Biểu đồ dân số Hậu Giang [4]
năm 2009
năm 2010
năm 2011
Lúa Khác
Hình 2.5 Diện tích trồng trọt tại Hậu Giang (ĐVT: ha) [3]
Trang 14năm 2009
năm 2010
năm 2011
Trồng chọt Chăn nuôi -thú y Ngành khác
Hình 2.6 Cán bộ ngành nông nghiệp Hậu Giang [4]
Hình 2.7 Số lớp tập huấn về nông nghiệp tại Hậu Giang
b Các bước triển khai xây dựng hệ chuyên gia cho bài toán
2.2 MỘT SỐ BỆNH TRÊN LÚA
2.2.1 Bệnh vàng lùn
a Tác nhân gây bệnh
b Những triệu chứng của bệnh
Trang 15Bảng 2.1 Triệu chứng bệnh vàng lùn [4]
CÁC TRIỆU CHỨNG GÂY RA BỆNH QUAN SÁT ĐƯỢC TRÊN LÚA
Lá Thân Gốc Rễ Bông hạt Chiều
cao
Kết luận
Bình thường
Nghẹn đồng Lùn
Vàng lùn
2.3 GIẢI PHÁP TƯ VẤN CHO BÀI TOÁN
Từ những phân tích những vấn đề liên quan tới cây lúa có thể xây dựng mô hình giải pháp cho bài toán như sau:
Trang 16Hình 2.8 Giải pháp cho bài toán phòng chống dịch bệnh trên lúa
Trang 17Gom d ữ l i ệu : Tập hợp dữ liệu về lúa như: giống, đặc trưng
vùng miền, tình trạng sâu bệnh, vụ mùa nào bệnh nhiều?, mật độ gieo sạ ra sao? Đây là dữ liệu chưa hoàn chỉnh hay còn gọi là dữ liệu thô được khai thác từ các nguồn báo, đài, nông dân sản xuất giỏi, sách, Internet, chuyên gia
Làm sạch, tiền xử lý và chuẩn bị trước dữ liệu: Giai đoạn thứ ba
này là giai đoạn rất quan trọng trong quá trình khai phá dữ liệu
Tại sao cần phải làm sạch tiền xử lý dữ liệu? vì dữ liệu thu
thập được là hỗn tạp, không đầy đủ: thiếu giá trị thuộc tính, thiếu các thuộc tính chắc chắn cần quan tâm, hoặc chỉ chứa dữ liệu chung; nhiễu (chứa dữ liệu bị lỗi hoặc bị lệch); không nhất quán (mâu thuẫn): chứa các mã hoặc các tên mâu thuẫn nhau; Dữ liệu không đảm bảo chất lượng thì kết quả khai phá không hiệu quả; Chất lượng các quyết định phải dựa trên chất lượng dữ liệu
Chuyển đổi dữ liệu: [15]
- Làm trơn(Smoothing): giảm nhiễu, loại bõ nhiểu/lổi khỏi dữ liệu
- Kết hợp(Aggregation): Sự tóm tắt dữ liệu, xây dựng dữ liệu dạng khối
- Tổng quát hóa(Generalization): khái niệm cấu trúc phân cấp
- Chuẩn hóa (Normalization): Đưa các giá trị về một khoảng được chỉ định
Khai phá dữ liệu [2]: Đây là bước mang tính tư duy trong khai phá
dữ liệu và cũng đặt ra câu hỏi là tại sao phải khai phá dữ liệu?
- Vì sự gia tăng bùng nổ của dữ liệu: Từ mức độ terabytes đến mức độ petabytes
+ Thu thập dữ liệu và sự tồn tại của dữ liệu
+ Các công cụ thu thập dữ liệu tự động, các hệ thống cơ sở
dữ liệu, World Wide Web, xã hội số
Trang 18- Các nguồn dữ liệu phong phú: Internet, thương mại điện tử, giao dịch thương mại, chứng khoán, tin tức, máy ảnh số, các mạng
xã hội…
- Chúng ta bị tràn ngập trong dữ liệu nhưng lại thiếu(cần) tri thức
- Khai phá dữ liệu: Giúp tự động phân tích các tập dữ liệu rất lớn để khám phá ra các tri thức
- Khai phá dữ liệu (Data mining – DM) – Khám phá tri thức
từ dữ liệu (Knowledge discovery from data- KD) được hiểu là việc
trích rút ra được các mẫu hoặc tri thức quan trọng từ một lượng dữ liệu (rất) lớn (quan trọng= không tầm thường, ẩn, chưa được biết
đến và có thể hữu ích)
Luật kết hợp: Một trong những kĩ thuật chính trong khai thác
dữ liệu điều liên quan các luật khám phá dựa trên mối kết hợp Trong
cơ sở dữ liệu được chú ý đến như là tập hợp nhiều giao dịch và mỗi cái lại liên quan việc thiết lập các mẫu tin [2],[15]
CHƯƠNG 3 CÀI ĐẶT THỬ NGHIỆM CHƯƠNG TRÌNH PHÒNG CHỐNG DỊCH BỆNH TRÊN LÚA TẠI HẬU GIANG
3.1 DỮ LIỆU CHO BÀI TOÁN
3.1.1 Nguồn dữ liệu tư vấn
3.1.2 Nhu cầu cần trợ giúp của người nông dân
3.1.3 Trợ giúp của người quản lý nông nghiệp