Điều khiển và giám sát mô hình nhà kính thông minh ứng dụng iot (internet of things) và thuật toán support vector machines Điều khiển và giám sát mô hình nhà kính thông minh ứng dụng iot (internet of things) và thuật toán support vector machines Điều khiển và giám sát mô hình nhà kính thông minh ứng dụng iot (internet of things) và thuật toán support vector machines
Trang 1TÓM TẮT
Từ những yêu cầu thực tế, những đòi hỏi ngày càng cao của cuộc sống hiện đại, cộng với sự hợp tác, phát triển mạnh mẽ của mạng di động và cuộc cách mạng công nghiệp
4.0 nên tác giả đã chọn đề tài “Điều khiển và giám sát mô hình nhà kính thông
minh sử dụng IoT (Internet of things) và thuật toán Support Vector Machines"
để đáp ứng được nhu cầu ngày càng cao của con người và góp phần vào sự tiến bộ, văn minh, hiện đại của nước nhà
Luận văn đã tạo nên một xu thế mới trong việc nghiên cứu nhà kính thông minh với
sự kết hợp của thuật toán Support Vector Machines
Đây cũng chính là tiền đề cho xu thế phát triển nông nghiệp công nghệ cao trong nước và trên toàn thế giới
Nội dung của luận văn bao gồm 5 chương:
Chương 1: Tổng quan: Giới thiệu đề tài, ý nghĩa khoa học, mục đích
nghiên cứu và giới hạn của đề tài Tình hình nghiên cứu trong và ngoài nước, ý tưởng thiết kế, đề cương nghiên cứu chi tiết, phương pháp nghiên cứu, phương tiện nghiên cứu
Chương 2: Cơ sở lý thuyết
Chương 3: Thiết kế hệ thống, ứng dụng công nghệ IoT và thuật toán
Support Vector Machines vào nhà kính thông minh
Chương 4: Quá trình thực nghiệm
Chương 5: Kết luận và hướng phát triển cho tương lai
Trang 2ABSTRACT
With the growing demand for mobile life and the industrial revolution of 4.0, I chose the subject "Control and supervise the smart greenhouse model use IoT (Internet of Things) and Support Vector Machines algorithm” to meet the increasing demand of people and contribute to the advancement, civilization and modernity of the country The thesis has created a new trend in smart glass research with the combination of Support Vector Machines algorithm
This is also the premise for the development of high-tech agriculture in the country and around the world
The content of the thesis consists of 5 chapters:
• Chapter 1: Overview: Introduct the subject, scientific significance, research purposes and limitations of the topic Research situation, design ideas, detailed research protocols, research methods, research tools
• Chapter 2: Theory
• Chapter 3: System design, application of IoT technology and Support Vector Machines in intelligent greenhouse
• Chapter 4: Experimental process
• Chapter 5: Conclusions and directions in the future
Trang 3MỤC LỤC
LÝ LỊCH CÁ NHÂN i
LỜI CAM ĐOAN iii
CẢM TẠ iv
TÓM TẮT v
MỤC LỤC vii
DANH SÁCH CHỮ VIẾT TẮT ix
DANH SÁCH CÁC HÌNH x
DANH SÁCH CÁC BẢNG xiii
CHƯƠNG 1 TỔNG QUAN 1
1.1 Giới thiệu đề tài 1
1.2 Ý nghĩa khoa học của đề tài 2
1.3 Mục đích nghiên cứu và giới hạn của đề tài 3
1.4 Tình hình nghiên cứu trong và ngoài nước 3
1.5 Ý tưởng thiết kế 13
1.6 Đề cương nghiên cứu chi tiết 13
1.7 Đối tượng nghiên cứu 13
1.8 Phương pháp nghiên cứu 18
1.9 Phân tích nhiệm vụ đề tài 18
1.10 Phương tiện nghiên cứu 21
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT 22
2.1 Nhà kính thông minh 22
2.2 Thuật toán máy học 23
2.3 Thuật toán Support Vector Machines 35
2.4 Công nghệ IoT 54
2.5 Mã nguồn Node.js 58
Trang 42.6 Giao thức MQTT 67
2.7 Cơ sở dữ liệu MongoDB 71
CHƯƠNG 3 THIẾT KẾ HỆ THỐNG, ỨNG DỤNG CÔNG NGHỆ IOT VÀ THUẬT TOÁN SUPPORT VECTOR MACHINES VÀO NHÀ KÍNH THÔNG MINH 74
3.1 Mô hình nhà kính thông minh 74
3.2 Xây dựng tập dữ liệu cho nhà kính thông minh 79
3.3 Áp dụng thuật toán SVM trong khai phá dữ liệu nhà kính thông minh 80
CHƯƠNG 4 QUÁ TRÌNH THỰC NGHIỆM 86
4.1 Giới thiệu .86
4.2 Hoạt động 92
4.3 Kết quả đạt được 92
CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 93
5.1 Kết luận 93
5.2 Hướng phát triển cho tương lai 93
TÀI LIỆU THAM KHẢO 94
PHỤ LỤC 97
Trang 5DANH SÁCH CÁC CHỮ VIẾT TẮT
Trang 6DANH SÁCH CÁC HÌNH
Hình 1.1: Các thành phần chính của nhà kính thông minh 2
Hình 1.2: Hệ thống cảm biến nhiệt độ và ẩm độ được cài đặt tại nhiều vị trí khác nhau và kết nối đến các computer 5
Hình 1.3: Các kỹ sư nông học kiểm tra dịch bệnh nhà kính, Kibbutz Masharap, Israel 6
Hình 1.4: Hệ thống tự động hóa kiểm soát môi trường trong nhà kính trồng hoa lan 7
Hình 1.5: Nhà kính hỗ trợ người trồng công tác chăm sóc, tránh côn trùng gây hại, tạo môi trường phù hợp cây trồng 11
Hình 1.6: Tự động giám sát và điều khiển môi trường nhà kính sử dụng năng lượng mặt trời bằng điện thoại smartphone 12
Hình 1.7: Bo vi điều khiển Arduino Mega 14
Hình 1.8: Bo nhúng Raspberry Pi 3 14
Hình 1.9: Bo ESP8266 14
Hình 1.10: Cảm biến nhiệt độ, độ ẩm DHT11 15
Hình 1.11: Cảm biến quang trở CDS 15
Hình 1.12: Cảm biến độ ẩm đất 16
Hình 1.13: Cảm biến đo độ PH của nước 16
Hình 1.14: Các cơ cấu chấp hành sử dụng trong nhà kính 17
Hình 1.15:Bộ lọc nhiễu nguồn 17
Hình 1.16: Tổng quan các thiết bị sử dụng trong luận văn 19
Hình 2.1: Mô hình cây quyết định [1] 26
Hình 2.2: Định lý Bayes 27
Hình 2.3: Đồ thi hồi quy tuyến tính [3] 27
Trang 7Hình 2.4: Đồ thị hồi quy logistic [4] 28
Hình 2.5: Phân lớp SVM [2] 29
Hình 2.6: Sơ đồ Ensemble Methods [9] 30
Hình 2.7: Thuật toán gom cụm [11] 31
Hình 2.8: Phép biến đổi PCA [15] 32
Hình 2.9: Đại số tuyến tính SVD [16] 33
Hình 2.10: Kỹ thuật thống kê ICA [17] 34
Hình 2.11: SVM classification 36
Hình 2.12: Margin SVM 37
Hình 2.13: Giải thuật học SVM [24] 40
Hình 2.14: Chuyển không gian 42
Hình 2.15: Mô hình nhiều lớp 43
Hình 2.16: Phân tách nhóm 44
Hình 2.17: Học trên tập dữ liệu con 45
Hình 2.18: Học song song SVM 45
Hình 2.19: Học trên dữ liệu symbolic 46
Hình 2.20: Tìm siêu phẳng 47
Hình 2.21: Tìm siêu cầu 47
Hình 2.22: Siêu phẳng phân chia dữ liệu học thành 2 lớp + và - với khoảng cách biên lớn hất Các điểm gần nhất (điểm được khoanh tròn) là các Support Vector .49
Hình 2.23: Minh họa bài toán 2 phân lớp bằng thuật toán SVM 51
Hình 2.24: Sơ đồ mạng lưới IoT 55
Hình 2.25: Sơ đồ tổng quát của Node.js [19] 63
Hình 2.26: Sơ đồ hoạt động Node.js [20] 66
Hình 2.27: Ví dụ vê giao thức MQTT [21] 67
Hình 2.28: Sơ đồ MQTT [22] 69
Hình 2.29: Mô hình hoạt động của MongoDB [23] 72
Hình 3.1: Sơ đồ toàn bộ hệ thống 74
Trang 8Hình 3.2: Sơ đồ tổng quát hệ thống 75
Hình 3.3: Sơ đồ điều khiển bằng Web 76
Hình 3.4: Lưu đồ tổng quát hệ thống 77
Hình 3.5: Giao diện Web 79
Hình 3.6: Các bước khai phá dữ liệu 80
Hình 3.7: Quá trình phân lớp dữ liệu nhà kính thông minh 81
Hình 3.8: Kết quả phân lớp bằng thuật toán Support Vector Machines 83
Hình 3.9: Sai số phân lớp 85
Hình 4.1: Mô hình ngôi nhà hoàn chỉnh 86
Hình 4.2: Tủ điện điều khiển nhà kính thông minh 87
Hình 4.3: Giao diện đăng nhập Web server 88
Hình 4.4: Giao diện Web Server 89
Hình 4.5: Giao diện điều khiển Web Server 89
Hình 4.6: Đồ thị quá trình thu thập dữ liệu cảm biến 90
Hình 4.7: Giao diện xuất cơ sở dữ liệu 91
Hình 4.8: Giao diện xuất báo cáo chi tiết 91
Trang 9DANH SÁCH CÁC BẢNG
Bảng 3.1: Bảng dữ liệu huấn luyện 83 Bảng 3.2: Bảng dữ liệu kiểm tra 84 Bảng 3.3: Khả năng ra quyết định và dự báo của thuật toán Support Vector
Machines 85
Trang 10CHƯƠNG 1:
TỔNG QUAN
1.1 Giới thiệu đề tài
Ngày nay cùng với sự phát triển mạnh mẽ của các ngành khoa học kỹ thuật, công nghệ kỹ thuật điện tử mà trong đó đặc biệt là kỹ thuật điều khiển tự động đóng vai trò quan trọng trong mọi lĩnh vực khoa học kỹ thuật, quản lí, công nghiệp, cung cấp thông tin Do đó, đội ngũ kỹ thuật, kỹ sư, chuyên gia, nhà khoa học phải biết nắm bắt và vận dụng nó một cách có hiệu quả nhằm góp phần vào sự phát triển nền khoa học kỹ thuật thế giới Bên cạnh đó còn là sự thúc đẩy sự phát triển của nền kinh
tế nước nhà
Hiện nay, hầu như tất cả các nhà kính trên thế giới đều sử dụng những công nghệ thô sơ và lạc hậu Các công việc như bón phân, tưới cây… đều phải thông qua bàn tay con người Đặc biệt với những vấn đề thời tiết như nhiệt độ, độ ẩm, độ sáng, tốc độ gió… đều phụ thuộc nhiều vào thời tiết Vì vậy mà chất lượng, năng suất nông sản không đạt mà lại tốn quá nhiều nhân công, thời gian, chi phí Nhà kính thông minh ra đời để đáp ứng nhu cầu trên
Với những tính năng tự động con người chỉ cần giám sát thông qua Web, hoặc điều khiển trực tiếp trên nền Web Sau đó hệ thống sẽ tự động thu thập dữ liệu để phân tích, đưa ra các cảnh báo và tối ưu hóa hệ thống điều khiển bằng các thuật toán Mọi tính năng của nhà kính đều có khả năng tự vận hành hoặc dưới sự điều khiển của người dùng thông qua điện thoại di động sử dụng mạng 3G hay Internet và cung cấp nhiều chế độ sử dụng Người dùng có thể truy cập từ xa vào hệ thống quản lý để xem
Trang 11tình trạng hoạt động nhà kính Ví dụ như theo dõi nhiệt độ, độ ẩm không khí,độ ẩm đất, độ PH, độ sáng…
Hình 1.1: Các thành phần chính của nhà kính thông minh Các thành phần chính của nhà kính thông minh: Các cảm biến thu thập dữ liệu nhà kính, các cơ cấu chấp hành, các cổng kết nối I/O, phần điều khiển trung tâm, các thiết bị giao tiếp qua mạng, các thiết bị điều khiển giám sát và cơ sở dữ liệu…
1.2 Ý nghĩa khoa học của đề tài
Ngày nay cùng với sự tiến bộ của khoa học kỹ thuật, các thiết bị điện- điện tử
ra đời ngày càng nhiều về chủng loại cũng như tính năng sử dụng Bên cạnh đó, nhu cầu sử dụng các thiết bị một cách tự động ngày càng cao, con người ngày càng muốn
có nhiều thiết bị giải trí cũng như các thiết bị sinh hoạt với kỹ thuật và công nghệ ngày càng hiện đại Tuy nhiên, trong lĩnh vực nhà kính thông minh vẫn chưa được đầu tư và phát triển
Từ những nhu cầu thực tế đó, tác giả muốn đưa một phần những kỹ thuật hiện đại của thế giới áp dụng vào điều kiện thực tế trong nước những năm trở lại đây đang phát triển đó là ý tưởng điều khiển và giám sát nhà kính từ xa ra đời, nhằm đáp ứng nhu cầu ngày càng cao của con người Đề tài lấy cơ sở là dùng Web Server để điều
Trang 12khiển và giám sát nhà kính, kết hợp thuật toán Support vector machines để phân lớp
dữ liệu, đánh giá độ chính xác phân lớp và dự đoán trạng thái nhà kính để đưa ra lệnh điều khiển cho nhà kính Với sự kết hợp của IoT và thuật toán Support Vector Machines con người chỉ cần giám sát và không cần điều khiển bất cứ quá trình nào Việc sử dụng Web để điều khiển thiết bị có thuận lợi là tiết kiệm chi phí, mang tính cạnh tranh Ngoài ra, sản phẩm của đề tài này có tính mở, có thể áp dụng cho nhiều đối tượng khác nhau trong dân dụng cũng như trong công nghiệp
1.3 Mục đích nghiên cứu và giới hạn của đề tài
Luận văn “Điều khiển và giám sát mô hình nhà kính thông minh sử dụng
IoT (Internet of things) và thuật toán Support Vector Machines” với mục đích
ứng dụng công nghệ Iot vào nhà kính, kết hợp với thuật toán Support Vector Machines để đánh giá phân lớp, đưa ra dự đoán, quyết định về trạng thái nhà kính
1.4 Tình hình nghiên cứu trong và ngoài nước
1.4.1 Ngoài nước
Trên thế giới với sự phát công nghệ thông tin và viễn thông phát triển vượt bậc như hiện nay ở các nước phát triển, điều khiển và giám sát không khó để thể thực hiện và ngày càng được nhân rộng Tuy nhiên nhà kính thông minh vẫn chưa được phát triển rộng, nhưng tầm thiết thực thì vô cùng lớn, một số nước lớn như Hà Lan
đã áp cụng công nghệ Iot cho nhà kính và đạt được những lợi ích thiết thực
a Nhà kính nông nghiệp công nghệ cao Israel ( Nguồn: Liên hiệp các hội khoa học và kỹ thuật tỉnh Thái Bình) [1]
Canh tác nhà kính được xem như một giải pháp công nghệ chìa khoá trong phát triển nông nghiệp công nghệ cao, là bước phát triển đột phá trong "nền văn minh nông nghiệp" Mục tiêu của canh tác nhà kính không có gì khác ngoài việc nâng cao hay tạo ra các mốc phát triển đột phá về năng suất, chất lượng sản phẩm, giảm thiểu rủi ro trong sản xuất; và để đạt được mục tiêu cao nhất cho người sản xuất là mục tiêu năng suất, chất lượng sản phẩm và sau cùng là mục tiêu hiệu quả kinh tế và giá trị thu nhập/đơn vị diện tích hay đồng vốn đầu tư Nhà kính công nghệ cao Israel, ngoài việc
Trang 13đảm bảo yêu cầu kết cấu bền vững, yêu cầu cho việc thực hiện cơ giới hoá đến mức cao nhất các công đoạn sản xuất, nhà kính còn có thể cho phép đáp ứng đến mức cao nhất các nhu cầu về kiểm soát “tiểu khí hậu nhà kính”; kiểm soát “sinh học nhà kính”; kiểm soát “dịch hại” nhà kính; và thực hiện các biện pháp điện toán điều chỉnh các yếu tố môi trường sinh thái nhà kính
Về kết cấu và cấu trúc: Kết cấu và cấu trúc nhà kính cần đảm bảo nguyên tắc cứng, nặng, đủ độ bền vững để chống lại gió mạnh (tuỳ theo đặc trưng thời tiết khí hậu địa phương) Hiện nay, Israel sử dụng toàn bộ loại hình nhà kính tiên tiến Các
bộ phận thường có của một nhà kính tiêu chuẩn là hệ thống rèm; "cửa ánh sáng" và
hệ thống lưới tạo bóng râm; các hệ thống kiểm soát và điều chỉnh môi trường sinh thái để tạo lập ra một môi trường sinh thái tối thích đáp ứng nhu cầu sinh lý cây trồng, như hệ thống kiểm soát và điều chỉnh nhiệt độ; hệ thống kiểm soát và điều chỉnh ẩm
độ không khí/ẩm độ đất; hệ thống kiểm soát và điều chỉnh ánh sáng; hệ thống thông khí, vv Cùng với việc nghiên cứu phát triển công nghệ tổng hợp, Israel đang tập trung khai thác và tận dụng các đặc trưng đặc tính của “vật liệu thông minh” để xây dựng nhà kính
Về độ cao: Nhà kính trước hết cần đảm bảo tiêu chuẩn độ cao phù hợp với đặc điểm sinh lý và sinh khối từng loại cây trồng cụ thể, (tạo lập một môi trường sinh thái tối thích cho cây trồng sinh trưởng phát triển) Độ cao nhà kính cũng là yếu tố tạo điều kiện thuận lợi cho việc thông gió, thông khí, tạo điều kiện thuận lợi phù hợp với các loại cây trồng Nhà kính cần đảm bảo và đáp ứng tốt mọi tiêu chuẩn và yêu cầu
kỹ thuật, đáp ứng các yêu cầu đòi hỏi cho công tác chăm sóc, công tác quản lý kỹ thuật sản xuất, bảo vệ thực vật, vv, ví dụ như tiêu chuẩn ngăn chặn côn trùng, ngăn chặn viruts, vi khuẩn xâm nhập, gây bệnh, vv Và đặc biệt, chiều cao nhà kính đôi khi còn phụ thuộc vào chiều cao của các loại máy móc, các trang thiết bị, các phương tiện cơ giới hoạt động trong nhà kính - thực hiện công việc chăm sóc/thu hoạch sản phẩm, tăng năng suất lao động
Về công nghệ kiểm soát tiểu khí hậu nhà kính công nghệ cao (Technologies for hi-tech greenhouses climate control)[2]: Nhà kính của Israel phải đảm bảo các
Trang 14tiêu chuẩn công nghệ quy định, ví dụ như tiêu chuẩn thích ứng nhiệt “làm mát vào ban ngày và toả ấm vào ban đêm” Việc thiết kế và xây dựng nhà kính như thế nào đó để sao cho việc kiểm soát và điều chỉnh các yếu tố môi trường để tạo ra " miền tiểu khí hậu tối thích " cho cây trồng phát triển trong khi chỉ cần "mức chi phí năng lượng tối thiểu" Để tự động hoá việc kiểm soát và điều chỉnh các thông số môi trường nhà kính, hệ thống cảm biến nhiệt độ và ẩm độ được cài đặt tại nhiều vị trí khác nhau
và được kết nối trực tiếp đến computer để thực hiện các lệnh tưới, bón, điều chỉnh nhiệt ẩm, tạo lập môi trường sinh thái tối thích cho cây trồng sinh trưởng phát triển
Hình 1.2: Hệ thống cảm biến nhiệt độ và ẩm độ được cài đặt tại nhiều vị trí khác
nhau và kết nối đến các computer
Về công nghệ kiểm soát sinh học và dịch bệnh nhà kính, việc kiểm soát sinh học nhà kính đóng vai trò quyết định tới năng suất, chất lượng nông sản và hiệu quả kinh tế sản xuất Để sớm phát hiện các tác động bất lợi của dịch bệnh, côn trùng, các
"Tấm chỉ thị" khác nhau được đặt trong nhà kính để thu hút và phát hiện các loại côn trùng gây hại xuất hiện trong nhà kính để từ đó các kỹ sư cây trồng đi đến quyết định
sử dụng biện pháp bảo vệ thực vật nào cho phù hợp Để giúp các loại cây trồng đạt
tỷ lệ đậu quả cao nhất có thể, trong nhà kính được đặt các tổ ong sinh học, ong sinh học trong nhà kính được thả bay tự do để thụ phấn cho cây Đối với các cây trồng thụ
Trang 15phấn như các loại dưa, cà chua … thì ong sinh học "Bio-bee"[3] đóng vai trò hết sức quan trọng trong việc thụ phấn - làm tăng năng suất quả
Hình 1.3: Các kỹ sư nông học kiểm tra dịch bệnh nhà
kính, Kibbutz Masharap, Israel
Về công nghệ điện toán nhà kính: Israel là đất nước có nền công nghệ thông tin phát triển sớm, bao gồm cả công nghệ phần cứng và công nghệ phần mềm Israel luôn nỗ lực khai thác ứng dụng đến mưc cao nhất lợi thế và ưu việt của công nghệ thông tin vào phát triển sản xuất nông nghiệp nói riêng Đối với sản xuất nhà kính, toàn bộ các hệ thống tưới nước/bón phân, hệ thống cấp và điều chỉnh ẩm
độ nhiệt độ, hệ thống kiểm soát tiểu khí hậu đều được thực hiện tự động hoá thông qua các hệ thống phần mềm quản lý kỹ thuật
Để việc thực hiện việc ứng dụng công nghệ thông tin vào sản xuất đạt hiệu quả cao nhất, giữa các nhà sản xuất (nhà nông), các kỹ sư sinh học/kỹ sư canh nông
và các kỹ sư công nghệ phần mềm Israel luôn duy trì mối quan hệ gắn bó mật thiết
Trang 16để cùng nhau đưa vào sản xuất "các phần mềm quản lý kỹ thuật", các giải pháp công nghệ tiên tiến và tối ưu nhất có thể
b Hệ thống nông nghiệp thông minh kiểm soát môi trường trong nhà kính trồng hoa lan tại Đài Loan (Nguồn: Leon Kennedy in Internet of Things) [4]
Hình 1.4: Hệ thống tự động hóa kiểm soát môi trường trong nhà kính trồng hoa lan
Hệ thống được xây xung quanh một Programmable Automation Controller (PAC) Advantech APAX-5000 series[5] cùng các bộ điều khiển tự động hóa khả trình để xây dựng nền tảng kiểm soát, cùng với phần mềm HMI/SCADA điện toán đám mây Webaccess[6] Các nhân viên của hợp tác xã phong lan có thể theo dõi các
dữ liệu quan trọng bất cứ lúc nào thông qua điện thoại thông minh, iPad, và các thiết
bị cầm tay, qua đó thay đổi các thông số kiểm soát điều kiện sinh trưởng và ra hoa
Yêu cầu hệ thống: Trong quá khứ, hầu hết các hệ thống kiểm soát môi trường của nhà kính trồng lan tại Đài Loan sử dụng PLC (Programmable Logic Controller) với khả năng mở rộng kém, chúng không thể kết nối với Internet và công nghệ điện toán đám mây Việc phân tích cơ sở dữ liệu và khả năng kết nối mạng, các
Trang 17nền tảng máy tính cần phải được sử dụng Do đó, hệ thống PAC với cả hai khả năng lập trình PLC và chức năng PC đem lại lựa chọn tốt hơn PAC kiểm soát môi trường của nhà kính qua việc tắt, bật các thiết bị như quạt, mái che sáng, máy tưới, máy phun sương Hệ thống APAC kiểm soát môi trường nhà kính có các thiết bị sau đây:
Cảm biến để phát hiện các điều kiện môi trường như nhiệt độ và độ ẩm bên trong và bên ngoài nhà kính, ánh nắng mặt trời, hướng gió và tốc độ
Thành phần điều khiển để thực hiện các lệnh điều khiển quạt, đóng mở tấm che, lưới, máy bơm nước và các thiết bị khác
Một máy chủ có khả năng phân tích và tính toán, kết nối các cảm biến ở trên, các thành phần điều khiển và thiết bị điện khác
Phần mềm HMI/ SCADA xử lý các thông số đầu vào từ máy tính, với khả năng phân tích cơ sở dữ liệu và giám sát từ xa
Với Advantech bộ điều khiển APAX và phần mềm WebAccess, các nhân viên của các trang trại hoa lan có thể thiết lập các thông số kiểm soát môi trường của nhà kính với một giao diện đồ họa dễ sử dụng Hệ thống tự động thông báo các yếu tố ánh sáng, nhiệt độ, độ ẩm, không khí lưu thông, và các điều kiện khác, cho phép kích hoạt các thành phần kiểm soát để điều chỉnh các điều kiện môi trường bên trong nhà kính
Các máy chủ APAX-5520 kết nối với máy tính văn phòng thông qua một cáp mạng và kết nối đến các đám mây qua 3G, wifi Để giám sát các điều kiện trong nhà
Trang 18kính, nhân viên chỉ cần tải về và cài đặt ứng dụng Advantech trên điện thoại thông minh hoặc iPad
Kết luận:
Hệ thống điều khiển nhà kính với bộ điều khiển Advantech APAX và phần mềm WebAccess có ưu điểm là chi phí rẻ và dễ dàng mở rộng Có thể dễ dàng kiểm soát và giám sát, theo dõi tình hình thông qua máy tính, điện thoại, tablet ở mọi lúc mọi nơi
Bằng cách sử dụng một hệ thống quản lý môi trường nhà kính, nông dân có thể kiểm soát thời gian ra hoa, điều chỉnh sản lượng qua đó cải thiện doanh thu và giảm các rủi ro thị trường Đồng thời, môi trường với các điều kiện tối ưu sẽ đảm bảo chất lượng của những bông hoa
Cũng như hoa lan, hệ thống kiểm soát môi trường nhà kính tự động cũng được phát triển cho việc trồng trái cây và rau hữu cơ làm tăng giá trị kinh tế nông nghiệp Với sự thay đổi khí hậu ngày càng rõ rệt, thời tiết trở nên khắc nghiệt hơn trước Hệ thống giám sát môi trường, cảnh báo và điều khiển tự động kết hợp với công nghệ thông tin và truyền thông có thể giúp ngành nông nghiệp thoát khỏi số phận "trông trời, trông đất, trông mây"
1.4.2 Trong nước
Với sự phát triển như vũ bão của khoa học kỹ thuật và những ứng dụng của chúng mang tầm chiến lược vào thực tế như hiện nay và khi Việt Nam gia nhập WTO, chúng ta hội nhập mạnh mẽ vào các hiệp hội, tổ chức có quy mô quốc tế, toàn cầu thì mới có cơ hội tiếp cận, giao lưu thương mại Hội nhập nền kinh tế thế giới đồng nghĩa với việc các hàng hóa của Việt Nam có thể phát triển mạnh xuất khẩu ra nước ngoài
và ngược lại có thể nhập khẩu hàng hóa từ nước ngoài vào Việt Nam, trong đó có mặt hàng công nghệ, thiết bị hiện đại phục vụ sản xuất và nhu cầu của người dân, đảm bảo trình độ công nghệ tiên tiến kịp thời đại, tương đương với các nước trong khu
vực và trên toàn thế giới
Trang 19Khoa học kỹ thuật càng phát triển thì cuộc sống của con người càng đầy đủ tiện nghi và việc ứng dụng tự động hóa càng được rộng rãi nên đề tài về điều khiển
và giám sát mô hình nhà kính thông minh sử dụng IoT (Internet of things) và thuật
toán thông minh thu hút được mọi người Các vị trí trong nhà kính đều gắn các bộ
điều khiển điện tử có thể kết nối với Internet, cho phép chủ nhân điều khiển hệ thống
từ xa hoặc lập trình cho thiết bị hoạt động theo từng loại nông sản Thêm vào đó, các thiết bị có thể hiểu được ngôn ngữ của nhau và có khả năng tương tác với nhau Tuy nhiên có một số hạn chế như ta có thể nhận thấy là giải pháp quản lý nhà kính thông minh đều phụ thuộc khá nhiều vào chất lượng dịch vụ viễn thông, bao gồm mạng điện thoại và mạng Internet tốc độ cao Vì vậy cần tối ưu hóa hệ thống với chức năng auto, mọi chức năng trong nhà kính sẽ kính hoạt chế độ auto khi không thề điều khiển qua Web
Nói tóm lại, việc nghiên cứu sử dụng nhà kính dùng Web điều khiển, theo dõi hiện nay tại Việt Nam đang còn rất mới mẽ và chưa đi vào thực tiễn ứng dụng Hầu hết các nghiên cứu đều là nghiên cứu tự phát của cá nhân những người hay nhóm người muốn tìm hiểu về công nghệ này, vẫn chưa phải là một hoạt động nghiên cứu mang tính chuyên nghiệp để có thể đưa vào ứng dụng Mặc dù vậy, nhưng trong thời đại công nghệ thông tin và viễn thông phát triển vượt bậc như hiện nay, không khó
để chúng ta có thể thực hiện được điều đó Ta sử dụng Web để điều khiển ở Việt Nam
là có cơ sở khi hầu hết máy tính, điện thoại hiện nay đều có thể lên Web Điều này là một lợi thế cho việc nghiên cứu và phát triển các ứng dụng trong điều khiển tự động hóa
a Điển hình là nhà kính thông minh của Trường đại học bách khoa TP.HCM ( Nguồn: Phòng thí nghiệm trọng điểm điều khiển số và kỹ thuật hệ thống) [8]
Nhà kính thông minh là sản phẩm của Phòng thí nghiệm trọng điểm điều khiển
số và kỹ thuật hệ thống, Trường đại học bách khoa TP.HCM
Nhà kính thông minh có khả năng tư ̣ cung cấp chất dinh dưỡng cho cây theo chu kỳ thời gian, tư ̣đôṇg điều khiển khí hâụ trong mô hình (nhiêṭ độ, đô ̣ẩm, ánh sáng ) do
Trang 20hê ̣thống có trang bị các cảm biến nhiêṭ đô,̣ đô ̣ẩm, ánh sáng , PH và các cơ cấu chấp hành như: bô ̣khuấy trôṇ , hệ thống tưới nhỏ giọt, hê ̣thống phun sương, quạt điều hòa , đèn Led chiếu sáng kích thích tăng trưởng
Hình 1.5: Nhà kính hỗ trợ người trồng công tác chăm sóc, tránh côn trùng gây hại,
tạo môi trường phù hợp cây trồng Sản phẩm được thiết kế gọn nhẹ, dễ dàng đi vào các con hẻm nhỏ, phù hợp với các sở nông nghiệp, các công ty chuyên cung cấp rau củ quả
Trang 21b Mô hình nông nghiệp sạch bằng hệ thống tự động ( Nguồn:
giaoduc.edu.vn) [9]
Hình 1.6: Tự động giám sát và điều khiển môi trường nhà kính sử dụng năng lượng
mặt trời bằng điện thoại smartphone
Nhóm nghiên cứu của Trường ĐH Quảng Bình và nhóm Combros (một nhóm Startup do những giảng viên Trường ĐH Bách khoa TP.HCM thành lập) đã thiết kế
và chế tạo thành công mô hình “Tự động giám sát và điều khiển môi trường nhà kính
sử dụng năng lượng mặt trời bằng điện thoại smartphone” Hệ thống tự động giám sát và điều khiển môi trường nhà kính thông qua các cảm biến: nhiệt độ, độ ẩm, ánh sáng và cơ cấu chấp hành: quạt, bơm tưới, mái che Điểm đặc biệt của mô hình này
là sử dụng nguồn năng lượng sạch và vô tận: năng lượng mặt trời, năng lượng gió và năng lượng tái tạo Hơn nữa, mô hình này được điều khiển từ xa bằng điện thoại smartphone thông qua kết nối không dây wifi nên không đòi hỏi nhiều nhân công và sức lao động Hiện tại, mô hình đã thành công bước đầu và đang triển khai vào môi trường thực tế
Trang 22+ Cơ sở dữ liệu nhà kính lưu lại toàn bộ dữ liệu nhà kính để đảm bảo cho quá trình phân tích thu thập dữ liệu mọi thời điểm
+ Phần thuật toán sử dụng thuật toán Support Vector Machines để đánh giá độ chính xác phân lớp và dự đoán, ra quyết định trạng thái nhà kính, sau đó lấy trạng thái làm cơ sở điều khiển nhà kính
1.6 Đề cương nghiên cứu chi tiết
Đề tài này được thực hiện gồm 5 chương
Chương 1: Tổng quan: Giới thiệu đề tài, ý nghĩa khoa học, mục đích nghiên cứu và giới hạn của đề tài Tình hình nghiên cứu trong và ngoài nước, ý tưởng thiết
kế, đề cương nghiên cứu chi tiết, phương pháp nghiên cứu, phương tiện nghiên cứu
Chương 2: Cơ sở lý thuyết
Chương 3: Thiết kế hệ thống, ứng dụng công nghệ IoT và thuật toán Support Vector Machines vào nhà kính thông minh
Chương 4: Quá trình thực nghiệm
Chương 5: Kết luận và hướng phát triển cho tương lai
1.7 Đối tượng nghiên cứu:
a Bo vi điều khiển, bo nhúng, bo giao tiếp wifi, một số loại cảm biến, các cơ cấu chấp hành, thiết bị chống nhiễu…
Trang 23- Bo vi điều khiển Arduino Mega
Hình 1.7: Bo vi điều khiển Arduino Mega
- Bo nhúng Raspberry Pi 3
Hình 1.8: Bo nhúng Raspberry Pi 3
- Bo giao tiếp wifi ESP8266: Giao tiếp với Raspberry Pi 3 qua Wifi
Hình 1.9: Bo ESP8266
Trang 24- Cảm biến:
+ Cảm biến nhiệt độ, độ ẩm DHT11: DHT11 Là cảm biến nhiệt độ, độ ẩm lấy dữ liệu thông qua giao tiếp 1-wire ( giao tiếp digital 1-wire truyền dữ liệu duy nhất) Cảm biến được tích hợp bộ tiền xử lý tín hiệu giúp dữ liệu nhận về được chính xác mà không cần phải qua bất kỳ tính toán nào
Hình 1.10: Cảm biến nhiệt độ, độ ẩm DHT11 + Cảm biến quang trở CDS: Cảm biến ánh sáng sử dụng quang trở có khả năng thay đổi điện trở theo cường độ ánh sáng chiếu vào
Hình 1.11: Cảm biến quang trở CDS + Cảm biến độ ẩm đất: Cảm biến độ ẩm đất, trạng thái đầu ra mức thấp (0V), khi đất thiếu nước đầu ra sẽ là mức cao (5V), độ nhạy cao chúng ta có thể điều chỉnh được bằng biến trở Phần đầu đo được cắm vào đất để phát hiện độ ẩm của đất, khi độ ầm của đất đạt ngưỡng thiết lập, đầu ra DO sẽ chuyển trạng thái
Trang 25Hình 1.12: Cảm biến độ ẩm đất + Cảm biến độ PH nước: Cảm biến PH được kết nối on-board, đầu ra tín hiệu Analog, thanh cảm biến nhúng vào nước dễ dàng đo được độ PH của nước tưới
Hình 1.13: Cảm biến đo độ PH của nước
Trang 26- Cơ cấu chấp hành: Gồm quạt thông gió, máy làm lạnh, thiết bị sưởi, bơm nước, đèn chiếu sáng…
Hình 1.14: Các cơ cấu chấp hành sử dụng trong nhà kính
- Thiết bị chống nhiễu nguồn: Bộ lọc nhiễu lọc các sóng nhiễu sinh ra từ thiết
bị quay ngược vào hệ thống, sẽ giúp cho các thiết bị xung quanh hoạt động ổn định, chính xác, và tăng tuổi thọ
Hình 1.15: Bộ lọc nhiễu nguồn
Trang 27b Web server, mã nguồn Node.js, giao thức MQTT và cơ sở dữ liệu MongoDB
- Mã nguồn Node.js được sử dụng để viết Web Server
- Giao thức MQTT là giao thức truyền nhận các thông điệp và giao tiếp các thiết
bị
- Cơ sở dữ liệu MongoDB được sử dụng để thu thập, lưu trữ dự liệu
c Thuật toán Support Vector Machines
- Thuật toán Support Vector Machines đánh giá độ chính xác phân lớp dữ liệu nhà kính và dự đoán nhãn lớp cho nhà kính
1.8 Phương pháp nghiên cứu
Trong đề tài này, tác giả đã sử dụng các phương pháp nghiên cứu:
Phương pháp tham khảo tài liệu: bằng cách thu thập thông tin từ sách, tạp chí
về điện tử, viễn thông, truy cập từ mạng internet, đặc biệt là những hệ thống Iot, AI
từ nước ngoài
Phương pháp quan sát: khảo sát một số bo mạch điện tử, cảm biến, các cơ cấu
để chọn lựa phương án thiết kế
Phương pháp thực nghiệm: từ những ý tưởng và kiến thức đã học và kinh nghiệm làm việc, kết hợp sự hướng dẫn của giáo viên, để xây dựng một mô hình hoàn chỉnh có thể áp dụng thực tế
1.9 Phân tích nhiệm vụ đề tài
Đề tài nhằm xây dựng một hệ thống có khả năng điều khiển giám sát, phân tích, lưu trữ dữ liệu của nhà kính từ xa mang lại hiệu quả cao trong nông nghiệp
Hệ thống được xây dựng gồm hệ thống nhúng, hệ thống điều khiển trung tâm, các cảm biến, các cơ cấu chấp hành, web server, cơ sở dữ liệu và thuật toán Support Vector Machines
Trang 28Sơ đồ tổng quát các module trong đề tài :
Hình 1.16: Tổng quan các thiết bị sử dụng trong luận văn
1.9.1 Các vấn đề cần giải quyết
Truyền nhận dữ liệu giữa vi điều khiển, nhúng và web
Đồng bộ dữ liệu giữa web và bộ điều khiển
Tạo cơ sở dữ liệu để lưu trữ và phân tích
Sử dụng thuật toán để tối ưu hóa hệ thống điều khiển
Chống nhiễu hệ thống
1.9.2 Tại sao có những vấn đề trên và hướng giải quyết vấn đề
1.9.2.1 Truyền nhận dữ liệu giữa vi điều khiển, nhúng và web
Như tên đề tài đã nêu ở chương trước thì chúng ta cũng có thể thấy rằng muốn điều khiển giám sát được thiết bị trong nhà kính qua web thì trước hết những thứ ta cần là:
Trang 29 Một trang web với một địa chỉ riêng và giao diện để người sử dụng có thể quan sát được trạng thái của các thiết bị và tạo ra những tác động với những thiết bị đó Vậy vấn đề được đặt ra là chúng ta cần học những gì để có thể tạo ra một trang web? Để tạo ra một trang web chúng ta cần tích hợp rất nhiều ngôn ngữ để tạo ra một trang web mang tích thẩm mỹ cao và phù hợp với mục đích người sử dụng theo những
gì đã tìm hiểu được từ mạng internet, sách báo và trong quá trình công tác thì trong luận văn này tác giả sử dụng : Node.js để xây dựng web với mục đích có thể giám sát, điều khiển, nâng cấp dễ dàng và tối ưu hóa hệ thống
Thứ hai chúng ta cần là một vi điều khiển trung tâm để thu thập dữ liệu từ các cảm biến và điều khiển thiết bị.đặc biệt vi điều khiển này phải giao tiếp với ngoại vi
để có thể truyền nhận dữ liệu lên internet
Thứ ba chúng ta cần giao tiếp giữa vi điều khiển và nhúng
Thứ tư là thu thập và phân tích dữ liệu dựa vào cơ sở dữ liệu MONGODB
Thứ năm là sử dụng thuật toán Support Vector Machines để tối ưu hóa hệ thống điều khiển bằng cách đánh giá độ chính xác phân lớp, dự đoán trạng thái nhà kính
1.9.2.2 Truyền nhận dữ liệu giữa board mạch trung tâm và bộ điều khiển
Để tạo sự tiện lợi trong việc điều khiển giàm sát trong phạm vi gần trong nhà kính đã xây dựng một bộ điều khiển có khả năng truyền nhận dữ liệu với bo mạch trung tâm Và vần đề đặt ra ở đây là làm sao để người sử dụng có thể biết trạng thái của các thiết bị một cách liên tục để làm được điều này thì bo vi điều khiển trung tâm phải liên tục truyền dữ liệu của các thiết bị và bên phía bộ điều khiển phải liên tục nhận dữ liệu và phân loại dữ liệu để có thể hiển thị chính xác Đồng thời phải lưu trữ cơ sở dữ liệu để phân tích và tối ưu hóa hệ thống
1.9.2.3 Đồng bộ dữ liệu giữa web và bộ điều khiển
Vì dữ liệu có thể điều khiển từ hai phía là web và bộ điều khiển nên vấn đề cần phải giải quyết ở đây là làm cách nào để cập nhật dữ liệu và thông tin điều khiển
Trang 30lên bộ điều khiển khi thiết bị được điều khiển từ web và ngược lại muốn làm được điều này thì ta phải tìm cách đồng bộ biến trong lập trình
1.10 Phương tiện nghiên cứu
- Sử dụng mã nguồn Node.js và giao thức MQTT để xây dựng Web server
- Sử dụng cơ sở dữ liệu MongoDB trong việc thu thập, phân tích dữ liệu
- Sử dụng thuật toán Support Vector Machine tối ưu hóa hệ thống Iot
Trang 31CHƯƠNG 2
CƠ SỞ LÝ THUYẾT 2.1 Nhà kính thông minh
Một môi trường nhà kính thông minh có thể được hiểu là một môi trường mà được trang bị hệ thống tiên tiến dành cho điều khiền đèn chiếu sáng, nhiệt độ, độ ẩm,
độ PH, quạt thông gió và nhiều tính năng khác nhằm mục đích làm cho chất lượng và năng suất nông sản là cao nhất, giảm bớt chi phí nuôi trồng đồng thời tăng chất lượng
an toàn nông sản Với sự kết hợp của công nghệ Internet of Things và thuật toán Support Vector Machines đã tối ưu hóa và làm cho nhà kính trở nên thông minh
5 đặc trưng của nhà kính thông minh gồm:
- Điều khiển từ xa các thiết bị: mỗi thiết bị phải được điều khiển từ xa hoặc tự động mà không cần sự can thiệp của con người
- Giao tiếp giữa các thiết bị: Trong hệ thống nhà kính thông minh các thiết bị phải có khả năng giao tiếp với các thiết bị khác trong hệ thống Ngoài ra các thiết bị cũng phải có khả năng giao tiếp được với nguồn thông tin bên ngoài thông qua internet
- Thu thập thông tin từ mạng cảm biến thông minh: phải có một cách chia sẻ, truyền thông tin từ hệ thống các cảm biến trong môi trường đến trung tâm điều khiển Trung tâm sử dụng thông tin này điều khiển trạng thái của các thiết bị
để đáp ứng tốt hơn các yêu cầu của người dùng
- Nâng cao chất lượng nhờ các thiết bị thông minh: Bằng cách thu thập thông tin từ mạng cảm biến và giao tiếp với thế giới bên ngoài giúp các nhà sản xuất
và lập trình viên tạo ra nhiều thiết bị thông minh hơn nhờ vào các thông tin đó
- Khả năng dự đoán và ra quyết định: với các đặc điểm nêu trên đã cho phép tạo
ra môi trường nhà kính thông minh Tuy nhiên vẫn còn nhiều mặt hạn chế như việc kiểm soát thủ công đòi hỏi phải giám sát và hiệu chỉnh thiết bị liên tục
Trang 32Để cho việc kiểm soát hoàn toàn tự động, hệ thống phải có khả năng học để thích nghi với các thay đổi
2.2 Thuật toán máy học
2.2.1 Giới thiệu
- Máy học(tiếng Anh: machine learning) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống
"học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể Ví dụ như các máy
có thể "học" cách phân loại thư điện tử xem có phải thư rác (spam) hay không
và tự động xếp thư vào thư mục tương ứng Máy học rất gần với suy diễn thống
kê (statistical inference) tuy có khác nhau về thuật ngữ
- Máy học có liên quan lớn đến thống kê, vì cả hai lĩnh vực đều nghiên cứu việc phân tích dữ liệu, nhưng khác với thống kê, máy học tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính toán Nhiều bài toán suy luận được xếp vào loại bài toán NP-khó, vì thế một phần của Máy học là nghiên cứu sự phát triển các giải thuật suy luận xấp xỉ mà có thể xử lý được
- Máy học có hiện nay được áp dụng rộng rãi bao gồm máy truy tìm dữ liệu, chẩn đoán y khoa, phát hiện thẻ tín dụng giả, phân tích thị trường chứng khoán, phân loại các chuỗi DNA, nhận dạng tiếng nói và chữ viết, dịch tự động, chơi trò chơi và cử động rô-bốt (robot locomotion)
- Biểu diễn (tiếng Anh: representation) là một trong những vấn đề quan trọng của máy học Biểu diễn ở đây có thể hiểu làm sao ghi mã (encode) những thông tin của thế giới thật giúp hoàn thành nhiệm vụ một cách hiệu quả và đầy
đủ nhất có thể Thông tin ở đây bao hàm cả thông tin về dữ liệu đầu vào, đầu
ra hay các trạng thái của hệ thống; cũng như cách đánh giá hiệu quả của chương trình
- Thông thường, trong máy học người ta hay xây dựng các mô hình sử dụng những biến ngẫu nhiên cho việc biểu diễn dữ liệu và nội trạng thái của hệ thống Ví dụ: dùng biến ngẫu nhiên để biểu thị cho tính chất của email là spam
Trang 33(tương ứng giá trị 0) hay là bình thường (tương ứng 1) Mối tương quan giữa các biến ngẫu nhiên này có thể sử dụng ví dụ như mô hình xác suất dạng đồ thị để miêu tả Mặt khác, để đo hiệu quả có thể dùng các hàm thiệt hại(hay hàm tiện ích, trong tiếng Anh là loss function và utility function tương ứng)
- Một trong những trọng tâm khác của máy học là đạt được tính phổ quát (tiếng Anh: generalization), nói cách khác là tính chất của chương trình có thể làm việc tốt với dữ liệu mà nó chưa gặp bao giờ (tiếng Anh: unseen data) Một chương trình chỉ hiệu quả với dữ liệu đã gặp nhìn chung không có nhiều tính hữu dụng
- Lấy ví dụ về xếp thư điện tử tự động như trên, một hệ thống tự động sau khi trải qua quá trình học từ dữ liệu ("training") có thể suy diễn một số nguyên tắc riêng (chẳng hạn như xem xét nội dung: nếu thư được viết bằng tiếng Anh mà chứa một số từ như "porn", "sell", "good product" hoặc người gửi đến từ Somalia trong khi người nhận ở Hà Nội không thân quen nhau) để quyết định xem có phải là thư rác hay không Tuy nhiên, nếu như trong dữ liệu bài giảng (training data) có ngôn ngữ khác trong thực tế (tiếng Việt thay vì tiếng Anh) hoặc thậm chí không phải dạng thuần văn bản (dạng ảnh khiến cho bóc tách nội dung khó hơn hoặc không thể) thì rất có thể máy sẽ dự báo không chính xác nữa
- Một số chương trình có thể tự động cập nhật trong thời gian thực (ví dụ như người sử dụng có chỉ ra rằng thư bị sắp xếp sai danh mục)
- Một số hệ thống Máy học nỗ lực loại bỏ nhu cầu trực giác của con người trong việc phân tích dữ liệu, trong khi các hệ thống khác hướng đến việc tăng sự cộng tác giữa người và máy Không thể loại bỏ hoàn toàn tác động của con người vì các nhà thiết kế hệ thống phải chỉ định cách biểu diễn của dữ liệu và những cơ chế nào sẽ được dùng để tìm kiếm các đặc tính của dữ liệu Máy học
có thể được xem là một nỗ lực để tự động hóa một số phần của phương pháp khoa học Một số nhà nghiên cứu Máy học tạo ra các phương pháp bên trong các khuôn khổ của thống kê Bayes
Trang 34- Các thuật toán máy học được phân loại theo kết quả mong muốn của thuật toán Các loại thuật toán thường dùng bao gồm:
- Học có giám sát: trong đó, thuật toán tạo ra một hàm ánh xạ dữ liệu vào tới kết quả mong muốn Một phát biểu chuẩn về một việc học có giám sát là bài toán phân loại: chương trình cần học (cách xấp xỉ biểu hiện của) một hàm ánh
xạ một vector {\displaystyle [X_{1},X_{2},\ldots X_{N}]}tới một vài lớp bằng cách xem xét một số mẫu dữ liệu - kết quả của hàm đó
- Học không giám sát: mô hình hóa một tập dữ liệu, không có sẵn các ví dụ đã được gắn nhãn
- Học nửa giám sát: kết hợp các ví dụ có gắn nhãn và không gắn nhãn để sinh một hàm hoặc một bộ phân loại thích hợp
- Học tăng cường: trong đó, thuật toán học một chính sách hành động tùy theo các quan sát về thế giới Mỗi hành động đều có tác động tới môi trường, và môi trường cung cấp thông tin phản hồi để hướng dẫn cho thuật toán của quá trình học
- Chuyển đổi: tương tự học có giám sát nhưng không xây dựng hàm một cách
rõ ràng Thay vì thế, cố gắng đoán kết quả mới dựa vào các dữ liệu huấn luyện, kết quả huấn luyện, và dữ liệu thử nghiệm có sẵn trong quá trình huấn luyện
- Học cách học: trong đó thuật toán học thiên kiến quy nạp của chính mình, dựa theo các kinh nghiệm đã gặp
Trang 352.2.2 Học cĩ giám sát
2.2.2.1 Cây quyết định (Decision Trees)
Cây quyết định là cơng cụ hỗ trợ quyết định sử dụng biểu đồ dạng cây hoặc mơ hình của các quyết định và kết quả cĩ thể xảy ra của chúng, bao gồm kết quả sự kiện ngẫu nhiên, chi phí tài nguyên và lợi ích Dưới đây là một ví dụ điển hình của cây quyết định:
Hình 2.1: Mơ hình cây quyết định [1]
Cây quyết định này cho ta gợi ý về việc có đi đá bĩng hay khơng Ví dụ, quang cảnh có nắng, độ ẩm trung bình thì tơi sẽ đi đá bóng Ngược lại, nếu trời mưa, gió mạnh thì tơi sẽ khơng đi đá bóng nữa
Cây quyết định tuy là mơ hình khá cũ, khá đơn giản những vẫn cịn được ứng dụng khá nhiều và hiệu quả Đứng dưới góc nhìn thực tế, cây quyết định là một danh sách tối thiểu các câu hỏi dạng yes/no mà người ta phải hỏi, để đánh giá xác suất đưa
ra quyết định đúng đắn
2.2.2.2 Phân loại Bayes
Phân loại Bayes là một nhóm các phân loại xác suất đơn giản dựa trên việc áp dụng định lý Bayes với các giả định độc lập (nạve) giữa các đặc tính
Trang 36Hình 2.2: Định lý Bayes Trong đó: P(A|B) là xác suất có điều kiện A khi biết B, P(A) là xác suất giả thuyết A (tri thức có được về giải thuyết A trước khi có dữ liệu B), P(B|A) là xác suất có điều kiện B khi biết giả thuyết A, P(B) là xác suất của dữ liệu quan sát B không quan tâm đến bất kỳ giả thuyết A nào
Thuật toán này được áp dụng trong một số bài toán như:
Đánh dấu một email là spam hay không
Phân loại bài viết tin tức thuộc lĩnh vực công nghệ, chính trị hay thể thao
Kiểm tra một đoạn văn bản mang cảm xúc tích cực hay tiêu cực
Sử dụng cho các phần mềm nhận diện khuôn mặt
2.2.2.3 Hồi quy tuyến tính (Ordinary Least Squares Regression)
Hình 2.3: Đồ thi hồi quy tuyến tính [3]
Trang 37Nếu bạn biết thống kê, bạn có thể đã nghe nói về hồi quy tuyến tính trước đây Bình phương nhỏ nhất là một phương pháp để thực hiện hồi quy tuyến tính Bạn
có thể suy nghĩ về hồi quy tuyến tính như là nhiệm vụ kẻ một đường thẳng đi qua một tập các điểm Có rất nhiều chiến lược có thể thực hiện được, và chiến lược "bình phương nhỏ nhất" sẽ như thế này - Bạn có thể vẽ một đường thẳng, và sau đó với mỗi điểm dữ liệu, đo khoảng cách thẳng đứng giữa điểm và đường thẳng Đường phù hợp nhất sẽ là đường mà các khoảng cách này càng nhỏ càng tốt
Một số ví dụ là người ta có thể sử dụng mô hình này để dự đoán giá cả (nhà đất, chứng khoán), điểm số,
2.2.2.4 Hồi quy logistic (Logistic Regression)
Hình 2.4: Đồ thị hồi quy logistic [4]
Hồi quy logistic là một cách thống kê mạnh mẽ để mô hình hóa một kết quả nhị thức với một hoặc nhiều biến giải thích Nó đo lường mối quan hệ giữa biến phụ thuộc phân loại và một hoặc nhiều biến độc lập bằng cách ước tính xác suất sử dụng một hàm logistic, là sự phân bố tích lũy logistic
Thuật toán này được sử dụng trong một số trường hợp:
Trang 38 Điểm tín dụng ( quyết định có cho khách hàng vay vốn hay không)
Đo mức độ thành công của chiến dịch marketing
Dự đoán doanh thu của một sản phẩm nhất định
sẽ tìm ra một đường thẳng nhằm phân cách các điểm đó thành 2 nhóm sao cho khoảng cách giữa đường thẳng và các điểm xa nhất có thể
Trang 39Xét về quy mô, một số vấn đề lớn nhất đã được giải quyết bằng cách sử dụng SVM (với việc thực hiện sửa đổi phù hợp) ví dụ như hiển thị quảng cáo, phát hiện giới tính dựa trên hình ảnh, phân loại hình ảnh có quy mô lớn
2.2.2.6 Kết hợp các phương pháp (Ensemble Methods)
Hình 2.6: Sơ đồ Ensemble Methods [9]
Phương pháp này dựa rên sự kết hợp của một vài phương pháp kể trên để dự đoán kết quả, sau đó sẽ đưa ra kết quả cuối cùng dựa vào trọng số của từng phương pháp
Vậy phương pháp này hoạt động như thế nào và tại sao nó lại ưu việt hơn các mô hình
cá nhân?
Trung bình sai số (bias): một số phương pháp hoạt động tốt và cho sai số nhỏ, ngược lại cũng có một số phương pháp cho sai số lớn Trung bình ta được một sai số chấp nhận được, có thể nhỏ hơn sai số khi sử dụng duy nhất một phương pháp
Giảm độ phụ thuộc vào tập dữ liệu (variance): ý kiến tổng hợp của một loạt các mô hình sẽ ít nhiễu hơn là ý kiến đơn lẻ của một mô hình Trong lĩnh vực
Trang 40tài chính, đây được gọi là đa dạn hóa - một - một danh mục hỗn hợp của nhiều
cổ phiếu sẽ ít biến động hơn so với chỉ một trong số các cổ phiếu riêng lẻ
Giảm over-fit: over-fit là hiện tượng khi mô hình hoạt động rất tốt với dữ liệu training, nhưng rất kém đối với dữ liệu test Việc kết hợp nhiều mô hình cùng lúc giúp giảm vấn đề này
2.2.3 Học không có giám sát
2.2.3.1 Thuật toán gom cụm (Clustering Algorithms)
Gom cụm là nhiệm vụ nhóm một tập hợp các đối tượng sao cho các đối tượng trong cùng một nhóm (cluster) giống nhau hơn so với các đối tượng trong các nhóm khác
Hình 2.7: Thuật toán gom cụm [11]
Gom cụm có nhiều phương pháp khác nhau, sau đây là một vài trong số đó:
Gom cụm dựa vào tâm điểm (Centroid-based algorithms)
Gom cụm dựa vào tính kết nối (Connectivity-based algorithms)
Gom cụm dựa vào mật độ (Density-based algorithms)
Gom cụm dựa vào xác suất (Probabilistic)
Gom cụm dựa trên giảm chiều dữ liệu (Dimensionality Reduction)