Vì vậy, Bộ giáo dục và Đào tạo đã đưa hoạt động giáo dục hướng nghiệp vào nhà trường từ rất sớm với mục đích giúp cho các em học sinh nhận thức đúng đắn về nghề nghiệp, có định hướng lựa
Trang 1ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA
-✵ -
NGUYỄN CAO ĐỨC
Trang 2
LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn này là công trình do tôi tổng hợp và nghiên cứu Trong luận văn có sử dụng một số tài liệu tham khảo như đã nêu trong phần tài liệu tham khảo, các số liệu thu thập và kết quả xử lý nêu trong luận văn là trung thực
Tác giả luận văn
Nguyễn Cao Đức
Trang 3LỜI CẢM ƠN
Sau thời gian học tập và rèn luyện tại Trường Đại học Bách khoa – Đại học Đà Nẵng, bằng sự biết ơn và kính trọng, tôi xin chân thành cảm ơn Ban Giám hiệu, các phòng, khoa thuộc Trường Đại học Bách khoa và các Giáo sư, P Giáo sư, Tiến sĩ đã nhiệt tình giảng dạy và tạo điều kiện thuận lợi giúp đỡ tôi trong quá trình học tập và làm Luận văn Đặc biệt, tôi xin bày tỏ lòng biết ơn và lời cảm ơn sâu sắc tới TS Đậu Mạnh Hoàn, người thầy đã trực tiếp hướng dẫn, giúp đỡ tôi trong suốt quá trình thực hiện đề tài
Xin chân thành cảm ơn các anh chị trong Ban lãnh đạo Phòng giáo dục huyện
Bố Trạch; Cán bộ quản lý, giáo viên, nhân viên cùng bạn bè, đồng nghiệp đã tạo điều kiện thuận lợi để tôi nghiên cứu hoàn thành Luận văn Do điều kiện về năng lực bản thân còn hạn chế, luận văn chắc chắn không tránh khỏi những thiếu sót Kính mong nhận được sự đóng góp ý kiến của các thầy cô giáo trong hội đồng khoa học, bạn bè và đồng nghiệp để luận văn của tôi được hoàn thiện hơn
Xin trân trọng cảm ơn./
Tác giả
Trang 4
MỤC LỤC
MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích và ý nghĩa của đề tài 3
2.1 Mục đích 3
2.2 Ý nghĩa khoa học 3
2.3 Ý nghĩa thực tiễn 3
3 Mục tiêu và nhiệm vụ đề tài 3
3.1 Mục tiêu 3
3.2 Nhiệm vụ 3
4 Đối tượng, phạm vi nghiên cứu 4
4.1 Đối tượng nghiên cứu 4
4.2 Phạm vi nghiên cứu 4
5 Phương pháp nghiên cứu 4
5.1 Phương pháp lý thuyết 4
5.2 Phương pháp thực nghiệm 4
6 Cấu trúc luận văn 5
Chương 1 - KHAI PHÁ DỮ LIỆU VÀ NHỮNG VẤN ĐỀ LIÊN QUAN 6
1.1 Tổng quan về khai phá dữ liệu 6
1.1.1 Khai phá dữ liệu là gì? 6
1.1.2 Phát hiện tri thức trong cơ sở dữ liệu 6
1.1.3 Quá trình khai phá tri thức trong cơ sở dữ liệu 8
1.2 Một số phương pháp và kỹ thuật khai phá dữ liệu 10
1.2.1 Các kỹ thuật khai phá dữ liệu 10
1.2.2 Các phương pháp khai phá dữ liệu 11
1.3 Ứng dụng của khai phá dữ liệu 13
1.3.1 Ứng dụng trong bài toán phân tích, dự báo, tư vấn: 13
Trang 51.3.2 Ứng dụng trong các bài toán khác 13
Chương 2 - NGHIÊN CỨU VỀ GIÁO DỤC HƯỚNG NGHIỆP TRONG TRƯỜNG THCS VÀ MẠNG NƠRON NHÂN TẠO 15
2.1 Giáo dục hướng nghiệp trong trường thcs 15
2.1.1 Tổng quan về hướng nghiệp và giáo dục hướng nghiệp 15
2.1.2 Hoạt động giáo dục hướng nghiệp cho học sinh THCS 16
2.1.3 Các con đường giáo dục hướng nghiệp cho học sinh THCS 18
2.2 Thực trạng công tác giáo dục hướng nghiệp cho học sinh THCS huyện Bố Trạch 20
2.2.1 Đặc điểm kinh tế xã hội của địa phương 20
2.2.2 Thực trạng giáo dục hướng nghiệp trên địa bàn Huyện Bố trạch 22
2.2.3 Nghiên cứu thực trạng 23
2.2.4 Kết quả khảo sát 24
2.3 Mạng nơron nhân tạo 24
2.3.1 Giới thiệu về mạng nơron nhân tạo 24
2.3.2 Một số tính chất và đặc trưng cơ bản của mạng nơron nhân tạo 25
2.3.3 Tổ chức của mạng nơron nhân tạo 25
2.3.4 Cấu trúc của mạng nơron nhân tạo 26
2.3.5 Phương thức hoạt động của mạng nơron và quá trình huấn luyện mạng 29
2.3.6 Mạng truyền thẳng và một số vấn đề liên quan 31
Chương 3 - XÂY DỰNG ỨNG DỤNG TƯ VẤN GIÁO DỤC HƯỚNG NGHIỆP CHO HỌC SINH THCS HUYỆN BỐ TRẠCH 35
3.1 Bài toán và mô hình cho bài toán 35
3.1.1 Mô tả bài toán 35
3.1.2 Mô hình tổng quát của bài toán 37
3.2 Kỹ thuật xử lý bài toán 38
3.2.1 Lựa chọn kỹ thuật 38
3.2.2 Luyện học sử dụng mạng nơron nhân tạo 40
3.2.3 Áp dụng kỹ thuật ANN để xử lý bài toán 41
Trang 63.2.4 Thuật toán tư vấn hướng nghiệp cho bài toán 42
3.3 Mô tả dữ liệu 43
3.3.1 Dữ liệu huấn luyện 43
3.3.1 Dữ liệu kiểm thử 45
3.4 Phân tích thiết kế hệ thống 45
3.4.1 Tác nhân 45
3.4.2 Danh sách ca sử dụng 45
3.4.3 Biểu đồ ca sử dụng 46
3.4.4 Lớp và quan hệ giữa các lớp 47
3.4.5 Biểu đồ trạng thái 49
3.5 Kết quả thực nghiệm 50
3.5.1 Công cụ và môi trường thực nghiệm 50
3.5.2 Một số kết quả 51
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 56
1 Kết luận 56
2 Hướng phát triển 57
TÀI LIỆU THAM KHẢO 58
Trang 7TÓM TẮT
ỨNG DỤNG MẠNG NƠRON NHÂN TẠO ĐỂ TƯ VẤN GIÁO DỤC HƯỚNG NGHIỆP CHO HỌC SINH THCS HUYỆN BỐ TRẠCH
Học viên: Nguyễn Cao Đức Chuyên ngành: Khoa học máy tính
Mã số: 8480101 Khóa 35 Trường Đại học Bách khoa - ĐHĐN
Tóm tắt - Quyết định lựa chọn một hướng đi cho tương lai sau khi kết thúc khóa
học Trung học cơ sở là một việc làm rất khó khăn mà đòi hỏi học sinh phải nắm bắt được nhiều vấn đề và có sự quan tâm của gia đình cũng như nhà trường, nếu chọn sai sẽ dẫn đến những tổn thất lớn về vật chất và tinh thần cho học sinh và gia đình ảnh hưởng đến cân đối lao đông của đất nước Các con đường giáo dục hướng nghiệp phổ biến hiện nay vẫn mang tính lý thuyết, chưa giúp được các em lựa chọn nghề nghiệp và hướng đi của mình trong tương lai
Trong nghiên cứu này chúng tôi xây dựng hệ tư vấn giáo dục hướng nghiệp bằng
kỹ thuật mạng nơron nhân tạo để tư vấn giáo dục hướng nghiệp cho học sinh trên địa bàn và coi đó như là một con đường giáo dục hướng nghiệp mới Việc nghiên cứu để tạo ra hệ tư vấn sẽ trợ giúp cho các em học sinh, giải quyết những khó khăn
và thắc mắc của các em trong việc lựa chọn nghề nghiệp trong tương lai
Từ khóa - Mạng nơron nhân tạo, giáo dục hướng nghiệp, hệ tư vấn, khai phá dữ
liệu, học máy
APPLICATION OF NEURAL NETWORK TO CONSULT PROFESSIONAL EDUCATION FOR SECONDARY SCHOOL
STUDENTS OF BO TRACH DISTRICT
Abstract - To choose a direction for the future after the end of the secondary
school is a very difficult decision that requires students to grasp many issues and their families and schools get involved If students choose a wrong direction for their future, this will lead to significant physical and mental losses for them and their families and affect the country's labor balance The popular vocational education ways are still theoretical, which have not helped them to choose their right career and future direction
In this article, we build a vocational education system by using artificial neural network techniques to consult vocational education for students in the area and consider it as a new vocational education way The research to create a consulting system will help students to solve their difficulties and questions in their future career choices
Keywords - Artificial neural network, vocational education, consulting system,
data mining, Machine Learning
Trang 8DANH MỤC CÁC CỤM TỪ VIẾT TẮT
THCS Trung học cơ sở
THPT Trung học phổ thông
KDD Knowledge Discovery in Database
ANN Artificial Neural Network
MLP Multilayer Perceptrons Networks
GDHN Giáo dục hướng nghiệp
THCN Trung học chuyên nghiệp
Trang 9DANH MỤC BẢNG BIỂU, HÌNH VẼ
Hình 1.1 Khai phá dữ liệu là một bước trong quá trình khai
phá tri thức
8
Hình 2.1 Mô hình mạng nơron nhân tạo đơn giản 26
Hình 3.1 Mô hình bài toán tư vấn hướng nghiệp cho học sinh 37
Hình 3.3 Sơ đồ thuật toán quá trình luyện học của ANN 40
Hình 3.10 Biểu đồ trạng thái Quản trị viên Training hệ thống 50
Hình 3.14 Các tiêu chí giá trị tương ứng tại Bảng 3.1 52
Trang 10MỞ ĐẦU
1 Lý do chọn đề tài
Khai phá dữ liệu là lĩnh vực rất phát triển trong những năm gần đây, thu hút sự quan tâm của nhiều tổ chức trong nước và thế giới và được ứng dụng trong nhiều lĩnh vực khác nhau Ngày nay với sự bùng nổ của nền công nghiệp 4.0 và công nghệ thông tin thì những tác động của nó đã ảnh hưởng đến mọi mặt trong đời sống xã hội từ văn hóa, giáo dục cho đến công nghệ và các lĩnh vực khác Công nghệ thông tin ngày càng phát triển kéo theo các hệ thống thông tin ngày càng mở rộng để lưu trữ một lượng lớn các dữ liệu liên quan, cùng với việc lưu trữ dữ liệu trực tuyến với dung lượng rất lớn đã tạo ra những kho dữ liệu khổng lồ mà qua đó con người có thể khai phá các thông tin và tri thức phục vụ cho công việc, đời sống hàng ngày Mục đích của khai phá dữ liệu là tìm ra mô hình phân loại hữu ích trong các dữ liệu phục vụ cho mục đích dự đoán, mô
tả, phân loại, phân nhóm, rút trích và khai thác thông tin trong các lĩnh vực khác nhau trong đời sống xã hội Sự ra đời và phát triển của nó đã đáp ứng và giải quyết được nhiều vấn đề ứng dụng trong đời sống xã hội và mang lại hiệu quả cao Kỹ thuật khai phá dữ liệu có nhiều ưu việt, quá trình lấy ra được những dữ liệu hữu ích được gọi quá trình khai phá tri thức, những dữ liệu đó là các tri thức học được Ứng dụng khai phá dữ liệu vào hoạt động giáo dục là một trong những xu thế phổ biến để nâng cao hiệu quả và chất lượng giáo dục và đào tạo
Lựa chọn nghề nghiệp là vấn đề vô cùng quan trọng và quyết định tương lai trong đời sống của mỗi con người Có nghề nghiệp phù hợp với cá nhân, điều kiện môi trường
xã hội thì con người mới có cuộc sống ổn định, mới làm ra của cải vật chất cho bản thân
và xã hội Ngày nay việc lựa chọn nghề nghiệp là một vấn đề trăn trở của các em học sinh và của các bậc phụ huynh khi con em đến tuổi trưởng thành Vì vậy, Bộ giáo dục
và Đào tạo đã đưa hoạt động giáo dục hướng nghiệp vào nhà trường từ rất sớm với mục đích giúp cho các em học sinh nhận thức đúng đắn về nghề nghiệp, có định hướng lựa chọn được cho mình một nghề phù hợp với bản thân đồng thời đáp ứng được nhu cầu của xã hội Việc giáo dục nghề nghiệp tốt trong nhà trường còn góp phần vào việc phân luồng nguồn lao động và sử dụng hợp lí nguồn lao động trẻ một cách hiệu quả để thúc đẩy kinh tế, xã hội đất nước phát triển bền vững Xác định được vai trò to lớn đó của giáo dục hướng nghiệp đối với học sinh, ngày 19 tháng 3 năm 1981, Hội đồng Chính phủ đã ban hành quyết định 126/CP về công tác hướng nghiệp trong trường phổ thông
và việc sử dụng học sinh các cấp phổ thông cơ sở và phổ thông trung học tốt nghiệp ra trường Trong đó đã nêu rõ: “Coi trọng công tác hướng nghiệp và phân luồng học sinh trung học, chuẩn bị cho thanh niên, thiếu niên đi vào lao động nghề nghiệp phù hợp với
sự chuyển dịch cơ cấu kinh tế trong cả nước và từng địa phương” [24]
Trang 11Nước ta đang bước vào giai đoạn đẩy mạnh công nghiệp hóa, hiện đại hóa trong bối cảnh khoa học – công nghệ phát triển như vũ bão Sự phát triển kinh tế - xã hội đặt
ra yêu cầu nền giáo dục Việt Nam phải tạo ra lớp người lao động mới có khả năng làm chủ được khoa học – công nghệ hiện đại Nghị quyết TW8 về đổi mới căn bản toàn diện giáo dục – đào tạo chỉ rõ: “Đẩy mạnh phân luồng sau trung học cơ sở; định hướng nghề nghiệp ở trung học phổ thông”, “ đảm bảo cho học sinh có trình độ trung học cơ sở (hết lớp 9) có tri thức phổ thông nền tảng, đáp ứng phân luồng mạnh sau trung học cơ sở, trung học phổ thông phải tiếp cận nghề nghiệp và chuẩn bị cho giai đoạn học sau phổ thông có chất lượng” Hướng nghiệp trong giáo dục, với bản chất là hệ thống các biện pháp tiến hành trong và ngoài nhà trường để giúp học sinh phổ thông có kiến thức về nghề nghiệp và có khả năng lựa chọn về nghề nghiệp trên cơ sở kết hợp nguyện vọng,
sở trường của cá nhân với nhu cầu sử dụng lao động của xã hội, đóng vai trò quan trọng trong quá trình đạt được mục tiêu đó
Trong những năm qua hiệu quả của giáo dục hướng nghiệp đã chuyển biến rõ rệt,
số lượng học sinh theo hướng chọn nghề ngày càng nhiều Tuy nhiên hiện nay do nhiều nguyên nhân chủ quan và khách quan khác nhau hoạt động giáo dục hướng nghiệp và công tác phân luồng học sinh vẫn còn hạn chế và kết quả chưa cao Theo thống kê của
Bộ giáo dục và Đào tạo hàng năm số học sinh sau khi học xong Trung học cơ sở (THCS) không học nghề mà vẫn học lên Trung học phổ thông (THPT), và học xong THPT lại đăng ký thi vào cao đẳng hay đại học còn rất lớn Kết quả thực tế này là do rất nhiều yếu
tố khách quan, chủ quan khác nhau từ phụ huynh đến học sinh và cả hiệu quả của giáo dục hướng nghiệp Trong thực tế chỉ một bộ phận học sinh không đủ khả năng vào THPT thì mới học nghề hay không thi vào được cao đẳng, đại học thì mới chọn vào trường dạy nghề để học
Quyết định lựa chọn một hướng đi là một việc làm khó khăn, đòi hỏi học sinh phải hiểu và có sự quan tâm của gia đình cũng như nhà trường, nếu chọn sai sẽ dẫn đến những tổn thất lớn về vật chất và tinh thần cho học sinh và gia đình Do đó việc định hướng chọn đúng ngành nghề sẽ giúp các em tránh khỏi những vấn đề nói trên Từ thực tiễn giáo dục hiện nay cũng như thực tế hoạt động hướng nghiệp trong trường mà tôi đang công tác, tôi nhận thấy việc tư vấn lựa chọn hướng nghiệp cho phụ huynh và học sinh đối với đề án giáo dục hướng nghiệp hiện nay của Bộ Giáo dục và Đào tạo là quan trọng, thông qua dữ liệu từ phụ huynh và học sinh để từ đó có thể sử dụng các thông tin đó để phục vụ cho công việc tư vấn định hướng cho học sinh và các hoạt động trong giáo dục
là hết sức cần thiết và cấp bách Vì vậy đề tài “ỨNGDỤNGMẠNGNƠRONNHÂNTẠOĐỂ TƯVẤN GIÁODỤC HƯỚNG NGHIỆP CHO HỌCSINH THCSHUYỆN
BỐTRẠCH” là cần thiết và có ý nghĩa về mặt lý thuyết và thực tiễn
Trang 122 Mục đích và ý nghĩa của đề tài
2.1 Mục đích
+ Nghiên cứu các phương pháp, các kỹ thuật khai phá dữ liệu
+ Sử dụng kỹ thuật học máy để xử lý bài toán tư vấn trong giáo dục hướng nghiệp cho học sinh
+ Nghiên cứu giáo dục hướng nghiệp đối với học sinh trung học cơ sở từ đó xây dựng ứng dụng Demo tư vấn phân luồng cho học sinh trên địa bàn huyện Bố trạch
+ Nghiên cứu và vận dụng tốt kỹ thuật khai phá dữ liệu
+ Sử dụng kỹ thuật học máy vào giải quyết bài toán tư vấn
+ Xây dựng Demo ứng dụng tư vấn phân luồng nghề nghiệp trong giáo dục hướng nghiệp hiện nay của huyện Bố Trạch
3.2 Nhiệm vụ
+ Nghiên cứu lý thuyết về kỹ thuật khai phá dữ liệu
+ Nghiên cứu thực tiễn về đề án giáo dục hướng nghiệp hiện nay của Bộ Giáo dục
Trang 134 Đối tượng, phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
+ Các kỹ thuật, phương pháp khai phá dữ liệu
+ Dữ liệu thu thập được về quan điểm của học sinh THCS đối với giáo dục hướng nghiệp hiện nay trên địa bàn huyện Bố Trạch
+ Các công cụ và phần mềm mã nguồn mở hỗ trợ nghiên cứu, thiết kế quy trình thực hiện
+ Quy trình tham vấn nghề trong giáo dục hướng nghiệp
4.2 Phạm vi nghiên cứu
Trong nghiên cứu này tôi chỉ giới hạn nghiên cứu các vấn đề sau:
+ Đối tượng nghiên cứu là học sinh THCS trên địa bàn huyện Bố Trạch, tỉnh Quảng Bình
+ Xây dựng công việc tư vấn phân luồng hướng nghiệp cho học sinh lựa chọn học lên THPT hay lựa chọn học nghề cho tương lai
+ Xây dựng ứng dụng Demo
5 Phương pháp nghiên cứu
Tiến hành thu thập và nghiên cứu các tài liệu có liên quan đến đề tài Tổng hợp các thông tin dữ liệu đã nghiên cứu Nghiên cứu các kỹ thuật có liên quan đến bài toán Nghiên cứu công cụ xử lý và việc ứng dụng công cụ cho bài toán
5.1 Phương pháp lý thuyết
+ Phương pháp nghiên cứu tài liệu về các vấn đề có liên quan đến đề tài, nghiên cứu các công trình đã được công bố liên quan đến đề tài, phân tích và tổng hợp Nghiên cứu các kỹ thuật có liên quan đến bài toán, nghiên cứu công cụ xử lý và hỗ trợ giải quyết bài toán
+ Phương pháp thống kê: Thống kê dữ liệu thu thập được trong quá trình xử lý + Phương pháp phân tích và thiết kế: Phân tích các đối tượng cần nghiên cứu để giải quyết các vấn đề liên quan và thiết kế dữ liệu, thiết kế quy trình xử lý dữ liệu + Phương pháp mô hình hóa: Mô hình hóa dữ liệu, mô hình hóa quy trình xử lý để thực hiện tư vấn trong bài toán
5.2 Phương pháp thực nghiệm
Nghiên cứu và khai thác các công cụ, các phần mềm hỗ trợ quá trình biên tập dữ liệu, khảo sát dữ liệu và đánh giá
Trang 14Xây dựng chương trình Demo tư vấn cho phụ huynh và học sinh lựa chọn định hướng giáo dục hướng nghiệp hiện nay của Bộ Giáo dục và Đào tạo
Kiểm tra, thử nghiệm, nhận xét và đánh giá kết quả
6 Cấu trúc luận văn
Ngoài phần mở đầu và kết luận, luận văn gồm ba chương:
Chương 1: Chương này chủ yếu nghiên cứu tổng quan về khai phá dữ liệu và các
vấn đề liên quan đến phương pháp, kỹ thuật và ứng dụng trong khai phá dữ liệu
Chương 2: Nghiên cứu về Giáo dục hướng nghiệp trong trường THCS và mạng
nơron nhân tạo
Chương 3: Xây dựng ứng dụng tư vấn giáo dục hướng nghiệp cho học sinh THCS
huyện Bố Trạch
Trang 15
Chương 1 - KHAI PHÁ DỮ LIỆU VÀ NHỮNG VẤN ĐỀ LIÊN QUAN 1.1 Tổng quan về khai phá dữ liệu
Các kỹ thuật chính được áp dụng trong lĩnh vực khai phá dữ liệu được phát triển
từ các lĩnh vực cơ sở dữ liệu, học máy, xác suất thống kê, trí tuệ nhân tạo và các ngành khác, vv, chúng đều hướng đến việc phân tích một lượng lớn các dữ liệu qua tiến trình khai phá dữ liệu sẻ sử dụng các công cụ để phân tích dữ liệu và trích xuất ra các thông tin quan trọng của các đối tượng bên trong cơ sở dữ liệu, kết quả của việc khai phá là xác định các mẫu hay các mô hình đang tồn tại bên trong, nhưng chúng nằm ẩn khuất ở các cơ sở dữ liệu Để từ đó rút trích ra được các mẫu, các mô hình hay các thông tin và tri thức từ các cơ sở dữ liệu Khai phá dữ liệu là bước chính của quy trình khai phá tri thức trong cơ sở dữ liệu (Knowledge Discovery in Database - KDD), nó được ứng dụng trong các loại hình cung cấp dịch vụ lưu trữ thông tin như kho dữ liệu, cơ sở dữ liệu quan hệ, cơ sở dữ liệu giao dịch, cơ sở dữ liệu hướng đối tượng, cơ sở dữ liệu quan hệ hướng đối tượng, cơ sở dữ liệu không gian, cơ sở dữ liệu thời gian, cơ sở dữ liệu văn bản, cơ sở dữ liệu đa phương tiện, cơ sở dữ liệu Web, cơ sở dữ liệu tri thức, vv [3]
1.1.2 Phát hiện tri thức trong cơ sở dữ liệu
Phát hiện tri thức từ cơ sở dữ liệu là một quá trình có sử dụng nhiều phương pháp
và công cụ khác nhau mà con người có vai trò trung tâm Hoạt động của hệ thống bao gồm nhiều hoạt động tương tác thường xuyên giữa con người và cơ sở dữ liệu mà có sự trợ giúp của các công cụ khác nhau “Tri thức” mà chúng ta đề cập đến ở đây là các tri thức rút ra từ cơ sở dữ liệu và được sử dụng cho việc giải quyết một loạt nhiệm vụ nhất định trong một lĩnh vực nào đó Do đó, quá trình phát hiện tri thức cũng mang tính chất hướng nhiệm vụ, không phải là phát hiện mọi tri thức bất kỳ mà là phát hiện tri thức
Trang 16nhằm giải quyết tốt công việc đề ra Trên cơ sở đó quá trình phát hiện tri thức là một qúa trình tương tác giữa con người với các công cụ để thực hiện các bước cơ bản sau: Toàn bộ tiến trình tìm kiếm và xử lý mẫu từ dữ liệu bao gồm các bước sau đây:
- Bước 1: Tìm một cách hiểu để thực hiện phạm vi ứng dụng và nhiệm vụ đặt ra,
xác định “Tri thức” được ưu tiên thích đáng, tìm ra mục đích của người sử dụng đầu cuối
- Bước 2: Tạo một tập dữ liệu đích thông qua chọn một tập dữ liệu hoặc điểm chính
trên một tập con của các biến đổi, hoặc các dữ liệu mẫu sao cho nó có ý nghĩa khi thực hiện khai phá
- Bước 3: Chuẩn bị trước dữ liệu, tiền xử lý dữ liệu: Loại bỏ dữ liệu nhiễu hoặc
những dữ liệu không quan trọng, tập hợp lại các thông tin cần thiết để phù hợp với mô hình, tính toán và kiểm soát các dữ liệu sai lệch, tính toán thời gian thông tin tuần tự và những thay đổi biết trước
- Bước 4: Thu nhỏ dữ liệu: Tìm những đặc trưng thường sử dụng để miêu tả dữ
liệu độc lập theo mục đích của công việc Sử dụng việc giảm bớt chiều hoặc các phương pháp chuyển đổi để giảm bớt số lượng biến nếu được
- Bước 5: Chọn nhiệm vụ khai phá dữ liệu: Quyết định có hay không đích của tiến
trình KDD là phân loại, hồi quy, phân nhóm, vv
- Bước 6: Chọn phương pháp khai phá dữ liệu thích hợp: Chọn một hoặc một số
phương pháp để sử dụng cho việc tìm kiếm trên các mẫu của dữ liệu Quyết định mô hình và các tham số thích hợp Biến đổi dữ liệu theo đặc trưng riêng của phương pháp khai phá với toàn bộ tiến trình KDD
- Bước 7: Khai phá dữ liệu: Tìm kiếm các mẫu quan trọng theo dạng trình bày
riêng biệt hoặc tập các mô tả như các luật hoặc cây phân loại, hồi quy, phân nhóm vv
- Bước 8: Đánh giá, giải thích, thử lại các mẫu đã khai phá được
- Bước 9: Cũng cố, tinh chế tri thức đã khai phá Kết hợp các tri thức thành hệ
thống Giải quyết các xung đột tiềm tàng trong tri thức khai thác được, sau đó, tri thức được chuẩn bị sẳn sàng cho ứng dụng
Nếu phát hiện tri thức là toàn bộ quá trình chiết xuất tri thức từ cơ sở dữ liệu thì khai phá dữ liệu là giai đoạn chủ yếu của quá trình đó
Theo trình bày ở trên, trong quá trình phát hiện tri thức, bước khai phá dữ liệu được thực hiện sau các bước tinh lọc và tiền xử lý dữ liệu, tức là việc khai phá để tìm ra các mẫu hình có ý nghĩa được tíên hành trên tập dữ liệu có cơ sở là sẽ thích hợp với nhiệm
vụ khai phá đó chứ không phải là khai phá hết dữ liệu với một thời gian đủ dài để lấy được một mẫu mà không có ích thực sự như khái niệm trong thống kê trước đây Do đó, khai phá dữ liệu thường bao gồm việc tìm một mô hình phù hợp với tập dữ liệu và tìm kiếm các mẫu từ tập dữ liệu theo mô hình đó Trong số các mẫu được lấy ra từ cơ sở dữ
Trang 17liệu thì những mẫu được xem là đáng quan tâm xét theo một phương diện nào đó mới được coi là tri thức Các mẫu là đáng quan tâm nếu chúng là mới, có lợi, đáng được xem xét Một mẫu được xem là mới phụ thuộc vào khung tham chiếu cho trước, có thể đó là phạm vi tri thức của hệ thống hoặc là phạm vi tri thức của người dùng Mục tiêu của KDD là tìm kiếm tri thức từ dữ liệu, và điểm cần nhấn mạnh là các ứng dụng “bậc cao” của các phương pháp khai phá Nó là điều quan tâm của những người nghiên cứu về học máy, nhận dạng, cơ sở dữ liệu, thống kê, trí tuệ nhân tạo, tri thức thu nhận cho hệ chuyên gia, và hình dung về dữ liệu Khai phá dữ liệu là một nhu cầu tất yếu, một sự nhạy cảm đáp lại nhu cầu bức thiết của giới kinh doanh và cũng là những thách thức mới của các nhà khoa học Khai phá dữ liệu được xây dựng trên các kỹ thuật mới, nó sử dụng các kỹ thụât thông minh để khai phá các tri thức tiềm ẩn trong dữ liệu Khai phá dữ liệu được định hướng theo nhu cầu kinh doanh để có thể giải quyết tự động các bài toán kinh doanh bằng các kỹ thuật dễ sử dụng và hiệu quả Các kết quả đạt được cho thấy mặc dù
kỹ thuật khai phá dữ liệu còn nhiều vấn đề cần giải quyết, nhưng với những gì nó đã và đang mang lại cho con người thì khai phá dữ liệu còn có một tiềm năng to lớn trong việc tạo ra những lợi nhuận đáng kể trong nền kinh tế [2]
1.1.3 Quá trình khai phá tri thức trong cơ sở dữ liệu
Quá trình khai phá dữ liệu có thể được chia thành các giai đoạn chính như sau [1, 13]:
Hình 1.1: Khai phá dữ liệu là một bước trong quá trình khai phá tri thức [1, 13]
Trích lọc dữ liệu
Tiền xử lý và chuẩn bị dữ liệu
Chuyển đổi dữ liệu
Mô hình
Tri thức
Trang 18Một cách tổng quát quá trình khám phá tri thức có thể phân thành các công đoạn: Tập hợp dữ liệu, trích lọc dữ liệu, chuẩn bị dữ liệu và tiền xử lý dữ liệu, biến đổi dữ liệu, khai phá dữ liệu, đánh giá và biểu diễn tri thức Trong đó quá trình khai phá tri thức được thực hiện lặp đi lặp lại nhiều lần cùng với sự tham gia của người sử dụng Kết quả của quá trình khai phá dữ liệu sẽ làm cho quá trình khai phá các dữ liệu lớn trong cơ sở
dữ liệu lớn trở nên dễ dàng hơn Trong thực tế, khai phá dữ liệu là một bước cụ thể trong quá trình khai phá tri thức Để giải quyết các nhiệm vụ đề ra khai phá dữ liệu sử dụng các thuật toán đặc biệt để trích xuất các mô hình từ cơ sở dữ liệu, thông qua các mô hình
và kết quả khai phá được sẽ tiến hành giải thích và xử lý kết quả của hệ thống, chuyển đổi thông tin vào hệ thống tri thức mà người sử dụng có thể hiểu được
a Tập hợp dữ liệu (Data): Đây là giai đoạn đầu tiên trong quá trình khai phá dữ
liệu Giai đoạn này lấy dữ liệu trong một cơ sở dữ liệu, một kho dữ liệu hay dữ liệu từ các nguồn khác
b Trích lọc dữ liệu (Selection): Trong giai đoạn này dữ liệu được lựa chọn hoặc
phân chia theo một số tiêu chuẩn nào đó
c Tiền xử lý và chuẩn bị dữ liệu (Preprocessing): Giai đoạn này rất quan trọng
trong quá trình khai phá dữ liệu Trong thực tế quá trình thu thập dữ liệu sẽ chứa một số lỗi thường mắc phải như thiếu thông tin, không logic điều này dẫn đến dữ liệu chứa các giá trị vô nghĩa, thông tin mang lại không hiệu quả và không có khả năng kết nối dữ liệu Mục đích của giai đoạn này là tiến hành xử lý những dạng dữ liệu nói trên để dữ liệu được “sạch và có ý nghĩa” vì nếu dữ liệu không được tiền xử lý, làm sạch và chuẩn
bị trước thì kết quả của quá trình khai phá dữ liệu sẽ không cao và thậm chí là sai lệch
d Chuyển đổi dữ liệu (Transformation): Trong giai đoạn chuyển đổi dữ liệu nay
dữ liệu đưa ra có thể sử dụng và điều khiển được bởi việc tổ chức lại nó Dữ liệu đã được chuyển đổi phù hợp với mục đích khai thác
e Khai phá dữ liệu (Data Mining): Đây là giai đoạn quan trọng của quá trình và
mang tính tư duy trong quá trình khai phá, giai đoạn này sử dụng nhiều thuật toán khác nhau để xuất ra các mẫu từ dữ liệu
f Đánh giá kết quả mẫu (Interpretation/ Evaluation): Là giai đoạn cuối trong quá
trình khai phá dữ liệu Trong giai đoạn này, các mẫu dữ liệu được chiết xuất ra bởi phần mềm khai phá dữ liệu, các mẫu thu được không phải mẫu dữ liệu nào cũng đều có nghĩa cho vấn đề cần giải quyết Vì vậy trong thực tế phải thực hiện đánh giá qua các tiêu chuẩn để lựa chọn được mẫu phù hợp, đưa ra được các tri thức cần thiết và sử dụng cho bài toán cụ thể
Trang 191.2 Một số phương pháp và kỹ thuật khai phá dữ liệu
1.2.1 Các kỹ thuật khai phá dữ liệu
Nếu đứng trên quan điểm của học máy thì các kỹ thuật trong khai phá dữ liệu bao gồm: Học có giám sát, học không có giám sát, học nửa giám sát Phương pháp dựa vào học máy sử dụng các giải thuật học máy nổi tiếng bằng việc sử dụng cú pháp và các đặc trưng trong ngôn ngữ Các giải thuật học máy đã được chứng minh là những giải thuật khai phá dữ liệu rất hiệu quả Học máy là một lĩnh vực có liên quan đến việc nghiên cứu các thuật toán và kỹ thuật cho phép các máy tính để "học hỏi" tự động từ kinh nghiệm
+ Học có giám sát:
Các phương pháp học có giám sát phụ thuộc vào sự tồn tại của các nhãn huấn luyện văn bản Có rất nhiều loại học có giám sát trong phân loại văn bản, quá trình phân loại qua phương pháp học có giám sát được thực hiện qua nhiều bước khác nhau: Đầu tiên cần xác định loại của tập dữ liệu cần huấn luyện, sau đó tiến hành thu thập dữ liệu huấn luyện Việc thu thập dữ liệu huấn luyện có thể thực hiện bằng nhiều cách khác nhau Bước tiếp theo là lựa chọn và biểu diễn các đặc trưng, bước này có vai trò quyết định hiệu quả của quá trình phân loại Hầu hết các phương pháp máy học áp dụng cho bài toán phân loại đều sử dụng cách biểu diễn văn bản dưới dạng vectơ đặc trưng Điểm khác biệt duy nhất chính là không gian đặc trưng được chọn lựa Số lượng các đặc trưng không được quá lớn, do sự bùng nổ dữ liệu, không được quá nhỏ sẽ không đảm bảo thông tin, chúng phải đủ lớn để dự đoán chính xác đầu ra Để giải quyết vấn đề này thông thường chúng ta sẽ chọn lựa những đặc trưng được đánh giá là hữu ích, bỏ đi những đặc trưng không quan trọng Trong giai đoạn này chúng ta sử dụng các phương pháp chọn lựa đặc trưng hiệu quả để giảm chiều của vectơ đặc trưng, chiều của vectơ sau khi được giảm mà không mất đi độ chính xác phân loại Bước cuối cùng là xác định cấu trúc của hàm chức năng cần tìm và chọn giải thuật học tương ứng, chạy giải thuật học từ tập huấn luyện thu thập được để cho ra kết quả Một số phương pháp học có giám sát phổ biến trong phân loại quan điểm như [5, 14]:
- Phân loại theo xác suất: Phân loại theo xác suất sử dụng mô hình phân loại hỗn hợp Các mô hình này giả định rằng mỗi lớp là một thành phần của hỗn hợp Mỗi thành phần hỗn hợp là một mô hình cung cấp xác suất lấy mẫu của một thuật ngữ cụ thể cho các thành phần đó Một số kỹ thuật phân loại xác suất nổi tiếng như phân loại Naıve Bayes, Bayesian Network, Maximum Entropy
- Kỹ thuật phân loại tuyến tính Kỹ thuật này nổi bật với phương pháp phân loại máy vector hỗ trợ (support vector machines), mạng nơron (neural network), cây quyết định (decision tree), phân loại dựa vào các luật cơ bản (rule-based)
Trang 20+ Học không có giám sát:
Học không giám sát là phương pháp nhằm tìm ra mô hình phù hợp với các tập dữ liệu quan sát Nó khác biệt với học có giám sát ở chỗ là đầu ra đúng tương ứng cho mỗi đầu vào là không biết trước Trong học không có giám sát, đầu vào là một tập dữ liệu được thu thập Học không có giám sát thường xem các đối tượng đầu vào như là một tập các biến ngẫu nhiên Sau đó, một mô hình mật độ kết hợp sẽ được xây dựng cho tập dữ liệu
đó Học không có giám sát có thể được dùng kết hợp với suy diễn Bayes để cho ra xác suất có điều kiện cho bất kì biến ngẫu nhiên nào khi biết trước các biến khác [4, 14]
Có nhiều thuật toán học không có giám sát được ra đời và phát triển nhằm giải quyết bài toán phân cụm phục vụ khai thác hiệu quả nguồn dữ liệu chưa gán nhãn nhiều và rất
đa dạng Việc lựa chọn sử dụng thuật toán nào tuỳ thuộc vào dữ liệu và mục đích của từng bài toán Một số thuật toán học không có giám sát thường hay sử dụng như thuật toán k-means, thuật toán Hierarchical Agglomerative Clustering- HAC, thuật toán Self-Organizing Map-SOM, vv
+ Học bán giám sát
Khi cả dữ liệu huấn luyện và dữ liệu đã dán nhãn không có sẵn, chúng ta có thể học nửa giám sát (học bán giám sát) Một phân loại thống kê được huấn luyện, việc huấn luyện có thể sử dụng cả dữ liệu có nhãn và không có nhãn Kết hợp các mẫu có gắn nhãn
và không gắn nhãn để sinh một hàm hoặc một bộ phân loại thích hợp
1.2.2 Các phương pháp khai phá dữ liệu
Nếu dựa trên quan điểm dựa vào lớp các bài toán cần giải quyết, thì có các phương pháp khai phá dữ liệu sau [6]: Phân lớp và dự đoán, Luật kết hợp, Phân cụm, Hồi qui, Tổng hợp, Mô hình ràng buộc, Dò tìm biến đổi và độ lệch
Phân lớp dữ liệu là tiến trình khám phá các quy luật phân loại hay tìm kiếm đặc trưng cho các tập dữ liệu đã được xếp lớp Với một tập dữ liệu huấn luyện có trước các giải thuật và công cụ sẽ xếp các đối tượng và một trong các lớp đã biết trước Tập dữ liệu học bao gồm tập đối tượng đã được xác định lớp sẽ được dùng để tạo mô hình phân lớp dựa trên đặc trưng của đối tượng trong tập dữ liệu học Các đặc trưng về dữ liệu được
sử dụng để xây dựng các bộ phân lớp dữ liệu Phân lớp dữ liệu có vai trò quan trọng trong tiến trình dự báo các khuynh hướng quy luật phát triển Bài toán dự đoán tương đương với bài toán phân lớp, khi có đối tượng mới bộ dự đoán dựa trên thông tin đang
có để đưa ra giá trị số học cho hàm cần dự đoán
+ Luật kết hợp (Association):
Kỹ thuật của phương pháp này là phát hiện và tìm ra trong tập dữ liệu cần khai phá những mối liên hệ giữa các giá trị với nhau qua đó tìm giá trị đầu ra thông qua các luật kết hợp tìm được từ tập dữ liệu ban đầu, quá trình khám phá các tập giá trị thuộc tính xuất hiện phổ biến trong các đối tượng dữ liệu Từ tập phổ biến có thể tạo ra các luật kết
Trang 21hợp giữa các giá trị thuộc tính nhằm phản ánh khả năng xuất hiện đồng thời các giá trị thuộc tính trong tập các đối tượng Một luật kết hợp X → Y phản ánh sự xuất hiện của tập X dẫn đến sự xuất hiện đồng thời của tập Y
+ Phân cụm (clutering):
Kỹ thuật phân cụm với mục đích tìm ra các cụm dữ liệu có đặc điểm tương tự nhau trong tập dữ liệu cần khai phá Các thành viên của một cụm sẽ có các đặc điểm giống nhau và có các đặc điểm khác nhau so với các thành viên của các cụm khác Các đối tượng được gom cụm sao cho mức độ tương tự giữa các đối tượng trong cùng một cụm
là cực đại và mức độ tương tự giữa các đối tượng nằm trong các cụm khác nhau là cực tiểu Kỹ thuật phân cụm sẽ nhận diện các cụm tiềm ẩn trong tập các đối tượng chưa được xếp lớp dựa trên mức độ tương tự giữa các đối tượng Các cụm được đặc trưng bằng các tính chất chung của tất cả các đối tượng trong cụm Do vậy, khảo sát các cụm sẽ giúp khái quát, tổng kết nhanh chóng nội dung của khối dữ liệu lớn
+ Hồi qui (regression): Là bài toán học một hàm ánh xạ từ một mẫu dữ liệu thành
một biến dự đoán có giá trị thực Mục đích của hồi quy tương tự như bài toán phân lớp, điểm khác biệt ở đây là các thuộc tính dự báo trong bài toán này là liên tục chứ không rời rạc
+ Tổng hợp (summarization):
Công việc liên quan đến các phương pháp tìm kiếm mô tả chung để xác định được các tập con dữ liệu hay các nhóm dữ liệu, trong đó các nhóm có thể chồng nhau hoặc tách rời, điều này có nghĩa là dữ liệu có thể thuộc nhóm này và cũng có thể thuộc nhóm khác
+ Mô hình ràng buộc (dependency modeling):
Là phương pháp tìm kiếm một mô hình mô tả sự phụ thuộc giữa các biến, thuộc tính theo hai mức, đó là mức cấu trúc của mô hình mô tả biểu diễn dưới dạng đồ thị Trong
đó sự phụ thuộc bộ phận của các biến phụ vào các biến khác Trường hợp thứ hai đó là mức định lượng mô hình mô tả mức độ phụ thuộc, thường được biểu diễn dưới dạng luật “nếu - thì” Trường hợp này phụ thuộc vào tiền đề để xác định kết luận, tiền đề thường là nhóm các giá trị thuộc tính và kết luận chỉ là một thuộc tính
+ Dò tìm biến đổi và độ lệch (change and deviation dectection):
Phương pháp này xác định giá trị chuẩn, phát hiện độ lệch đáng kể giữa nội dung của tập con dữ liệu thực và nội dung mong đợi Hai mô hình thường hay sử dụng đó là đo
độ lệch theo thời gian và đo độ lệch theo nhóm Đối với đo độ lệch theo thời gian thì sự thay đổi có ý nghĩa của dữ liệu theo thời gian, còn đo độ lệch theo nhóm sẽ xác định sự khác nhau giữa hai tập con dữ liệu, nghĩa là xác định dữ liệu trong một nhóm con của đối tượng có khác so với toàn bộ đối tượng không, qua đó phát hiện những sai sót dữ liệu và sai lệch so với giá trị thông thường Thông thường những nhiệm vụ này yêu cầu
Trang 22số lượng và các dạng thông tin khác nhau nên sẽ ảnh hưởng đến việc thiết kế và chọn phương pháp khai phá dữ liệu khác nhau
1.3 Ứng dụng của khai phá dữ liệu
Có thể nói sau khi ra đời, các kỹ thuật khai phá dữ liệu đã thu hút được rất nhiều sự quan tâm của các nhà nghiên cứu nhờ vào tính ứng dụng trong thực tiễn của nó, và chính
ưu điểm này lại thúc đẩy khai phá dữ liệu ngày càng được nghiên cứu nhiều hơn và trở thành nội dung nghiên cứu liên quan đến đa ngành, đa lĩnh vực trong đời sống xã hội Hiện nay, khai phá dữ liệu đã và đang được ứng dụng rộng rãi trong rất nhiều lĩnh vực
và đã có rất nhiều công cụ được xây dựng và phát triển dưới dạng thương mại và phi thương mại, các công cụ hỗ trợ cho ứng dụng trong thực tế Khi dữ liệu số và dữ liệu trên môi trường web ngày càng nhiều thì khai phá dữ liệu ngày càng được phát triển sâu rộng nhằm khai thác nguồn dữ liệu phong phú trong các hệ thống thông tin đó Một số hướng ứng dụng phổ biến hiện nay của khai phá dữ liệu như:
1.3.1 Ứng dụng trong bài toán phân tích, dự báo, tư vấn:
Đối với bài toán này có rất nhiều lĩnh vực được ứng dụng, một số ngành điển hình như:
+ Trong y tế: từ những thông tin của bệnh nhân hệ thống phân tích và dự đoán bệnh
và đưa ra phác đồ điều trị, đưa ra các bài toán dự báo về nguy cơ lây nhiểm hay các bài toán khác;
+ Trong thương mại bài toán dùng để phân tích thông tin sản phẩm, khách hàng, phân tích quan điểm người sử dụng, phân tích các sở thích để từ đó dự báo các chiến lược kinh doanh, các nhu cầu của khách hàng;
+ Đối với lĩnh vực chính trị, xã hội: phân tích ý kiến, thái độ dư luận để dự báo xu hướng phát triển, xu hướng quan điểm của dân về các chế độ chính sách;
+ Ứng dụng phân tích dự báo trong các ngành khoa học như thiên văn học, khí tượng, sinh học…vv Đặc biệt đối với khai phá dữ liệu sinh học là một phần rất quan trọng của lĩnh vực Tin - Sinh học (Bioinformatics), nó được biết đến với một số ứng dụng điển hình như lập chỉ mục, tìm kiếm tương tự, bất thường trong cơ sở dữ liệu Gen; xây dựng
mô hình khai phá các mạng di truyền và cấu trúc của Gen, protein; xây dựng các công
cụ trực quan trong phân tích dữ liệu di truyền
+ Trong hoạt động giáo dục thường phát triển theo các dạng chuyên gia hỗ trợ học tập hoặc tư vấn trong các hoạt động giáo dục, đào tạo
1.3.2 Ứng dụng trong các bài toán khác
+ Bài toán tìm kiếm thông tin là bài toán khá phát triển và phổ biến, các dạng mở rộng trong khai phá dữ liệu được ứng dụng nhiều trên các bộ dữ liệu khác nhau, đặc biệt
Trang 23là trên các bộ dữ liệu phân tán lớn Một hướng ứng dụng khá phổ biến đó là khai phá dữ liệu trên kho dữ liệu khách hàng của các bài toán ngân hàng, kinh doanh, maketing, vv Việc khai thác và sử dụng dữ liệu để phân tích đa chiều trên kho dữ liệu khách hàng về doanh số bán hàng, khách hàng, sản phẩm, thời gian và khu vực cũng như các thông số khác
+ Bài toán ứng dụng trong công nghiệp viễn thông là một trong những hướng mới mới nổi, với mục tiêu cung cấp các dịch vụ liên quan đến môi trường trên điện thoại di động, môi trường Internet, môi trường trên các mạng xã hội Hướng khai phá dữ liệu trong ngành công nghiệp viễn thông giúp các nhà quản lý xác định các mô hình viễn thông, quản lý và phát hiện các hoạt động gian lận trong viễn thông, khai thác có hiệu quả nguồn tài nguyên viễn thông và nâng cao chất lượng dịch vụ viễn thông cho người dùng Một số ứng dụng của khai phá dữ liệu trong ngành công nghiệp viễn thông như:
- Phân tích nguồn dữ liệu đa chiều trong viễn thông
- Xây dựng mô hình để quản lý và phát hiện gian lận trong viễn thông
- Quản lý và phát hiện trong giao dịch viễn thông
- Phân tích hành vi sử dụng dịch vụ viễn thông của khách hàng để tư vấn cũng như có những chiến lược phát triển khác
- Phân tích dữ liệu viễn thông thông qua các công cụ trực quan
+ Bài toán phát hiện xâm nhập bất hợp pháp và an ninh mạng là một trong những hướng ứng dụng quan trọng ngày nay bởi vì việc ngặn chặn và phát hiện xâm nhập bất hợp pháp sẽ ngăn chặn được các đe dọa đến an toàn và bảo mật của tài nguyên Trong thế giới phẳng bảo mật đã trở thành vấn đề lớn đối với sự tồn tại của hệ thống Với sự phát triển của công nghệ và sự sẵn có của các công cụ trên web, việc kiểm soát truy cập bất hợp pháp là vấn đề rất quan trọng cho các hệ thống hiện nay Bài toán này được ứng dụng qua khai phá dữ liệu để có thể phát hiện xâm nhập theo các hướng như kỹ thuật phát hiện xâm nhập; phân tích, kết hợp, tương quan và khác biệt giữa các yếu tố để phát hiện xâm nhập; phân tích dòng dữ liệu để phát hiện bất thường, vv
Trang 24Chương 2 - NGHIÊN CỨU VỀ GIÁO DỤC HƯỚNG NGHIỆP TRONG
TRƯỜNG THCS VÀ MẠNG NƠRON NHÂN TẠO 2.1 Giáo dục hướng nghiệp trong trường THCS
2.1.1 Tổng quan về hướng nghiệp và giáo dục hướng nghiệp
Việc lựa chọn nghề nghiệp có ý nghĩa quyết định đến tương lai của thế hệ học sinh,
vì vậy công tác hướng nghiệp cho học sinh không chỉ vì tương lai các em mà còn tác động đến gia đình và xã hội Một thực trạng đối với nước ta là hầu hết các Bố mẹ có con
đi học đều mong muốn con thi vào đại học cho dù khả năng học tập của các em học sinh còn chưa tốt Do đó đã xảy ra tình trạng đào tạo tràn lan ở tất cả các địa phương, học sinh sau khi tốt nghiệp rất khó kiếm được việc làm, hiện tượng “thừa thầy thiếu thợ” xảy ra phổ biến và nhiều người được đào tạo mà vẫn thất nghiệp Chính vì vậy vấn đề quan trọng hiện nay là làm thế nào để nâng cao nhận thức của mọi người đối với công tác hướng nghiệp, huy động được nhiều lực lượng xã hội, đặc biệt là bố mẹ tham gia hướng nghiệp một cách tích cực, đúng hướng và hiệu quả cho con em mình
Thuật ngữ hướng nghiệp ra đời từ rất lâu và được hiểu theo nhiều cách khác nhau
Có quan điểm cho rằng hướng nghiệp là hướng dẫn để quyết định việc chọn ngành, nghề cho học sinh chuẩn bị tốt nghiệp phổ thông; có người cho rằng đây là quá trình định hướng cho các em lựa chọn ngành, nghề cho bản thân mình trong tương lai Nhưng dù theo quan điểm nào đi nữa thì Giáo dục hướng nghiệp được hiểu là “Hướng nghiệp trong giáo dục là hệ thống các biện pháp tiến hành trong và ngoài nhà trường để giúp học sinh
có kiến thức về nghề nghiệp và có khả năng lựa chọn nghề nghiệp trên cơ sở kết hợp nguyện vọng, sở trường của cá nhân với nhu cầu sử dụng lao động của xã hội” (trích Điều 3- Nghị định 75/2006/NĐ-CP Quy định chi tiết và hướng dẫn thi hành một số điều Luật Giáo dục) [21] Như vậy, hướng nghiệp là giáo dục cho các em sự lựa chọn nghề nghiệp của mình nhằm đảm bảo và phù hợp cho các em trong lao động nghề nghiệp để qua đó có thể phát huy và cống hiến được nhiều nhất cho xã hội
Thực tiễn đã chứng minh rằng việc lựa chọn ngành nghề không phù hợp sẽ có tác động tiêu cực và làm chậm sự phát triển kinh tế xã hội, làm mất cân đối trong cơ cấu ngành nghề và làm sai lệch nhu cầu lao động Tư vấn và định hướng nghề nghiệp sẽ giúp học sinh chọn đúng nghề và qua đó điều chỉnh xu hướng phân công lao động xã hội để làm cho xã hội phát triển cân bằng Vị trí, vai trò và ý nghĩa của hoạt động này rất quan trọng và có ý nghĩa rất lớn trong giáo dục, hoạt động hướng nghiệp sẽ giúp học sinh lựa chọn và điều chỉnh được hướng đi, lựa chọn được nghề nghiệp phù hợp với sở trường, năng lực của bản thân và phù hợp với nhu cầu nghề nghiệp trong xã hội tại thời điểm đó một cách tốt nhất Giáo dục hướng nghiệp giúp học sinh phát huy được năng
Trang 25lực, sở trường bản thân, hứng thú và có nhận thức chọn nghề một cách đúng đắn là việc làm hết sức quan trọng và có ý nghĩa đối với hướng nghiệp Hoạt động hướng nghiệp tốt sẽ cung cấp nguồn nhân lực cho xã hội một cách hợp lý
Ngoài ra Giáo dục hướng nghiệp là một nội dung quan trọng trong chương trình giáo dục, nó góp phần cụ thể hóa mục tiêu đào tạo trong nhà trường, trong chương trình học sinh được tiếp cận các môn học tích hợp nghề nghiệp và thông qua các môn học đó
để cung cấp cho học sinh các kiến thức cơ bản về các ngành nghề trong xã hội để từ đó giúp học sinh định hướng được việc lựa chọn nghề tương lai cho bản thân mình Như vậy quá trình hướng nghiệp một mặt giáo dục ý thức lao động nghề nghiệp cho học sinh, mặt khác thực hiện nhiệm vụ định hướng nghề nghiệp trong tương lai cho học sinh Giáo dục hướng nghiệp tốt sẽ tạo động lực và tạo cơ hội cho học sinh trong việc lựa chọn nghề nghiệp phù hợp, giúp học sinh phát huy hết năng lực sau này để phát triển ngành nghề của mình và cũng phát huy hết tính sáng tạo trong công việc, nâng cao chất lượng hiệu quả công việc và thúc đẩy xã hội phát triển
Trong nhà trường phổ thông, hoạt động hướng nghiệp là một nhiệm vụ cần thiết trong tiến trình cải cách giáo dục nhằm thực hiện mục tiêu giáo dục và mục tiêu phân
bố việc làm cho xã hội Công tác hướng nghiệp trong nhà trường phổ thông nhằm mục đích bồi dưỡng, hướng dẫn học sinh chọn nghề phù hợp với yêu cầu phát triển của xã hội, đồng thời phù hợp với thể lực và năng khiếu của cá nhân Những nhiệm vụ chính của giáo dục hướng nghiệp trong nhà trường phổ thông là:
- Giáo dục thái độ lao động và ý thức đúng đắn về nghề nghiệp;
- Tổ chức cho học sinh thực tập, làm quen với một số nghề chủ yếu trong xã hội
và các nghề truyền thống của địa phương;
- Tìm hiểu năng khiếu, khuynh hướng nghề nghiệp của từng học sinh để khuyến khích, hướng dẫn và bồi dưỡng khả năng nghề nghiệp thích hợp nhất;
- Động viên hướng dẫn học sinh đi vào những nghề, những nơi đang cần lao động trẻ tuổi có văn hoá (trích: Thông tư số 31 – TT ngày 17 tháng 11 năm 1981, “Hướng dẫn thực hiện quyết định của Hội đồng chính phủ về Công tác hướng nghiệp trong nhà trường phổ thông”) [21]
2.1.2 Hoạt động giáo dục hướng nghiệp cho học sinh THCS
Theo định hướng của đề án số 522/QĐ-TTg “Giáo dục hướng nghiệp và định hướng phân luồng học sinh trong giáo dục phổ thông giai đoạn 2018-2025” của Thủ tướng Chính phủ ký ngày 14 tháng 5 năm 2018 [22] thì mục tiêu đến năm 2020 của giáo dục hướng nghiệp có khoảng 55% trường trung học cơ sở, 60% trường trung học phổ thông có chương trình giáo dục hướng nghiệp gắn với hoạt động sản xuất, kinh doanh, dịch vụ của địa phương; đối với các trường ở địa phương có điều kiện kinh tế - xã hội
Trang 26đặc biệt khó khăn đạt ít nhất 50% đối với cả hai cấp học trên Trong đó cũng đã chỉ ra các nhiệm vụ và giải pháp quan trọng để thực hiện đó là nâng cao nhận thức về giáo dục hướng nghiệp, định hướng phân luồng học sinh phổ thông và đổi mới nội dung, phương pháp, hình thức giáo dục hướng nghiệp trong trường phổ thông
Trong giáo dục học sinh THCS giáo dục hướng nghiệp không chỉ tác động đến nhận thức của học sinh trong việc lựa chọn nghề nghiệp cho tương lai mà qua đó giúp học sinh hiểu rõ giá trị của nghề nghiệp và công việc mình lựa chọn, giáo dục cho học sinh say mê hứng thú với lao động qua đó nhận ra giá trị đích thực của nghề nghiệp Hoạt động giáo dục hướng nghiệp là hoạt động đa dạng có nhiều thành phần tham gia
và chịu tác động của nhiều yếu tố, bị ảnh hưởng bởi điều kiện sống và môi trường xã hội cũng như hiểu biết của cá nhân, nó bị tác động bởi rất nhiều yếu tố như môi trường giáo dục, tác động của thị trường lao động, cũng như tác động của nhà trường, gia đình
và xã hội
Một thực trạng phổ biến ở nước ta hiện nay là hầu hết học sinh học xong THCS đều muốn tiếp tục học lên THPT cho dù năng lực học tập của mỗi học sinh như thế nào, điều này dẫn đến chất lượng bậc phổ thông giảm sút, số học sinh trúng tuyển vào các trường cao đẳng và đại học không cao Định hướng phân luồng tốt đối với học sinh THCS sẽ là cơ hội để các trường THCS và dạy nghề phát huy vai trò của mình và cũng đảm bảo cho việc phát triển giáo dục chuyên nghiệp đi đúng hướng mà nền giáo dục nước nhà đã đề ra Hoạt động giáo dục hướng nghiệp trong trường THCS cũng giúp hệ thống giáo dục phát triển cân đối, hợp lý giữa các hệ thống giáo dục phổ thông, giáo dục chuyên nghiệp, giáo dục đại học, qua đó đáp ứng nhu cầu lao động cho đất nước trong tương lai Thông qua hoạt động này để giúp học sinh học tập có kiến thức, kỹ năng nghề nghiệp phù hợp nhất với năng lực và sở trường của mình Hoạt động giáo dục hướng nghiệp có vai trò tích cực trong định hướng nghề nghiệp tương lai cho học sinh Bên cạnh ý nghĩa hoạt động hướng nghiệp giúp điều chỉnh khuynh hướng chọn nghề của học sinh, mặt khác hướng nghiệp giúp điều tiết và sử dụng hợp lý tiềm năng lao động trong tương lai, phát huy hết năng lực, sở trường lao động, phát triển khả năng sáng tạo trong lao động Giáo dục hướng nghiệp trong nhà trường THCS phát hiện và bồi dưỡng phẩm chất nhân cách nghề nghiệp cho học sinh, giúp các em hiểu biết được khả năng của mình, hiểu được yêu cầu của nghề qua đó chọn đúng nghề nghiệp phù hợp với bản thân mình, chính điều này có tác dụng điều chỉnh sự phân công lao động xã hội, tạo ra sự cân bằng trong việc phân bổ lực lượng lao động và chính nó làm đồng bộ hóa đội ngũ lao động nghề nghiệp, phân bổ lại lực lượng lao động xã hội chuyên môn hóa tiềm năng lao động trẻ tuổi của nước nhà [9]
Trang 272.1.3 Các con đường giáo dục hướng nghiệp cho học sinh THCS
Giáo dục hướng nghiệp trong nhà trường THCS thực hiện mục tiêu đào tạo của giáo dục trong nhà trường thông qua các môn học Do đó các thành tố trong hoạt động của nó bao gồm [7, 8]:
* Mục tiêu của giáo dục hướng nghiệp:
- Về kiến thức: Học sinh cần hiểu được ý nghĩa và tầm quan trọng của việc lựa chọn nghề nghiệp cho bản thân mình trong tương lai; nắm được những thông tin cơ bản
về việc phát triển kinh tế - xã hội, về thị trường lao động của địa phương, đất nước và thế giới
- Về kĩ năng: Trang bị cho học sinh kỹ năng tự đánh giá được năng lực của bản thân và điều kiện gia đình mình trong việc định hướng nghề nghiệp cho cá nhân mình tương lai; biết tìm kiếm những thông tin về nghề và những thông tin liên quan cần thiết cho việc lựa chọn nghề nghiệp; có khả năng định hướng và lựa chọn được nghề nghiệp trong tương lai cho bản thân mình
- Về thái độ: Học sinh phải có thái độ chủ động trong việc lựa chọn nghề phù hợp với bản thân và điều kiện ngoại cảnh của mình; có hứng thú và khuynh hướng chọn nghề đúng đắn
* Các con đường giáo dục hướng nghiệp:
Giáo dục hướng nghiệp được thực hiện thông qua 5 con đường đó là thông qua dạy học các môn khoa học cơ bản; thông qua việc tổ chức hoạt động giáo dục hướng nghiệp chính khóa; thông qua hoạt động ngoại khóa; thông qua hoạt động dạy và học môn công nghệ; thông qua các buổi sinh hoạt hướng nghiệp Cụ thể là:
+ Giáo dục hướng nghiệp thông qua dạy học các môn khoa học cơ bản, qua đó nhằm khai thác mối liên hệ giữa kiến thức môn học với các ngành nghề liên quan, gắn nội dung của bài học với cuộc sống sản xuất bằng cách tích hợp, lồng ghép những kiến thức môn học với kiến thức nghề nghiệp giúp học sinh hiểu biết những vấn đề liên quan đến các ngành nghề trong xã hội, phát triển và bồi dưỡng năng khiếu cho học sinh Từ
đó giáo viên định hướng cho học sinh chọn nghề phù hợp với năng khiếu và năng lực bản thân mình
+ Giáo dục hướng nghiệp thông qua việc tổ chức hoạt động chính khóa nhằm mục đích giới thiệu cho học sinh những ngành nghề chủ yếu, cơ bản của đất nước, những ngành nghề mà nhà nước đang cần phát triển một cách hệ thống; Cung cấp thông tin đào tạo và hướng phát triển kinh tế của đất nước, của địa phương, qua đó tư vấn chọn nghề cho học sinh Trên cơ sở nhận thức đó học sinh dần hình thành hứng thú đối với nghề
mà mình yêu thích, xây dựng cơ sở khoa học để lựa chọn nghề trong tương lai phù hợp với năng lực, hứng thú, sở thích của cá nhân mình và phù hợp với thực tiễn nhu cầu năng lực của địa phương và xã hội
Trang 28+ Giáo dục hướng nghiệp thông qua hoạt động ngoại khóa nhằm hỗ trợ cho các hoạt động giáo dục hướng nghiệp khác trong việc giới thiệu, tuyên truyền nghề cho học sinh
+ Giáo dục hướng nghiệp thông qua hoạt động dạy và học môn công nghệ nhằm cung cấp cho người học những nguyên lí cơ bản về kĩ thuật, công nghệ khoa học, quy trình sản xuất trong thực tế, làm cho học sinh hiểu được những ứng dụng của chúng trong hoạt động nghề nghiệp khác nhau và qua đó giúp học sinh có những kiến thức cơ bản về ngành nghề trong xã hội
+ Giáo dục hướng nghiệp thông qua các buổi sinh hoạt hướng nghiệp để học sinh chia sẽ những hiểu biết của mình với bạn bè về nghề nghiệp đồng thời biết thêm những kiến thức khác Mỗi buổi sinh hoạt là một chủ đề, mỗi chủ đề đều đem lại cho các em những kiến thức mới, hình thành cho các em ý thức trong việc chọn nghề cho bản thân Các con đường giáo dục hướng nghiệp nói trên vừa có tính độc lập, vừa có mối quan hệ tương tác, hỗ trợ cho nhau đảm bảo hiệu quả tối ưu cho hoạt động giáo dục hướng nghiệp trong nhà trường Mỗi con đường có những giá trị nhất định trong việc định hướng nghề nghiệp cho học sinh [10]
Như vậy năm con đường giáo dục hướng nghiệp nói trên là 5 con đường phổ biến nhất cho việc định hướng nghề nghiệp cho học sinh Tuy nhiên trong thực tế cho thấy việc áp dụng 5 con đường trên vẫn mang tính lý thuyết, chưa đi sâu được vào việc giúp học sinh giải tỏa về mặt tâm lí và giải quyết những băn khoăn, lo lắng, thắc mắc, và quan trọng là chưa có được các thông số cụ thể để giúp các em lựa chọn nghề nghiệp và hướng
đi của mình trong tương lai Đây cũng chính là lý do trăn trở mà chúng tôi muốn xây dựng hệ thống tư vấn hỗ trợ giúp các em trong việc lựa chọn nghề nghiệp trong tương lai của mình Chính điều này đã hướng chúng tôi đến việc nghiên cứu để tạo ra các nhà
tư vấn, trợ giúp cho các em học sinh, giải quyết những khó khăn thắc mắc của các em trong việc lựa chọn nghề nghiệp trong tương lai Từ sự phân tích nói trên, chúng tôi đã nghiên cứu và mong muốn tăng hiệu quả của công tác giáo dục hướng nghiệp cho học sinh ở nhà trường THCS trong giai đoạn hiện nay thông qua hình thức đưa tham vấn nghề bằng chương trình máy tính vào nhà trường THCS và coi đó như là một con đường giáo dục hướng nghiệp cho học sinh hiện nay trên địa bàn địa phương Thông qua tham vấn nghề này nhằm trợ giúp các em học sinh giải quyết được những khó khăn trong quá trình chọn nghề và lựa chọn được một hướng đi phù hợp, đồng thời thông qua việc giải quyết những khó khăn đó mà nhà trường sẽ trợ giúp học sinh nhận thấy được những giá trị năng lực tự đánh giá bản thân, hiểu biết về ngành, nghề, về trường đào tạo và có năng lực lựa chọn ngành, nghề phù hợp với khả năng của chính bản thân và điều kiện gia đình, môi trường của mình
Trang 292.2 Thực trạng công tác giáo dục hướng nghiệp cho học sinh THCS huyện Bố Trạch
2.2.1 Đặc điểm kinh tế xã hội của địa phương
Huyện Bố Trạch nằm ở vị trí chính giữa và được bao quanh bởi các huyện khác trong tỉnh Với diện tích tự nhiên 2.124,2 km2 được trải rộng từ Tây sang Đông và chiếm trọn chiều ngang của Đất nước; Vị trí địa lý của huyện Bố Trạch vừa tiếp giáp với biển Đông vừa tiếp giáp với Lào Phía Nam của huyện giáp thành phố Đồng Hới, phía Bắc giáp thị xã Ba Đồn và huyện Quảng Trạch Trên địa bàn huyện có 28 xã và 2 thị trấn
Cơ cấu địa hình của huyện với đầy đủ địa hình đồng bằng, miền núi, trung du và ven biển Địa bàn huyện cũng hội tụ đầy đủ hệ thống giao thông đường bộ, đường sắt, đường biển và nhất là có các tuyến đường giao thông huyết mạch chạy qua là đường Hồ Chí Minh, quốc lộ 1A, đường sắt Bắc - Nam và các tỉnh lộ tạo thành mạng lưới giao thông ngang - dọc tương đối hoàn chỉnh Trên địa bàn huyện có cảng Gianh, có nhiều khu du lịch và đặc biệt là có Vườn Quốc gia Phong Nha - Kẻ Bàng một điểm du lịch nổi tiếng
và thế mạnh trong huyện được xác định và khai thác hợp lý nên đã đưa lại hiệu quả kinh
tế ngày càng cao Đối với nông nghiệp phát triển toàn diện, từng bước đáp ứng được các yêu cầu của thị trường Bố Trạch được biết đến với chương trình xây dựng nông thôn mới đạt kết quả cao trong tỉnh, bộ mặt nông thôn có nhiều khởi sắc và thay đổi, có 14
xã đạt chuẩn Quốc gia về nông thôn mới Thu nhập bình quân đầu người/năm đạt 48 triệu đồng Giảm tỷ lệ hộ nghèo bình quân 2,0%/năm theo chuẩn hiện hành Giải quyết việc làm mới hàng năm trên 3.000 lao động, trong đó xuất khẩu lao động trên 1.000 lao động Tỷ lệ trẻ em dưới 5 tuổi suy dinh dưỡng dưới 13% Ổn định độ che phủ rừng ở mức 82% Hàng năm, có 50% tổ chức cơ sở đảng trong sạch vững mạnh; tỷ lệ kết nạp đảng viên mới trên 3%
Sản xuất công nghiệp - tiểu thủ công nghiệp và ngành nghề nông thôn duy trì được tốc độ tăng trưởng khá, bình quân hàng năm giá trị tăng thêm đạt 433 tỷ đồng Các loại hình dịch vụ phát triển khá nhanh đặc biệt là dịch vụ du lịch đã trở thành mũi nhọn chiến lược trong phát triển kinh tế huyện nhà Chú trọng phát triển dịch vụ để trở thành mũi nhọn trong phát triển kinh tế, trong đó phát triển dịch vụ du lịch là hướng đột phá chiến lược trong phát triển kinh tế - xã hội của huyện trong thời kỳ mới Tập trung khai thác lợi thế dịch vụ từ du lịch Phong Nha - Kẻ Bàng Hình thành và xây dựng dọc bờ biển
Trang 30các khu du lịch, bãi tắm Ưu tiên xây dựng các khu du lịch sinh thái, du lịch nghỉ dưỡng,
du lịch văn hoá tâm linh, du lịch cộng đồng, du lịch gia đình Tạo môi trường cạnh tranh lành mạnh, công bằng để phát triển các loại hình kinh tế
Các loại hình kinh tế tiếp tục phát triển mạnh, các cơ sở sản xuất đã giải quyết việc làm cho hơn 15.000 lao động mỗi năm, góp phần nâng cao thu nhập, giảm nghèo bền vững và phát triển huyện Bố trạch cũng như tỉnh nhà
Hoạt động Văn hóa - xã hội có nhiều hình thức đa dạng, tạo sự chuyển biến tích cực trong các mặt đời sống và an sinh xã hội Giáo dục và đào tạo tiếp tục phát triển, chất lượng mũi nhọn tiếp tục được khẳng định, chất lượng đại trà có tiến bộ Nguồn nhân lực của huyện có chuyển biến cả về số lượng và chất lượng, luôn đáp ứng yêu cầu, nhiệm vụ đặt ra Công tác đào tạo nghề, giải quyết việc làm có bước tiến đáng kể đã tạo thuận lợi cho nhiều lao động nông thôn học nghề và tạo việc làm, tăng thu nhập Nhiệm
vụ chăm sóc sức khoẻ nhân dân có tiến bộ, cơ bản đã làm tốt công tác khám chữa bệnh
và chăm sóc sức khỏe ban đầu cho nhân dân Thu nhập bình quân đầu người hàng năm tăng nhanh Quan tâm thực hiện đầy đủ, kịp thời và đúng quy định các chính sách an sinh xã hội
Quốc phòng - an ninh, trật tự an toàn xã hội được giữ vững, chất lượng hoạt động của lực lượng vũ trang có nhiều tiến bộ, góp phần giữ vững ổn định chính trị, thúc đẩy phát triển kinh tế - xã hội Các lực lượng quân sự, công an thường xuyên nắm chắc tình hình, giải quyết kịp thời, có hiệu quả các vụ việc liên quan đến an ninh chính trị ngay từ
cơ sở Các nguồn lực trên địa bàn huyện Bố Trạch đã và đang khai thác, phát huy hiệu quả, hạ tầng phục vụ sản xuất và đời sống từng bước được xây dựng, chất lượng cuộc sống người dân được nâng lên
Nâng cao chất lượng giáo dục toàn diện, chất lượng đại trà gắn với chất lượng mũi nhọn Tăng cường công tác đào tạo nghề, giải quyết việc làm Nâng cao chất lượng chăm sóc và bảo vệ sức khoẻ của nhân dân Đẩy mạnh phong trào “Toàn dân đoàn kết xây dựng đời sống văn hóa” Khai thác và sử dụng có hiệu quả các nguồn tài nguyên gắn với bảo vệ môi trường Tập trung mọi nguồn lực để thực hiện giảm nghèo, thực hiện tốt hơn nữa các chính sách an sinh xã hội Tiếp tục thực hiện tốt các chế độ đối với người
có công, chính sách xã hội
Với truyền thống đoàn kết, anh hùng trong đấu tranh cách mạng, cần cù, sáng tạo trong lao động sản xuất, Đảng bộ và nhân dân huyện Bố Trạch tiếp tục phát huy những thành tựu đã đạt được, tranh thủ tốt nhất những điều kiện và thời cơ mới, vượt qua mọi khó khăn, thách thức đoàn kết thực hiện thành công mọi nhiệm vụ đặt ra, đưa quê hương
Bố Trạch phát triển toàn diện và vững chắc hơn trong thời kỳ công nghiệp hóa, hiện đại hóa nông nghiệp nông thôn, thời kỳ hội nhập và phát triển [23]
Trang 312.2.2 Thực trạng giáo dục hướng nghiệp trên địa bàn Huyện Bố trạch
Hoạt động giáo dục hướng nghiệp trên địa bàn huyện Bố trạch gắn liền với chương trình giáo dục hướng nghiệp hiện nay mà Bộ giáo dục và đào tạo quy định Với mục tiêu giúp cho học sinh am hiểu về ngành nghề, nhu cầu lao động trong tỉnh và trong khu vực hiện nay; giúp cho học sinh xác định hướng đi sau khi tốt nghiệp THCS và chọn nghề sao cho phù hợp Song song với việc hướng nghiệp là việc phân luồng học sinh THCS theo năng lực học tập của từng học sinh Thực hiện chủ trương, chính sách đó phòng Giáo dục và Đào tạo huyện đã định hướng cho các trường phổ thông thực hiện việc giáo dục hướng nghiệp, tuyên truyền nâng cao nhận thức của học sinh xác định đúng hướng
đi sau khi tốt nghiệp THCS sao cho phù hợp với năng lực học tập của bản thân Trong những năm qua mặc dù các trường đã thực hiện đúng chủ trương đường lối và sử dụng nhiều giải pháp nhưng công tác phân luồng vẫn còn gặp nhiều khó khăn và chưa đáp ứng yêu cầu Kết quả thực tế trên địa bàn với những tình trạng như sau:
- Kết quả tuyển sinh vào lớp 10 THPT vẫn còn nhiều học sinh có chất lượng học tập thấp, mức độ đầu tư, động cơ học tập còn hạn chế Số lượng vào trung cấp chuyên nghiệp, trường dạy nghề còn ít
- Nhiều học sinh chưa nhận thức đúng cho hướng đi trong tương lai của mình, nhiều học sinh có học lực kém nhưng việc vận động các em HS sau khi tốt nghiệp THCS đến học nghề tại trung tâm là rất khó Một số em ở miền núi lại không theo học nghề mà phần lớn sau khi học xong THCS đều ở nhà làm nương rẫy với bố mẹ, rồi lập gia đình sớm Một số khác rời quê hương đi làm ăn xa với nghề tự do
- Tâm lý “không ai muốn con mình làm thợ” và “muốn vào đại học là con đường duy nhất” đã ăn sâu vào tiềm thức của hầu hết những người làm cha mẹ Nhiều bậc phụ huynh cho rằng, con mới học hết lớp 9, còn quá nhỏ để theo học tại các trường nghề Trong trường hợp bất đắc dĩ, khi năng lực của con quá yếu và không đỗ vào trường THPT thì mới học nghề tại các trường cao đẳng, trung cấp nghề, là lựa chọn cuối cùng
- Chỉ tiêu tuyển sinh vào lớp 10 hằng năm trên địa bàn huyện gần như tương đương với số HS tốt nghiệp THCS Như vậy rõ ràng, các em sẽ lựa chọn thi vào lớp 10 trường THPT Nếu các em không học trường công lập thì vẫn có thể học tại các trường tư thục, chỉ những trường hợp điểm quá thấp, không thể đỗ thì các em mới chuyển sang học bổ túc hoặc học nghề
- Khảo sát một số trường THCS trên địa bàn huyện, công tác phân luồng HS còn dựa vào điểm số Đây cũng là một nguyên nhân quan trọng khiến số HS lựa chọn học nghề sau khi tốt nghiệp THCS chỉ chiếm một tỷ lệ nhỏ Bởi lẽ, việc dựa vào điểm số để phân luồng đối tượng vô tình tạo nên sự mặc cảm trong tâm lý phụ huynh và HS Cụ thể, khi tiến hành phân luồng, giáo viên thường chú ý vào nhóm đối tượng là HS có lực học yếu, hổng kiến thức căn bản, khó có khả năng đỗ khi thi vào trường THPT để đi học
Trang 32tại các cơ sở GDHN đào tạo trình độ trung cấp, cao đẳng Điều này không sai nhưng lại tạo cho phụ huynh và HS một mặc cảm nhất định
- Tỷ lệ học sinh tốt nghiệp THCS vào học THPT cao làm ảnh hưởng đến cơ cấu đào tạo của lực lượng lao động Học tiếp lên THPT vẫn là luồng chủ yếu mà học sinh THCS hướng tới, mặc dù có nhiều em học sinh do hoàn cảnh khó khăn hoặc bị hạn chế
về năng lực đã bỏ học khi chưa hoàn thành THPT Phần lớn các trường đều có tỷ lệ học sinh học tiếp lên THPT với tỷ lệ hơn 70%, thậm chí có trường hơn 80% Trong khi đó, việc chọn luồng giáo dục thường xuyên chỉ là giải pháp của rất ít học sinh
- Việc các trường phổ thông thời gian qua chưa có đội ngũ chuyên trách công tác hướng nghiệp cũng là một rào cản lớn khiến việc phân luồng HS sau THCS gặp khó Hằng năm, những tiết học hướng nghiệp chủ yếu do giáo viên chủ nhiệm kiêm nhiệm
Do vậy, việc tư vấn, định hướng nghề nghiệp chưa được tiến hành sâu sát, thậm chí là
“cưỡi ngựa xem hoa” dẫn đến HS nắm bắt thông tin một cách hời hợt
2.2.3 Nghiên cứu thực trạng
2.2.3.1 Mục đích khảo sát
Trên cơ sở nghiên cứu hiện trạng việc lựa chọn nghề nghiệp của học sinh ở các trường trên địa bàn và qua đó đánh giá thực trạng của học sinh trong việc lựa chọn nghề nghiệp từ đó rút ra những kết luận cần thiết, làm cơ sở thực tiễn cho việc nghiên cứu đề tài Nắm bắt các thông tin ảnh hưởng đến việc lựa chọn nghề nghiệp của học sinh qua bảng hỏi và qua đó rút ra được các quy luật, các yếu tố quan trọng cho việc tư vấn lựa chọn nghề cho học sinh
2.2.3.2 Đối tượng khảo sát
Đối tượng khảo sát là học sinh khối 9 tại các trường:
Trang 332.2.3.3 Nội dung khảo sát
Qua quá trình nghiên cứu lý thuyết về giáo dục hướng nghiệp và các vấn đề liên quan, chúng tôi đã tiến hành khảo sát việc lựa chọn nghề nghiệp thông qua các yếu tố ảnh hưởng với các tiêu chí cụ thể được thể hiện trong bảng 3.1 (mục 3.1.1.2 mô tả bài toán của ở chương 3) Quá trình khảo sát cần tư vấn lựa chọn hướng đi trong tương lai cho học sinh, giúp các em hiểu rõ về hướng mình lựa chọn, nắm được đặc điểm của hướng đó, các yêu cầu của nó, biết phân tích và lựa chọn thông tin một cách toàn diện nhất Giúp học sinh hiểu được việc chọn nghề phải đạt được mục tiêu của giáo dục nghề nghiệp, đó là học sinh có năng lực tự khám phá bản thân: Năng lực, tính cách, sở thích, giá trị, mong muốn, nguyện vọng của bản thân; Học sinh có hiểu biết đầy đủ về ngành nghề qua đó có năng lực lựa chọn ngành nghề phù hợp
2.2.3.4 Phương pháp khảo sát
Phương pháp được dùng để khảo sát là phương pháp điều tra xã hội học thông qua việc xây dựng bộ công cụ điều tra khảo sát gồm các bộ phiếu điều tra với thông tin trên bảng 2.1 và thực hiện ở đối tượng học sinh lớp 9 trong các trường nói trên trên địa bàn Chúng tôi sử dụng công cụ Google Forms để khảo sát thông tin từ học sinh, kết quả lưu vào file excel để sau này tiến hành xử lý
2.2.4 Kết quả khảo sát
Chúng tôi tiến hành khảo sát trên 10 trường với số lượng học sinh khảo sát là 1000 học sinh Kết quả khảo sát sẽ được tiến hành xử lý theo quy trình trong chương 3
2.3 Mạng nơron nhân tạo
2.3.1 Giới thiệu về mạng nơron nhân tạo
Mạng nơron nhân tạo (Artificial Neural Network - ANN) là phương pháp máy học được nghiên cứu nhiều trong lĩnh vực trí tuệ nhân tạo, là một bộ phận không thể thiếu trong ngành khoa học trí tuệ nhân tạo ANN là hệ thống được xây dựng dựa trên nguyên tắc cấu tạo của bộ não con người, nó có một số lượng lớn mối liên kết của các phần tử biến đổi với mối liên kết song song ANN có khả năng tương tự như bộ não con người với các khả năng học, tái tạo và tổng hợp thông tin từ sự luyện tập của các mẫu và dữ liệu Các phần tử biến đổi của mạng nơron nhân tạo được gọi là các nơron nhân tạo hoặc gọi tắt là nơron Với những đặc điểm trên mạng nơron nhân tạo đã phát triển rất mạnh
mẽ và được ứng dụng vào rất nhiều lĩnh vực trong đời sống và xã hội Mạng nơron nhân tạo mô phỏng lại mạng nơron sinh học là một cấu trúc khối gồm các đơn vị tính toán đơn giản được liên kết chặt chẽ với nhau trong đó các liên kết giữa các nơron quyết định chức năng của mạng
Trang 34Những nghiên cứu về mạng nơron nhân tạo đã được nhiều nhà nghiên cứu tìm hiểu
từ rất sớm Năm 1943, tác giả McCulloch và Pitts đã nghiên cứu và đưa ra khả năng liên kết, một số liên kết cơ bản của mạng nơron nhân tạo Năm 1949, nhà nghiên cứu Hebb cũng đã đưa ra các luật thích nghi trong mạng nơron nhân tạo, ông đã đưa ra giả thuyết đầu tiên về một cơ chế thần kinh mềm dẻo Đến năm 1958, tác giả Rosenblatt đưa ra cấu trúc Perception Năm 1969, hai tác giả Minsky và Papert đã phân tích sự đúng đắn của Perception và chứng minh các tính chất cũng như chỉ rõ các giới hạn của một số mô hình liên quan Năm 1976, Grossberg dựa vào tích chất sinh học đã đưa ra một số cấu trúc của hệ động học phi tuyến với các tính chất mới Năm 1982, Hoppfield đã đưa ra mạng học phi tuyến với các tính chất mới Năm 1982, Rumelhart đưa ra mô hình song song và một số kết quả và thuật toán Đặc biệt năm 1986 các tác giả Rumelhart, Hinton, Williams đã đề xuất thuật toán học lan truyền ngược (Back Propagation learning rule)
và phương pháp luyện mạng nơron nhiều lớp Ngày nay có rất nhiều tác giả nghiên cứu
và đề xuất nhiều loại cấu trúc mạng nơron mới, nhiều kỹ thuật mới, nổi bật là ứng dụng vào kỹ thuật học sâu để ứng dụng vào tất cả các lĩnh vực kinh tế, kỹ thuật, khoa học và đời sống xã hội [16]
2.3.2 Một số tính chất và đặc trưng cơ bản của mạng nơron nhân tạo
- Là hệ phi tuyến: Mạng nơron nhân tạo có khả năng to lớn trong lĩnh vực nhận dạng và điều khiển các đối tượng phi tuyến
- Là hệ xử lý song song: Mạng nơron nhân tạo có cấu trúc song song, do đó có tốc
độ tính toán rất cao phù hợp với lĩnh vực dự báo và tư vấn
- Là hệ học và thích nghi: Mạng được luyện từ các số liệu đã có, có khả năng tự học và thích nghi với dữ liệu mới
- Là hệ nhiều biến: tham số hoạt động có nhiều đầu vào và nhiều đầu ra
- Hệ thống gồm một tập các đơn vị xử lý đó là các nơron nhân tạo
- Giữa các đơn vị có liên kết thông qua một giá trị trọng số nào đó
- Một luật lan truyền quyết định cách tính tín hiệu ra của từng đơn vị từ đầu vào của nó
- Hàm kích hoạt, hay hàm chuyển (activation function, transfer function), xác định mức độ kích hoạt khác dựa trên mức độ kích hoạt hiện tại
2.3.3 Tổ chức của mạng nơron nhân tạo
Mô hình mạng nơron nhân tạo gồm có ba thành phần chính:
+ Kiến trúc
+ Hàm chi phí
+ Thuật toán tìm kiếm
Trang 35Trong đó kiến trúc định nghĩa dạng chức năng liên quan giá trị nhập đến giá trị xuất Kiến trúc bao gồm:
+ Kiến trúc phẳng: Mạng phân loại đơn giản nhất (còn gọi là mạng logic) có một đơn vị xuất là kích hoạt kết quả và không có lớp ẩn, kết quả trả về ở dạng hàm tương đương với mô hình hồi quy logic Trong trường hợp này thuật toán tìm kiếm chia nhỏ
mô hình mạng để thích hợp với việc điều chỉnh mô hình ứng với tập huấn luyện + Kiến trúc Modun: Việc sử dụng một hay nhiều lớp ẩn của những hàm kích hoạt phi tuyến tính cho phép mạng thiết lập các mối quan hệ giữa những biến nhập và biến xuất Mỗi lớp ẩn học để biểu diễn lại dữ liệu đầu vào bằng cách khám phá ra những đặc trưng ở mức cao hơn từ sự kết hợp đặc trưng ở mức trước
Trong công trình của Wiener et al (1995) [17] dựa theo khung của mô hình hồi quy, liên quan từ đặc trưng đầu vào cho đến kết quả gán chủ đề tương ứng được học từ tập dữ liệu Do vậy, để phân tích một cách tuyến tính, tác giả dùng hàm sigmoid sau làm hàm truyền trong mạng Neural:
Trong đó, n là sự kết hợp của những đặc trưng đầu vào và p phải thỏa điều kiện p (0,1)
2.3.4 Cấu trúc của mạng nơron nhân tạo
Mạng nơron nhân tạo là một hệ thống bao gồm nhiều phần tử xử lý là nơron tựa như nơron thần kinh của não con người, chúng hoạt động song song và được nối với nhau bởi các liên kết nơron Mỗi liên kết kèm theo một trọng số nào đó, đặc trưng cho tính kích hoạt hoặc ức chế giữa các nơron Trong mô hình mạng các trọng số được xem
là phương tiện để lưu trữ thông tin cho mạng nơron và mục đích của quá trình huấn luyện mạng là cập nhật các trọng số khi có thêm thông tin về mẫu học để cho ra kết quả tốt nhất
Hình 2.1: Mô hình mạng nơron nhân tạo đơn giản
Lớp vào
Lớp ẩn
Lớp ra
Trang 36Hình trạng của mạng được định nghĩa bởi số lớp (layers), số đơn vị trên mỗi lớp,
và sự liên kết giữa các lớp như thế nào Trong mô hình mạng nơron nhân tạo các nơron được nối với nhau bởi các liên kết nơron, mỗi liên kết có một trọng số đặc trưng cho đặc tính kích hoạt hay ức chế giữa các nơron, đồng thời các nơron được nhóm lại với nhau theo cấu trúc phân lớp, bao gồm: lớp vào, lớp ra và lớp ẩn [15, 18] Trong đó:
- Lớp nơron thực hiện tiếp nhận các tín hiệu vào gọi là lớp vào (Input Layer) Các nút trong lớp vào gọi là nút vào, chúng mã hóa mẫu được đưa vào mạng xử lý Các nơron vào không xử lý thông tin, chúng thực hiện nhiệm vụ phân tán thông tin cho các nút khác
- Lớp nơron thực hiện đưa tín hiệu ra gọi là lớp ra (Output Layer) Các nơron trong lớp này có nhiệm vụ đưa thông tin ra phù hợp với mẫu mà người sử dụng cần
- Giữa hai lớp nơron vào và ra có một hoặc nhiều lớp nơron không liên hệ trực tiếp với môi trường bên ngoài được gọi là các lớp ẩn (Hidden Layer) Chúng tạo thành các
mô hình toán học phi tuyến cho mạng
Theo quan điểm kiểu liên kết nơron mạng nơron nhân tạo bao gồm các loại sau đây:
a) Mạng truyền thẳng (feed – forward Neural Network)
Trong mạng, các liên kết nơron chỉ đi theo một hướng từ lớp vào đến lớp ra, không tạo thành chu trình với các đỉnh là các nơron, các cung là các liên kết giữa chúng Như vậy, dòng dữ liệu được truyền thẳng từ đơn vị đầu vào đến đơn vị đầu ra Việc xử lý dữ liệu có thể mở rộng ra trên nhiều lớp, nhưng không có các liên kết phản hồi Nghĩa là, các liên kết mở rộng từ các đơn vị đầu ra tới các đơn vị đầu vào trong cùng một lớp hay các lớp trước đó là không cho phép Mạng nơron truyền thẳng nhiều lớp có thể có 1 hoặc nhiều lớp nơron ẩn Mạng nơron được gọi là liên kết đầy đủ nếu từng đầu ra của mỗi lớp được liên kết với đủ các nơron ở các lớp tiếp theo Hai loại mạng nơron một lớp và nhiều lớp được gọi là truyền thẳng nếu đầu ra của mỗi nơron được nối với các đầu vào của các nơron cùng lớp đó hoặc đầu vào của các nơron của các lớp trước đó Trong mạng không tồn tại bất kỳ một mạch hồi tiếp nào kể cả hồi tiếp nội lẫn hồi tiếp từ đầu
ra trở về đầu vào Mạng nơron bao gồm một hay nhiều lớp trung gian gọi là mạng MLP (Multilayer perceptrons Networks)
Trang 37Hình 2.2: Mạng nơron truyền thẳng nhiều lớp
Có một số loại cấu trúc của mạng nơron truyền thẳng như mạng một lớp truyền thẳng (Single – Layer Feedforward network), mạng nhiều lớp truyền thẳng (Multi layer – Layer Feedforward Network)
b Mạng hồi quy (Recurrent Neural Network)
Trong mạng cho phép các liên kết nơron tạo thành chu trình Tức là có chứa các liên kết ngược, có thông tin được xử lý theo hai chiều Mạng hồi quy có khả năng lưu giữ trạng thái trong của nó dưới dạng các ngưỡng kích hoạt ngoài các trọng số liên kết nơron Khả năng này thực hiện được là nhờ các thông tin ra của các nơron được truyền lại cho các nơron đã góp phần kích hoạt chúng Khác với mạng truyền thẳng, các thuộc tính động của mạng mới quan trọng Trong một số trường hợp, các giá trị kích hoạt của các đơn vị trải qua quá trình nới lỏng (tăng giảm số đơn vị và thay đổi các liên kết) cho đến khi mạng đạt đến một trạng thái ổn định và các giá trị kích hoạt không thay đổi nữa Trong các ứng dụng khác mà cách chạy động tạo thành đầu ra của mạng thì những sự thay đổi các giá trị kích hoạt là đáng quan tâm
Trang 38Hình 2.3 – Mạng nơron hồi quy (Recurrent neural network)
c Mạng kết nối đối xứng và không đối xứng
Mạng kết nối đối xứng là mạng thỏa mãn nếu có một đường nối từ nút i đến nút j thì cũng có một đường nối từ nút j đến nút i và trọng số tương ứng với hai đường này là bằng nhau (wij = wji) Ngược lại, mạng mà không thỏa mãn tính chất trên thì gọi là mạng không đối xứng
2.3.5 Phương thức hoạt động của mạng nơron và quá trình huấn luyện mạng
Mạng nơron nhân tạo thực hiện hai chức năng quan trọng là học và tổng quát hóa Trong đó học là quá trình hiệu chỉnh các tham số và các trọng số liên kết trong mạng để tối thiểu hóa sai số với vector đầu vào cho trước Quá trình học dừng lại khi mạng thỏa mãn một tiêu chuẫn dừng nào đó Tổng quát hóa là quá trình đưa vào một vector đầu vào mới và sản sinh ra quyết định dựa trên vector đầu ra tính được từ mạng
Mạng nơron nhân tạo khi mới hình thành còn chưa có tri thức, tri thức của mạng được hình thành dần sau một quá trình học Mạng nơron được huấn luyện bằng cách dựa vào các đầu vào của mạng cũng như các tham số đáp ứng tương ứng, phù hợp với từng loại kích thích sẽ được lưu giữ, giai đoạn này được gọi là giai đoạn học của mạng Khi đã hình thành tri thức mạng có thể giải quyết các vấn đề cụ thể một cách đúng đắn Quá trình hoạt động được thực hiện chủ yếu dựa trên sự tổ chức hợp nhất giữa các thông tin đầu vào của mạng và các đáp ứng đầu ra Cụ thể đối với một mạng liên kết có nhiệm
vụ là hoàn chỉnh hoặc hiệu chỉnh các thông tin thu thập được không đầy đủ hoặc bị tác động nhiễu Mạng nơron kiểu này được ứng dụng trong lĩnh vực hoàn thiện mẫu của bài toán Nhiệm vụ tổng quát của mạng nơron nhân tạo là lưu giữ tác động thông tin Trong
đó dạng thông tin lưu giữ chính là quan hệ giữa các thông tin đầu vào của mạng và các
Trang 39đáp ứng đầu ra tương ứng, để khi có một kích thích bất kỳ tác động vào mạng, mạng có khả năng suy diễn và đưa ra một đáp ứng phù hợp nhất Đó chính là chức năng nhận dạng theo mẫu của mạng nơron nhân tạo Để thực hiện chức năng này mạng nơron nhân tạo đóng vai trò như một bộ phận tổ chức các nhóm thông tin đầu vào và tương ứng với mỗi nhóm là một đáp ứng đầu ra phù hợp Như vậy một nhóm bao gồm một loại thông tin đầu vào và một đáp ứng ra Các nhóm có thể hình thành trong quá trình học và cũng
có thể không hình thành trong quá trình học Mục đích của quá trình học nói trên là tạo
ra một tri thức cho mạng thông qua rèn luyện Nguyên tắc học được thực hiện cho mạng
mà cấu trúc của mạng cũng như của các phần tử nơron cố định, chính là thay đổi giá trị của các phần tử trong véc tơ hàm trọng lượng, véc tơ ghép nối giữa các phần tử nơron trong mạng, các phần tử này được chọn sao cho quá trình truyền đạt mong muốn nhận được xấp xỉ một cách đủ chính xác như bài toán yêu cầu Mạng nơron nhân tạo phỏng theo việc xử lý thông tin của bộ não người, do vậy đặc trưng cơ bản của mạng là có khả năng học, khả năng tái tạo các hình ảnh và dữ liệu khi đã học, học chính là quá trình giải bài toán tối ưu tham số [12]
Trong thực tế chức năng của một mạng nơron nhân tạo được quyết định bởi các yếu tố như hình trạng mạng có bao nhiêu lớp, số đơn vị trên mỗi tầng, cách thức mà các lớp trong mạng liên kết với nhau và các trọng số của các liên kết bên trong mạng Hình trạng của mạng thường là cố định, và các trọng số được quyết định bởi một kỹ thuật học Tiến trình điều chỉnh các trọng số để mạng nhận biết các giá trị liên hệ giữa đầu vào và đầu ra được gọi là quá trình học Có rất nhiều nghiên cứu về vấn đề này và đều tập trung vào vấn đề để tìm ra tập trọng số tối ưu làm giải pháp học tốt nhất cho các bài toán Có hai kiểu học, đó là học thông số nghĩa là tìm ra biểu thức cập nhật các thông số về trọng
số cập nhật kết nối giữa các nơron và học cấu trúc, loại này tìm sự biến đổi cấu trúc của mạng nơron gồm số lượng nút (node) và các mẫu liên kết Tương ứng với đó có hai cách học đồng thời và không đồng thời Có ba phương pháp học phổ biến: Học có giám sát (Supervised Learning), Học không có giám sát (Unsupervised Learning ) và Học củng
cố (Reinforcement Learning)
a Học có giám sát (Supervised Learning):
Học có giám sát (Supervised Learning) hay còn gọi là học có thầy, là quá trình học
có sự tham gia giám sát của một “thầy giáo” Quá trình học mạng được huấn luyện bằng cách cung cấp cho nó các cặp mẫu đầu vào và các đầu ra mong muốn Các cặp được cung cấp bởi "thầy giáo", hay bởi hệ thống trên đó mạng hoạt động Sự khác biệt giữa các đầu ra thực tế so với các đầu ra mong muốn được thuật toán sử dụng để thích ứng các trọng số trong mạng Điều này thường được đưa ra như một bài toán xấp xỉ hàm số
- cho dữ liệu huấn luyện bao gồm các cặp mẫu đầu vào x, và một đích tương ứng t, mục đích là tìm ra hàm f(x) thoả mãn tất cả các mẫu học đầu vào