1. Trang chủ
  2. » Công Nghệ Thông Tin

Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)

20 472 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 0,99 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)

Trang 1

-

TRẦN VĂN HẢI

ỨNG DỤNG THUẬT TOÁN HỌC MÁY SVM TRONG TƯ VẤN HƯỚNG NGHIỆP CHO HỌC SINH TRUNG HỌC PHỔ THÔNG

CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH

MÃ SỐ: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ

HÀ NỘI – 2017

Trang 2

Luận văn được hoàn thành tại:

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: TS Đào Đình Khả

(Ghi rõ học hàm, học vị)

Phản biện 1: ……… Phản biện 2: ………

Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông

Vào lúc: …… giờ …… ngày …… tháng …… năm ……

Có thể tìm hiểu luận văn tại:

- Thư viện của Học viện Công nghệ Bưu chính Viễn thông

Trang 3

LỜI MỞ ĐẦU

Việt Nam là nước có dân số đông, số lượng người trong độ tuổi lao động lớn, cung cấp nguồn nhân lực dồi dào cho quá trình công nghiệp hóa, hiện đại hóa đất nước Tuy nhiên, trong những năm gần đây tình trạng nhiều sinh viên ra trường không tìm được việc làm hoặc phải làm việc không đúng với chuyên môn đang diễn ra khá phổ biến Điều này đã gây ra sự lãng phí nguồn nhân lực lao động của xã hội Một phần nguyên nhân là do việc đào tạo ngành nghề còn nhiều bất hợp lý, việc phân bố nguồn nhân lực giữa các vùng miền còn chưa đồng đều Bên cạnh đó, nguyên nhân của thực trạng trên còn nằm ở việc phần lớn học sinh bậc học phổ thông lựa chọn ngành nghề chủ yếu là theo cảm tính, theo xu thế hoặc do tác động từ gia đình, cha mẹ, bạn bè, … không xác định được khả năng, năng lực bản thân có phù hợp với ngành nghề hay không từ đó dẫn tới việc học tập và làm việc không hiệu quả, gây lãng phí lớn cho bản thân, gia đình và xã hội

Tư vấn hướng nghiệp là một vấn đề cần phải được quan tâm, nhất là ở cấp bậc phổ thông Khi được định hướng đúng đắn về nghề nghiệp, mỗi người sẽ yên tâm với nghề mình lựa chọn, có thái độ tích cực, chủ động học tập, rèn luyện để có thể hoạt động tốt lĩnh vực nghề nghiệp trong tương lai Đối với học sinh ở bậc phổ thông, tư vấn hướng nghiệp sẽ giúp các em định hướng ngành nghề một cách có cơ sở, có nhận thức đúng đắn về nghề nghiệp, phát huy được tối đa khả năng của bản thân, khơi dậy niềm đam mê của các em đối với công việc mình lựa chọn từ đó góp phần ổn định cuộc sống của bản thân trong tương lai đồng thời đáp ứng được nhu cầu xã hội, tránh lãng phí trong đào tạo và sử dụng hợp lý nguồn nhân lực góp phần vào việc phát triển kinh tế – xã hội của đất nước

Trong việc chọn nghề, để có thể lựa chọn được một ngành nghề phù hợp ta phải dựa vào khả năng, năng lực bản thân cũng như sở thích và tính cách của từng người Do đó, đối với công tác tư vấn hướng nghiệp cho học sinh trung học phổ thông, cần phải có một phương pháp phân loại để phân nhóm các em học sinh dựa trên các yếu tố này, từ đó mới có thể đưa

ra sự tư vấn, định hướng nghề nghiệp một cách chính xác cho các em Nói cách khác, để có thể giải quyết được vấn đề về công tác tư vấn hướng nghiệp cho học sinh trung học phổ thông

ta cần phải giải quyết được bài toán phân loại học sinh Đây là bài toán nhằm mục đích phân lớp các em học sinh vào các nhóm ngành nghề khác nhau dựa trên các đặc trưng về khả năng, năng lực, sở thích cũng như tính cách của từng em

Trang 4

Ngày nay, đối với các bài toán phân loại, việc sử dụng các mô hình tính toán dựa trên các phương pháp học máy ngày càng được áp dụng một cách rộng rãi và đạt được nhiều thành công to lớn Trong đó, phương pháp học máy Support Vector Machine (SVM) là một trong những phương pháp được sử dụng phổ biến nhất do tính hiệu quả và độ chính xác cao khi xử

lý đối với bộ dữ liệu lớn, rất thích hợp để ứng dụng trong bài toán phân loại học sinh

Với các lý do và mục tiêu như trên, tôi xin chọn đề tài nghiên cứu “Ứng dụng thuật toán học máy SVM trong tư vấn hướng nghiệp cho học sinh trung học phổ thông”

Mục tiêu cụ thể được trình bày trong luận văn như sau:

- Phát biểu bài toán về tư vấn hướng nghiệp cho học sinh trung học phổ thông

- Nghiên cứu học máy và thuật toán học máy SVM

- Áp dụng học máy và thuật toán học máy SVM cho bài toán tư vấn hướng nghiệp cho học sinh trung học phổ thông

- Cài đặt thử nghiệm thuật toán học máy SVM cho bài toán tư vấn hướng nghiệp cho học sinh trung học phổ thông

Nội dung của luận văn được trình bày trong 3 chương như sau:

- Chương 1: Tổng quan về học máy và bài toán tư vấn hướng nghiệp cho học sinh trung học phổ thông

- Chương 2: Xây dựng mô hình tư vấn hướng nghiệp cho học sinh trung học phổ thông dựa trên phương pháp Support Vector Machine

- Chương 3: Thực nghiệm và kết quả

CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY VÀ BÀI TOÁN TƯ VẤN

HƯỚNG NGHIỆP CHO HỌC SINH THPT 1.1 Tổng quan về học máy

1.1.1 Giới thiệu về học máy

Học máy (machine learning) là khả năng của chương trình máy tính sử dụng kinh nghiệm, quan sát hoặc dữ liệu trong quá khứ để cải thiện công việc của mình trong tương lai thay vì chỉ thực hiện theo đúng các quy tắc đã được lập trình sẵn Chẳng hạn, máy tính có thể học cách dự đoán dựa trên các ví dụ, hay học cách tạo ra các hành vi phù hợp dựa trên quan sát trong quá khứ

Trang 5

Ví dụ như chương trình có thể dựa vào dữ liệu trong quá khứ để phân loại thư điện tử xem có phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương ứng Thư rác ở đây được hiểu là các thư điện tử có chứa các nội dung quảng cáo hay các loại hàng miễn phí cho dùng thử được chuẩn bị từ trước và gửi đồng loạt tới nhiều địa chỉ Khái niệm “rác” đến

từ ý nghĩa là những thư này thường bị loại bỏ hơn là được sự lưu tâm của người nhận

1.1.2 Ứng dụng của học máy

Ngày nay, học máy có ứng dụng rộng rãi trong nhiều ngành nghề khoa học và sản xuất, đặc biệt là những ngành cần phân tích khối lượng dữ liệu khổng lồ, dưới đây là một số ứng dụng cụ thể của việc áp dụng các phương pháp học máy:

- Máy tìm kiếm

- Dịch tự động

- Phân loại văn bản tự động

- Phát hiện và nhận dạng mặt người

- Chuẩn đoán y khoa

- Các hệ tư vấn, khuyến nghị

1.1.3 Phân loại các phương pháp học máy

1.1.3.1 Học có giám sát

Học có giám sát (supervised learning) là dạng học máy trong đó tập dữ liệu huấn luyện đầu vào được cho trước dưới dạng các ví dụ với các giá trị đầu ra hay giá trị đích Nhiệm vụ của một thuật toán học có giám sát là dựa trên dữ liệu huấn luyện cần phải xây dựng được mô hình hay hàm đích để dự đoán giá trị đầu ra (giá trị đích) cho các trường hợp mới

1.1.3.2 Học không giám sát

Học không giám sát (unsupervised learning) là một phương pháp học máy nhằm tìm

ra một mô hình mà phù hợp với tập dữ liệu quan sát Học không giám sát khác học có giám sát ở chỗ các ví dụ được cung cấp nhưng không có giá trị đầu ra hay giá trị đích

1.1.3.3 Học bán giám sát

Học bán giám sát (semi-supervised learning) là dạng kết hợp giữa học có giám sát và học không giám sát Trong đó, nó kết hợp các ví dụ có gán nhãn và không gán nhãn để sinh

ra một hàm hoặc một bộ phân loại thích hợp

Trang 6

1.2 Tổng quan về phương pháp Support Vector Machine

1.2.1 Giới thiệu về Support Vector Machine

Support Vector Machine (SVM) là một phương pháp phân loại xuất phát từ lý thuyết thống kê Phương pháp này thực hiện phân lớp dựa trên nguyên lý tối thiểu rủi ro cấu trúc SRM (Structural Risk Minimisation) SVM sẽ cố gắng tìm cách phân loại dữ liệu sao cho lỗi xảy ra trên tập kiểm tra là nhỏ nhất

SVM dạng chuẩn nhận dữ liệu đầu vào và phân loại chúng vào hai lớp khác nhau Do

đó SVM còn được gọi là một thuật toán phân loại nhị phân, tuy nhiên nó vẫn có thể được mở rộng cho phân lớp đa lớp Với một bộ các ví dụ luyện tập thuộc hai thể loại cho trước, thuật toán huấn luyện SVM xây dựng một mô hình SVM để phân loại các ví dụ khác vào hai thể loại đó

1.2.1.1 Ý tưởng của phương pháp

Cho trước một tập dữ liệu huấn luyện gồm n ví dụ, mỗi ví dụ được biểu diễn là một điểm trong không gian véc-tơ Phương pháp SVM sẽ tìm ra một siêu phẳng quyết định tốt nhất có thể để chia không gian này thành hai lớp riêng biệt tương ứng là lớp “+” và lớp “-” Chất lượng của siêu phẳng này được quyết định bởi khoảng cách của điểm dữ liệu gần nhất của mỗi lớp đến siêu phẳng này

Trường hợp không thể phân chia các ví dụ bằng một siêu phẳng, phương pháp SVM

sẽ ánh xạ không gian ban đầu của các ví dụ sang một không gian khác thường là có số chiều cao hơn, sau đó tìm siêu phẳng tốt nhất trong không gian này

1.2.1.2 Cơ sở lý thuyết

Cho tập huấn luyện T = {(x1,y1), (x2,y2), …, (xn,yn)} trong đó xi ϵ Rn là các véc-tơ đặc trưng và yi ϵ {-1, +1} là nhãn phân loại tương ứng của các xi Giả sử ta chọn tập các đặc trưng

là D = {d1, d2, …, dn} thì véc-tơ đặc trưng xi = {xi1, xi2, …, xin} trong đó xij ϵ Rn Đối với bài toán phân lớp nhị phân, nhãn yi sẽ có hai giá trị -1 hoặc +1

Ta cần tìm một siêu phẳng có lề lớn nhất phân tách các điểm yi = -1 và yi = +1 Mỗi siêu phẳng có thể được biểu diễn dưới dạng

𝑓(𝑥) = 〈𝑤 𝑥〉 + 𝑏 = 0 Một ví dụ xi sẽ có nhãn phân loại yi được xác định như sau:

Trang 7

𝑦𝑖 = 𝑠𝑖𝑔𝑛𝑓(𝑥𝑖) = 𝑠𝑖𝑔𝑛(𝑤⃗⃗ 𝑥⃗⃗⃗ + 𝑏) = {𝑖 +1, 𝑤⃗⃗ 𝑥⃗⃗⃗ + 𝑏 ≥ 0 𝑖

−1, 𝑤⃗⃗ 𝑥⃗⃗⃗ + 𝑏 < 0 𝑖

1.2.2 SVM tuyến tính và SVM phi tuyến

1.2.2.1 SVM tuyến tính

1.2.2.1.1 SVM tuyến tính với tập dữ liệu phân tách được

Hai lề của siêu phẳng 𝑓(𝑥) = 〈𝑤 𝑥〉 + 𝑏 = 0 sẽ là:

- Lề cộng: 〈𝑤 𝑥〉 + 𝑏 = +1

- Lề trừ: 〈𝑤 𝑥〉 + 𝑏 = −1

Độ rộng lề:

𝑚 = 𝑑++ 𝑑− = 1

1

2

‖𝑤‖

Thuật toán SVM nhằm mục đích tìm một siêu phẳng tối ưu sao cho độ rộng của lề là lớn nhất, điều đó tương đương với việc giải quyết bài toán tối ưu sau:

Tìm w và b sao cho m = 2

‖𝑤‖ đạt cực đại, với ràng buộc:

{ 〈𝑤 𝑥𝑖〉 + 𝑏 ≥ 1, 𝑦𝑖 = +1

〈𝑤 𝑥𝑖〉 + 𝑏 ≤ −1, 𝑦𝑖 = −1

∀𝑖 = 1, 2, … , 𝑛 Với mọi ví dụ huấn luyện xi bài toán trên tương đương với bài toán cực tiểu hóa có ràng buộc sau:

min

𝑤,𝑏 ‖𝑤‖

Với ràng buộc 𝑦𝑖(〈𝑤 𝑥𝑖〉 + 𝑏) ≥ 1 ∀𝑖 = 1, 2, … , 𝑛

Bài toán này rất khó giải, do đó ta cần chuyển mục tiêu từ ‖𝑤‖ sang 1

2‖𝑤‖2

min

𝑤,𝑏

1

2‖𝑤‖2

Với ràng buộc 𝑦𝑖(〈𝑤 𝑥𝑖〉 + 𝑏) ≥ 1, ∀𝑖 = 1, 2, … , 𝑛

Biểu thức Lagrange là:

Trang 8

𝐿𝑃 = 1

2||𝑤||

2− ∑ 𝛼𝑖[𝑦𝑖(〈𝑤 𝑥𝑖〉 + 𝑏 − 1)]

𝑛

𝑖=1

Với αi ≥ 0 là các hệ số nhân Lagrange

Biểu thức đối ngẫu Lagrange là:

𝐿𝐷 = ∑ 𝛼𝑖 −1

2

𝑛

𝑖=1

∑ 𝛼𝑖𝛼𝑗𝑦𝑖𝑦𝑗〈𝑥𝑖𝑥𝑗〉

𝑛

𝑖,𝑗=1

Bài toán đối ngẫu Lagrange:

𝑚𝑎𝑥

𝛼 ∑ 𝛼𝑖 − 1

2

𝑛

𝑖=1

∑ 𝛼𝑖𝛼𝑗𝑦𝑖𝑦𝑗〈𝑥𝑖𝑥𝑗〉

𝑛

𝑖,𝑗=1

Với ràng buộc

{ ∑𝛼𝑖 𝑦𝑖 = 0

𝑛

𝑖=1

𝛼𝑖 ≥ 0, 𝑖 = 1, … , 𝑛

Công thức siêu phẳng quyết định ranh giới phân lớp:

𝑓(𝑥) = 〈𝑤 𝑥〉 + 𝑏 = ∑ 𝛼𝑖 𝑦𝑖〈𝑥𝑖 𝑥〉 + 𝑏

𝑥 𝑖  𝑆𝑉

= 0

Đối với một ví dụ cần phân lớp chúng ta chỉ cần tính giá trị:

𝑠𝑖𝑔𝑛(〈𝑤 𝑥〉 + 𝑏) = 𝑠𝑖𝑔𝑛( ∑ 𝛼𝑖 𝑦𝑖〈𝑥𝑖 𝑥〉 + 𝑏

𝑥𝑖 𝑆𝑉

)

1.2.2.1.2 SVM tuyến tính với tập dữ liệu có nhiễu

Để làm việc với các dữ liệu nhiễu, ta cần nới lỏng các điều kiện bằng cách sử dụng các biến Slack 𝜉𝑖 ≥ 0 như sau:

〈𝑤 𝑥𝑖〉 + 𝑏 ≥ 1 − 𝜉𝑖 nếu yi = +1

〈𝑤 𝑥𝑖〉 + 𝑏 ≤ −1 + 𝜉𝑖 nếu yi = -1

Đối với một ví dụ nhiễu (lỗi) thì 𝜉𝑖 ≥ 1 và ∑ 𝜉𝑖 sẽ là giới hạn trên của lỗi trong tập dữ liệu huấn luyện

Trang 9

Ta cần phải tích hợp lỗi trong hàm mục tiêu tối ưu bằng cách gán giá trị chi phí cho các lỗi vào hàm mục tiêu mới Bài toán tối ưu nguyên gốc chuyển thành:

min

𝑤,𝑏,𝜉

1

2‖𝑤‖2+ 𝐶(∑ 𝜉𝑖

𝑛

𝑖=1

)𝑘

Với các ràng buộc

{𝑦𝑖(〈𝑤 𝑥𝑖〉 + 𝑏) ≥ 1 − 𝜉𝑖, ∀𝑖 = 1, 2, … , 𝑛

𝜉𝑖 ≥ 0, ∀𝑖 = 1, 2, … , 𝑛 Trong đó, C > 0 là tham số xác định mức độ chi phí đối với các lỗi Giá trị C càng lớn thì mức độ chi phí lỗi càng cao Nó ảnh hưởng đến độ cực đại biên và làm giảm số lượng các biến phụ 𝜉𝑖 Giá trị k = 1 thường được sử dụng để có biểu thức đối ngẫu đơn giản hơn

Ta có biểu thức Lagrange là:

𝐿𝑃 = 1

2‖𝑤‖2+ 𝐶 (∑ 𝜉𝑖

𝑛

𝑖=1

) − ∑ 𝛼𝑖[𝑦𝑖(〈𝑤 𝑥𝑖〉 + 𝑏) − 1 + 𝜉𝑖] − ∑ 𝜇𝑖𝜉𝑖

𝑛

𝑖=1

𝑛

𝑖=1 Với αi, µi ≥ 0 là các hệ số nhân Lagrange

Biểu thức đối ngẫu Lagrange là:

L𝐷 = ∑ 𝛼𝑖−1

2

𝑛

𝑖=1

∑ 𝛼𝑖𝛼𝑗𝑦𝑖𝑦𝑗〈𝑥𝑖𝑥𝑗〉

𝑛

𝑖,𝑗=1

Vậy bài toán đối ngẫu Lagrange là:

max

𝛼 ∑ 𝛼𝑖

𝑛

𝑖=1

−1

2 ∑ 𝛼𝑖𝛼𝑗𝑦𝑖𝑦𝑗〈𝑥𝑖𝑥𝑗〉

𝑛

𝑖,𝑗=1

Với các ràng buộc

𝑛

𝑖=1

0 ≤ 𝛼𝑖 ≤ 𝐶, 𝑖 = 1, … , 𝑛 Siêu phẳng phân tách dữ liệu:

𝑓(𝑥) = 〈𝑤 𝑥〉 + 𝑏 = ∑ 𝛼𝑖𝑦𝑖〈𝑥𝑖 𝑥〉

𝑛

𝑖=1

+ 𝑏 = 0

Để phân lớp một ví dụ mới ta cũng chỉ cần tính sign(〈𝑤 𝑥〉 + 𝑏) như với trường hợp tập dữ liệu huấn luyện có thể phân tách được

Trang 10

1.2.2.2 SVM phi tuyến

Ngoài các trường hợp về tập dữ liệu có thể phân tách tuyến tính được, ta còn có thể gặp những tập dữ liệu huấn luyện có ranh giới quyết định là không tuyến tính nên rất khó giải quyết Phương pháp được đưa ra ở đây là ta sẽ ánh xạ các véc-tơ dữ liệu x từ không gian n chiều vào một không gian mới m chiều (m > n), gọi là không gian đặc trưng (feature space) Không gian đặc trưng này phải đảm bảo sao cho dữ liệu huấn luyện sau khi ánh xạ sẽ trở nên tuyến tính và phân tách dữ liệu sẽ ít lỗi hơn không gian ban đầu

Sau quá trình chuyển đổi không gian biểu diễn, bài toán tối ưu trở thành:

min

𝑤,𝑏,𝜉

1

2‖𝑤‖2+ 𝐶 ∑ 𝜉𝑖

𝑛

𝑖=1

Với ràng buộc:

{𝑦𝑖(〈𝑤 Φ(𝑥𝑖)〉 + 𝑏) ≥ 1 − 𝜉𝑖, ∀𝑖 = 1, 2, … , 𝑛

𝜉𝑖 ≥ 0, ∀𝑖 = 1, 2, … , 𝑛 Bài toán đối ngẫu Lagrange tương ứng là:

max

𝛼 ∑ 𝛼𝑖

𝑛

𝑖=1

−1

2 ∑ 𝛼𝑖𝛼𝑗𝑦𝑖𝑦𝑗〈Φ(𝑥𝑖)Φ(𝑥𝑗)〉

𝑛

𝑖,𝑗=1

Với ràng buộc:

𝑛

𝑖=1

0 ≤ 𝛼𝑖 ≤ 𝐶, 𝑖 = 1, … , 𝑛 Siêu phẳng phân tách dữ liệu:

𝑓(Φ(𝑥)) = 〈𝑤 Φ(𝑥)〉 + 𝑏 = ∑ 𝛼𝑖𝑦𝑖〈Φ(𝑥𝑖) Φ(𝑥)〉

𝑛

𝑖=1

+ 𝑏 = 0

Việc ánh xạ từ không gian ban đầu sang không gian đặc trưng mới có nhiều chiều hơn

sẽ làm cho dữ liệu trở thành phân chia tuyến tính Tuy nhiên, việc ánh xạ như vậy sẽ đòi hỏi cần phải tính toán các đặc trưng mới Số lượng đặc trưng như vậy có thể rất lớn thậm chí là

vô cùng Việc tính số lượng đặc trưng mới nhiều như vậy sẽ gặp vấn đề về chi phí, thời gian

và không thực tế Để tránh việc tính toán các đặc trưng trong không gian mới, SVM sử dụng các hàm nhân (kernel function)

Trang 11

Do không cần xây dựng tường mình ánh xạ Φ và sử dụng hàm nhân nên biểu thức siêu phẳng phân tách có thể được viết lại như sau:

𝑓(Φ(𝑥)) = ∑ 𝛼𝑖𝑦𝑖𝐾(𝑥𝑖, 𝑥)

𝑛

𝑖=1

+ 𝑏 = 0

1.2.3 SVM trong phân lớp đa lớp

1.2.3.1 Chiến lược One-against-Rest

Giả sử ta cần phải phân loại tập dữ liệu huấn luyện vào n lớp khác nhau Chiến lược này sẽ sử dụng n-1 bộ phân lớp và chuyển bài toán phân loại n lớp thành n bài toán phân lớp nhị phân Trong đó bộ phân lớp nhị phân thứ i (i = 1, 2, …, n-1) được xây dựng để phân tách các ví dụ thuộc lớp i với tất cả các lớp còn lại

Hàm quyết định phân lớp của lớp thứ i có dạng:

𝑓𝑖(𝑥) = 〈𝑤𝑖 𝑥〉 + 𝑏𝑖 = 0 Khi đó, siêu phẳng phân chia tối ưu sẽ có dạng fi(x) = 0, các véc-tơ hỗ trợ thuộc lớp i thỏa mãn fi(x) = 1 Nếu véc-tơ dữ liệu x thỏa mãn điều kiện fi(x) > 0 đối với duy nhất một lớp

i thì x sẽ được phân vào lớp thứ i

1.2.3.2 Chiến lược One-against-One

Khác với chiến lước OAR, chiến lược OAO sẽ kết hợp từng đôi một các lớp với nhau

để phân loại, sau đó sử dụng phương pháp lựa chọn theo đa số để kết hợp các bộ phân loại với nhau và xác định kết quả phân loại cuối cùng Chiến lược này sẽ cần phải sử dụng n(n-1)/2 bộ phân loại đối với trường hợp đầu ra có n nhãn

Hàm quyết định phân lớp của lớp thứ i đối với lớp thứ j là:

𝑓𝑖𝑗(𝑥) = 〈𝑤𝑖𝑗 𝑥〉 + 𝑏𝑖𝑗 = 0

𝑓𝑖𝑗(𝑥) = −𝑓𝑗𝑖(𝑥) Đối với một véc-tơ x ta tính:

𝑓𝑖(𝑥) = ∑ 𝑠𝑖𝑔𝑛(𝑓𝑖𝑗(𝑥))

𝑛

𝑗≠𝑖,𝑗=1

Trong đó: 𝑠𝑖𝑔𝑛(𝑥) = {1, 𝑥 > 00, 𝑥 ≤ 0

Trang 12

Ví dụ x sẽ được phân vào lớp i khi: arg max

𝑖=1,…,𝑛

𝐷𝑖(𝑥)

1.3 Bài toán tư vấn hướng nghiệp cho học sinh trung học phổ thông

1.3.1 Giới thiệu về tư vấn hướng nghiệp

1.3.1.1 Khái niệm tư vấn hướng nghiệp

Tư vấn hướng nghiệp được hiểu là hệ thống những biện pháp tâm lí, giáo dục và một

số biện pháp khác được các chuyên viên tư vấn hướng nghiệp, các thầy/cô giáo làm nhiệm vụ

tư vấn hướng nghiệp, … (gọi chung là tư vấn viên) sử dụng nhằm phát hiện, đánh giá sở thích nghề nghiệp, khả năng về thể chất, trí tuệ của học sinh, sinh viên, thanh, thiếu niên, … (gọi chung là người được tư vấn); đối chiếu các khả năng thực có của mỗi em với những yêu cầu của bậc học cao hơn hoặc những yêu cầu của nghề đặt ra đối với người lao động, có cân nhắc đến nhu cầu nhân lực của địa phương và xã hội Từ đó, giúp cho người được tư vấn tự tìm ra giải pháp và từng bước giải quyết vấn đề để chọn được hướng học hoặc chọn nghề phù hợp

1.3.1.2 Mục đích của tư vấn hướng nghiệp

- Phát hiện và giúp các em đánh giá đúng sở thích nghề nghiệp, khả năng của bản thân; hiểu rõ hơn yêu cầu của nghề và nhu cầu lao động của xã hội

- Góp phần xác định con đường tiếp tục phát triển nhân cách và sự phù hợp nghề của các em trong tương lai

1.3.1.3 Nhiệm vụ của tư vấn hướng nghiệp

- Phát hiện và đánh giá được những sở thích, khả năng nghề nghiệp hiện có của học sinh

- Khuyến khích, động viên học sinh tự giáo dục, rèn luyện và phát triển những khả năng còn thiếu

- Hướng dẫn/hỗ trợ học sinh chuẩn bị sẵn sàng về tâm lí cũng như những hiểu biết thực

tế đối với nghề nghiệp mà các em định chọn

- Giúp học sinh tìm ra giải pháp và từng bước giải quyết vấn đề để chọn được hướng học hoặc chọn nghề phù hợp

1.3.1.4 Các loại hình tư vấn hướng nghiệp

Ngày đăng: 23/10/2017, 12:42

HÌNH ẢNH LIÊN QUAN

CHƯƠNG 2: XÂY DỰNG MÔ HÌNH TƯ VẤN HƯỚNG NGHIỆP CHO HỌC SINH THPT DỰA TRÊN PHƯƠNG PHÁP SUPPORT  - Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)
2 XÂY DỰNG MÔ HÌNH TƯ VẤN HƯỚNG NGHIỆP CHO HỌC SINH THPT DỰA TRÊN PHƯƠNG PHÁP SUPPORT (Trang 16)
- Bước 4: Xây dựng mô hình phân lớp theo phương pháp SVM trên tập HL - Bước 5: Sử dụng mô hình phân lớp có được để phân loại với tập dữ liệu KC  - Bước 6: Phân tích và đánh giá kết quả của mô hình phân lớp  - Ứng dụng thuật toán học máy svm trong tư vấn hướng nghiệp cho học sinh trung học phổ thôn (tt)
c 4: Xây dựng mô hình phân lớp theo phương pháp SVM trên tập HL - Bước 5: Sử dụng mô hình phân lớp có được để phân loại với tập dữ liệu KC - Bước 6: Phân tích và đánh giá kết quả của mô hình phân lớp (Trang 17)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w