1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích, khai phá dữ liệu dạy học và thông tin phản hồi của sinh viên nhằm nâng cao chất lượng và hiệu quả quản lý đào tạo

70 87 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 70
Dung lượng 8,74 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘIBÁO CÁO TỔNG KẾT KẾT QUẢ TH ựC HIỆN ĐÊ TÀI KH&CN CẤP ĐẠI HỌC QUỐC GIA Tên đê tài: Phân tích, khai phá dữ liệu dạy học và thông tin phản hôi của sinh viên nhằm nâ

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

BÁO CÁO TỔNG KẾT KẾT QUẢ TH ựC HIỆN ĐÊ TÀI KH&CN

CẤP ĐẠI HỌC QUỐC GIA

Tên đê tài: Phân tích, khai phá dữ liệu dạy học và thông tin

phản hôi của sinh viên nhằm nâng cao chất lượng

và hiệu quả quản lý đào tạo

Hà N ội, 02/2018

Trang 2

MỤC LỤC

T HỨ T ự CÁC BÁO CÁO VÀ TÀI LIỆU

Các tài liệu đưọ'c ngăn cách bởi trang bìa cứng

1

Trang 3

ĐẠI HỌC QUỐC GIA HÀ NỘI

BÁO CÁO TỔNG KẾT

KẾT QUẢ THựC HIỆN ĐÊ TÀI KH&CN

CẤP ĐẠI HỌC QUỐC GIA

Phân tích, khai phá dữ liệu dạy học và thông tin phản hôi của sinh viên nhằm nâng cao chất lượng

và hiệu quả quản lý đào tạo QG.15.29

PGS.TS Phan Xuân Hiếu

Tên đề tài:

Mã số:

Chủ nhiệm:

Ị -[RUNG TÂM THÔN©

L —

-Hà N ội, 02/2018

Trang 4

PH ẦN I THÔNG TIN CHUNG

1.1 Tên đề tài: Phân tích, khai phá dữ liệu dạy học và thông tin phản hồi của sinh viên nhằm

nâng cao chất lượng và hiệu quả quản lý đào tạo

1.2 Mã số: QG.15.29

1.3 Danh sách chủ trì, thành viên tham gia thực hiện đề tài

1.4 Đơn v ị chủ trì: Trường Đại học Công nghệ, Đ ại học Quốc gia Hà N ội

1.5 Thời gian thực hiện:

1.5.1 Theo hợ p đồng: 24 tháng, từ tháng 02 năm 2015 đ ến tháng 02 năm 2017

1.5.2 Gia h ạ n (nếu có): 12 tháng, đến th án g 02 n ăm 2018

1.5.3 Thực hiện th ự c tế: 30 tháng, từ thán g 02 năm 2015 đ ến th án g 08 năm 2017

1.6 N hữ ng thay đổi so vói thuyết m inh ban đầu (nếu có): k hông

(Về mục tiêu, nội dung, phương pháp, kết quả nghiên cứu và tố chức thực hiện; Nguyên nhân; Ý kiến của Cơ quan quản lý)

1.7 Tông kinh phí được phê duyệt của đề tài: 300 triệu đồng.

Trang 5

thác, phân tích các dạn g d ữ liệu liên q u an đ ến hoạt dộng giảng dạy, học tập, q u ản lý đào tạo, d ữ liệu phản hồi của các bên liên quan (người dạy, ngư ò i học, đ ơ n vị tuy ển d ụ n g đê’ có thêm n h ũ n g hiểu biết, n h ũ n g góc nhìn m ới về việc dạy, việc học, việc q u ản lý nhằm nâng cao hiệu quả của các h o ạt đ ộ n g này Vê m ặt kỹ thuật, EDM nghiên cứu và đề xuất các ph ư ơng pháp xừ lý và p h ân tích các dạng d ữ liệu đặc biệt từ các trư ờng, viện, các cơ

sở giáo dục nhằm khám p h á n h ữ n g hiểu biết m ới về sinh viên, về chư ơng trình, về các

m ôn học, và về các ho ạt độ n g dạy-học cũng n h ư các tác động qua lại giữa các đối tượng liên quan [BakerlO, RomerolO, Pena-A yalal4]

Có nhiều cách tiếp cận và các v ấ n đề đư ợc đ ặt ra trong lĩnh vự c EDM Baker [2009, 2010]

đề xuất bốn hướng ng hiên cứ u và ứ n g d ụ n g bao gồm: cải tiến các m ô h ìn h sinh viên (sudent models), cải tiến các m ô h ìn h lĩnh vực (dom ain m odels), n g h iên cứ u các tác động

và hỗ trợ về m ặt sư p h ạm bởi các p h ần m ềm học tập, và các n g h iên cứu k hoa học tác đ ộng vào h oạt động dạy-học và ngư ời học Đi kèm đó là việc sử d ụ n g các kỹ th u ậ t d ự đoán (prediction), phân cụm (clustering), khai p h á q u an hệ (relationship m ining), chắt lọc d ữ liệu đê đ án h giá v.v C astro và cộng sự [2007] p h ân tích, đ án h giá hiệu quả học tập của sinh viên, điều chỉnh thích ứ n g và gợi ý các m ôn học (course ad ap tation /reco m m en datio n) cho người học dựa trên các h à n h vi và h oạt đ ộ ng của sin h viên, cũng n h ư xử lý p h ả n hồi của người dạy, người học và p h á t hiện các h àn h vi học đặc trư ng của sinh viên Cụ thể, các

h ư ớ n g nghiên cứu nổi b ật đ ư ợ c cộng đồng quốc tế q u an tâm tro n g lĩnh vực EDM bao gồm: (1) p h ân tích và th ốn g kê sư p h ạm (mức độ hiểu, n ắm b ắt kiến thức, h iểu sai v ấn đề,

tỉ lệ đ ậu .) [Zinn06]; (2) p h ân tích thô ng tin p h ả n hồi của ngư ời học và các bên liên q u an (stakeholders) nhằm n ân g cao hiệu quả các h o ạt đ ộn g dạy-học [B entonl4, M erceron08, Psaromiligkos09]; (3) các hệ th ố n g gợi ý cho sin h viên n h ư tự đ ộ n g gợi ý m ôn học, khoá học, tài liệu học tập p h ù h ợ p với khả năng, sở thích, tình trạ n g và sự lựa chọn nghề nghiệp của m ỗi sinh viên [Zhang08]; (4) d ự đoán, kết quả, hiệu q u ả học tập của sinh viên (predicting stu d en t p eríorm ance) [HamalainenOó, Romero08]; và các vấn đề n h ư m ô hình hóa sinh viên (student m odeling) hoặc p h ân nhóm , p h ân cụm sinh viên

EDM tập tru n g khai thác trên hai d ạn g d ữ liệu chính: (1) d ữ liệu đ ư ợ c ghi n h ận bởi các hệ thố ng q uản lý hoạt động dạy-học bao gồm d ữ liệu n h ậ t ký (log), d ữ liệu về thi cử, đ án h giá, điểm và (2) d ữ liệu p h ả n hồi chủ độn g của các b ên th am gia m à cụ th ể là từ sinh viên, giảng viên, bộ p h ận q u ả n lý đào tạo các cấp và các đ ơ n vị sử d ụ n g lao động Trong hơn m ột thập kỷ qua, các n g h iên cứu p h ân tích d ữ liệu đào tạo ở Việt N am chủ yếu tập tru n g vào việc xử lý d ữ liệu p h ả n hồi của sin h viên (về m ôn học, về giảng viên, về chất

lư ợng dịch vụ đào tạo) [N guyen05a, N guyen05b, La05] Các kết q u ả cho thấy, việc p h ân tích d ữ liệu p h ản hồi từ n g ư ờ i học đ ạt hiệu q u ả tốt và có tính k hách q u an cao Tuy vậy, cần có nh ữ n g nghiên cứu m a n g tín h toàn diện, lấy ý kiến từ n h iề u bên th am gia, kết hợp

nh iều khía cạnh đ ể có m ột bứ c tran h khách quan, rõ n ét về thự c trạn g q u ản lý giáo dục cũng n h ư hoạt động dạy-học tại các đ o n vị đ ào tạo

Đại học Q uốc gia Hà Nội, với vai trò là m ột đ ơ n vị đào tạo chất lư ợ ng cao h àng đ ầu trong nước, đã th ể hiện sự q u an tâ m đ ến các công tác kiểm đ ịn h chật lư ợng, đ á n h giá các hoạt đào tạo ở nhiều khâu, nh iều khía cạnh Tuy nhiên, chưa có m ột sự h ợ p tác liên lĩnh vực, liên n gành giữa n h ũ n g chuyên gia p h ân tích, khai p h á d ữ liệu và n h ũ n g n h à giáo dục học,

nh ữ n g người làm công tác q u ản lý giáo d ụ c đê cùng n hau th u th ập d ữ liệu, p h ân tích,

đ án h giá, từ đó gọi m ở các ý tư ở n g cải tiến chất lư ợng đào tạo cũng n h ư đề xu ất các ứ ng

2

Trang 6

dụng thông m inh cho phép tự đông hóa m ột số khâu trong hoạt động dạy-học nhằm nâng cao hiệu quả m ột cách tổng th ể của lĩnh vực này Đề tài nghiên cứu này được đề xuất thực hiện trong bối cảnh đó, với m ong m u ốn kết hợ p được các phư ong p háp p hân tích, khai phá d ữ liệu hiện đại đ ể xử lý các dạng d ữ liệu thu thập được từ lĩnh vực giáo dục, đào tạo Theo đó, đề tài tập trung vào hai h ư ớng nghiên cứu chính n h ư sau: (a) d ự đoán hiệu quả học tập của người học và trợ giúp, định hướng người học xuyên su ốt trong quá trình họcvà (b) th u thập và p hân tích d ữ liệu phản hồi của người học, của giảng viên và của

nh ữ n g người quản lý nhằm nâng cao hiểu biết về hoạt dộng đào tạo và từ đó đề xu ất các giải p háp đ ể nâng cao hiệu quả của hoạt động này Đối với hướng nghiên cứu th ứ nhất, đề tài tập trung giải quyết hai bài toán cụ thể: (a.l) dự đoán hiệu quả học tập của sinh viên (student's períorm ance prediction) [GoldingOó, H uangl3, Asifl5] và (a.2) nghiên cứu, xây dựng phương p háp gợi ý, tư vấn lựa chọn m ôn học cũng nh ư hỗ trợ, định hướng người học trong suốt lộ trình học tập Bên cạnh đó, đề tài cũng đã p h át triển hệ thống p h ần mềm

tự động gợi ý và trợ giúp người học lựa chọn lộ trình học tập phù hợp (Personalized Recom m ender System in Education) thỏa m ãn đa ràng buộc [Param esvvaranll] H ệ thống này hướng đến thay th ế m ột p hần lớn nhiệm vụ cố vấn học tập trong hệ thống đào tạo tín chỉ vốn hiện tại được các thầy cô giáo đảm nhiệm Đối với hướng nghiên cứu thứ hai, đề tài khảo sát, đ án h giá công tác q uản lý đào tạo đại học ở ĐHQG H à N ội m ột cách toàn diện, đa chiều (đa tham số) và khách q uan (đa phương pháp, đa nguồn) Từ đó, đề tài đúc kết các khuyến nghị nhằm tăng cường và đảm bảo chất lượng đào tạo tại các đơn vị đào tạo nói riêng và của cả ĐHQG H à N ội nói chung

2 Mục tiêu

Mục tiêu chung của đề tài là đề xuất và ứ n g d ụ ng các phương pháp khai phá d ữ liệu hiện đại nhằm phân tích d ữ liệu đào tạo và thông tin phản hồi của sinh viên, giảng viên,, nh ữ ng nhà quản lý hướng đến nâng cao chất lượng dạy-học và hiệu quả qu ản lý đào tạo Theo

đó, đề tài đặt ra bốn m ục tiêu cụ th ể sau đây:

(1) Xác định và thiết k ế được k hu ng m ẫu bảng hỏi thu thập thông tin phản hồi từ sinhviên, giảng viên và các nhà quản lývề các khía cạnh của hoạt động dạy-học và q u ản lý đào tạo tại các đơn vị trong phạm vi Đại học Quốc gia H à Nội

(2) Đề xuất và ứng d ụ ng các p hư ơ ng p háp và kỹ thuật khai phá d ữ liệu hiện đại đ ể phân tích d ữ liệu đào tạo và thông tin p h ản hồi nhằm dự đoán, d ự báo, tìm ra các m ối liên

hệ giữa các yếu tố liên quan đến chất lượng đào tạo và hiệu quả q u án lý đào tạo

(3) D ựa trên nhữ ng kết quả phân tích, đề tài sẽ tống hợp và đề xuất các giái pháp nhằm nâng cao chất lượng hoạt động giảng dạy cũng như nâng cao hiệu q uả quản lý đào tạo tại các đơn vị thuộc Đại học Q uốc gia H à Nội

(4) Đề xuất giải p háp và xây dự ng hệ thống phần mềm tự động tư vấn lựa chọn m ôn học

và lộ trình học tập p h ù hợp với từ n g cá nhân người học

3 Phương pháp nghiên cứu

Phương pháp nghiên cứu chính được tiến h ành trong đề tài là nghiên cứu định lượng với các nội dung nh ư sau:

3

Trang 7

• Đối với bài toán phân tích và d ự đoán hiệu quả học tập của sinh viên, đề tài đề xuất các cách tiếp cận nh ư lọc cộng tác (Collaborative Filtering) hay hồi quy (Regression).

tài áp d ụ n g các kỹ thuật tiên tiến bao gồm hồi quy, lọc cộng tác, giải th u ật Min-Cost-

M ax-Flow đ ể tìm luồng cực đại nhằm tìm ra tập tối ưu các m ôn học ph ù hợp với từng sinh viên cụ thể

đ ào tạo, đề tài khảo sát, phân tích, đ ánh giá theo cách tiếp cận đa chiều, toàn diện (đa tham SỐ) và khách quan (đa ph ư ơng pháp, đa nguồn) Các thang đo được đ ánh giá thô ng q ua hệ số tin cậy Cronbach A lpha và phư ơng p h áp phân tích n h ân tố EFA rất

h ữ u hiệu

đ ịn h lượng, khách quan

kiến nghị đ ể nâng cao hiệu quả đào tạo Các kết quả nghiên cứu định lượng được công

b ố trên các tạp chí quốc tê (Scopus, ISI), tạp chí trong nước, các hội nghị quốc tế đ ể

n h ậ n đư ợc đ án h giá và thẩm định của cộng đồng khoa học

4 T ổng kết kết quả nghiên cứu

Với m ục tiêu chung và bốn m ục tiêu cụ th ể nêu trên, nhóm đề tài đã thực hiện và đ ạt được

n h ữ n g k ết quả đáng chú ý n h ư sau:

(1) Đề x u ất 02 m ẫu bảng hỏi (phiếu khảo sát) đ ể thu thập ý kiến p h ản hồi của người học (sinh viên đại học) và cán bộ (giảng viên và cán bộ quản lý đào tạo) Các bảng hỏi khai thác thô ng tin nhiều chiều từ các đối tượng người học và cán bộ tham gia khảo sát Đối với sin h viên, các nội du n g q u an tâm bao gồm chương trình đào tạo, h o ạt động giảng dạy, h o ạ t động học tập, môi trư ờng và cơ sở vật chất, lựa chọn và đăng ký m ôn học, lộ trìn h và đ ịn h hướng học tập.ĐỐi với giảng viên và cán bộ quản lý, các nội d u n g quan trọ n g bao gồm hệ thống v ăn b ản về quản lý đào tạo, m ục tiêu và k ế hoạch đào tạo,

q u ản lý chương trình đào tạo, tuyển sinh, tổ chức thực hiện đào tạo, quản lý hoạt động giảng dạy của giảng viên quản lý hoạt động học tập của sinh viên, quản lý môi trường học tập, cơ sở vật chất v.v Hai bảng hỏi được mô tả đầy đủ trong Phu lưc 1 và Phu luc

2 đi kèm báo cáo này

(2) Đề x u ất p hư ơ n g pháp p h ân tích và d ự đoán hiệu quả học tập của sinh viên (student's períorm ance prediction) d ự a trên mô hình lọc cộng tác và hồi quy Kết quả này được công b ố ở bài báo tạp chí Scopus [QG.15.29-01] (có trong Phu luc 1 kèm theo báo cáo này) Đề tài cũng đề xuất p hư ơng pháp tư vấn lựa chọn m ôn học và lộ trình học tập thoả m ãn đa ràng buộc d ự a trên hồ sơ, năng lực, sở thích, tình trạng hiện tại và mục tiêu d ài hạn của từ ng sinh viên Kết quả này đang trong thời gian chờ p h ản biện tại

m ột tạp chí Scopus [QG.15.29-03] (có trong Phu luc 1 kèm theo báo cáo này) Bằng việc

sử d ụ n g 02 bảng hỏi nêu trên, nhóm đề tài đã thu thập được ý kiến p h ản hồi của 136 cán bộ và 482 sinh viên từ 06 trường đại học và 02 khoa trực thuộc của Đ HQ GHN Đề tài đã tiến h ành phân tích nhiều chiều, toàn diện, và khách quan Các th an g đo được

đ án h giá thông qua hệ số tin cậy Cronbach A lpha và phương p háp p h ân tích n hân tố

4

Trang 8

EFA Kết quả này được công b ố trong bài báo Tạp chí Khoa học ĐHQG Hà Nội [QG.15.29-04] (có trong Phu luc 1 kèm theo báo cáo này).

(3) D ựa trên các kết quả phân tích từ d ữ liệu đào tạo và thông tin p h ả n hồi từ người học, người quản lý, đề tài đã đề xuất 02 bản kiến nghị n h ằm n ân g cao chất lượng hoạt động giảng dạy cũng n h ư nâng cao hiệu quả quản lý đào tạo tại các đ o n vị thuộc Đ HQ GHN Các đề xuất này có trong Phu luc 1 và Phu luc 2 đi kèm báo cáo này

(4) N hóm đề tài đãnghiên cứu và p h át triển hệ thống p h ần m ềm tự đ ộn g tư vấn lựa chọn

m ôn học và lộ trình học tập dự a trên hồ sơ, khả n ăng n h ận thức, tình trạng hiện tại, sở thích học tập và m ục tiêu dài hạn Phần m ềm xem xét các m ối ràn g buộc, quan hệ giữa các m ôn học và các ràng buộc từ quy chế đào tạo Tất cả đư ợc kết hợp vào trong m ột

hệ thống tự động gợi ý, tư vấn cho từng sinh viên cụ th ể và giảm tải công việc cho các

cố vấn học tập Phần m ềm và các tài liệu đặc tả thiết kế, tài liệu h ư ớ ng dẫn sử d ụ n g có trong Phu luc 3 đi kèm báo cáo này

Các kết quả trên được mô tả cụ thể, chi tiết trong các bài báo khoa học đã được công bố hoặc các báo cáo chuyên đề thuộc các Phụ lục 1, 2, và 3 đi kèm báo cáo tổng kết này Trong

ph ần nội d u ng báo cáo tổng kết dưới đây, nhóm đề tài chỉ tập tru n g trình bày h ai nội

d u n g liên hệ chặt chẽ với nhau: (a) p h ân tích và d ự đoán hiệu quả học tập của sinh viên và (b) p h ân tích và đề xuất ph ư ơ n g pháp, mô h ìn h tự động tư v ấn lựa chọn m ôn học và lộ trình học thoả m ãn đa ràng buộc và cá n h ân hoá cho từ n g đối tư ợ n g sinh viên

N gày nay nhiều trường đại học đào tạo đại học và sau đại học đã chuyển sang hình thức đào tạo tín chỉ Theo hình thức đào tạo này, sinh viên được lự a chọn m ô n học dự a trên các ràng buộc yêu cầu về m ôn học, số tín chi cũng n h ư các khối kiến thứ c khác nhau Lựa chọn m ôn học, đặc biệt là các m ôn học lựa chọn hoặc chuyên sâu, là m ột quyết định không

dễ đối với sinh viên.Việc lựa chọn này cũng ảnh hư ở ng tới kết q uả học tập cũng n h ư lộ trình và khối kiến thức thu được của sinh viên sau này N ếu sinh viên đăng ký m ô n học không p h ù hợp sẽ khiến họ học tập với động lực th ấp và điều này d ẫ n đến kết quả học tập không cao, không thu được kiến thức h ữ u ích cho công việc sau này Sinh viên thư ờng khó đ ư a ra được quyết định đún g đ ắn bởi tại thời điểm lựa chọn m ô n học sinh viên không

có n hiều hiểu biết về m ôn học Giải p h áp hiện tại d ự a vào các cố v ấn học tập (là các thầy

cô p h ụ trách lóp) hoặc học hỏi theo kinh nghiệm các anh chị sinh viên khoá trên Tuy nhiên, giải p háp này gặp phải vấn đề ờ chỗcác cố vấn học tập th ư ờ n g không hiểu rõ về sinh viên (sở trường, sở đoản, khả năng n h ận thức, đ ịn h h ư ớ n g n ghề nghiệp và thậm chí

có th ể là kết quả học tập đến thòi điếm hiện tại) Do đó, cần thiết ph ải có m ột hệ thống tư vấn lựa chọn m ôn học tự động có khả n ăn g giải qu yết được các v ấn đề nêu trên

N gày nay, hệ tư vấn (còn gọi là hệ gợi ý hoặc hệ kh uy ến nghị) [Herlocker04, R iccill] đã và

đ an g xuất hiện trong cuộc sống hàng ngày của chúng ta n h ất là tro n g lĩnh vực thư ơ n g mại điện tử Nổi bật trong đó có A m azon, Netílix, Youtube, hay Linkedin.Trong lĩnh vực giáo dục, ngày càng nhiều trường đại học sử d ụ n g thông tin về sinh viên, về m ôn học, về hoạt động dạy-học đ ể tư vấn cho từng cá n h ân sinh viên Ví d ụ n h ư hệ thống tư vấn m ôn học CourseRank của Đại họ Staníord, Degree Com pass của Đại học Bang A ustin Peay của Mỹ hay hệ tư vấn m ôn học và d ự đoán kết quả học tập của Đại học C ân Thơ Tuy nhiên phần lớn các hệ tư vấn m ôn học ngày nay đều đư a ra tư vấn dự a trên việc so sánh thông tin của sinh viên với tập d ữ liệu có sẵn trong quá khứ, m à bò qua xem xét n h ữ n g ràng buộc về

5

Trang 9

m ôn học từ phía nhà trư ờ n g hay sớ thích cũng như m ục tiêu dài hạn từ sinh viên Do đó

đề tài sẽ h ư ớ ng đc'n xây d ụ n g m ô hình tự động tư vấn m ôn học và lộ trình học thoả m ãn

đa ràng buộc cũng n h ư xem xét tất cả các yếu tố liên quan đêh hồ sơ sinh viên, khả năng tiếp thu, tình trạng học tập hiện tại, sở thích cũng n h ư m ục tiêu dài hạn và định hướng nghề n g hiệp của sinh viên

4.1 Tông quan tư vân m ôn học dựa trên đa ràng buộc

Tư vấn m ô n học và lộ trìn h học tập là m ột hướng ứ ng d ụ n g trong hệ tư vấn, do đó m à các

p h ư ơ n g p h áp tư v ấn m ôn học v ẫn d ự a trên các kĩ thuật xây dự n g hệ tư vấn nói chung Tại

T rư ờng Đại học Công N ghệ, Đại học Q uốc gia Hà Nội, với mỗi ngành học, khung chương trình đào tạo lại khác nhau T rong đ ó các nhóm m ôn học chia làm hai nhóm chính là nhóm

m ôn b ắt buộc và nhó m m ô n tự chọn K hung tư vấn m ôn học hướng đến tư vấn các m ôn

tự chọn cho sinh viên Các m ôn học tự chọn này được tính toán trọng số th ể hiện độ h ữ u ích của nó với từng sinh viên d ự a trên các phương ph áp d ù n g trong hệ tư vấn n h ư lọc cộng tác và tư vấn d ự a trên nội du ng Cuối cùng, chúng tôi sắp xếp tập hợp các m ôn học

đư ợc lựa chọn tư vấn theo từ n g học kỳ Các bước được m inh họa n h ư H ìn h l dưới đây:

H ìn h 1 Mô h ìn h tổ ng th ể tư vấn m ôn học với đa ràng buộcXem xét k h u n g chương trìn h đ ào tạo của Khoa Công nghệ Thông tín, TrườngĐ ại học Công nghệ, hệ thống đào tạo theo tín chỉ yêu cầu sinh viên phải học đ ủ lượng X tín chi trong tổng số lượng Y tín chỉ tro n g nh óm m ôn học z Ví d ụ ờ Bảng 1 trong nhóm m ôn học bô’ trợ đ ư ợ c yêu cầu n h ư sau:

Bảng 1 Ví d ụ ràn g buộc số tín chi của m ôn học

6

Trang 10

Ở đây, nhóm m ôn học z là nhóm các m ôn bô’ trợ, X là 5 tín chi cần học trên tổng số Y là 20 tín chỉ Đ ưa ràng buộc về số tín chỉ này về bài toán luồng, ta có đồ thị th ể hiện mỗi quan

hệ giữ các m ôn học và các nhóm m ôn học n h ư Hình 2:

H ình 2 Ràng buộc tín chỉ trong giải thuật m in-cost m ax-flow

N ú t nguồn s kí hiệu cho sinh viên (student), nú t gốc t kí hiệu cho m ục tiêu (target) Sinh viên s có th ể lựa chọn tập hợp các m ôn học tự chọn {clr ,cn}, trong đó các m ôn này lại thuộc nhóm các m ôn học {G1, ,Gm } Đ ể có thể tốt nghiệp sinh viên cần chọn các m ôn học

sao cho thỏa m ãn số tín chỉ tại các nhóm Khung tư vấn m ôn học n ày m ong m uốn tư vấn đến sinh viên đ ú ng bằng lượng tín chỉ yêu cầu tại mỗi n h ó m m ôn học, do đó m à việc áp

dụ n g th uật giải luồng cực đại đáp ứ ng được yêu cầu này

H ơn th ế nữa, nếu mỗi m ôn học có độ không phù hợp với sin h viên là Cũị thì các m ôn

được tư vấn nên có tổng độ không p h ù hợp là nhỏ nhất Do đó m à luồ ng cực đại với với giá trị nhỏ n h ất giải quyết được ràng buộc về số tín chỉ, đ ồn g thời chọn được các m ôn học

có độ phù hợp tốt nhất

N hư hình vẽ m inh họa trên, mỗi cạnh (u,v) sẽ có trọng số (a,b) trong đó a là số tín chỉ tích lũy được, b là độ không p h ù hợp của m ôn học hay nhóm m ôn học u

4.2.MỘÍ mô hình đánh giá trọng sô của môn học

Việc chọn các m ôn học đ ể thỏa m ãn ràng buộc về số tín chi là m ột trong nhữ ng điều kiện cần thiết Trong KCT đào tạo, có rất nhiều tập m ôn học thỏa m ãn điều kiện về số tín chỉ

Do đó mà vấn đề của m ô hình tư vấn m ôn học là làm sao đ ể xác định m ôn học nào hữu ích hơn m ôn học nào Đ ể xác định m ôn học hữu ích, k h u n g tư vấn đề xuất ở đây sẽ tính toán trọng số th ể hiện độ tốt của từng m ôn học dựa trên thông tin của sinh viên (đặt tên là

score, 0 < score< 1 ) Giả sử đặt c o st — 1 — score, dễ dàng n h ận thấy khi cost càng nhỏ

thì m ôn học càng h ứ u ích Trong khi bài toán luồng cực đại có th ể đ áp ứng được ràng buộc về số tín chi thì m ở rộng của nó là luồng cực đại với giá trị nhò n h ất có thể giải quyết được cả bài toán lựa chọn tập hợp các m ôn học với tổng độ h ữ u ích là lớn nhất Do đó, khi

7

Trang 11

áp d ụ ng thuật toán luồng cực đại với giá trị nhó nhất vào bài toán gợi ý môn học đa ràng buộc, việc tính to án độ h ữ u ích của m ôn học (tính toán score) có th ể xem là q uan trọng nhất Có nhiều yếu tố ảnh h ư ở ng đ ến việc tính toán score ví dụ n hư thông tin sinh viên,

độ phô biến của m ô n học, sở thích của sinh viên Cách tính toán score cụ th ể được mô tả như H ình 3 dưới đây

H ìn h 3 Các ph ư ơng p h áp tính toán score

Phương pháp 1: D ự đoán khả năng m ôn học được đăng kí dựa trên lọc cộng tác

Dữ liệu kết quả học tập của 721 sinh viên được chuẩn hóa và sử d ụng làm tập d ữ liệu

h u ấn luyện Khi m ộ t sinh viên m ới tham gia vào mô hình tư vấn, thông tin nh ữ n g m ôn của sinh viên sẽ đ ư ợ c sử d ụ n g tro n g lọc cộng tác Cụ th ể hơn, nếu m ôn học đã được học thì rating bằng 1, chưa học có ratin g bằng 0 Phương p háp lọc p h ân rã m a trận của lọc cộng tác sau đó sẽ đư ợc sử d ụ n g Kết quả n h ận được khi sử dụng phư ơng pháp này là các con số nằm trong k ho ản g từ 0 đ ến 1 th ế hiện d ự đoán khả năng mà m ôn học sẽ được sinh viên học H ai b ản g 2 và 3 dư ớ i đây th ể hiện đ ầ u vào và đ ầu ra của phư ơ ng p háp lọc cộng

tác đ ư a ra d ự đ o án khả n ăng m ôn học được đ ăn g kí Bằng cách này, ta có được sc o r e đầu tiên, đ ặt tên là s c o r e x

Bảng 2 D ư liệu đ ầu vào đ ể d ự đ oán khả n ăng m ôn học được đăng kí với lọc cộng tác

Student ID Coursei Courseỉ • • Coursen

L _ J

Bảng 3 Kết quả d ự đ o án khả n ăng m ôn học được đăng kí dự a trên lọc cộng tác

11020117 0.082 0 "ị"" . 1 0

Trang 12

Phương pháp 2: D ự đoán điểm bằng phương pháp lọc cộng tác dựa trên đặc điểm của sinh viên

Về việc d ự đoán kết quả học tập của học sinh ở cấp độ khóa học, Shaobo H uang và Ning Fang [H uangl3] đã khai thác hiệu quả kết q u ả của học sinh tro ng các m ôn học tiên quyết

và kêt quả giữa kỳ đ ể d ự đoán hiệu suất của họ trên các m ôn học mới Cho đến nay vẫn chưa có nghiên cứu có hệ thống về các yếu tố ảnh hưởng đ ến thàn h tích của sinh viên trong m ột khóa học đặc biệt, đặc biệt là trong các hệ thống học th u ật m à chúng ta không

có nhiều thông tin Các nghiên cứu trước đ ây về hệ thống e-learning cho thấy thông tin học tập là cần thiết cho kết quả tốt và các yếu tố nhân khẩu học-xã hội có thê’ ít liên quan hơn [Asifl5, GoldingOó] Vì vậy, chúng ta cần sử dụ n g thông tin h ữ u ích bổ sung về thành tích học tập của học sinh đ ể dự đoán hiệu quả hoạt động của họ Trong nghiên cứu này, chúng tôi đề xuất sử d ụ n g các thông tin sẵn có về các khóa học tiên cpayết (như trong công việc của [H uangl3] m à còn tất cả các khóa học đã học, tổng số GPA tích lũy, GPA của học

kỳ trước, vv đ ể d ự đoán kết quả học tập của sinh viên C húng tôi đề xuất một phương

p h áp thiết lập quan hệ giữa các khóa học d ự a trên các thuộc tính của các khóa học Thông tin này sẽ được sử d ụ n g n h ư các tính n ăn g đ ể xây d ự ng d ự đ o án d ự a trên hồi quy

N goài ra, chúng tôi cũng sử d ụn g p h ư ơ n g p h áp chấm điểm tro n g hệ tư vấn, như đã đề xuất trước đây cho bài toán trong các m ôi trư ờ n g học tập điện tử (e-learning) [N g u y en ll, ToscherlO] Cách tiếp cận này giúp d ự đ o án được điểm của m ộ t học sinh trong m ột khóa học cụ thê’ dự a trên điểm của các sinh viên khác trong khóa học đó,

Đ ể sử dụng hiệu quả hai cách tiếp cận này, chúng tôi cũng đề xuất m ột ph ư ơng pháp kết hợp đơn giản đ ể bao gồm các kết quả của các hệ thống trước đó đ ể tăng cường hiệu quả của hệ thống d ự đ o án cuối cùng P hư ơng p h áp này đã được trình bày cụ th ể ở phần khác trong báo cáo này-Đề tài đề xuất m ột p h ư ơ n g p háp lai đa chiến lược sử d ụ n g nhiều đặc trư ng khác n h au đ ể n âng cao độ chính xác của d ự đoán Đ ầu ra của p h ư ơ n g pháp này là điểm được d ự đoán cho mỗi môn học ở th an g 10 Do đó chúng sẽ được convert về thang

[0,1] bằng cách chia cho 10 Ta có s c o r e th ứ hai, kí hiệu là s c o r e 2

Phương pháp 3: Đ ộ phù hợp của m ôn học dựa trên định hướng nghề nghiệp

Các m ôn học được đề xuất vào giảng d ạy tại trường đại học p h ần lớn đều liên quan nghề nghiệp định hướng sau này của sinh viên Sự ảnh hưởng của m ôn học và nghề nghiệp được các chuyên gia đ án h giá m ột cách tư ơ ng đối được th ể hiện qua Bảng 4 dưới đây

Bảng 4 Ví dụ vê độ tư ơ n g q u a n giữa m ôn học và n ghề n g h iệp

Courses Engineer developer developer developer security

Trang 13

pháp thứ ba đ ể tính toán s c o r e và đư ợc đ ặt tên là s c o r e 3 Một ĩân nữa đê đưa s c o r e về

đoạn [0;1] ta nhân s c o r e 3 với 0.2

Phương pháp 4: Đ ộ phù hợp của m ôn học dựa trên sở thích cá nhân của sinh viên

4 kĩ năng đồng thời cũng là 4 đặc điểm của m ôn học sau sẽ được xem xét (Toán, Lập

Trình, Tiếng A nh, Ghi N hớ) chúng đư ợc kí hiệu là 1 vector 4 chiều (sx, s 2, s 3, s4), ờ đây s t =

Toán, s 2 = Lập Trình, s 3 = Tiếng A nh, s 4 = Ghi Nhớ Khảo sát được thực hiện vói tù n g sinh

viên khi tham gia vào m ô h ìn h tư vấn, yêu cầu họ đánh giá theo thang từ 1 đến 5 (1 là m ức

độ yêu thích thâ'p nhất, 5 là m ức độ yêu thích cao nhất) Câu trả lời của sinh viên cũng ở

dưới dạng vector 4 chiều n h ư trên đư ợc kí hiệu là v e c to r A = (sr1,s r 2,s r 3,s r 4) Tiếp

theo, chuyên gia sẽ cho ý kiến của họ về sự ảnh hưởng của 4 kĩ năng trên đối vói từ n g

m ôn học dưới d ạn g vector tư ơng ứ n g n h ư sau:

{ O ru , er12, er13f e r 14), (e r2V er22, e r23, e r24) , (erklt erk2, erk3, erk4)}

S co re cho m ỗi m ôn học đư ợc tính toán dự a trên sở thích của sinh viên được kí hiệu là

s c o r e 4 Áp d ụ n g công thứ c độ tư ơng đ ồng cosine, ta tính toán độ tương đồng của m ôn

học với sở thích của sinh viên T rong đó sở thích của sinh viên kí hiệu là vectoivl =

Công thức tính toán độ tư ơ n g đồng cosine n h ư sau:

Ớ đây m là số lư ợ n g thuộc tính của m ôn học, trong trư ờng hợp này m = 4

4 p hư ơng p h áp tín h toán s c o r e , d ự a vào đặc điểm của d ữ liệu được đư a vào tính toán, cụ

thê’ là 2 p h ư ơ n g p h áp đ ầu tín h toán d ự a trên phư ơng p h áp của hệ gợi ý và sử d ụ n g d ữ

liệu cố định lấy từ thông tin của 721 sinh viên đ ã tốt nghiệp tại UET Do đó m a in s c o r e là

sc o re d ự a trên thông tin kháo sát, dễ thay đổi từ phía sinh viên và được kết hợp lại thành

e x tr a sco re.

- Sự kết hợp của m a i n s c o r e :

S c o rẽ ị d ự đ o án khả n ăn g m ôn học sẽ đư ợ c đ ăng kí bời sinh viên, S co re2 d ự đoán điểm

của từ ng m ôn học M ôn học đư ợc d ự đ o án điểm cao thì khả năng sinh viên đăng kí m ôn

học đó sẽ cao hơn Tuy n h iê n cũng không ngoại lệ trư ờng hợp m à điếm d ự đ oán thấp

n h ư ng khả n ăn g m ôn học đư ợc học lại cao hoặc ngược lại Do đó, m ột trong n h ữ n g cách

kết hợp 2 s c o r e n ày lại là n h ư sau:

C o m b i n e d s c o r e = s c o r e x X s c o r e 2

- Kết hợp tất cả các score:

sở thích của sinh viên là 2 s c o r e đư ợ c thêm vào với m ong m uốn giúp mô hình tư v ấn thỏa

m ãn các ràng buộc từ p hía sinh viên Mô h ìn h tư vấn được đề xuất trong báo cáo n ày sừ

d ụn g giải th u ậ t luông cực đại với giá trị nhỏ nhất, do đó mà giá trị s c o re được đư a vào sử

d ụn g là duy nhâ't A p d ụ n g vào bài toán tư v ấn m ôn học này, các score được kết h ợ p lại

với nhau bằng p h ư ơ n g trìn h tuy ến tính n h ư sau:

S im ila rity = co s(0 ) = — A,B - ĩi=iáLEi

Trang 14

C o m b in e d s c o r e — ^ a i.s c o r e i

i= 1

Ở đây, n là số lượng p hư ơng p h áp tính toán score, trong đó m ain score được tính là 1

phư ơng pháp Trong bài báo cáo này n = 3.Xf=i ơị = 1

Tùy thuộc vào năm học của sinh viên mà các giá trị a đư ợc xét khác nhau vì độ ảnh hưởng

của các ràng buộc với từ ng năm học là khác nhau

4.3 Tư vấn môn học cho từng kì

{c1( c2, —,c k} được tư vấn cho từ ng sinh viên Tuy nhiên, các m ôn học này chưa đư ợc sắp

xếp theo từ n g kì Đ ể xây d ụ n g lộ trình học tập cho sinh viên, đồ thị có hướng được đề xuất trong bài báo cáo này N hờ đó m à ràng buộc về số m ôn tiên quyết được xử lí Trong

đó mỗi đỉnh là m ột m ôn học, mỗi cạnh có hướng th ể hiện mối quan hệ m ôn tiên quyết

giữa các m ôn học ( q -* c2’.c 1 là m ôn tiên quyết của c2) T rong mỗi học kì, m ột tập hợp các

m ôn học (ở đây là tập hợ p các đỉnh) với độ ưu tiên cao n h ất sẽ được chọn từ đồ thị có

hướng này N hữ n g đ ỉn h được chọn chính là những đ ỉn h gốc của đồ thị thỏa m ãn các m ôn tiên quyết của nó đã đư ợc học

Việc tư vấn các m ôn học cho từ ng học kì thỏa m ãn ràng buộc m ôn tiên quyết sẽ được

m inh họa bằng p seu d o code n h ư dưới đây

Algorithm 1: Course graph creating

1: procedure CreateCourseGraph(C, P)

create a directed graph:G = (V, A)

for each c e Cdo

Algorithm 2: Sorted list of courses generation

1: procedure G eneratingSortedListO íCourses (ns, mc, c, P)

2: create a sem ester list: semList = 0

3: create a directed graph: SG = CreateCourseGraph(C,P)

4: for 1 to ns do // ns is num ber of semesters

5: create a list of course in a semester: courseList = 0

6: create check = FALSE //variable for checking vvhile loop condítion

7: //w hen num ber of credit exceed mc

8: //whcrc mc is maximum allovved crcdits per scmester)

9: vvhile check = FALSE a n d SG ìs not e m p t y do

11

Trang 15

11

get from SG accorđing to íollovving priorities respectively:

(1) length of the longcst đirected path with current node

12 as the tail maxln(v)= 0

13 (2) length of the longest directed path with current node

14 as the hcad m axOut(v)is highest,

15 (3) nu m b er of node w hich has any path connect from current

16 node num O fPrerequisite(v) is highest

4.4.1 Kết quả dự đoán điểm sin h viên

a) D ữ liệu

D ữ liệu thu thập của sinh viên n g à n h CNTT, trư ờ n g Đại học Công nghệ - ĐHQG Hà Nội gồm 1268 sinh viên đại học theo chư ơng trình chuẩn trong 7 năm (từ K52 đ ến K58) Trong bảy năm đó, có ba chương trình đào tạo chuẩn được xuất bản lần lượt vào năm 2007, năm

2009 và năm 2012 Các chương trìn h đào tạo này tương đối giống nhau, như ngvẫn có m ột

số sửa đổi nhỏ Đ ể cập nhật, ch ú n g tôi chọn chương trình đào tạo mới n hất được phát

h ành vào năm 2012 C hương trìn h này bao gồm 78 m ôn học được phân thành sáu nhóm

Do đó, chúng tôi đã phải chuẩn h ó a bộ d ữ liệu của hai chương trình đào tạo trước đó dựa trên chương trình này Đối vói sin h viên sau hai chương trình đào tạo trước đó, nếu các khóa học của họ không trùn g k h ớ p với các chương trình đào tạo mới nhất, chúng tôi đã thực hiện việc sửa đổi cho p h ù h ợ p với k h u n g chương trình mới nh ất năm 2012

b) Thiết lập thực nghiệm

Đối với môi khóa học, chúng tôi đã xây d ự ng m ột mô hình d ự đoán riêng Tập d ữ liệu của mỗi khóa học được chia ngẫu n h iên th àn h hai tập rời rạc Tập đầu tiên bao gồm khoảng 10% số liệu, được gọi là bộ p hát triển (dùng đ ể lựa chọn các tham số của ph ư ơng pháp lai) 90% còn lại được sử d ụ ng đ ể xây d ự n g và thử nghiệm mô hình d ự báo Đ ể huấn luyện và

Trang 16

kiếm thử mô hình, chúng tôi đã thực hiện 10 Tân kiểm tra xác n h ận chéo Trong cài đặt này, tất cả học sinh tham gia khóa học đó sẽ được p h ân chia ngẫu nhiên thành 10 phần bằng nhau Ở mỗi vòng, m ột p hần sẽ được sử d ụ n g đ ể kiểm tra và 9 p h ần còn lại sẽ được

sừ d ụn g đ ể huấn luyện mô hình Các biện p h áp thực hiện sau đó được tính trung bình trên 10 vòng.H iệu su ất của các hệ thống d ự đ o án được tính bằng điểm số RMSE Đây là

m ột thước đo thư ờng được sử dụ n g cho sự khác biệt giữa điểm số của sinh viên được d ự đoán bởi m ột mô hình và điểm số thật sự th u được RMSE của m ộ t ước lượng s được định nghĩa theo công thức sau:

đối với sinh viên trong việc lựa chọn các khóa học tù y chọn đ ể học tập

Bảng 5 Độ đo RMSE của hai p hư ơng p h áp lấy d ữ liệu h u ấn luyện sử d ụ n g p hư ơng p h áp

tiếp cận CF và m ột số baselines

Phương pháp

Tất cả m ôn học M ôn học tự chọn TrData _A11 TrData_Subset TrData_All TrData_Subset Baselines Trang bình

Kết quả thực nghiệm sử dụng phương pháp lọc cộng tác và mốt số baselines.

Trong phần này, chúng tôi trình bày các kết quả thực nghiệm sử d ụ n g p h ư ơ n g p háp tiếp cận CF so với m ột số baseline n h ư đề x uất trong [N g u y en ll] Ba p hư ơ n g p h áp cơ bản được sử d ụng bao gồm m ức trung b ìn h của học sinh, tru n g bình của khóa học và mức trung bình tất cả

Kết quả thực nghiệm trên Bảng 5 cho thấy phương p h áp tiếp cận CF bằng kỹ th u ật phân

rã m a trận tốt hơn hai phư ơng pháp cơ b ản trên cả hai cách lấy d ữ liệu h u ấ n luyện Đối với tất cả các khóa học, cách tiếp cận CF là tốt nhất Tuy nhiên, đối với các m ôn tự chọn, baseline trung bình cùa học sinh có hiệu quả cao hơn N hìn chung, p h ư ơ n g p h áp tiếp cận

CF vẫn có RMSE thấp nhất là 1.909 cho tất cả các m ôn học, và 2.022 cho các m ôn tự chọn

Trang 17

khi sử dụng p h ư ơ n g p h áp đ ầu tiên đê thu thập d ữ liệu Có thê nói rằng trên các hệ thống học thuật, cách tiếp cận CF không hiệu quả n h ư trong các hệ thống e-learning Kết quả thử nghiệm cũng cho th ấy rằng sử d ụ n g tất cả các khóa học đã học của sinh viên đ ể đào tạo

m ô hình cho hiệu quả tốt h o n chỉ sử d ụ n g các khóa học được học trước khi m ột khóa học

d ự đoán nhất định N ói cách khác, nó đã làm phong p h ú thêm mô hình d ự đoán bằng cách cung cấp thêm th ô n g tin Kết quả thí nghiệm cũng cho thấy rằng việc thực hiện các

d ự đoán về các m ôn tự chọn là tồi h o n d ự đ oán tất cả các m ôn học Điều này có thể là do

s ố lượng sinh viên tham gia các khóa học b ắt buộc lớn hơn Đặc biệt, m ột số m ôn học tự chọn có m ột số lư ợ n g rất nhỏ sinh viên học tập (ví d ụ n h ư trong khóa học INT3207, chỉ có

185 học sinh th am gia khóa học đó, trong khi khóa học b ắt buộc POLIOI, h ầu hết sinh viên (1134 sinh viên trong số 1268 học sinh) đều học)

H iệu quả của tập thuộc tính kỹ năng được đê xuất cho phương pháp hồi quy

Đ ể ước tính hiệu q u ả của các thuộc tính bô sun g về kỹ năn, chúng tôi tiến hành hai loại thự c nghiệm Đ ầu tiên, ch úng tôi k hô ng sử d ụ n g bộ thuộc tính bổ sung Thông tin sẵn có chỉ sử dụ n g đ ể d ự đ o án th à n h tích của học sinh bao gồm giới tính, ID học sinh, điểm số, học kỳ, CGPA, GPA của học kỳ trư ớc và điểm tru n g b ình của các m ôn học bắt buộc Trong cài đ ặt th ứ hai, ch ú n g tôi thêm bộ thuộc tính bổ sun g được đề xuất trong Phần 3.1 Chúng tôi đã thực hiện các th í n gh iệm trên hai p h ư ơ n g p h áp lấy d ữ liệu h u ấn luyện bằng cách sử

d ụ n g bốn p h ư ơ n g p h áp học m áy p h ổ biến Bốn p hư ơ n g p h áp bao gồm Linear Regression [Seal67], m ạng th ầ n kinh n h â n tạo [McCulloch43], cây quyết đ ịn h [Quinlan87], và SVM [Cortes95] Các kết q u ả thí n g hiệm đư ợc m inh h ọ a trong Bảng 6 và Bảng 7

Bảng 6 Tất cả m ô n học: Đ iểm RMSE của hai tập d ữ liệu của n h ữ n g th u ật toán học m áy

khác n h a u trong hồi quy

Bảng 7 M ôn tự chọn: Đ iểm RMSE của hai tập d ữ liệu của nh ữ n g th u ật toán học m áy khác

n h au trong hồi quy

Trang 18

Các kết quả thực nghiệm cho thấy bộ thuộc tính đề xuất thực sự làm p hong phú thêm các

mô h ìn h d ự đoán Trong cả hai bảng, chúng tôi có điểm RMSE thấp hơn khi thêm các tính năng liên quan đến kỹ năng Trong so sánh giữ a các phư ơng p h áp học tập máy khác nhau, SVM đã vượt trội hơn các phư ơng pháp còn lại trên cả hai cài đ ặt tập d ữ liệu h u ấ n luyện

C húng tôi có điểm số RMSE thấp nhất đo đư ợc trên tất cả các m ôn học và các m ôn tự chọn tương ứ ng là 1,703 và 1,791

Các kết quả thực nghiệm cũng củng cố kết lu ận rú t ra từ p hần trước rằng sử dụng tất cả các khóa học đã học của sinh viên đ ã học trước đó giúp năng su ất hiệu suất tốt hơn bằng cách sử dụ n g chỉ m ột tập họ p con của chúng cho cả bốn thuật toán

Kết hợp lọc cộng tác và hôi quy

C húng tôi đã chọn nh ữ n g kết quả tốt nhất của từng cách tiếp cận đ ể thực hiện kết hợp Trong p hư ơng pháp hồi quy, đầu ra tốt n h ất là của phương p h áp được xây dự n g dự a trên các th u ậ t toán SVM sử d ụ n g tập d ữ liệu h u ấ n luyện TrData_All và thêm các thuộc tính liên quan đ ến kỹ năng Trong phư ơng p háp tiếp cận lọc hợp tác, đầu ra của p hư ơ ng pháp

sử d ụ ng hệ số phân rã m a trận Sau đó, chúng tôi tiến h ành kết hợp các kết quả d ự đoán này đ ể nâng cao hiệu su ất của hệ thống cuối cùng Phương p h áp kết h ợ p đã được trình bày trong báo cáo đính kèm

Trong các thực nghiệm , chúng tôi thay đổi thông số a giữa 0 và 1 (với bước 0.1) và đo

điểm SỐ RMSE Các thông số của điểm số RMSE tốt nhất trên m ột bộ p h át triển được sử

d ụ n g đ ể kết hợp các kết quả đầu ra với d ữ liệu thử nghiệm Các kết quả thực nghiệm

trong H ình 4 cho thấy a (0,3) và Ị3 (0,7) cho điểm RMSE tốt n h ất là 1,669 Trên các m ôn tự

chọn, chúng tôi cũng có điểm số RMSE th ấp h ơ n 1.748 so với mỗi p h ư ơ n g ph áp tiếp cận cá nhân N hững kết quả này chứng m inh rằng ph ư ơng pháp lai đơ n giản này khá hiệu quả cho nhiệm vụ d ự đoán điểm

RMSE scores

H ình 4 Kết quả thực nghiệm của độ chính xác dự đoán trên các khối kiến thức

So sánh RMSE giữa các khối kiên thức

C húng tôi đã thực hiện m ột số thống kê về các nhóm kiến thức khác n h au trong chương trình đào tạo 2012 dựa trên kết quà của hệ thống dự đoán cuối cùng tốt nhất - phương

p háp lai Kết quả thí nghiệm trên các nhóm kiến thức khác nhau đư ợc m inh họa trong

H ình 5 Nó cho thấy nhóm đầu tiên và nhóm thứ 5 có kết quả tốt nhất Các khóa học (ví dụ

15

Trang 19

như Tiếng Anh 1-2-3, Đại số, P hân tích Toán học, M ácxít Leninist 1-2, Tối ưu hóa, v.v.) trong các nhóm này th ư ờ n g đòi hỏi khả năn g tiếng A nh cao, học thuộc lòng, và kiến thức toán học Cũng có thê nói rằng khô ng có sự khác biệt giữa các nhóm này.

C húng tôi đã chọn n h ữ n g kết quả tốt n h ấ t của từ ng cách tiếp cận đ ể thực hiện kết hợp Trong phư ơng ph áp hồi quy, đ ầu ra tốt n h ât là của ph ư ơ n g ph áp được xây d ự n g d ự a trên các thuật toán SVM sử d ụ n g tập d ữ liệu h u ấ n luyện TrData_All và thêm các thuộc tính liên quan đến kỹ năng Trong p h ư ơ n g p h áp tiếp cận lọc hợp tác, đầu ra của phư ơ ng ph áp

sử dụ ng hệ số ph ân rã m a trận Sau đó, ch úng tôi tiến hành kết hợp các kết quả d ự đo án này đ ể nâng cao hiệu su ất của h ệ th ố n g cuối cùng P hương p h áp kết hợp đã được trình bày chi tiết trong báo cáo 2 đ ín h kèm

2.100

1 5 0 0

2 0 2 8

■ Collaborative Piltenng (Matrix Factorization)

■ Regression-based (SVM)

■ Hybnd approach

All courses Elective courses

Approaches grouped by the type of courses

H ình 5 Kết qu ả thực nghiệm của p h ư ơ n g p h á p lai sử d ụ n g kết quả tốt n h ất của lọc cộng

tác và hồi quy

Trong các thực nghiệm , chú ng tôi thay đổi thông số a giữa 0 và 1 (với bước 0.1) và đo

điểm số RMSE Các thô ng số của điểm số RMSE tốt n h ất trên m ột bộ p h át triển được sử

d ụ n g đ ể kết h ọ p các kết quả đ ầ u ra với d ữ liệu th ử nghiệm Các kết quả thực nghiệm

trong H ình 4 cho thấy a (0,3) và p (0,7) cho điểm RMSE tốt n h ất là 1,669 Trên các m ôn tự

chọn, chúng tôi cũng có điểm số RMSE th ấp h ơ n 1.748 so với m ỗi phư ơng ph áp tiếp cận cá nhân N hững kết q uả này chứ ng m inh rằng p h ư ơ n g p h áp lai đơn giản này khá hiệu quả cho nhiệm vụ d ự đ o án điểm

4.4.2 Kết quả khung tư vấn m ôn học

C hương trước đã mô tả chi tiết p h ư ơ n g p h áp tư v ấn m ôn học thỏa m ãn đa ràng buộc Trong chương này, việc thu th ập d ữ liệu, và đ á n h giá kết quả thực nghiệm sẽ được m inh họa rõ h o n n h ư dư ới đây

a) Dữ liệu offIine

Trang 20

Với sự hỗ trợ của p hòng công tác sinh viên trường đại học Công N ghệ, tập d ữ liệu huấn luyện được thực nghiệm trên 721 sinh viên đã tốt nghiệm từ năm 2007 đến 2011 (Khóa 52 đến 56) Tuy nhiên, kh un g chương trình giáo dục của mỗi năm học lại thay đổi, cho nên nhữ ng dữ liệu này đều đư ợc chuẩn hóa về khung chương trình gần đây n h ất của khóa 60 Sau khi được chuẩn hóa, d ữ liệu sẽ được sử d ụ ng đ ể lọc cộng tác và lọc nội dung.

Dữ liệu sử dụng làm hệ quy chiếu trong bài cũng được thu thập từ việc hỏi ý kiến chuyên gia đ ể đánh giá m ức độ ản h hưởng của m ôn học đối với n ghề nghiệp và lượng kiến thức (Toán, Tiếng Anh, Lập Trình, Ghi N hó) có chứa trong các m ôn học

b) D ữ liệu Online

Bới vì m ục tiêu của bài n g hiên cứu này là tư vấn lộ trình học tập xuyên suốt 4 năm học của sinh viên ở trường đại học, do đó phương pháp thực nghiệm của bài báo cáo này được khảo sát trên nh ữ n g sinh viên đã hoàn thành xong chương trình đại học.Tuy nhiên việc xin d ữ liệu riêng tư của sinh viên là tương đối khó khăn, lượng d ữ liệu khảo sát thu thập hiện tại mới chỉ trên 20 sinh viên của K57 và K58

c) Thiết lập tham số a

Phương trình tuyến tính giúp kết hợp các phương pháp tính toán score, trong đó từng score lại th ể hiện cho m ỗi ràng buộc khác nhau Các ràng buộc này có độ ảnh hưởng đến mỗi năm học là khác nhau Do đó mà bằng kết quả chạy thự c nghiệm các giá trị tham số a

ph ù hợp với năm nhất, n ăm hai, năm ba fân lượt là (1, 0, 0), (0.475, 0.05, 0.475), (0.4, 0.2,

0.4) Bằng việc tính to án với các giá trị a này, tập các m ôn học tư vấn cho sinh viên sẽ

được so sánh với tập các m ôn học thực tế m à sinh viên đã học đ ể đ án h giá chất lượng của

m ô hình tư vấn

d) Phương pháp đánh giá

Có nhiều phư ơng p h áp đ ể đánh giá độ tốt của m ột mô hình tư vấn, p h ư ơ n g pháp đô độ lỗi RMSE hay MAE là m ột trong số đó Tuy nhiên, dựa vào o u tp u t của m ô hình tư vấn là

m ột tập hợp các m ôn học đi so sánh với m ột tập các m ôn đã học thực tế (so sánh đối xứng

2 tập m ôn học với nhau), do đó phương p háp đo "Simple M atching Coefficient" với công thức sau:

m ôn này

Trang 21

Các p hư ơng p h áp đo khác n h ư MAE, RMSE, Precision, Recail, F1 tham khảo tài liệu[Golding06].

e) Kết quả đánh giá tư vân m ôn học

Simple M atching Coefficient (SMC) so sánh sự tương đồng giữa 2 lists đối xứng, phù hợp

đ ể so sánh giữa list các m ôn đã học và list các m ôn được tư vấn, th ể hiện được độ hữ u ích của m ô hình tư v ấn trên các sinh viên đã khảo sát Biểu đồ cột dưới đây mô tả độ chính xác của mô hình tư v ấn được chia theo năm học của sinh viên Tại mỗi năm học, có 2 cột: cột đ ầu tiên là độ chính xác khi chưa cho thêm các ràng buộc n hư sở thích hay đ ịn h hướng nghề nghiệp của sin h viên m à chỉ dự a vào thông tin sẵn có của sinh viên; cột th ứ 2 đã kết hợp các thông tin khảo sát thêm

■ SMC w ith all scores

completed first year completed second completed third total 20 tested

students yearstu d e n ts yearstud ents students

H ình 6 Kết q u ả thự c nghiệm trên 20 sinh viênFigure 6 ở trên cho th ấy rằn g sự cho thêm các ràng buộc m ềm từ phía sinh viên đã phần nào tăng độ tốt của m ô h ìn h tư vấn C h ứ ng tỏ rằng p h ư ơ n g pháp khảo sát nếu được thực hiện chặt chẽ ng h iêm túc thì sẽ m ang đ ến kết quả tư v ấn tốt đến người dùng

Với n gu ồn d ữ liệu offline của 721 sin h viên đã tốt nghiệp, độ chính xác của m ô hình tư vấn m à không có các ràn g buộc m ềm đư ợc th ế hiện n h ư trong Bảng 8 dưới đây

Bảng 8 Kết q u ả thực n gh iệm với 721 sin h viên khi chưa có các ràng buộc m ềm

C om pleted first year students 0.83108

C om pleted second year students 0.84973

C om pleted third year students 0.86348 Total 721 tested students 0.848099

18

Trang 22

Khi không có các ràng buộc mềm, độ tương đồng của tập hợp các m ôn tư vấn và các m ôn học thực tế đạt đến gần 85% Mô hình tư vấn m ôn học được đề xuất trong bài báo cáo này

hi vọng sẽ đạt được kết quả tư ơng đồng cao h ơ n nếu n h ư có các ràng buộc mềm khác tù’ phía sinh viên

Bên cạnh đó, m ô hìn h tư vấn được trong bài báo cáo này cũng đề xuất lựa chọn khác cho sinh viên đ ể sinh viên có nhiều lựa chọn hơn Độ chính xác của 2 list m ôn học tư v ấn này với list m ôn học thực tế được m inh họa n h ư H ìn h 7 dưới đây

The real chosen set

H ình 7 So sánh 2 tập m ôn học tư vấn với tập m ôn học thực tế

5 Đánh giá về các kết quả đã đạt được và kết luận

Đề lài tập trung p h ân tích và khai phá d ữ liệu đào tạo cũng n h ư thông tin phản hồi của sinh viên và cán bộ tại các đơn vị của Đại học Quốc gia H à Nội Đối với d ữ liệu đào tạo, đề tài tiền xử lý, p h ân tích, và đề xuất các m ô hình d ự báo hiệu quả học tập của sinh viên cũng n h ư đề xuất phư ơng p háp tư vấn lựa chọn m ôn học và lộ trình học dựa trên hồ sơ sinh viên và các thông tin liên quan n hư năng lực tiếp thu, tình trạng học tập, sở thích và định hướng, m ục tiêu dài hạn Đối với d ữ liệu p hản hồi, đề tài đã đề x uất các bảng điêu tra đ ể thu thập ý kiến phản hồi của người học và cán bộ quản lý Từ d ữ liệu th u thập được, đề tài đã đề xuất việc phân tích đa chiều, toàn diện và khách quan d ự a trên các chi

SỐ tin cậy Từ các kết quả p h ân tích được, đề tài đã tổng kết các đề xuất, kiến nghị giải pháp n ân g cao chất lượng đào tạo và hiệu quả quản lý đào tạo tại các đơ n vị thuộc Đ ại học Quốc gia Hà Nội

Các kết quả của đề tài đã được công b ố trên 01 bài báo tạp chí Scopus, 01 bài báo tạp chí ISI-SCIE, 01 bài báo tạp chí Đ HQ G HN , 05 bài báo hội nghị quốc tế (03 có Scopus-indexed),

và 01 bài tạp chí Scopus đang trong quá trình p hản biện N hóm đề tài cũng đã p h át triển

hệ thống p hần m ềm tư vấn m ôn học và lộ trình học thoả m ãn đa ràng buộc và xem xét các khía cạnh thông tin của sinh viên Đề tài đã hỗ trợ đào tạo 02 NCS, 03 thạc sỹ, và 10 cử nhân Tất cả 15 sinh viên, học viên và NCS này đều có công trình bài báo k hoa học cảm ơn

đề tài

19

Trang 23

Có th ể nói, đây là m ột trong số ít đề tài tại Việt N am kết hợp các công cụ phân tích, khai phá d ữ liệu vào miền lĩnh vực giáo dục, đào tạo Là đề tài liên ngành nên việc phối hợp thực hiện đôi khi gặp nh ữ n g khó khăn Việc thu th ập và tiền xử lý d ữ liệu cũng không thực sự dễ d àn g nên ảnh h ư ở ng đ ến tiến độ thực hiện Tuy vậy nhóm thực hiện đề tài đã

nô lực đ ể vượt qua n h ữ n g trở ngại này đê’ thu được nhữ ng kết quả khả q uan và m ong

m uốn có thê ứ n g d ụ n g hệ thống p h ần m ềm tư vấn lựa chọn m ô n học và lộ trình học trong thực tiễn tại các đơn vị đào tạo thuộc ĐHQ G H à Nội

Tài liệu tham khảo:

[Asifl5] R, Asif, M A gathe, and M K Pathan: Predicting S tudent Academ ic Períorm ance

at Degree Level: ACase Study International Ịournal of Intelligent Systems and Applications Vol.7, N o l, pp.49-61, 2015.

[Baker09] R Baker and K Yacef: The State of Educational Data M ining in 2009: A Revievv

and F uture Visions Ịournal o f Educational Data M ining (ỊEDM), Vol.l, N o.l, pp.3-17,

2009

[BakerlO] R Baker: D ata M ining for Education International Encydopedia of Education,

Elsevier, 2010

[Bentonl4] s L Benton an d w E Cashin: Students Ratings of Instruction in College and

U niversity Courses In Paulsen M (eds) Higher Education: Handbook of Theory and Research, Vol.29, 2014, Springer.

[Castro] F Castro, A Vellido, A N ebot, and F M ugica: A pplying Data M ining Techniques

to E-Leam ing Problem s Evolution of Teaching and Learning Paradigms in Intelligence Environment, 2007.

[Cortes95] c Cortes an d V Vapnik: Support-V ector N etw orks Machine Learning, Vol.20,

No.3, p p 273-297,1995

[Friedman97] N Priedm an, D Geiger, and M G oldszm idt: Bayesian Netvvork Classiíiers

Machine Learning, Vol.29, N o.2-3, p p 131-163,1997.

[GoldingOó] p G olding and o D onaldson: Predicting Academ ic Períorm ance In Proceedings of The 36,h Annual Frontiers in Education Conỷerence, pp.21-26, 2006, IEEE

Press

[HamalainenOó] w H am alainen a n d M Vinni: C om parison of M achine Learning M ethods

for Intelligent T utoring Systems In Proceedings of The International Conference on Intelligent Tutoring Systems, pp.525-534, 2006.

[Herlocker04] J L H erlocker, J A Konstan, L G Terveen, and J T Riedl: Evaluating

C ollaborative Filtering R ecom m ender Systems ACM Transactions on Inỷormation Systems (AC M TOIS), Vol.22, N o l, pp.5-53, 2004.

[H uangl3] s H u an g an d N Fang: Predicting S tud ent Academ ic Períorm ance in An Engineering D ynam ics Course: A C om parison of Four Types of Predictive

M athem atical M odels Computers & Education, Vol.61, p p 133-145, 2013.

[H uynhl3] H uỳ nh Lý T h anh N hàn Hệ thống d ự đ o án kết quả và gợi ý lựa chọn m ôn học

d ù n g giải thu ật p h ân rã m a trận Luận vãn cao học, Đại học Cân Thơ, 2013.

20

Trang 24

[La05] Lã Văn Mến: Đ ánh giá phương pháp giáng dạy của giảng viên Giảo dục đại học: chất lượng và đánh giá, NXB Đại học Quốc gia H à Nội.

[McCulloch43] w s M cCulloch and w Pitts: A Logical Calculus of The Ideas Im m anent

in N ervous Activity Bulletin of Mathematical Biophysỉcs, Vol.5, No.4, p p 115-133, 1943.

[Merceron80] A M erceron and K Yaceí: Interestingness M easures for Association Rules in

Educational Data In Proceedinys of International Conỷerence on Educationaỉ Data Mining,

pp.57-66, 2008

[MustolO] c Musto: Enhanced Vector Space M odels for C ontent-based R ecom m ender

Systems In Proceedings of The 4lh ACM Con/erence on Recommender Systems (ACM RecSỵs), pp.361-364, 2010.

[Nguyen05a] N guyễn Phương Nga: Quá trình hình thành và p hát triển việc đ án h giá

giảng viên - Thử nghiệm công cụ và mô hình Giáo dục đại học: chất lượng và đánh giá,

NXB Đại học Q uốc gia H à Nội, 2005

[Nguyen05b] N guyễn Phương N ga và Bùi T rung Kiên: Sinh viên đ án h giá hiệu quả giảng

dạy Giáo dục đại học: chất lượng và đảnh giá, NXB Đại học Q uốc gia Hà Nội.

[N g u y en ll] T.-N N guyen, T H orv'th, and L Schmidt-Thieme: Personalized Forecasting

Student Períorm ance In Proceedings of The IV ' IEEE International Con/erence on Advanced Learning Technologies (ICALT), pp.412-414, 2011.

[N guyenl5] N guyễn Thái N ghe và Trương Q uốc Định: Hệ thống hỗ trợ tư vấn tuyến sinh

đại học Tạp chí Khoa học Trường Đại học Cân Thơ, p p 152-159, 2015.

[Param esvvaranll] A Param esw aran, p Venetís, and H Garcia-M olina: R ecom m endation

Systems w ith Complex Constraints: A Course Recom m endation Perspective ACM Transactions on Information Systems (ACM TOỈS), Vol.29, No.4, Article.20, 2011.

[Pena-Ayalal4] A Pena-Ayala: Educational Data Mining: Applications and Trends Springer,

2014

[Psaromiligkos09] Y Psaromiligkos, M O ríanidou, c Kytagias, and E Zafiri: M ining Log Data for The Analysis of Learners' Behavior in VVeb-based Learning M anagem ent

Systems Operationaì Research Ịournal, pp.1-14, 2009.

[Quinlan87] J R Q uinlan: Simpliíying Decision Trees International Ịournal of Man-Machine Studies, Vol.27, No.3, pp.221-234, 1987.

[Riccill] F Ricci, L Rokach, B Shapira, and p Kantor: Recom m ender Systems H anđbook, Springer, 2011

[Romero08] c Romero, s V entura, c Hervas, and p Gonzales: Data M ining A lgorithm s

to Classiíy Students ỉn Proceedin^s of The International Conỷerence on Educational Data Mining, pp.8-17, 2008.

[RomerolO] c Romero and s Ventura: Educational Data Mining: A Revievv of The State of

The Art IEEE Transactions on Systems, Man, and Cybernctics, Part C: Applications and Revieios, Vol.40, N o.6, p p 601-618, 2010.

21

Trang 25

[Seal67] H L Seal: Studies in the H istory of Probability and Statistics XV The Historical

D evelopm ent of The G auss Linear Model Biomtrika, Vol.54, No 1-2, pp.1-24, 1967.

[ToscherlO] A Toscher and M Jahrer: Collaborative Filtering Applied to Educational Data

M ining A C M KDD Cup, 2010.

[Zhang08] L Zhang, X Liu, and X Liu: Personalized Instructing Recom m endation Sysem

Based on W eb Mining In Proceedings of The International ConỊerence for Younỵ Computer Scientists, pp.2517-2521, 2008.

[Zinn06] c Z inn an d o Scheuer: G etting to K now Your Students in D istance-Leam ing

Contexs In Proceedings o f The First European Conference on Technology Enhanced Learning, pp.437-451, 2006.

6 Tóm tắt kết quả (tiếng Việt và tiếng Anh)

Tóm tắt tiếng Việt:

Tên dề tà i: Phân tích, khai phá dữ liệu dạy học và thông tin phản hoi của sinh viên nhằm nâng cao chất lượng và hiệu quả quản lý đào tạo

Mã SỐ: QG.15.29

C hủ n h iêm : PGS.TS P han X uân H iếu

Tóm tắ t: Đề tài Q G 15.29 đ ặt trọ n g tâm nghiên cứu vào các vấn đề p hân tích và khai phá

d ữ liệu dạy-học và d ữ liệu p h ản hồi của các bên tham gia (người học, người dạy, người

q u ản lý) nh ằm n ân g cao hiệu quả q uản lý và chất lượng đào tạo Đối với d ữ liệu dạy học,

đề tài tiến h ành p h â n tích và xây d ự n g m ô h ìn h d ự đ oán hiệu quả học tập của sinh viên (stu d en t's períorm ance prediction) và p h át triển p h ư ơ n g p háp cũng nh ư dịch vụ phần

m ềm tự động tư v ấn lựa chọn m ôn học và lộ trìn h học p h ù hợp cho từng đối tượng sinh viên dự a vào n ăn g lực, sở thích, m ục tiêu dài hạn, cũng n h ư tình trạng hiện tại của họ Đối với d ữ liệu p h ản hồi, đề tài đề x u ất form m ẫu th u th ập d ữ liệu từ người học, ngư ời dạy và ngư ời q u ản lý, từ đó đ ư a ra các p h ân tích đ a chiều, toàn diện nhằm rú t ra n hữ ng hiểu biêt, kết luận, cũng n h ư đ ư a ra các kiến nghị n h ằm nâng cao hiệu quả quản lý đào tạo

N hóm thự c hiện đ ề tài đã công b ố 07 bài báo quốc t ế (01 bài tạp chí ISI-SCIE, 01 bài tạp chí Scopus, 05 bài hội ng hị quốc tế trong đó có 03 bài đư ợc nằm trong chỉ m ục Scopus) và 01 bài tạp chí trong nư ớ c (Tạp chí khoa học Đ HQ G HN ) H iện còn 01 bài tạp chí Scopus đang tro n g thời gian chờ p h ản biện Đ ề tài đã p h á t triển m ộ t dịch vụ phần m ềin tự đ ộng tư vấn cho sinh viên lựa chọn m ôn học và lộ trìn h học p h ù hợp và đề xuất 02 bản kiến nghị đ ể

n ân g cao hiệu q u ả q u ản lý và chất lượng đ ào tạo Đề tài đã hỗ trợ đào tạo 02 NCS, đã đào tạo th à n h công 03 thạc sỹ và 10 cử nhân Tất cả NCS, thạc sỹ, cử nhân này đều có công bố khoa học (tạp chí, hội nghị) cảm ơn đề tài

Trang 26

Principal investigator: Associate Proíessor Phan Xuan Hieu

A bstract: Project QG 15.29 íocused on analyzing and m ining educational data, including teaching and leam ing data as well as íeedback data from stakeholders (students, teachers, and office staffs) in o rder to enhance m anagem ent períorm ance and education quality For the teaching/learning data, w e proposed m ethods and m odels for predicting stu d en ts' test períorm ance and a m ethod to recom m end courses and stu d y p ath for each particular students based on their ability, preíerences, long-term target, as well as their cu rren t status

or condition VVe have developed a software Service to dem onstrate ou r recom m endation

m ethods To collect íeedback data from students and staff m em bers, w e have p ro po sed

tw o types of questionnaires We conducted the analysis on the collected d ata considering different aspects and m ultidim ensions todiscover new und erstan ding of stu den ts an d staff

m em bers in order to propose new solutions to enhance the m anagem ent perform ance in education

Project m em bers have published 07 intem ational papers (including 01 ISI-SCIE jo u m al paper, 01 Scopus journal paper, 05 international coníerence papers in w hich 03 of them are Scopus-indexed coníerence) and 01 VNU joum al paper There is also a Scopus-joum al pap er that is u n d er review at the moment Project also developed a softw are Service that autom atically recom m end suitable courses and studying paths for students This project supported tw o PhD students, 03 masters, and 10 bachelors All of them h ave scientiíic publications that acknow ledge this proịect (QG.15.29)

lượng hoạ động dạy-học

và công tác quản lý đào

tạo

Thu thập được thông tin

từ người học và cán bộ (giảng viên và quản lý đào tạo) ở nhiều khía cạnh liên quan đến học tập, cơ sở vật chất, dịch

vụ đào tạo, m ức độ hài lòng, quy chế, quy định đào tạo

Bảng (phiếu) khảo sát cho ngư ời học bao gồm chương trình đào tạo, hoạ động học tập,

cơ sở v ật chất, lộ trình,

đ ịnh h ư ớ n g

Bảng (phiếu) khảo sát cán bộ (GV và CB

q u ản lý) về n hiều khía cạnh của đ ào tạo và quản lý đào tạo

23

Trang 27

2 Báo cáo khảo sát về thực

Báo cáo kháo sát về thực trạng quán lý hoạt động đào tạo tại Đ H Q G H N bao gồmcơ cấu tổ chức cũng

n h ư các nhận đ ịn h dựa trên phân tích d ữ liệu phản hồi từ người học và cán bộ (GV & CB quản lý)

và kỹ thuật p h ân tích và

khai phá dữ liệu đào tạo

và phản hồi của người

học, áp dụng trực tiếp

phân tích d ữ liệu đ ào tạo

và p hản hồi của ngư ời

học ở Đ HQ G H N

P hân tích được: (1) mối

tư ơng quan giữa các m ôn học, p hư ơ n g ph áp giảng dạy, cách đ án h giá, và kết quà đ ạt được của sinh viên; (2) p h ân tích hồ sơ của người học; (3) p h ân tích tình trạng của người học

Kỹ thu ật p h ân tích đa chiều, áp d ụ n g phân tích d ữ liệu p hản hồi của người học và cán

bộ (sử d ụ ng hệ số tin cậy Cronbach A lpha

và phư ơng p h áp phân tích n hân tố EFA)Các mô hình, phương pháp phân tích và dự đoán hiệu quả học tập của người học dựa trên ph ư ơng p háp lọc cộng tác và ph ư ơng

tư ơng đồng của các sinh viên có cùng trình độ; (4) tình trạn g hiện tại và khả năn g tiếp th u kiến thứ c của sinh viên

Phương p h áp tự động tư vấn sinh viên lựa chọn

m ôn học và lộ trình học thoả m ãn đa ràng buộc dựa trên lọc cộng tác, hồi quy, luồng cực đại với phư ơng pháp Min-Cost- Max-Flow P hương pháp thực hiện tư v ấn d ự a trên nhiều dạng thông tin như

hồ sơ sinh viên, khả năng tiếp thu, sở thích học tập,

m ục tiêu dài hạn, cũng

n h ư sự liên hệ giữa các

m ôn học với n h au và giữa các m ôn học với m ục tiêu dài hạn

24

Trang 28

5 Mô đun p h ần m ềm gợi ý

môn học và lớp học cho

sinh viên

Có khả n ăn g gợi ý các môn học p h ù hợp với từng sinh viên trước môi học kỳ đ ể sinh viên quyết định đăng ký, giảm tình trạng h u ỷ và đăng ký lại cũng n h ư giảm tải tư vấn

từ cán bộ cố vấn học tập

Hệ thống p hần mềm tự động tư vấn sinh viên lựa chọn m ôn học và lộ trình học ph ù h ợ p với khả năng, sở thích, tình trạng hiện tại cũng như mục tiêu dài hạn Kết quả tư vấn thoả m ãn đa ràng buộc bao gồm các ràng buộc cứng và ràng buộc mềm N goài ra hệ thống

p h ần m ềm còn có nhiều tính năng khác như kế nối sinh viên - giảng viên, lựa chọn và đăng ký chủ đề nghiên cứu

xuất hỗ trợ ra quyết định

nâng cao chất lượng dạy-

học và nâng cao hiệu quả

của quy trình q u ản lý

đào tạo tại các đ ơ n vị của

ĐHQ G HN dự a trên các

kết quả p h ân tích và khai

phá từ d ữ liệu đào tạo

Diễn giải và tổng hợp được các tri thức phân tích được từ d ữ liệu đào tạo, dữ liệu phản hồi của sinh viên T hể hiện được các mối tư ơng quan, kết hợp, p h ụ thuộc lẫn nhau giữa các khía cạnh trong hoạt động giảng dạy và kết quả (chất lượng giảng dạv và m ứ c độ hài lòng của người học) Từ các kết quả p h ân tích này, các nhà q u ản lý giáo dục sẽ

có đư ợc cái nhìn định lượng v à khách quan trong việc ra quyết định trong q u ản lý giáo dục, đào tạo tại các đơn vị

nâng cao hiệu quả quản lý hoạt động đào tạo tại ĐHQGHN.Các kiến nghị có thể áp

d ụ n g ơ cấp ĐHQGHN hoặc ở các đơn vị trực tiếp đào tạo

n âng cao chất lượng đào tạo ở ĐHQGHN Bản kiến nghị gồm 5 điểm và đặt trọng tâm vào việc thúc đẩy hoạt động lấy thông tin

p h ản hồi và phân tích thông tin phản hồi thư ờng xuyên đ ể đảm bảo hiểu sâu sát và cập n h ậ t hiểu biết về tình h ìn h đào tạo

25

Trang 29

7 Kết quà về công bố khoa

học:

Bài báo quốc tế: 02

01 bài tạp chí ISI hoặc Scopus

01 bài báo quốc tế không thuộc ISI/Scopus

Bài báo trong nước:

01 bài tạp chí quốc gia

Đ ào tạo 02 học viên làm luận văn cao học

Đào tạo 03 thạc sỹ (có công

bô'khoa học từ đê tài): vượt

sản phẩm)

Ghi địa chi

và cảm ơn

sự tài trợ của ĐHQGHN đúng quy định

Đánh giá chung

(Đạt, không đạt)

1 Công trình công bố trên tạp chí quốc tê theo hệ thống ISI hoặc Scopus (đăng kỳ 01 bài) 1.1 [QG.15.29-01]

Thi-Oanh Tran, Hai-Trieu

Dang, Viet-Thuong Dinh,

Thi-Minh-Ngoc Tru ong,

- DOI: 10.1515/cait-2017-0024

Ghi địa chỉ

và cảm ơn

sự tài trợ của đề tài ĐHQGHN đúng quy định (đề tài QG.15.29)

Đạt

26

Trang 30

Víinh-Tien N guyen, Duc-

Vu Tran, Le-M inh N guyen,

X uan-H ieu Phan (2018):

Exploiting User P ostsỊor

Web D ocum ent

Summ arization. ACM

Đ H Q G H N

đú n g quy

đ ịn h (đề tài QG.15.29)

Vượt

Thi-Hai-Yen V uong, Thi-

Thu Trinh, H ong-D uyen

H a, T hi-O anh Tran, Xuan-

In ío rm atio n Technologies

(CIT), Subm itted

Đ H Q G H N

đú n g quy địn h (đề tài QG.15.29)

5 Bài báo trên các tạp chí khoa học của ĐHQGHN, tạp chí khoa học chuyên ngành quốc gia

V ương Thị P hư ơng Thảo,

P han Xuân H iếu

(2017):Tiếp cận đa chiêu về

quản lý hoạt động đào tạo ở

Đ H Q G H N

đ ú n g quy định (đề tài

Đạt

27

Trang 31

Thai-Le Luong, T hi-H anh

Tran, Q uoc-Tuan Truong,

Thi-M inh N goe T ruong,

Thi-Thu Phi, X uan-H ieu

Phan (2016): Learning to

ĩiỉte r User Expìicit ỉn ten ts in

Online Vietnamese Sociaì

Mcdia Texts. Intelligent

Iníorm ation a n d D atabase

Đ H Q G H N

đ ú n g quy

đ ịn h (đề tài QG.15.29)

ldentifying User In ten ts in

Vietnamese Spoketĩ Language

Commands and Its

Application in Sm art Mobile

Voice Interaction. Intelligent

Iníorm ation a n d D atabase

Đ H Q G H N

đ ú n g quy

đ ịn h (đề tàiQG.15.29)

V ượt

Phuong-N am T ran, Van-

Duc Ta, Q uoc-T uan

Truông, Q uang-V u Du ong,

Thac-Thong N guyen,

X uan-H ieu P h an (2016):

Named E ntitỵ Recognition

for Victnamese Spoken Tcxts

and Its Application in Sm art

Voice Interaction. Intelligent

[níorm ation an d D atabase

Đ H Q G H N đúng quy

đ ịn h (đề tài QG.15.29)

V ượt

28

Trang 32

3 Đ ăng ký sỡ h ữ u trí tuệ 0 0

ISI/Scopus

05 bài hội nghị quốc tế (trong

đó 03 bài hội n g h ị quốc tế

thuộc Scopus-indexed)

học của Đ HQ GHN, tạp chí khoa học

chuyên n gành quốc gia hoặc bài báo

đăng trong kỷ yếu hội nghị quốc tê'

chính sách theo đ ặt hàng của đơn vị sử

dụng

cơ quan hoạch định chính sách hoặc cơ

PHẦN V TÌNH HÌNH SỪ DỤNG KINH PHÍ

Kinh phí được duyệt

(triệu đông)

Kinh phí thực hiện

(triệu đông)

Ghi chú

kinh phí chuyên m ôn, kinh phí hỗ trợ

đào tạo, hội nghị phí, chủ nhiệm đề tài)

cương chi tiết, th u thập và viết tài liệu

Trang 33

PHẦN V KIÊN NGHỊ (vê phát triển các kết quả ítghiên cứu của đê tài; về quản lý, tô’chức thực

hiện ở các cấp)

Bên cạnh n h ữ n g đề xuất ưng dụ n g các mô h ìn h ph ân tích và khai phá d ư liệu cùng công

bố quốc tế, đề tài đã p h á t triển dịch vụ p h ần m ềm giúp tự động tư vấn lựa chọn môn học

và lộ trình học tập p h ù h ợ p cho m ỗi đối tư ợ n g sinh viên N hóm thực hiện đề tài đề xuất

và kiến nghị Đ HQ G H à Nội nói chung và Trường Đại học Công nghệ nói riêng tạo điều kiện triển khai th ử nghiệm dịch vụ ph ần m ềm này Và đ ể phát triển ph ần m ềm đạt đến mực có th ế ứ n g d ụ n g th u ận tiện, nhóm đề tài kiến nghị ĐHQ G HN xem xét tài trợ đ ể nhóm phát triển thêm tính năn g và hoàn thiện dịch vụ phần mềm

PHẦN VI PHỤ LỤC (minh chứng các sản phẩm nêu ở Phần IU)

M inh chứng các sản p h ẩm n êu ở P hần III đư ợc tập hợp trong các quyển Phụ lục 1 (Sản phẩm khoa học và đào tạo), P hụ lục 2 (Các báo cáo chuyên đề), và Phụ lục 3 (Hệ thống phần mềm tư vấn lựa chọn m ôn học và lộ trình học tập)

'Hà Nội, ngày 28 tháng 02 năm 2018

Chủ nhiệm đề tài

(Họ tên, chữ ký)

PGS.TS Phan Xuân Hiếu

32

Trang 34

THUYẾT MINH ĐÈ CƯƠNG ĐỀ TÀI NGHIÊN cứu

KHOA HỌC VÀ CÔNG NGHỆ CẤP ĐHQGHN

thông tin phản hồi của sinh viên nhằm nâng cao chất lượng và hiệu quả quản lý

đào tạo

Chủ nhiệm đề tài: TS Phan Xuân Hiếu

Tổ chức chủ trì: Trường Đại học Công nghệ, ĐHQGHN

HÀ NỘI, 12/2014

Trang 35

Tiếng Việt: Phân tích, p h a i khá dữ liệu dạy học và thông tin phản hồi của sinh viên nhom

n â n g c a o c h ấ t lư ợ n g v à h iệu qu à q u ả n lý đ à o tạo

Tiếng Anh: A n a ĩy z in g a n d m in in g th e e d u c a tio n a l d a ta a n d th e s tu d e n is [e e d b c ic k loxvards

m h a n c in g th e q u a lity a n d th e e ffe c tiv e n e s s o f m an cigem en t in e d u c a tio n a n d tr a in in g

2 - M ã số (được cấp khi Hồ s ơ (rúng tuyển):

3 - T h òi gian thự c hiện: 24 tháng, từ tháng 01/2015 đến tháng 12/2016

4 - T hông tin về chủ nhiệm đc tài

Họ và tên: Phan Xuân Hiếu

Ngày, tháng, năm sinh: 01/12/1979 Nam/Nữ: Nam

Trình độ chuyên môn: Tiến sĩ khoa học thông tin và máy tính

Chức danh lchoa học: Tiến sĩ

Điện thoại:

Fax: 04-3754.7460 E-mail: hieupx@vnu.edu.vn hoặc pxhieu@gmail.com

Tên tổ chức đang công tác: Khoa Công nghệ Thông tin, Trường ĐH Công nghệ, Đại học Quốc gia Hà Nội

Địa chỉ tổ chức: Nhà E3, 144 Xuân Thủy, c ầ u Giấy, Hà Nội

5 - T h ư ký đề tài (nếu có)

Họ và tên: Trần Thị Oanh

Ngày, tháng, năm sinh: 20/06/1984 Nam/ Nữ: Nữ

Trình độ chuyên môn: Tiến sĩ Khoa học máy tính

Chức danh khoa học: Tiến sĩ

Điện thoại:

Tổ chức: 04-3557.5992 Nhà riêng: Mobilc: 01662220684

Fax: E-mail: oanhtt@gmail.com hoặc oanhtt@vnu.edu.vn

Tôn tổ chức đang công tác: Khoa Quốc tế, Đại học Quốc gia Hà Nội

Địa chi tổ chức: Làng sinh viên Hacinco, Thanh Xuân, Hà Nội

Ngày đăng: 14/02/2019, 23:57

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w