Hơn 1,2 tỷtrẻ em, học sinh, sinh viên không được đến trường.Farah & Li,2020 Trong bối cảnh đó, hình thức học trực tuyến đã trở thành giải pháp tối ưu cho việcgiảngdạycủahầuhếtcáctrườnghọ
Trang 1HỌCUEH TRƯỜNGKINHTẾ,LUẬTVÀQUẢNLÝNHÀNƯỚC
Trang 33.3 Quytrìnhnghiêncứuvàmôhìnhđềxuất3.3.1 Quytrìnhnghiêncứu
Trang 5Hình3.5ThuậttoánSupportVectorMachine(SVM)Hình3.6
Sơđồ KNN
Hình4.8:KếtquảmatrậnnhầmlẫncủamôhìnhLogisticRegressionHình4.9: Kếtquảmatrận nhầmlẫncủamô hìnhSVM
Hình4.10:KếtquảmatrậnnhầmlẫncủamôhìnhTree
Trang 61 Lídochọnđề tài:
Đại dịch Covid bùng phát lần đầu tiên vào cuối tháng 12/2019 tại thành phố VũHán,TrungQuốc.Dịchbệnhnaylâylanquađườnghôhấpvàtheosốliệuthốngkêcóhơn207 quốc gia và vùng lãnh thổ mắc phải căn bệnh này Dịch bệnh diễn ra khiến tất cả cácnướcphải tiến hành cách lyxãhội,điều đó dẫn đến các trường họct r ê n t h ế g i ớ i p h ả i đóng cửa Hơn 1,2 tỷtrẻ em, học sinh, sinh viên không được đến trường.(Farah & Li,2020)
Trong bối cảnh đó, hình thức học trực tuyến đã trở thành giải pháp tối ưu cho việcgiảngdạycủahầuhếtcáctrườnghọc.Họctrựctuyến,còngọilàE-
learninglàhìnhthứchọctập diễn ra thông qua mạng Internet, quá trình họctập và giảng dạy có thể diễn ratrongmột khoảng cách xa, người học và người dạy có thể tương tác thông qua các ứngdụngdạy học Hình thức dạy học này tuy không phải mới ra đời nhưng trong bối cảnhđại dịchđãphổ cập tàihầuhết cácquốcgiavàđượcápdụng trong mọiviệcgiảngdạy
Học sinh ở hầu hết các nước đều phải tham gia học trực tuyến trong thời gian cách lyxãhội Tuy nhiên nó có thể học tập từ xa, tiết kiệm chi phí cơ sở vật chất, thời gianlinhđộng,… Hình thức học này đối với học sinh còn khá mới và có nhiều bất cập nhưkhôngthể tương tác trực tiếp với giáo viên, và giảng viên không thể giám sát trực tiếptình
hìnhhọctậpcủahọcsinh,đườngtruyềnmạng,cơsởvậtchấtkhôngđảmbảotấtcảhọcsinh,
… Chính vì những ưu nhược điểm của phương pháp học tập này đã gây ra nhữngtranhluận liệu phương pháp này có thật sự hiểu quả ? Học sinh học tập bằngphương phápnàycó tốt bằng phương pháp học tập trực tiếp và có nên tiếp tục việc dạy học trực tuyến haykhông?
Chính vì những lí do trên, nhóm nghiên cứu chọn đề tài: “Dự đoán mức độ thích
ứngcủahọcsinh tronggiáodục trựctuyếnbằngphương pháphọcmáy”
2 Mụctiêuvàđốitượngnghiêncứu
2.1 Mụctiêunghiên cứu:
Bài nghiên cứu sẽ tiến hành dự đoán mức độ thích ứng của các nhóm học sinh đốivớiphươngpháphọctậptrựctuyếnthôngquaviệcphântíchdữliệuphânlớpvàphâncụm
Trang 7Đồng thời xác định mức độ thích ứng hình thức học tập này với các nhóm tuổi khácnhauđể đưa ra các hướng giải quyết cũng như hình thức học tập phù hợp đảm bảo choquátrìnhhọctậpđảmbảochấtlượng.Trêncơsởđóbàinghiên cứusẽtrảlờicáccâuhỏisau:
Cácnộidungliênquanvề sốliệuvàorangeở tạiđây
CHƯƠNG2:HIỆNTRẠNGCỦAVIỆCHỌCONLINEVÀĐÁNHGIÁ
2.1 Hiệntrạng
Đại dịch Covid – 19 là trường hợp đầu tiên mà cả thế giới gần như ngưng lại tất cảcáchoạt động Không chỉ tác động sâu sắc đến kinh tế, sức khoẻ của con người, đại dịchcònlàmảnhhưởngnặngnềđếncáchoạtđộngởlĩnhvựcgiáodục.Vàolúccaođiểm,hơn188 quốc gia, chiếm khoảng 91% số người đăng ký học trên toàn thế giới, đã đóng cửatrường học của họ để cố gắng ngăn
chặn sự lây lan của vi rút (UNESCO, n.d.).Kể từ
khibùngphátcáchđâyhainăm,đạidịchCOVID-19đãphávỡhệthốnggiáodụctrêntoàn
Trang 8cầu, ảnh hưởng nặng nề nhất đến những người học dễ bị tổn thương nhất Nó đã làmgiatăngb ấ t b ì n h đ ẳ n g v à l à m t r ầ m t r ọ n g t h ê m m ộ t c u ộ c k h ủ n g h o ả n g g i á o d ụ c đ
ã c ó t ừ trước Việc đóng cửa trường học từ không đóng cửa ở một số quốc gia cho đến hơn mộtnăm học Thiếu kết nối vàcác thiết bị đã loại trừ ít nhất một phần ba sinh viên theo đuổiviệchọctừxa
Năm 2020, bốn mươi hai triệu học sinh, sinh viên tại Bangladesh đột nhiên bị bỏ lại
vìkhông có lớp học, trường học nào mở cửa (Hub et al., 2021).Đến tháng 3 năm 2020,
chếđộ đóng cửa nghiêm ngặt tránh giao thương dần được gỡ bỏ, các doanh nghiệp hoạtđộngtrở lại thì các cơ sở giáo dục tại quốc gia này vẫn đang bị đóng cửa Việc đóng cửanàythựcs ự l à m ộ t c u ộ c k h ủ n g h o ả n g V ì h ọ c s i n h k h ô n g ch ỉ k h ô n g đ ư ợ c l ê n l ớ p m
à c ò n hoàn toàn quên hết những gì mình đã được học ở năm trước Theo UNICEF, chỉ có 46%trong số 95% học sinh tốtnghiệp tiểu học và vào trung học cơ sở Đây là tỷ lệ thấp nhất ởNamÁ(NishatAhmedSamrin,2021)
Trên toàn cầu, nhiều nghiên cứuđã được tiến hành liên quan đến các quan sát và quytrìnhđào tạo từ xa hoặc giáo dục trực tuyến trong đại dịch COVID-19 Tuy nhiên, ngườitaquansátthấyrằngdoquyđịnhđóngcửahoàntoàn,cáctrườnghọctrênkhắpthếgiớiphải đối mặt với một thách thức lớn trong việc duy trì hoạt động học tập của học sinh.Trong trường hợp của Bangladesh,tất cả các trường học đều đã trải qua và trải qua tìnhtrạng nguy cấp như vậy Mặc dùchính phủ Bangladesh đã thực hiện một số biện pháp đểđưa sinh viên vào các lớp họctrực tuyến thông qua kênh Sangsad TV và đài phát thanhcộng đồng, nhưng trên thực tế,một số lượng lớn sinh viên vẫn nằm ngoài tầm với Do cósự khác biệt về kỹ thuật số ở
cả thành thị và nông thôn, không đủ khả năng tài chính vàthiếu hỗ trợ về cơ sở hạ tầngnhư điện thoại thông minh và cơ sở internet không bị giánđoạn, nó đã trở thành mộtthách thức lớn để đảm bảo giáo dục hòa nhập trong đại dịchCOVID-19 Ngay cả nhữngtrường học đã bắt đầu các lớp học trực tuyến cũng không thểtiếp cận hết tất cả học sinhbằng các hoạt động học tập trực tuyến một cách hiệu quả Dođó, hoàn cảnh chưa từng cócủa đại dịch này đã ảnh hưởng rất nhiều đến khả năng thíchnghicủahọcsinhvàsinhviên
Trang 9Nghiên cứu của (Farah & Li, 2020) cho thấy rằng trong đại dịch, các trường học đãtiếnhành các hoạt động dạy học theo nhiều cách khác nhau Một số trường tổ chức cáclớphọc trực tuyến, trong khi những trường khác tổ chức đồng thời cả các lớp học trựctuyếnvà ngoại tuyến Khi được hỏi về phương pháp học trực tuyến trong trường học đểđảmbảo trải nghiệm học tập hiệu quả từ giáo viên và học sinh, tỷ lệ phương pháp lớphọc trựctuyến cao hơn, bao gồm 56,66% trả lời từ giáo viên và 35% trả lời từ học sinh Bên cạnhhoạt động trực tuyến, một
số trường đã cung cấp các ghi chú hỗ trợ để tạo sự thuận tiệnchohọcsinh củamình
Cáchoạt động giáo dục trựctuyến yêu cầu nhiều vềv ấ n đ ề t h i ế t b ị đ ể h ỗ
t r ợ , ( K ö n i g e t al.,2020) cũng chứng minh rằng để tiến hành và tham dự cáclớp họctrựct u y ế n , h ọ c sinh, giáo viên và phụ huynh tiếp cận điện thoại thông minh caonhất (lần lượt là 93,84%,55% và 85,54%) Trong khi tính khả dụng của máy tính xách tay và tab tương đối thấp(lầnlượtlà12.29%,5%và 11.76%)
Tuy nhiên, đối với đào tạo từ xa, một điều kiện tiên quyết khác là kết nối internetthôngsuốt và không bị gián đoạn Trong nghiên cứu(Farah & Li, 2020), khảo sát ngườihọc vàkết quả cho thấy 65% học sinh sinh viên sử dụng dữ liệu di động và 35% được sửdụngthiết bị Wi-Fi.21,67% học sinh, 40% giáo viên và 30% phụ huynh thích một hệthốnginternet nhanh Tuy nhiên, 30%n g ư ờ i đ ư ợ c h ỏ i c h o b i ế t r ằ n g
nhanh”,và35%trảlờilàtìnhtrạng“khôngnhanh chút nào”
2.2 Nghiêncứutrướcđây
Vớitìnhtrạngtrên,tầmquantrọngcủahệthốnggiáodụctrựctuyếnđượclàmrõvàđểlạinhiều mối quan tâm Trong (Noor & Shaoun, 2021) (Hopfenbeck, 2022) các tác giả đãnghiên cứu cảia tiến mô hình giáo dục bằng hình thức trựctuyến (Afrouz & Crisp, 2020)chứng minh sự khác biệt đáng kể của học sinh sinh viên cũng như sự hài lòng về nhưnglợi ích mà giáodục trực tuyến mang lại Khác với 2 nghiên cứu trên, (Hopfenbeck, 2022)tập trung đánhgiá thành tích học tập, có 85% học sinh sinh viên cho rằng họ học đượcnhiềuthứhơnkhihọctrựctuyến
Trong bài nghiên cứu của (Pinheiro Cavalcanti et al., 2019) họ sử dụng thuật toán MLđểlàmrõsựtồntạicủacácbàithựchành,tậptrungvàocácphảnhồitừcáckhoáhọcLMS
Trang 10(Hopfenbeck, 2022) cũng nghiên cứu việc cải tiến mô hình giáo dục trực tuyến kếthợpvớimáy họcvàphântích dữ liệutronghệthống LMS.
Monica và cộng sự (Ciolacu et al., 2017) đã nghiên cứu rằng Giáo dục đang chuyểnsangtrựctuyếnvànộidungkhóahọccósẵntrêncácnềntảngkỹthuậtsố.Vìvậy,họphântíchdựatrênnNeuralNetworks,SupportVectorMachine(SVM),Câyquyếtđịnh(Decision Tree) và Phântích cụm (Cluster Analysis) Độ chính xác dự đoán của họ vềBlended Learning không đạt yêu cầu Kết quả khámphá cho thấy Giáo dục trực tuyến tốthơnso với giáodụckết hợp
Trong (Farah & Li, 2020) và (Baticulon et al., 2021), nhà nghiên cứu đã nghiên cứurằngCOVID-19 là mối quan tâm của các hệ thống giáo dục toàn cầu Đối với bệnhCorona,hơn 100 quốc gia đã đóng cửa trường học Nghiên cứu của họ cho thấy tác độngcủacoronavirus đối với giáo dục là rất kinh khủng và họ tìm thấy nhiều rào cản cản trởsựtương tác của sinh viên và người hướng dẫn trong giáo dục trực tuyến để tiếp tục họctậptrong thời gian COVID-19 bị khóa Ngoài ra, họ nhận thấy khu vực nông thônkhôngđược cập nhật, không có kỹ năng kỹ thuật số, rào cản công nghệ, rào cản cá nhân,rào cảntrongnước,ràocảnthể chế,ràocảnthôngtinliênlạc,điệnkém,cóvấnđềvề mạng,thiếuđào tạothích hợp, thiếu tài chính, khả năng chống lại sự thay đổi, v.v là những rào cảnlớn đối với giáo dục trực tuyến trong đạidịch COVID-19 Vì vậy, trong công việc củamình, chúng tôi đã cố gắng tìm hiểu khảnăng thích ứng của học sinh với giáo dục trựctuyếntrongtình huống đại dịchnày
CHƯƠNG3:Phươngphápnghiêncứu 3.1 Dữliệuvàđánhgiádữliệu
3.1.1 Dữliệu
Dữ liệu được sử dụng là kết quả khảo sát trực tiếp và trực tuyến được công bố trêntrangKaggle(Nishat Ahmed Samrin, 2021) Dữ liệu này là kết quả của cuộc khảo sátđược thựchiện ở các bậc học khác nhau( Đại học, THPT và Cao đẳng) Bộ dữ liệu này gồm 1205quan sát và được thu thậptrong thời gian từ ngày 10/12/2020 đến ngày 5/2/2021.Tuynhiêntrongbàinghiêncứunàynhómtácgiảmuốnhướngđếnnhómđốitượngtừ11tuổi
Trang 11trở lên để đánh giá hiệu quả một cách trực quan hơn Vì nhóm này đã có một số kiếnthứcvề công nghệ nhất định có thể tự mình thực hiện hoàn toàn còn dưới 11 tuổi có thể đã cóxuấthiện sựhỗ trợtừgiađình.Dướiđâylàbảngmôtảdữliệusaukhiđược sànlọclại:
Bảng3.1:Môtả dữ liệu
Hours
Trang 12đã trình bày ở phía trên nhóm tác giả đã lọc bớt dữ liệu lại chỉtậptrungvào nhómđốitượng trên11 tuổi.
Hình3.1MứcđộthíchứngphântheođộtuổiQuahình3.1cóthểchothấymứcđộthíchứngởcácđộtuổikhácnhauđãcósựkhácbiệtđá
ng kể
3.2 Địnhhướngnghiêncứu
Trang 13Có rất nhiều thuật toán ML có thể sử dụng để dự đoán mức độ thích ứng của họcsinhtrong việc học online Các thuật toán có thể kể đến như K-Nearest Neaighbor, Câyquyếtđịnh(Decision Tree), SVM,… Trong bài nghiên cứu này sẽ đánh giá sơ bộ thông
số củacác thuậttoánnàyđểđưara quyết địnhdùngthuậttoánnào đểphântích
Nhóm tác giả sử dụng excel để thực hiện xử lý số liệu và làm sạch cũng như vẽ các biểuđồ.Orangeđượcnhómsử dụngtrongviệcphân tích dữliệu.
Trang 14gồmnút gốc, các nhánh, các nút bên trong và các nút lá (IBM, n.d.-a; Myles et al.,2004;Nowozinet al.,2011)
Trang 15Hình3.3chothấycâyquyếtđịnhbắtđầubằngmộtnútgốcvàsẽkhôngcóbấtkìđượcnối nào
từ nhánh này đến nhánh khác Các nhánh sẽ đi từ nút gốc sau đó đưa vào các nútbên trong hay còn gọi là nút quyết định.Dựa trên các tính năng có sẵn, cả hai loại nútđềutiếnhànhđánhgiáđểtạothànhcáctậpconđồngnhất(IBM,n.d.-a;Mylesetal., 2004)
Trang 16Nguồn:IBMHình3.4Quytắcquyếtđịnhlựa chọn
Loại cấu trúc này (hình 3.4) cũng tạo ra một đại diện dễ hiểu về việc ra quyết định,chophépcác nhómkhácnhautrongmộttổchức hiểurõ hơntạisaolạiđưara quyếtđịnh
SupportVectorMachine(SVM)
Support Vector Machine (SVM) “là mộtthuật toán học có giám sátđược sử dụngchonhiều vấn đề phân loại và hồi quy, bao gồm các ứng dụng y tế xử lý tín hiệu, xử lýngônngữtựnhiên,nhậndạnggiọng nói vàh ì n h ảnh.”(MATLAB&Simulink,n.d.)
Trang 17Theo hình 3.5 thuật toán này, chúng ta sẽ vẽ đồ thị dữ liệu là các điểm trong n chiều vớinlàsố lượng tính năng màchúng tacó.Vậy với cácgiátrị củam ỗ i t í n h n ă n g s ẽ l à
m ộ t phần liên kết Sau đó chúng ta thực hiện tìm Hyper-plane (đường bay) phân chiacác
lớp(Noble,2006a).MuctiêucủaSVMlàtìmramộtsiêuphẳng ởmứcđộtốtnhấtcóthểtách các điểm dữ liệu thành nhiều lớp phân chia rõ ràng Siêu phẳng tốt nhất ở đây đượchiểu là siêu phẳng mà có lề nhấtlớn giữa hai lớp và được biểu thị bằng +;- như hình 3.5.Lề ở đây được hiểu là chiều rộngtối đa của tấm song song với siêu phẳng không cóđiểmdữliệubêntrong(Noble,2006b).Tuynhiêntrongthựctếthuậttoánhầunhưkhôngthể
Trang 18tìmđược1siêuphẳngthõamãncácđiềukiệntrênvìvậythuậttoánsẽtốiđahóabiênđộmềmchophépmộtsốlượngnhỏcác phânloạisai(MATLAB&Simulink,n.d.).
Thuậttoánnày được xây dựngc h o các bài to án nhịphâ nvà cá c bài toánđa ph ân lớp(Noble,2006a)
K-nearestneighbors
“K-nearest neighbors còn được gọi là KNN hoặc k-NN, là một bộ phân loại học cógiámsát, phi tham số, sử dụng khoảng cách gần nhất để thực hiện phân loại hoặc dựđoán vềviệcnhómmộtđiểmdữliệuriênglẻ.Mặc dùnócóthểđược sửdụngchocácbàitoánhồiquyhoặc phân loại, nhưng nó thường được sử dụng như một thuật toán phân loại, dựatrêngiảđịnhrằngcácđiểmtươngtựcóthểđược tìmthấygầnnhau.”(IBM, n.d.-b)
Nguồn:IBMHình3.6Sơ đồKNN
Đốivớicácvấnđềphânloại,mộtnhãnlớpđượcchỉđịnhtrêncơsởđasốhaynóicáchkháclàmộtnhãnđược biểudiễnthường xuyênquanhmột điểmdữliệunhất định
MụctiêucủaKNNlàxácđịnhcác“lánggiềng”gầnnhấtcủamộtđiểmtruyvấnđểtacóthể gán cho nhãnlớpchođiểm đó(IBM,n.d.-b)
CHƯƠNG4:KẾTQUẢNGHIÊNCỨU (NhómsửdụngphầnmềmOrange)
Trang 19- Tỷ lệ người học theo loại hình tổ chức giáo dục chính phủ (Government) thấp hơnvớiphi chính phủ (Non-Government) (chính phủ chiếm 33,7% và phi chính phủchiếm66,3%).
- Tỷ lệ người học dùng loại Internet là dữ liệu di động (mobile data) hơn phân nửawifi(dữ liệu diđộng chiếm55,2% vàwifi chiếm44,8%)
- Tỷ lệ người học dùng loại kết nối mạng là 4G chiếm tỷ lệ cao nhất là 63%, loại3Gchiếm35,6% vàloại 2Gchiếm1,4%
- Tỷ lệ người học có mức độ giảm tải cao (high) chiếm 18,5% và mức độ giảm tảithấp(low)chiếm81,5%
II Phân tích tương quan dữ liệu của các đặc trưng về nhân khẩu học với mức độthíchnghicủahọc sinhtrong giáodụctrựctuyếnbằng máy
Phân tích sự tương quan giữa mức độ thích nghi của học sinh trong giáo dục trựctuyếnbằngmáy theo giớitính
Trang 20Sự tương quan giữa mức độ thích nghi của học sinh trong giáo dục trực tuyến bằng máy theo giới tính.
400 350 300 250 200 150 100 50 0
Thấp Trung bình Cao
NamNữ
Sự tương quan giữa mức độ thích nghi của học sinh trong giáo dục trực tuyến bằng máy theo cấp cơ sở giáo dục
250 200 150 100 50
0 Trường học Cao đẳng Đại học
Trang 21Sự tương quan giữa mức độ thích nghi của học sinh trong giáo dục trực tuyến bằng máy theo khả năng học sinh (người học học như một sinh viên công nghệ thông tin (IT)).
400 350 300 250 200 150 100 50 0
Thấp Trung bình
CóKhông
Kếtquảchothấyngườihọccấpcơsởgiáodụcđạihọcvàtrườnghọccómứcđộthíchng
hitrung bìnhcaohơn cáccấpcơsởcaođẳng
Tỷlệ mứcđộthíchnghitrungbìnhsovớimứcđộthíchnghicủa cấpcơ sởđạihọclà 50%
Tỷlệmứcđộthíchnghitrungbìnhsovớimứcđộthíchnghicủacấpcơsởtrườnghọclà57%
glà43,8%
Phân tích sự tương quan giữa mức độ thích nghi của học sinh trong giáo dục trực
tuyếnbằng máy theo khả năng học sinh (người học học như một sinh viên công nghệ
thông tin(IT))
Hình4.3:Biểuđồsựtươngquangiữa mứcđộthíchnghicủahọcsinhtronggiáodục trựctuyến bằng máy
theo khả năng học sinh (người học học như một sinh viên công nghệthôngtin (IT))