Thông tin chung: - Tên đề tài: SỬ DỤNG BOOTSTRAP TRONG VIỆC PHÂN TÍCH CÁC YẾU TÔ TÁC ĐỘNG ĐÉN KÉT QUÁ HỌC TẬP CỦA SINH VIÊN CHÍNH QUY ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHÓ HÒ CHÍ MINH.. Mục
Trang 1CAC YEU TO TAC DONG DEN KET QUA HOC TAP
CỦA SINH VIÊN CHÍNH QUY ĐẠI HỌC SU’ PHAM KY THUAT THANH PHO HO CHi MINH
MA SO: T2015 - 44TD
Tp Hồ Chí Minh, 2016 SU’ DUNG BOOTSTRAP TRONG VIEC PHAN TICH X
Trang 2THANH PHO HO CHi MINH
BAO CAO TONG KET
DE TAI KH&CN CAP TRUONG TRONG DIEM
sU' DUNG BOOTSTRAP TRONG VIEC PHAN TICH
CAC YEU TO TAC DONG DEN KET QUA HOC TAP CUA SINH VIEN CHINH QUY DAI HOC SU PHAM
KY THUAT THANH PHO HO CHi MINH
Trang 3
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THANH PHO HO CHI MINH KHOA KHOA HQC CO BAN
BAO CAO TONG KET /
DE TAI KH&CN CAP TRUONG TRONG DIEM
SU DUNG BOOTSTRAP TRONG VIEC PHAN TICH CAC YEU TO TAC DONG DEN KET QUA HOC TAP CUA SINH VIEN CHINH QUY DAI HOC SU PHAM
KY THUAT THANH PHO HO CHI MINH
Trang 4Danh sách thành viên tham gia nghiên cứu đề tài
1 Chủ nhiệm đề tài: Thạc sĩ Nguyễn Hồng Nhung Bộ môn Toán,
Khoa Khoa Học Cơ Bản, trường Đại Học Sư Phạm Kỹ Thuật Thành
pho H6 Chi Minh.
Trang 51 Nội dung phương pháp BootSfrap kiem 15
2 Sai số tiêu chuẩn Bootstrap - 21.212.21.01 1 1erei 16
3 Khoảng ước lượng boofStFAp-( eieiiirrireriee 17 3.1 Khoảng ước lượng bootstrap-t cho trung bình se ee 18 3.2 _ Khoảng ước lượng bootstrap-t cho tỷ lỆ p - SH set 19
4 Kiểm định l0 200077 .4 21
4.1 Kiểm định bootstrap so sánh hai trung bình . sc©cssccsvescce2 21
4.2 Kiểm định bootstrap so sánh hai tỷ lỆ -s- c-+ecxsEkeeEEkeerrkerrxercee 23
CHƯƠNG44 conpnnngg2 661 11148110111805151541415153661136139560316138616448533ã-đ51 aia RITES 27
KET QUA PHAN TICH SO LIEU .-.2-5°s©s<Sse++eesetvvvseestrxssssrseee 27
1 Sử dụng khoảng ước lượng bootstrap phân tích các yếu tô ảnh hưởng đến kết quả học tập của sinh VIÊN +4 tt HH H011 01021101.01 1111 27
2 Sử dụng kiểm định Bootstrap phân tích các yếu tố ảnh hưởng đến kết quả học tập của sinh ;VIÕH ausaassnadais tran G6 0S81810101308138048%.56388110646148A-R/080014020601015g880900003084/010918888 30
KẾT' LUẬN VÀ KIÊN NGÏcceneneeninntiintdtitriroitiSNOiTN8011400300140000001500004/450207800001800100584 35
"TẤT LIÊN THAM THÔ ggnnernoarttoototrtittrgintrrtgttiVTTD0151010400100 01010836 4107T8ĐT20E119030013883888 38
PHỤ TU kraarnresannnatiiditetitiiit0Niutit00900447001106000046189905467545193086101918458801508953/115191588840619050% 39
Trang 6DANH MỤC BẢNG BIEU
Bảng I- Phân loại sinh viên theo khoa (ngành) và năm thứ
Bang 2: Phân loại sinh viên theo khoa (ngành) và giới tính
Bảng 3: Khoảng ước lượng bootstrap-t với độ tin cay 95% cho ty lé cac yếu tổ ảnh hưởng đến chất lượng học tập của sinh viên
Bảng 4: Kiểm bđjnh giả thuyết H: pi=p› với mức ý nghĩa 5%, kiểm định yếu tô tác động đến khó khăn trong học tập của sinh viên: thiếu thời gian học, học không hiểu, không thích học
Bang 5: Kiém dinh gia thuyết H: tạ = Hạ với mức ý nghia 5%, kiểm định các yếu
tô ảnh hưởng đến điểm học tập trung bình của sinh viên
Bảng 6: Kiểm định giả thuyết H: pi=p› với mức ý nghĩa 5%, kiểm định các yếu to
ảnh hưởng đến việc học lại nhiêu của sinh viên.
Trang 7DANH MUC CAC CHU VIET TAT
ĐH SPKT: Đại học Sư phạm Kỹ thuật
Tp.HCM: Thành phố Hồ Chí Minh
HCMC: Ho Chi Minh City
UTE: University of Technical Education
CLC: Khoa Dao tao chat luong cao
DDT: Khoa Dién - Điện tử
CKM: Khoa Co khi ché tao may
CKD: Khoa Cơ khí động lực
IN: Khoa In và Truyền thông
CNTT: Khoa Công nghệ thông tin
XD: Khoa Xây dựng và Cơ học ứng dụng
MTT: Khoa Céng nghé may vả thời trang
HMT: Khoa Công nghệ may hoá học và thực phẩm
NN: Khoa Ngoại ngữ
KT: Khoa Kinh tế
Trang 8TRUONG DAI HOC SU PHAM KY THUAT CONG HOA XA HOI CHU NGHIA VIET NAM
THANH PHO HO CHi MINH Độc lập - Tự do - Hạnh phúc
KHOA KHOA HỌC CƠ BẢN
Tp HCM, Ngày 25 tháng 9 năm 2015
THONG TIN KET QUA NGHIEN CUU
1 Thông tin chung:
- Tên đề tài: SỬ DỤNG BOOTSTRAP TRONG VIỆC PHÂN TÍCH CÁC YẾU TÔ TÁC ĐỘNG ĐÉN KÉT QUÁ HỌC TẬP CỦA SINH VIÊN CHÍNH QUY ĐẠI HỌC
SƯ PHẠM KỸ THUẬT THÀNH PHÓ HÒ CHÍ MINH
- Mã số: T2015-44TĐ
- Chủ nhiệm: Th.S Nguyễn Hồng Nhung
- Cơ quan chủ trì: Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh
- Thời gian thực hiện: 12 tháng
2 Mục tiêu
Đề tài nghiên cứu ứng dụng của phương pháp Bootstrap trong việc phân tích các yếu
tố tác động đến kết quả học tập của sinh viên chính quy Đại học Sư phạm Kỹ thuật
Tp.HCM
3 Tính mới và sáng tạo
Điều tra thu thập số liệu mẫu từ sinh viên chính quy trường Đại học Sư phạm Kỹ
thuật Tp.HCM Xử lý số liệu mẫu bằng phương pháp Bootstrap từ đó rút kết luận về các
yếu tố tác động đến kết quả học tập của sinh viên chính quy của trường
4 Kết quả nghiên cứu
Trình bày cơ sở lý thuyết của phương pháp Bootstrap từ đó trình bày các thuật toán
thống kê bằng phương pháp Bootstrap trên phan mém Matlab.
Trang 9Phân tích số liệu đưa ra các kết luận về các yếu tố ảnh tố ảnh hưởng đến kết học tập của sinh viên chính quy trường Đại học Sư phạm Kỹ thuật Tp.HCM
5 Hiệu quả, phương thức chuyển giao kết quả nghiên cứu và khả năng áp dụng
Các kết luận thu được từ quá trình phân tích là những thông tin tham khảo hữu ích giúp các thầy cô giáo cũng như các phòng ban trong trường Đại học Sư phạm Kỹ thuật Tp.HCM có được những nhận định về các yếu tố ảnh hưởng đến kết quả học tập của sinh viên Từ đó có thể đưa ra những giải pháp nhằm nâng cao hơn nữa chất lượng học tập của sinh viên chính quy trong trường
Báo cáo tổng kết đồng thời cũng là một tài liệu tham khảo cho sinh viên, học viên cao
học chuyên ngành Xác suất Thống kê và những đối tượng sử dụng phương pháp
Bootstrap trong nghiên cứu
Arg phe “lull —
PGS.TS, Đỗ Quang, Bình Ng wpb Hen Nhung,
Trang 10INFORMATION ON RESEARCH RESULTS
3 Creativeness and innovativeness
By collecting sample data from HCM UTE students in full-time course and processing sample data by Bootstrap method, the factors affecting study result of HCM UTE students will be concluded from
5, Effects, transfer alternatives of reserach results and applicability
Drawn conclusions from analysis process are helpful information not only for the
teachers but also for the faculties in UTE to assess about the factors affecting study result
6
Trang 11of their students Since then we propose the solutions to enhance study quality for our
students
These are also reference document for students, post-educated students specialized in Probability Statistics and for whom using Bootstrap method in research
Trang 12MỞ ĐẦU
1 Tổng quan tình hình nghiên cứu thuộc lĩnh vực đề tài ở trong và ngoài nước
Phương pháp Bootstrap là phương pháp coi mẫu gốc ban đầu đóng vai trò tổng thê
mà từ đó nó được rút ra Từ mẫu ban đầu lấy lại các mẫu ngẫu nhiên cùng cỡ với mẫu gốc bằng phương pháp lấy mẫu có hoàn lại, gọi là mẫu bootstrap Phương pháp
Bootstrap được B.Efron đề xuất vào năm 1970 là một phương pháp lấy mẫu mới và
nó cho phép xử lý nhiều lần với mẫu gốc ban đầu Sự phổ biến và phát triển của máy
: tính đã khắc phục được nhược điểm của phương pháp là có khối lượng tính toán lớn
Ngày nay, phương pháp Bootstrap được rất nhiều các nhà toán học quan tâm nghiên cứu cơ sở lý thuyết, cũng như được các chuyên gia phân tích thông kê ứng dụng trong
nhiều lĩnh vực
2 Tính cấp thiết
Trong thống kê, Bootstrap được xem như là một phương pháp giải quyết các bat
định của bài toán thống kê khi cỡ mẫu nhỏ mà không cần giả thuyết về phân phối xác suất của tham số thống kê cần nghiên cứu Vì ưu điểm này mà việc nghiên cứu và phát triển phương pháp Bootstrap thu hút được sự quan tâm của nhiều nhà khoa học
trên thế giới Phương pháp được phổ biến rộng rãi khi nhiều trường đại học trên thé
giới đưa vào chương trình giảng dạy cho sinh viên, đồng thời phương pháp cũng được các chuyên gia phân tích thông kê sử dụng trong nhiều lĩnh vực nghiên cứu Ở Việt Nam đã có một số nhà nghiên cứu sử dụng phương pháp Bootstrap trong các phân tích thống kê của mình Đề tài này là kết quả của quá trình áp dụng phương pháp Bootstrap trong nghiên cứu khoa học giáo dục
._ Kết quả học tập của mỗi sinh viên ngoài việc phụ thuộc vào khả năng nhận thức của mỗi sinh viên còn phụ thuộc vào nhiều yếu tố khách quan khác Đã có nhiều nhà chuyên môn nghiên cứu về vấn đề và đưa ra một số lời nhận xét trên tổng thê sinh
viên một số trường cụ thể Tuy nhiên, hầu hết các bài tham luận về vấn đề này đều đưa ra các kết luận định tính và có rất ít các nghiên cứu có cách tiếp cận định lượng nhằm có những kết luận thực sự mang tính thuyết phục.
Trang 13Đề tài sử dụng phương pháp thống kê Bootstrap nghiên cứu định lượng về một số
yếu tố ảnh hưởng đến kết quả học tập của sinh viên, cụ thể là sinh viên chính quy
trường Đại học Sư phạm Kỹ thuật Tp.HCM Kết quả phân tích của để tài sẽ phác họa phần nào những yếu tố tác động đến kết quả học tập của sinh viên chính quy trường
Tác giả hy vọng các kết luận, nhận xét của dé tài sẽ giúp ích phần nào cho việc nâng cao hơn nữa chất lượng và kết quả học tập của sinh viên trường chúng ta
Mục tiêu
Mục tiêu của dé tai là áp dụng phương pháp Bootstrap phân tích số liệu thu được
từ quá trình lấy mẫu trong tổng thể sinh viên Đại học Sư phạm Kỹ thuật Tp.HCM Từ
đó đưa ra các kết luận nhận xét về các yếu tố ảnh hưởng đến kết quả học tập của sinh
viên chính quy trường
Cách tiếp cận
Để giải quết vấn đề trên, để tài sử dụng các thuật toán tìm khoảng ước lượng và kiểm định Bootstrap phân tích số liệu thu thập trên mẫu thu được Từ kết quả phân
tích tác giả đưa ra kêt luận, nhận xét về vân đề cân nghiên cứu
Phương pháp, đối tượng và phạm vi nghiên cứu
Đầu tiên ta tiến hành điều tra thu thập số liệu mẫu từ tổng thể sinh viên chính quy trường Đại học Sư phạm Kỹ thuật Tp.HCM
Sau đó, tác giả sử dụng phần mềm Matlab viết thuật toán phân tích số liệu, rồi tiễn hành phân tích số liệu đã thu thập được
Từ kết quả phân tích sô liệu, ta rút ra kết luận và nhận xét về các yêu tô ảnh hưởng
đến kết quả học tập của sinh viên trong trường
Nội dung nghiên cứu
Sau phần mở đầu, bản tong két dé tai gồm ba chương nội dung, phần kết luận, danh mục các tài liệu tham khảo và phụ lục.
Trang 14Chương 1 trình bảy quá trình điều tra thu thập số liệu mẫu từ tổng thê sinh viên
chính quy trường Đại học Sư phạm Kỹ thuật Tp.HCM Mô tả mẫu thực nghiệm thu
được từ quá trình thu thập số liệu
Chương 2 trình bày nội dung phương pháp Bootstrap, sai số tiêu chuân Bootstrap
Trình bày thuật toán tìm khoảng ước lượng Boofstrap-t cho tham số trung bình, tỷ lệ Trình các bước kiểm định giả thuyết Bootstrap đối với hai mẫu cho tham số trung
Đề tài được hoàn thành với sự giúp đỡ của các bạn sinh viên trường Đại học Sư
phạm Kỹ thuật Tp.HCM đã nhiệt tình và nghiêm túc trong việc cung cấp những số liệu giúp cho công tác nghiên cứu được thực hiện tốt đẹp Xin được gởi lời cám ơn
sâu sắc tới các bạn sinh viên
Tôi xin chân thành gửi lời cám ơn tới các quý thầy cô trong trường đã giới thiệu
và phổ biến cho sinh viên trong toàn trường về đẻ tài nghiên cứu, giúp cho công tác
điều tra thu thập số liệu diễn ra một cách thuận lợi, suôn sẻ Đặc biệt em xin được bày
tỏ lòng biết ơn sâu sắc đến Tiến sĩ Nguyễn Văn Toản, một chuyên gia nghiên cứu về
lý thuyết của phương pháp Bootstrap, đối với những góp ý của thầy cho đề tài
Tôi rất mong nhận được đóng góp ý kiến của các quý thầy cô giáo, các nhà nghiên cứu Xác suất Thống kê, nghiên cứu giáo dục và các bạn độc giả quan tâm đến vân để
nghiên cứu của đê tài
10
Trang 15Tp Hồ Chí Minh 25 tháng 9 năm 2015
Tác giả
Nguyễn Hồng Nhung
11
Trang 16Chương 1
DIEU TRA THU THAP SO LIEU
Công việc điều tra thu thập số liệu là một công việc quan trọng trong quá trình
nghiên cứu Số liệu mẫu sẽ là những thông tin mà chúng ta dựa vào đó để xử lý, phân tích
và đưa ra kết luận về vấn để ta đang nghiên cứu Những thông tin của mẫu cần thu được một cách ngẫu nhiên, đại diện một cách trung thực cho hiện tượng, đại lượng ta quan tâm nghiên cứu Vì vậy công việc điều tra thu thập số liệu trong nghiên cứu này được quan
tâm chú ý và thực hiện một cách nghiêm túc, cần thận
Với mục đích phân tích các yếu tố ảnh hưởng đến kết quả học tập của sinh viên
chính quy trường Đại học Sư phạm Kỹ thuật Tp.HCM, một mẫu gồm 888 sinh viên trường Đại học Sư phạm Kỹ thuật Tp.HCM được khảo sát một cách ngẫu nhiên thuộc các khoa và 30 ngành đảo tạo trình độ đại học:
¡ Khoa Đảo tạo chất lượng cao
Khoa Điện - Điện tử
Khoa Cơ khí chế tạo máy
6 Khoa Công nghệ thông tin
7 Khoa Xây dựng và Cơ học ứng dụng
8 Khoa Céng nghệ may va thời trang
9 Khoa Công nghệ may hoá học và thực phẩm
Trang 17Bảng 1: Phân loại sinh viên theo khoa (ngành) và năm thứ
Số liệu mẫu được thu thập đưới hình thức trả lời phiếu điều tra hoặc bảng hỏi trên
Link: https://qoo.gl/EkFJPh trong khoảng thời gian từ thắng 5 đến tháng 6 năm 2015
Nội dung phiếu điều tra gồm hai phần:
e Phần một gồm các câu hỏi về các yếu tố liên quan đến chương trình học, quá trình học tập, sinh hoạt của sinh viên
e Phần hai gồm các câu hỏi về kết quả học tập của sinh viên, khả năng ngoại ngữ và tin học
Nội dung cụ thể của phiếu điều tra được trình bày trong phần Phụ lục phía cuối của báo cáo tông kêt đê tài
13
Trang 18Các số liệu điều tra được phân loại thành các biến định lượng và biến định tính
Sau đó các biến được tổ chức mã hóa Đối với các biến định lượng lấy số đo của của biến |
làm mã Với các biến định tính được mã hóa nhị phân bằng hai giá trị 1-0 tương ứng với
có hoặc không có tính chất A
Sau khi nhập hoàn chỉnh, toàn bộ số liệu được rà soát kĩ lưỡng, làm sạch khỏi
những lỗi có thể mắc phải ở tất các khâu trước khi chính thức đưa vào phân tích
Số liệu sau khi tông hợp được xử lý, phân tích với sự hỗ trợ của phần mềm Matlab Mathlab là một ngôn ngữ lập trình cấp cao được sử dụng rộng rãi trong môi
trường học thuật và công nghệ Matlab có khả năng hỗ trợ tối ưu cho việc nghiên cứu với
hàng ngàn lệnh, hàm tiện ích và các hàm chuyên dụng trong các Toolbox Matlab có
Toolbox chuyên dụng cho phân tích thống kê đáp ứng được mục đích mà nghiên cứu yêu
`
cau
14
Trang 19Chương 2
PHƯƠNG PHÁP BOOTSTRAP
1 Nội dung phương pháp Bootstrap
Phương pháp Bootstrap là phương pháp coi mẫu gốc ban đầu đóng vai trò tổng thể
mà từ đó nó được rút ra Thống kê của tham số cân quan tâm ứng với mỗi mẫu
bootstrap được gọi là théng ké bootstrap Phan phối của thống kê bootstrap được gọi
là phan phối bootstrap
Ký hiệu x = Œ„, Xz, ,Xn) là mau géc ban dau ta cé mau bootstrap x* = (x‡,x$, , xã) với mỗi giá trị xị được lầy ngẫu nhiên từ tập các giá trị Xạ, X, , Ấn với xác suất 1/n Tương ứng với mỗi mẫu bootstrap x” ta có mô phỏng bootstrap của
6 la 6* = T(x") Voi ham théng ké T(x") tương tự với hàm thống kê T(x) tác động
lên mẫu x
Với mẫu bootstrap ngẫu nhiên X" = (Xj,X¿, Xn) ô* = T') là một thống kê
trên mẫu bootstrap, khi đó F”(t) = P(6* < Ð) là phân phối bootstrap của ô"
Mau bootstrap 2 ¬› Giá trị Ổ; |
Mẫu bootstrap 3 > Gia tri 65 |
ô*
Hình 1 Sơ đồ mô phỏng phân phối bootstrap
15
Trang 202 Sai số tiêu chuẩn Bootstrap
Mục đích của thống kê học là đưa ra thông tin về các tham số của tông thể nghiên cứu Trong thực tế ta không biết chính xác các tham số này mà chỉ ước tính dựa vào một hay nhiều mẫu rút ra từ tổng thể Nhưng việc chọn mẫu là ngẫu nhiên nên với
mỗi mẫu thực nghiệm (Xk¡, Xụ¿, , Xen) thứ k ta có giá trị ñu = T%Xwt, Xk¿¿ › Xkn)
thir k va cdc gid tri 6, nay cé thé thay đổi khi k thay đồi
Chọn m mẫu (cùng kích thước n), ta có m giá tri 6, (k=1, 2, 3, ., m) Dd léch tiéu chudn cua m gia tri 6, goi la sai sO tiéu chuan cua 9, ky higu
1 m 1 m 2
se(8)= [m=12, (%.-29'a) k=1 k =1
Sai số tiêu chuẩn phản ánh mức độ thay đối của các giá trị Ổ„ Giá trị se() nhỏ
thì các giá trị Ô„ ít thay đổi (ít biến thiên) ngược lại giá trị se(8) lớn thì các giá trị 6,
thay đổi nhiều (biến thiên nhiều)
Trong trường hợp không thể lấy nhiều mẫu từ tổng thể, để xác định sai số tiêu
chuẩn của Ô, ta dùng phương pháp bootstrap ước lượng sai số tiêu chuẩn của Ô từ một mẫu gốc ban đầu Theo [2, tr 47], ta có các bước thực hiện như sau:
Bước 1: Lấy theo phương pháp có hoàn lại từ mẫu gốc ban đầu được b mẫu
bootstrap độc lập cùng cỡ với mau géc xf = (Xi Xka, ›Xkn), KEl, 2, , Ð
Bước 2: Với mỗi mẫu bootstrap có được ở bước I ta tính giá trị théng ké 6, =
T(X,) = T(Xty Xk ;Xn), Kk=], 2, , Ð
Bước 3: Tính độ lệch tiêu chuẩn của b giá trị tính được ở bước 2
Độ lệch tiêu chuẩn này là ước lượng bootstrap của sai số tiêu chuẩn se(6)
Ta có giá trị se¿(8*) xấp xỉ se(6) khi số lượng mẫu bootstrap b là lớn
lim se}, (6*) = se(6) = se(6*)
16
Trang 213 Khoảng ước lượng bootstrap-t
Từ mẫu gốc ban đầu x = (X;,X;, ,Xạ) ta tính được giá trị tham số mẫu 6 = T%;, X;, , Xn) là một giá trị ước lượng điểm cho 9 Với mỗi mẫu bootstrap xự ta tính được giá trị thống kê mẫu bootstrap DN = T@Xặ) = TCX Xk¿; -› Xen), KE], 2, ,Ð
Từ b giá trị thống kê mẫu bootstrap Ôy ta tính được sai số tiêu chuan bootstrap
giá trị phân vị mirc a = 0,05 là giá trị Zÿ ở vị trí thứ 50 Giá trị phân vị mức œ = 0,95
là giá trị Zÿ ở vị trí thứ 950 Trong trường hợp bơ không là một số nguyên và œ < 0.5 giá trị phân vị mức œ là giá trị Z¿ ở vị trí thứ k= [Œ + 1)œ] là số nguyên lớn nhất <
(b + 1)a, gid trị phân vị mức 1 — œ là giá trị Z£ ở vị trí thứ (b + 1 — k) Hàm [x] là
hàm phần nguyên, ví dụ [m] là số nguyên lớn nhất không quá m
Khi đó theo [2, tr 160], ta khoảng ước lượng bootstrap-t với độ tin cậy 1 — 2œ của