Một trong các phương pháp nghiên cứu trong khoa học giáo dục là Thống kê và sử dụng phần mềm xử lý số liệu thống kê.. Với các câu hỏi như trên, chúng tôi quyết định chọn đề tài “Sử dụng
Trang 1KHOA VẬT LÝ
KIM VĂN THANH
KHÓA LUẬN TỐT NGHIỆP
SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU SPSS VÀ R TRONG NGHIÊN CỨU VỀ KHOA HỌC GIẢNG DẠY VẬT LÝ
Chuyên ngành: Sư phạm Vật lý
TP Hồ Chí Minh, năm 2020
Trang 2TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH
KHOA VẬT LÝ
SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU SPSS VÀ R TRONG NGHIÊN CỨU VỀ KHOA HỌC GIẢNG DẠY VẬT LÝ
Người thực hiện: Kim Văn Thanh Người hướng dẫn khoa học: ThS Tô Thị Hoàng Lan
TP Hồ Chí Minh, năm 2020
Trang 3LỜI CẢM ƠN
Trong suốt thời gian học tập và hoàn thành khóa luận tốt nghiệp, với sự
cố gắng nỗ lực của bản thân, tôi đã nhận được sự giúp đỡ, hướng dẫn tận tình của nhiều cá nhân và tập thể Cho phép tôi được tỏ lòng biết ơn và gửi lời cảm
ơn chân thành tới:
Ban Giám hiệu Trường Đại học Sư phạm Thành phố Hồ Chí Minh cùng toàn thể cán bộ quản lý và giảng viên của Trường nói chung và của Khoa Vật
lý nói riêng Với sự giúp đỡ, tạo điều kiện của nhà Trường, tôi đã có một môi trường thuận lợi để học tập, nghiên cứu và tiếp thu kiến thức cho bản thân Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc tới giảng viên hướng dẫn ThS
Tô Thị Hoàng Lan đã tận tình hướng dẫn, giúp đỡ, quan tâm và động viên tôi trong quá trình tìm hiểu và xây dựng khóa luận tốt nghiệp
Xin chân thành cảm ơn các tác giả của các tài liệu tham khảo mà tôi đã trích dẫn trong khóa luận của mình Đặc biệt là GS Nguyễn Văn Tuấn bởi những bài giảng cùng sự tư vấn, giải đáp các khó khăn, khúc mắc mà tôi gặp phải trong quá trình tìm hiểu về phần mềm R
Xin chân thành cảm ơn sự nhận xét và góp ý tận tình của ThS Lê Hải Mỹ Ngân, TS Phan Thị Ngọc Loan, cùng sự giúp đỡ của bạn Nguyễn Thị Thảo Trang đã giúp tôi hoàn thành sản phẩm cho khóa luận
Tôi xin chân thành cảm ơn bạn Phan Thanh Trà đã luôn đồng hành, giúp
đỡ, nhận xét và góp ý để giúp tôi hoàn thành khóa luận
Cuối cùng, nhân dịp hoàn thành khóa luận tốt nghiệp, cho phép tôi được gửi lời cảm ơn sâu sắc tới gia đình, người thân cùng bạn bè đã hỗ trợ, động viên, giúp đỡ và tạo điều kiện thuận lợi cho tôi vượt qua mọi khó khăn trong quá trình học tập kiến thức, tìm hiểu và xây dựng khóa luận tốt nghiệp này.
TP Hồ Chí Minh, tháng 06 năm 2020
Tác giả
Kim Văn Thanh
Trang 4DANH MỤC CÁC TỪ VIẾT TẮT
Ký hiệu Ý nghĩa XSTK Xác suất thống kê
Trang 5MỤC LỤC
LỜI CẢM ƠN i
DANH MỤC CÁC TỪ VIẾT TẮT ii
MỤC LỤC iii
DANH MỤC BẢNG BIỂU 1
DANH MỤC HÌNH ẢNH 2
PHẦN MỞ ĐẦU 5
1 Lý do chọn đề tài 5
2 Tổng quan nghiên cứu 5
3 Định hướng nghiên cứu của đề tài 8
3.1 Mục tiêu đề tài 8
3.2 Câu hỏi nghiên cứu 8
4 Phương pháp, đối tượng nghiên cứu 8
4.1 Phương pháp nghiên cứu 8
4.2 Đối tượng nghiên cứu 9
5 Cấu trúc khóa luận 9
CHƯƠNG 1 SỬ DỤNG PHẦN MỀM SPSS 11
1 Giới thiệu phần mềm SPSS 11
1.1 Lịch sử hình thành và phát triển 11
1.2 Khả năng của SPSS 11
1.3 Giao diện 12
1.4 Khai báo biến 12
1.5 Nhập dữ liệu 13
2 Các chức năng cơ bản của SPSS 14
2.1 Tạo biến mới từ các biến sẵn có 14
2.2 Thống kê mô tả 16
2.3 Tạo bảng tương quan nhiều chiều 21
2.4 So sánh trung bình 22
2.5 Phân tích tương quan 33
2.6 Kiểm định độ tin cậy của thang đo 36
Trang 62.7 Phân tích hồi quy 39
2.8 Biểu đồ 46
CHƯƠNG 2 SỬ DỤNG PHẦN MỀM R 48
1 Giới thiệu phần mềm R 48
1.1 Lịch sử hình thành và phát triển 48
1.2 Khả năng của R 48
1.3 Giao diện 49
1.4 Dẫn nhập 51
1.5 Nhập dữ liệu 54
2 Các chức năng cơ bản của R 58
2.1 Tạo biến mới từ các biến sẵn có 58
2.2 Thống kê mô tả 61
2.3 So sánh trung bình 66
2.4 Phân tích tương quan 75
2.5 Kiểm định độ tin cậy của thang đo 77
2.6 Phân tích hồi quy 79
2.7 Biểu đồ 84
3 Các lỗi thường gặp trong sử dụng R và RStudio 85
3.1 Lỗi đọc file 85
3.2 Lỗi không tìm thấy dataset, không tìm thấy lệnh 85
3.3 Lỗi trùng tên biến 85
4 Tổng kết các lệnh thường dùng trong R 85
CHƯƠNG 3 ỨNG DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU PHỤC VỤ NGHIÊN CỨU KHOA HỌC GIẢNG DẠY VẬT LÝ 89
1 So sánh phần mềm SPSS và R 89
1.1 Giống nhau 89
1.2 Khác nhau 89
2 Ưu và nhược điểm của phần mềm SPSS và R 90
2.1 Ưu và nhược điểm của phần mềm SPSS 90
2.2 Ưu và nhược điểm của phần mềm R 91
3 Ứng dụng phần mềm SPSS và R vào các nghiên cứu Khoa học giảng dạy Vật lý 92
KẾT LUẬN VÀ KIẾN NGHỊ 94
Trang 7TÀI LIỆU THAM KHẢO 97 PHỤ LỤC 99
Trang 8DANH MỤC BẢNG BIỂU
Bảng 1 Thống kê mô tả biến Diemthi 19
Bảng 2 Bảng chéo Xeploai và Lop 20
Bảng 3 Bảng tương quan giữa Xeploai với Gioitinh và Lop 22
Bảng 4 Kết quả tính giá trị trung bình theo biến định tính 23
Bảng 5 Kết quả kiểm định Paired-Samples T-Test 25
Bảng 6 Kết quả kiểm định One-Sample T Test 27
Bảng 7 Kết quả so sánh trung bình giữa hai nhóm 29
Bảng 8 Kết quả kiểm định One-Way ANOVA 32
Bảng 9 Kết quả phân tích tương quan đơn 35
Bảng 10 Đánh giá hệ số Cronbach’s Alpha 39
Bảng 11 Bảng Model Summary 42
Bảng 12 Bảng ANOVA 43
Bảng 13 Bảng Coecients 44
Bảng 14 Tổng hợp các lệnh cơ bản thường dùng trong R 88
Trang 9DANH MỤC HÌNH ẢNH
Hình 1 Giao diện làm việc của SPSS 12
Hình 2 Cửa sổ khai báo biến 13
Hình 3 Nhập dữ liệu vào SPSS 14
Hình 4 Mã hóa biến 15
Hình 5 Mã hóa biến Xeploai 15
Hình 6 Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu 16
Hình 7 Tính tần suất biến Diemthi 17
Hình 8 Kết quả tính tần số biến Diemthi 18
Hình 9 Các tùy chọn trong lệnh Options của Descriptives 18
Hình 10 Tạo bảng chéo hai biến 19
Hình 11 Đồ thị bảng chéo Xeploai và Lop 20
Hình 12 Tạo bảng nhiều chiều 21
Hình 13 Tính giá trị trung bình theo biến định tính 23
Hình 14 Bảng số liệu so sánh cặp 24
Hình 15 Kiểm định Paired-Samples T-Test 25
Hình 16 Kiểm định One-Sample T Test 26
Hình 17 So sánh trung bình giữa hai nhóm 28
Hình 18 Phân nhóm giá trị so sánh trung bình giữa hai nhóm 28
Hình 19 Cơ sở dữ liệu mức tiêu thụ xăng 30
Hình 20 Kiểm định One-Way ANOVA 31
Hình 21 Đánh giá kết quả kiểm định One-Way ANOVA 32
Hình 22 Phân tích tương quan đơn 34
Hình 23 Đánh giá hệ số Cronbach’s Alpha 38
Hình 24 Bảng số liệu phân tích hồi quy tuyến tính 40
Hình 25 Phân tích hồi quy tuyến tính bội 40
Hình 26 Cài đặt thông số phân tích 41
Trang 10Hình 27 Cài đặt biểu đồ kiểm tra giả thiết hồi quy 41
Hình 28 Bảng ý nghĩa giá trị Durbin-Watson 43
Hình 29 Đồ thị Histogram 45
Hình 30 Đồ thị Normal P-P Plot 45
Hình 31 Đồ thị Scatter Plot 46
Hình 32 Vẽ đồ thị với SPSS 47
Hình 33 Giao diện sử dụng của R 49
Hình 34 Giao diện sử dụng của RStudio 50
Hình 35 Cài đặt Packages trực tiếp cho R 53
Hình 36 Cài packages tự động với RStudio 54
Hình 37 Hợp nhất các biến thành dataset 55
Hình 38 Nhập dữ liệu trực tiếp 56
Hình 39 Đọc file vào RStudio 57
Hình 40 Xem trước dữ liệu trước khi đọc 57
Hình 41 Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu 58
Hình 42 Cơ sở dữ liệu mức tiêu thụ xăng 59
Hình 43 Tạo biến mới đơn giản 59
Hình 44 Lệnh mã hóa biến Xeploai 60
Hình 45 Mã hóa biến Xeploai 60
Hình 46 Trích dữ liệu từ dataset cũ 61
Hình 47 Dữ liệu lớp thực nghiệm trích từ dataset Dulieu 61
Hình 48 Thông báo package và dataset sẽ làm việc 62
Hình 49 Bảng phân tích tần số biến Diem 62
Hình 50 Lệnh vẽ đồ thị phân bố tần số 63
Hình 51 Đồ thị phân bố tần số biến Diem 63
Hình 52 Lệnh vẽ biểu đồ beeswarm 64
Hình 53 Biểu đồ phân bố điểm theo từng lớp 64
Hình 54 Bảng chéo phân tích hai biến 66
Trang 11Hình 55 Phân tích tham số thống kê theo nhóm 67
Hình 56 Dữ liệu so sánh cặp 68
Hình 57 Kiểm định Paired T Test 69
Hình 58 Lệnh kiểm định trung bình tổng thể điểm lớp thực nghiệm 70
Hình 59 Lệnh kiểm định trung bình tổng thể điểm lớp đối chiếu 70
Hình 60 Kiểm định trung bình tổng thể điểm lớp thực nghiệm 71
Hình 61 Kiểm định trung bình tổng thể điểm lớp đối chiếu 71
Hình 62 So sánh phương sai giữa điểm của hai nhóm lớp 72
Hình 63 Kiểm định Two Sample T Test giữa điểm của hai nhóm lớp 73
Hình 64 Cơ sở dữ liệu mức tiêu thụ xăng 74
Hình 65 Kiểm định ANOVA 74
Hình 66 Tương quan giữa mức tiêu thụ xăng và công suất động cơ 76
Hình 67 Tương quan giữa mức tiêu thụ xăng và khối lượng xe 76
Hình 68 Tương quan giữa mức tiêu thụ xăng và số cylinder 77
Hình 69 Tương quan giữa mức tiêu thụ xăng và dung tích động cơ 77
Hình 70 Hệ số Cronbach's Alpha của cơ sở dữ liệu mức tiêu thụ xăng 78
Hình 71 Phân tính hồi quy tuyến tính với R 79
Hình 72 Biểu đồ Histogram về phân bố phần dư 81
Hình 73 Biểu đồ Normal Q-Q Plot về phân bố phần dư 81
Hình 74 Biểu đồ studentized residuals về phương sai và giá trị tiên lượng 82
Hình 75 Biểu đồ Component + Residual Plot về mối tương quan tuyến tính 83 Hình 76 Kiểm tra giả định độc lập durbinWatsonTest 84
Trang 12PHẦN MỞ ĐẦU
1 Lý do chọn đề tài
Ngày 26/12/2018, Bộ Giáo dục và Đào tạo đã chính thức công bố chương trình giáo dục phổ thông mới bao gồm chương trình giáo dục tổng thể và chương trình giáo dục từng bộ môn Đây là bước đổi mới toàn điện trên quy mô cả nước về chương trình dạy và học ở phổ thông Chương trình giáo dục phổ thông mới sẽ tập trung phát triển về phẩm chất và năng lực cho các em học sinh Qua đó, chương trình giáo dục phổ thông mới tập trung trả lời câu hỏi: “Học xong chương trình, học sinh làm được những gì?” Việc đổi mới chương trình cũng đồng thời đặt ra yêu cầu và thách thức đối với đội ngũ giáo viên trong việc đổi mới phương pháp dạy học và cách thức tổ chức dạy học nhằm phát triển tối đa phẩm chất và năng lực cho từng đối tượng học sinh
Trong bối cảnh có rất nhiều thay đổi và mới mẻ về tổ chức dạy học các môn học
ở phổ thông nói chung và Vật lý nói riêng, cần có những nghiên cứu khoa học trong lĩnh vực này trở nên là một việc cần thiết và cũng là cơ hội để mở ra nhiều hướng nghiên cứu trong lĩnh vực khoa học giáo dục mà môn Vật lý là một phần trong đó Một trong các phương pháp nghiên cứu trong khoa học giáo dục là Thống kê và sử dụng phần mềm xử lý số liệu thống kê Hiện nay, các phần mềm thống kê cũng rất phát triển với nhiều phần mềm khác nhau có thể tính toán và xử lý lượng lớn dữ liệu Tuy
nhiên, được sử dụng rộng rãi trên thị trường có thể kể đến hai phần mềm là SPSS và R (cùng các gói package của R) Cả hai phần mềm này có đáp ứng được phần lớn nhu cầu
xử lý số liệu trong nghiên cứu khoa học giáo dục hay không? Mỗi phần mềm có ưu điểm
và nhược điểm nào, đặc biệt với đối tượng sử dụng là sinh viên, học viên cao học hoặc giáo viên phổ thông? Cách sử dụng mỗi phần mềm này ra sao và để cho hiệu quả? Với
các câu hỏi như trên, chúng tôi quyết định chọn đề tài “Sử dụng phần mềm xử lý số
liệu SPSS và R trong nghiên cứu về khoa học giảng dạy Vật lý” để làm đề tài nghiên
cứu
2 Tổng quan nghiên cứu
Các đề tài nghiên cứu về khoa học dạy học Vật lý đều ít nhiều sử dụng Thống
kê Những mô thức phổ biến là sử dụng thống kế mô tả, so sánh trung bình mẫu, kiểm định giả thuyết thống kê Có thể thấy rõ mô thức này trong luận văn Thạc sĩ Khoa
học giáo dục của tác giả Hà Thị Trúc Linh (2016) “Xây dựng và sử dụng hệ thống
câu hỏi TNKQ theo định hướng phát triển năng lực chuyên biệt và dạy học chương
“Cảm ứng điện từ” – Vật lý 11”[11]; Banhnalak Bosanthay (2017) “Tổ chức dạy
Trang 13học chương “Dòng điện một chiều” – Vật lý lớp 9 THCS ở nước CHDCND Lào theo hướng phát huy tính tích cực, tự lực học tập của học sinh”[3]; Bùi Xuân Dương
(2017) “Tổ chức dạy học giải quyết vấn đề một số kiến thức của chương “Các định
luật bảo toàn” – Vật lý 10 với sự hỗ trợ của phần mềm Crocodile PHYsics”[5]
Những số liệu này cần thiết cho việc nghiên cứu mẫu can thiệp và mẫu đối chứng Các tham số được sử dụng như điểm trung bình, phương sai, độ lệch chuẩn, tần số điểm, tần số tích lũy,… của điểm các lớp trước và sau khi áp dụng phương pháp mới Các tác giả kết so sánh kết quả, vẽ biểu đồ từ đó kết luận độ hiệu quả của phương pháp mới được nêu ra
Nếu chỉ dừng ở thống kê mô tả thì việc xử lý số liệu khá đơn giản, có thể tính bằng tay hoặc dùng phần mềm Excel Tuy nhiên, để xử lý số liệu với các bước phức tạp hơn thì các đề tài nghiên cứu cần đến phần mềm chuyên dụng xử lý số liệu
Trước tiên, xét đến phần mềm SPSS SPSS là một phần mềm thương mại có phí
bản quyền khoảng 99$/tháng Đó là một khó khăn với sinh viên, học viên cao học hay giáo viên phổ thông nếu muốn sử dụng phần mềm này cho nghiên cứu của mình
Tuy nhiên, tính năng của SPSS giúp việc sử lý số liệu phức tạp được tiến hành dễ
dàng và có mức độ sâu hơn là thống kê mô tả Trong luận văn Thạc sĩ Khoa học giáo
dục của các tác giả: Hoàng Thị Hạnh (2016) “Vận dụng mô hình PEER
INSTRUCTION trong dạy học một số kiến thức chương “Chất khí” – Vật lý 10”[7],
tác giả đã giới thiệu mô hình Peer Instruction và phân tích ưu điểm, hạn chế và những thuận lợi, khó khăn khi áp dụng mô hình vào dạy học Vật lý phổ thông ở Việt Nam Dựa vào đó tác giả đã phân tích kiến thức và xây dựng tiến trình dạy học chương
“Chất khí” – Vật lý 10 theo mô hình Peer Instruction Từ đó tổ chức thực nghiệm sư
phạm và khảo sát số liệu đánh giá kết quả của mô hình Tác giả đã dùng SPSS để tính
toán các tham số của thống kê mô tả như điểm trung bình, phương sai, độ lệch chuẩn, tần suất và tần suất tích lũy, … Ngoài ra với số liệu khảo sát là điểm của hai lớp gồm lớp thực nghiệm và lớp đối chiếu tác giả đã sử dụng kiểm định Independent-Sample
T Test để so sánh trung bình giữa hai nhóm Từ đó thấy được sự khác nhau về ý nghĩa thống kê giữa điểm của lớp thực nghiệm và điểm của lớp đối chiếu Điểm trung bình của lớp thực nghiệm cao hơn so với lớp đối chiếu nên có thể thấy được độ hiệu quả của việc áp dụng mô hình Peer Instruction vào dạy học Vật lý phổ thông ở nước ta Thao tác này sẽ khó khăn hơn nếu không sử dụng một phần mềm chuyên dụng cho việc xử lý số liệu
Trang 14Ngoài SPSSI, có thể sử dụng phần mềm Transana để phân tích các đoạn phim
trong quá trình giảng dạy Phần mềm Transana được sử dụng trong luận văn Thạc sĩ
Khoa học giáo dục của tác giả Đinh Vũ Nguyên Chương (2017) “Tổ chức dạy học
chủ đề tích hợp “Năng lượng” cho sinh viên chuyên ngành kỹ thuật”[4] Trong đó
phần mềm Transana được sử dụng để phân tích các clip được quay lại trong quá trình giảng dạy bằng phương pháp mới Từ đó đánh giá được sự tích cực làm việc, hoạt động của học sinh được nâng cao
Bên cạnh đó, cũng có những đề tài không sử dụng phân tích thống kê để đánh giá kết quả mà thay vào đó, tác giả chấm điểm sản phẩm của học sinh và thu thập những nhận xét của học sinh, giáo viên và các chuyên gia để kết luận độ hiệu quả của
mô hình Ví dụ như luận văn Thạc sĩ Khoa học giáo dục của tác giả: Đàm Việt Thắng
(2017) “Tổ chức hoạt động ngoại khóa về ứng dụng kỹ thuật chương “Cơ học chất
lưu” – Vật lý 10 theo hướng phát huy tính tích cực và phát triển năng lực sáng tạo của học sinh”[15]; luận văn tốt nghiệp của tác giả Nguyễn Thanh Huy (2017) “Xây dựng cơ sở học liệu cho việc dạy và học học phần thiên văn và quang học trong môn khoa học tự nhiên ở bậc tiểu học”[9] Phương pháp đánh giá này không thuyết phục
do đây chỉ là đánh giá trên một mẫu nhỏ và chưa đủ cơ sở để đánh giá độ hiệu quả của đề tài trên phạm vi quần thể
Như vậy, qua tìm hiểu và phân tích một vài luận văn, khóa luận về khoa học dạy học môn Vật lý được bảo vệ tại Khoa Vật lý trường Đại học Sư phạm Tp.HCM
trong khoảng 3 năm trở lại đây các tác giả có sử dụng SPSS và một số phần mềm khác
để xử lý số liệu Tuy nhiên trong phạm vi tìm hiểu, chúng tôi chưa ghi nhận đề tài
nào có sử dụng phần mềm R để xử lý số liệu
Trong khi sử dụng SPSS cần phải trả phí bản quyền, R là một phần mềm thống
kê miễn phí Tuy nhiên R có thể xem như là một ngôn ngữ thống kê vì người dùng phải lập trình với rất nhiều câu lệnh và nhiều gói Packages khá phức tạp Điều này
có lẽ là một nguyên nhân dù được sử dụng miễn phí nhưng không nhiều đề tài dành
cho sinh viên, học viên cao học sử dụng, mặc dù tìm hướng dẫn sử dụng R không khó Trong các hướng dẫn chi tiết về R, có thể kể đến sách của Giáo sư Nguyễn Văn Tuấn (2014) “Phân tích dữ liệu với R”[14] Trong quyển sách này, tác giả đã trình bày rất chi tiết về các chức năng và hướng dẫn sử dụng phần mềm R để phân tích số
liệu Giáo sư đã trình bày rõ ràng và đầy đủ về cách sử dụng kèm theo các ví dụ cụ
thể về các chức năng của R trong sách Tuy nhiên, chính vì đầy đủ nên tài liệu khá
Trang 15dài, lên đến 517 trang, phù hợp cho học tập và nghiên cứu với R nhưng lại không
thân thiện với một người mới bắt đầu dùng và chỉ dùng như một công cụ nghiên cứu Chính vì lẽ đó, trong khóa luận này chúng tôi sẽ trình bày cách sử dụng các chức năng quan trọng, cần thiết cho phân tích số liệu trong lĩnh vực Khoa học giáo dục nói
chung và Khoa học giảng dạy Vật lý nói riêng của phần mềm SPSS và R Một quyển
cẩm nang vừa phải là rất cần thiết cho những người dùng ban đầu Đồng thời chúng tôi cũng phân tích ưu và nhược điểm của từng phần mềm để người dùng có thể lựa chọn phần mềm nào phù hợp với bản thân
3 Định hướng nghiên cứu của đề tài
3.1 Mục tiêu đề tài
Phân tích hai phần mềm xử lý số liệu SPSS và R để phục vụ cho các nghiên cứu
về khoa học giảng dạy Vật lý và tạo ra một quyển cẩm nang sử dụng cho hai phần mềm này với các chức năng quan trọng và cơ bản nhất
3.1.1 Mục tiêu cụ thể
- Giới thiệu và phân tích ưu, nhược điểm của phần mềm SPSS
- Giới thiệu và phân tích ưu, nhược điểm của phần mềm R
- So sánh sự khác nhau giữa hai phần mềm SPSS và R
- Phân tích số liệu thực tế để đưa ra sự phù hợp của từng phần mềm với các đề tài nghiên cứu khác nhau về khoa học giảng dạy Vật lý
- Thiết kế cẩm nang hướng dẫn sử dụng
3.2 Câu hỏi nghiên cứu
- Sử dụng phần mềm SPSS và R trong xử lý số liệu nghiên cứu như thế nào?
- Ưu, nhược điểm của hai phần mềm SPSS và R là gì?
- Đâu là sự khác nhau giữa SPSS và R? Tại sao hai phần mềm này có thể tồn tại
song song với nhau trên trị trường mà không nghiêng hẳn về một phần mềm nào?
- Từng phần mềm SPSS và R phù hợp với đề tài nghiên cứu nào?
4 Phương pháp, đối tượng nghiên cứu
4.1 Phương pháp nghiên cứu
4.1.1 Phương pháp nghiên cứu lý luận
- Phân tích và nghiên cứu các tài liệu liên quan đến phần mềm SPSS và R
Trang 16- Nghiên cứu các tài liệu về khoa học giảng dạy Vật lý
- Mô hình hóa các hệ thống số liệu thực tế
- Nghiên cứu các tài liệu về xử lý số liệu, các luận văn, luận án liên quan đến
xử lý số liệu và khoa học giảng dạy Vật lý
4.1.2 Phương pháp nghiên cứu thực tiễn
- Nghiên cứu các số liệu thực tiễn liên quan đến khoa học giảng dạy Vật lý
- Nghiên cứu việc xây dựng hướng xử lý và sử dụng phần mềm xử lý số liệu
SPSS và R để phân tích số liệu thực tế liên quan đến khoa học giảng dạy Vật lý
4.2 Đối tượng nghiên cứu
Hai phần mềm SPSS và R cùng số liệu của các đề tài nghiên cứu về khoa học
giảng dạy Vật lý
5 Cấu trúc khóa luận
Để đạt được mục tiêu đã đề ra, khóa luận sẽ nghiên cứu thực tế tình hình sử dụng phần mềm xử lý số liệu trong các nghiên cứu về khoa học giảng dạy Vật lý; đưa
ra ưu, nhược điểm của hai phần mềm SPSS và R; so sánh đặc điểm khác nhau giữa
hai phần mềm; rút ra nhận xét về sự phù hợp của từng phần mềm với các đối tượng nghiên cứu khác nhau trong lĩnh vực khoa học giảng dạy Vật lý Với các nhiệm vụ như trên khóa luận này được chia làm ba chương không kể phần mở đầu và kết luận
Chương 1: Sử dụng phần mềm SPSS
Trong chương này khóa luận sẽ giới thiệu phần mềm SPSS, và các chức năng
cơ bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý Song song
đó, khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên các số liệu thực tế
Chương 2: Sử dụng phần mềm R
Trong chương này khóa luận sẽ giới thiệu phần mềm R, và các chức năng cơ
bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý Song song đó, khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên các
số liệu thực tế
Chương 3: Ứng dụng phần mềm xử lý số liệu phục vụ nghiên cứu khoa học giảng dạy Vật lý
Trong chương này khóa luận sẽ tập trung vào việc đánh giá hai phần mềm SPSS
và R Từ kết quả thu được khi phân tích các VD với số liệu thực tế ở Chương 1 và
Trang 17Chương 2 rút ra kết luận về ưu, nhược điểm của hai phần mềm này Qua đó trình bày
về những đặc điểm giống và khác nhau của hai phần mềm trên để trả lời câu hỏi tại sao hai phần mềm này lại cùng tồn tại song song với nhau mà không nghiêng hẳn về một phần mềm nào? Đồng thời đưa ra kết luận về sự phù hợp của từng phần mềm với các đối tượng sử dụng khác nhau, các đối tượng nghiên cứu khác nhau trong lĩnh vực khoa học giảng dạy Vật lý
Trang 18CHƯƠNG 1 SỬ DỤNG PHẦN MỀM SPSS
1 Giới thiệu phần mềm SPSS
1.1 Lịch sử hình thành và phát triển
SPSS là một phần mềm phổ biết đã được xây dựng từ những năm 1968 và được
hoàn thiện dần theo thời gian
SPSS (viết tắt của Statistical Package for the Social Sciences) là một
chương trình máy tính phục vụ cho công tác phân tích thống kê SPSS được
sử dụng rộng rãi trong công tác thống kê kinh tế - xã hội và được sử dụng rộng rãi trong kinh tế lượng.[2]
Thế hệ đầu tiên của SPSS được đưa ra từ những năm 1968 chuyên sử dụng cho các máy chủ ở Mỹ SPSS được sử dụng bởi các nhà nghiên cứu
thị trường, nghiên cứu y khoa, công ty điều tra, các nhà nghiên cứu giáo dục và những lĩnh vực khác Sau đó phần mềm không ngừng cải tiến và
nâng cao các tính năng của mình, ngày càng có nhiều thế hệ mới của SPSS
ra đời, với các tiện ích ngày càng phong phú, đa dạng hơn Thế hệ mới
nhất cho đến nay được xem là SPSS 22.0 được giới thiệu từ tháng 8 năm
2008, có cả phiên bản cho các hệ điều hành Microsoft Windows, Mac, và
Linux/ UNIX SPSS 22.0, nhiều chức năng đa dạng và linh hoạt nên được
sử dụng rộng rãi trong nhiều ngành khoa học khác nhau như: Xã hội học,
Y học, Nhân học, Tâm lý học, Kinh tế học, Marketing…[2]
1.2 Khả năng của SPSS
Phần mềm SPSS cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích
thống kê với giao diện thân thiện cho người dùng trong môi trường đồ hoạ, sử dụng các trình đơn mô tả và các hộp thoại đơn giản
Chức năng cơ bản của SPSS:
+ Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số liệu tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics)
+ Thống kê 2 biến số (Bivariate statistics): trung bình (Means), tương quan (bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests), kiểm định
sự tin cậy của thang đo bằng Cronbach Alpha phân tích tương quan, kiểm định trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh) bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing)
Trang 19+ Dự báo (Prediction): Hồi quy (regression), phân tích nhân tố (Factor analysis), cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant)
1.3 Giao diện
Giao diện của SPSS trực quan và quen thuộc nhờ có nét tương đồng với các
phần mềm Office thường dùng, trong đó:
Hình 1 Giao diện làm việc của SPSS
1 Thanh menu chức năng,
2 Biểu tượng một số chức năng thông dụng,
3 Cột hiển thị tên các biến,
4 Số thứ tự các dòng,
5 Data View (cửa sổ nhập liệu và thể hiện dữ liệu) Variable View (cửa sổ khai
báo biến)
1.4 Khai báo biến
SPSS yêu cầu người sử dụng phải khai báo đầy đủ các biến trước khi thực hiện
các bước tính toán với dữ liệu Công việc này được thực hiện trong của sổ Variable
View, với:
Trang 20Hình 2 Cửa sổ khai báo biến
+ Name: tên biên, ký tự liên tục, không có khoảng trắng,
+ Type: kiểu dữ liệu, số (numeric), chữ (string), ngày tháng (date), tiền tệ (dollar),…
+ Width: độ rộng kiểu dữ liệu, nêu type là string thì width là số ký tự tối đa, + Decimals: lượng số thập phân,
+ Label: nhãn biến (chú thích cho tên biến, là tên cột hiển thị ở bảng kết quả), + Values: giá trị mã hóa dữ liệu: ví dụ 1 là Nam, 2 là Nu,
+ Missing: khai báo giá trị khuyết (khai báo khi bản khảo sát có dữ liệu sai hoặc
không đúng cấu trúc), các giá trị này sẽ bị bỏ đi để tránh làm ảnh hướng tới kết quả,
+ Columns: độ rộng cột tên biến,
+ Align: vị trí hiển thị dữ liệu trong cột (căn lề),
+ Measure: loại thang đo dữ liệu:
• Scale (thang đo tỉ lệ): có thể cộng, trừ, nhân, chia,
• Ordinal (thang đo thứ bậc): có thể cộng, trừ nhưng hạn chế về nhân chia,
SPSS cung cấp nhiều công cụ nhập số liệu khảo sát rất tiện dụng, trong đó phổ
biến là nhập dữ liệu thủ công và nhập từ phần mềm Excel
Trang 21Hình 3 Nhập dữ liệu vào SPSS + Nhập dữ liệu thủ công được thực hiện trực tiếp trên cửa sổ Data View Thực hiện khai báo các biến trong cửa sổ Variable View sau đó nhập số liệu cho các biến trong cửa sổ Data View
+ Để đọc dữ liệu từ file Excel ta vào File → Open → Data…→ Chọn all file →
Chọn file dữ liệu cần sử dụng Ngoài ra SPSS còn cho phép sao chép dữ liệu trực tiếp
từ Excel bằng lệnh Copy/Paste
* Lưu ý: dữ liệu đưa vào SPSS nên là số hoặc ký tự không dấu, không khoảng trắng để tránh lỗi Để SPSS có thể mở được file thì tên file và tên đường dẫn đến file
đều phải là ký tự tiếng Anh hoặc tiếng Việt không dấu
2 Các chức năng cơ bản của SPSS
2.1 Tạo biến mới từ các biến sẵn có
SPSS cung cấp nhiều tính năng để tạo biến mới trong Menu Transform, trong
đó thường dùng nhất là:
+ Compute Variable…: dùng để tạo một biến mới từ các biến đã có sẵn VD: có
thể tạo thêm một biến “điểm hệ số 2” = 2* “điểm”
Trang 22+ Recode into Same Variables…: dùng để mã hóa lại giá trị của biến có sẵn và
thêm điều kiện lọc nếu cần Biến mới tạo ra sẽ thay thế biến cũ
+ Recode into Different Variables…: dùng để mã hóa lại giá trị của biến có sẵn
và thêm điều kiện lọc nếu cần Biến mới tạo sẽ độc lập với biến cũ
VD: Mã hóa biến Diemthi để tạo biến mới Xeploai
Hình 4 Mã hóa biến 1: Dùng để đặt tên và mô tả cho biến mới,
2: Dùng để mã hóa các giá trị của biến cũ,
3: Dùng để thêm điều kiện lọc cho biến mới
Chọn Old and New Values… để mã hóa biến Xeploai với điều kiện mã hóa như
sau:
Hình 5 Mã hóa biến Xeploai
Trang 23Kết quả sẽ xuất ra biến mới Xeploai với các giá trị 1, 2, 3, 4, 5 lọc theo các giá trị của biến Diemthi Sau khi có biến mới ta có thể tiếp tục vào cửa sổ Variable View
→ Values để mã hóa tiếp thành các bậc xếp hạng A, B, C, D, F nếu cần
2.2 Thống kê mô tả
Thống kê mô tả gồm các chức năng tính toán cơ bản như tính tần suất, giá trị
trung bình, phương sai, độ lệch chuẩn,… Các chức năng thống kê mô tả được SPSS cung cấp trong Menu Analyze → Descriptive Statistics Để VD cho các chức năng
thống kê chúng ta xét cơ sở dữ liệu là số liệu thống kê về lớp thực nghiệm và lớp đối chiếu được khảo sát trong luận văn Thạc sĩ Khoa học giáo dục của các tác giả: Hoàng
Thị Hạnh (2016) “Vận dụng mô hình PEER INSTRUCTION trong dạy học một số
kiến thức chương “Chất khí” – Vật lý 10”[7]
Hình 6 Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu
Trang 24Trong đó các lệnh thường dùng là:
* Frequencies…: Tính tần suất
Hình 7 Tính tần suất biến Diemthi
Để lập bảng tần suất ta chọn lệnh Frequencies… → chuyển biến cần tính vào ô Variable(s) → OK Ngoài ra có thể sử dụng các lệnh bên phải để thêm các yêu cầu
cho phép toán, các lệnh thường sử dụng như sau:
+ Lệnh Statistics để tính thêm các tham số thống kê như giá trị trung bình,
phương sai, độ lệch chuẩn, độ nhọn, giá trị lớn nhất, nhỏ nhất, khoảng biến thiên, tính đối xứng,… Để tính các thông số này, chúng ta chọn lệnh và tích vào các thông số muốn tính
+ Lệnh Charts để vẽ đồ thị biểu diễn tần suất của các giá trị trong biến đã lựa
chọn, có nhiều dạng đồ thì như cột, tròn, đường Để sử dụng ta chọn lệnh và chọn loại đồ thị cần vẽ
Kết quả:
Trang 25Hình 8 Kết quả tính tần số biến Diemthi
* Descriptives…: Tính các tham số thống kê mô tả như: giá trị trung bình,
phương sai, độ lệch chuẩn, độ nhọn, giá trị lớn nhất, nhỏ nhất, khoảng biến thiên, tính đối xứng,…
Để sử dụng ta chọn lệnh Descriptives → chuyển biến cần mô tả vào ô Variable(s) → chọn Options để tùy chọn các giá trị cần tính → Continue → OK để
phần mềm bắt đầu tính toán
Hình 9 Các tùy chọn trong lệnh Options của Descriptives
Trang 26Kết quả mô tả biến Diemthi
Descriptive Statistics
Statistic Statistic Statistic Statistic Statistic Std Error Statistic Statistic
Valid N (listwise) 89
Bảng 1 Thống kê mô tả biến Diemthi
* Crosstabs: Tạo bảng chéo hai biến (phân tích hai biến)
Để tạo bảng chéo hai biến chúng ta chọn lệnh Crosstabs → chuyển biến vào ô Row và Column để tạo bảng chéo Lưu ý có thể chọn nhiều biến nhưng một bảng sẽ
chỉ gồm 2 biến phụ thuộc nhau Có thể tích chọn Display clustered bar charts để tạo
đồ thị dạng cột cho bảng
VD: Tạo bảng chéo hai biến Lop và biến Xeploai vừa tạo ở phần trước
Hình 10 Tạo bảng chéo hai biến
Trang 27Bảng 2 Bảng chéo Xeploai và Lop
Hình 11 Đồ thị bảng chéo Xeploai và Lop
Trang 282.3 Tạo bảng tương quan nhiều chiều
SPSS cung cấp công cụ để tạo bảng tương quan giữa các biến có tương quan với
nhau trong Menu Analyze → Tables Để tạo bảng ta chọn lệnh Custom Tables → kéo
các biến vào ô Rows và Columns → OK để tạo bảng mong muốn
VD: Sử dụng cơ sở dữ liệu về lớp đối chiếu và lớp thực nghiệm để tạo bảng
tương quan giữa biến Xeploai với Gioitinh của các học sinh trong hai Lop
Hình 12 Tạo bảng nhiều chiều
Trang 29So sánh trung bình là một công để phân tích số liệu có liên quan đến so sánh
điểm trước và sau hoặc so sánh điểm giữa các nhóm học sinh SPSS cũng cung cấp những công cụ so sánh trung trong Menu Analyze → Compare Means Trong công
cụ này chúng ta cũng xét các VD dựa trên cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu đã nêu ở trên Các chức năng thường được sử dụng là:
* Means: Tính giá trị trung bình của một biến định lượng theo một biến định
tính
Để tính giá trị trung bình của một biến định lượng theo một biến định tính chúng
ta sử dụng chức năng Means của SPSS Chọn lệnh Means trong Menu Analyze →
Trang 30Hình 13 Tính giá trị trung bình theo biến định tính Kết quả:
Sử dụng khi so sánh giá trị trung bình của hai nhóm tổng thể riêng biệt nhưng
có sự tương quan theo cặp giữa các phần tử của hai nhóm, thường được sử dụng để khảo sát sự thay đổi của một nhóm đối tượng sau một thời gian, hoặc sau khi có biến
cố gì xảy ra VD: So sánh sự thay đổi của điểm số các nhóm học sinh trước và sau khi áp dụng phương pháp dạy học mới
Điều kiện áp dụng là kích cỡ mẫu giữa hai nhóm đối tượng phải bằng nhau và giá trị của hai mẫu phải có phân bố chuẩn hoặc kích cỡ mẫu lớn để xem như xấp xỉ phân bố chuẩn
Kiểm định Paired-Sample T Test bắt đầu tính toán sự chênh lệch của từng cặp
rồi tính toán sự chênh lệch trung bình của hai mẫu Kết quả nhận được bằng 0 tức là hai mẫu không có sự khác biệt và khác 0 là hai mẫu có sự sai khác so với nhau
Các bước khi thực hiện phân tích Paired-Samples T-Test bao gồm:
+ Bước 1: Đặt giả thuyết Ho: “Không có sự khác nhau về trị hai trung bình tổng thể”, tức là khác biệt giữa hai trung bình là bằng 0
Trang 31+ Bước 2: Thực hiện kiểm định Paired-Samples T-Test
+ Bước 3: So sánh giá trị sig của kiểm định t được xác định ở bước 2 với 0.05
(mức ý nghĩa 5% = 0.05 | độ tin cậy 95%) Nếu sig > 0.05 thì ta chấp nhận giả thuyết
Ho nghĩa là trung bình hai tổng thể là bằng nhau, không có sự khác biệt Nếu sig <
0.05 thì ta bác bỏ giả thuyết Ho nghĩa là có khác biệt trung bình hai tổng thể
VD: Thực hiện so sánh cặp giữa điểm của các học sinh ở hai lớp thực nghiệm
và lớp đối chiếu Mỗi lớp lấy 43 học sinh và xem như lớp thực nghiệm chính là lớp đối chiếu sau khi áp dụng phương pháp dạy học mới
Với giả thuyết như vậy, chúng ta được bảng số liệu mới như sau:
Hình 14 Bảng số liệu so sánh cặp
Thực hiện kiểm định: chọn Paired-Sample T Test → đưa hai biến muốn kiểm
định trị trung bình vào khung Paired Variables → Chọn Options và nhập độ tin cậy
(sử dụng độ tin cậy 95% tương đương mức ý nghĩa là 5%) → OK
Trang 32Hình 15 Kiểm định Paired-Samples T-Test
Kết quả:
Paired Samples Statistics
Paired Samples Test
Deviation
Std
Error Mean
95% Confidence Interval of the Difference
+ Đầu tiên cần quan tâm bảng Paired Samples Test: giá trị Sig = 0,000 < 0,05
tức là chúng ta bác bỏ giả thiết Ho tức là có sự khác biệt giữa điểm của hai lớp
Trang 33+ Tiếp theo đánh giá bảng Paired Samples Statistics: dễ thấy điểm trung bình
của lớp thực nghiệm là 7,551 cao hơn so với 6,407 của lớp đối chiếu
+ Cuối cùng bảng Paired Samples Correlations: cho biết mối tương quan của
dữ liệu giữa hai nhóm khảo sát Giá trị sig = 0,855 > 0,05 cho thấy dữ liệu của hai
nhóm này có sự tương quan rất gần với nhau
* One-Sample T Test: Kiểm định trung bình tổng thể
Sử dụng để so sánh trung bình của tổng thể với một giá trị nào đó
VD: So sánh điểm của lớp thực nghiệm với điểm 7
Quy trình kiểm định:
+ Bước 1: Đặt ra giả thuyết Ho là điểm trung bình của lớp thực nghiệm là 7 điểm
+ Bước 2: Thực hiện kiểm định One-Sample T Test
+ Bước 3: So sánh giá trị sig của kiểm định t được xác định ở bước 2 với 0.05
(mức ý nghĩa 5% = 0.05 | độ tin cậy 95%) Nếu sig > 0.05 thì ta chấp nhận giả thuyết
Ho nghĩa là điểm trung bình tổng thể bằng 7 Nếu sig < 0.05 thì ta bác bỏ giả thuyết
Ho nghĩa là điểm trung bình tổng thể khác 7, từ đó dựa vào cột Mean Difference có
giá trị dương hay âm để kết luận điểm trung bình lớp hơn hay nhỏ hơn 7
Thực hiện kiểm định: Chọn lệnh One-Sample T Test → đưa các biến cần kiểm
định vào khung Test Variable → nhập giá trị muốn so sánh vào ô Test Value → OK
Hình 16 Kiểm định One-Sample T Test
Trang 34+ Đánh giá cột Mean Difference: điểm trung bình lớp thực nghiệm có hiệu số
dương và lớp hơn 7 Ngược lại điểm trung bình lớp đối chiếu có hiệu số âm và nhỏ hơn 7
Lưu ý ở đây One-Sample T Test đưa ra giá trị sig để chấp nhận hay bác bỏ giả
thuyết Ho không chỉ dựa vào điểm trung bình mà còn dựa vào các yếu tố về kích thước mẫu, độ lệch chuẩn, khoảng biến thiên, độ tin cậy,… Do đó, khi muốn so sánh
trung bình của biến với một giá trị nào đó, chúng ta cần tiến hành kiểm định
One-Sample T Test chứ không thể kết luận dựa vào giá trị trung bình của biến đó được
* Independent-Sample T Test: So sánh trung bình giữa hai nhóm
Independent-Sample T Test chỉ dùng để kiểm định sự khác biệt trung bình trong
trường hợp chỉ có hai biến định tính VD: lớp thực nghiệm, lớp đối chiếu; nam, nữ;
cô giáo A dạy, cô giáo B dạy;… Trong trường hợp ta có từ ba biến định tính trở lên
thì ta phải sử dụng kiểm định ANOVA nếu không sẽ rất mất thời gian khi đi so sánh
từng cặp biến định tính với nhau
Independent-Sample T Test dùng để kiểm định sự khác biệt trung bình của biến
định lượng với các giá trị khác nhau của biến định tính VD: Có sự khác nhau về điểm
số giữa lớp chuyên và lớp không chuyên hay không? Có sự khác nhau về mức độ chi tiêu giữa sinh viên thành phố với sinh viên các tỉnh hay không?
Trang 35VD: Thực hiện kiểm định trên cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu
với hai biến định tính là Lop gồm “lopthucnghiem” và “lopdoichieu” cùng biến định lượng là Diemthi với độ tin cậy 95%
Hình 17 So sánh trung bình giữa hai nhóm
Chọn Independent-Sample T Test → đưa biến định lượng vào ô Test Variable
và đưa biến định tính và ô Grouping Variable → chọn Define Groups… để phân
nhóm giá trị (với giá trị của lopthucnghiem là 1 và giá trị của lopdoichieu là 2 đã mã
hóa ban đầu) → Continue → OK
Hình 18 Phân nhóm giá trị so sánh trung bình giữa hai nhóm
Trang 36Independent Samples Test
Levene's Test for Equality of Variances
t-test for Equality of Means
(2-tailed)
Mean Difference
Std Error Difference
95% Confidence Interval of the Difference Lower Upper
t-test (hàng đầu tiên Equal variances assumed):
+ sig T-test < 0,05 : kết luận có sự khác biệt về điểm số của hai lớp
+ sig T-test 0,05 : kết luận không có sự khác biệt về điểm số của hai lớp
Nếu giá trị Sig Levene's Test lớn hơn hoặc bằng 0,05 thì phương sai giữa hai lớp không có sự khác nhau nhiều Tiếp tục quan sát giá trị Sig (2-tailed) ở cột t-test (hàng thứ 2 Equal variances not assumed):
+ sig T-test < 0,05 : kết luận có sự khác biệt về điểm số của hai lớp
+ sig T-test 0,05 : kết luận không có sự khác biệt về điểm số của hai lớp
Trang 37* One-Way ANOVA: Phân tích phương sai một chiều (kiểm định ANOVA)
dùng khi có nhiều nhóm cần so sánh
Kiểm định One-Way ANOVA cũng dùng để kiểm định trung bình giống như kiểm định Independent-Sample T Test ở trên Tuy nhiên với One-Way ANOVA chúng
ta có thể so sánh trung bình về một tiêu chí nào đó với hai hay nhiều đối tượng nghiên
cứu chứ không bó buộc trong hai đối tượng như Independent-Sample T Test
VD: Có sự khác nhau về trường học giữa các học sinh có số điểm thi tốt nghiệp khác nhau hay không, có sự khác nhau giữa giáo viên giảng dạy giữa các học sinh đạt mức điểm thi khác nhau hay không
Ở chức năng này chúng ta sử dụng cơ sở dữ liệu về mức tiêu thụ xăng của các
máy công nghiệp Dữ liệu được lấy từ bài tập Phân tích dữ liệu nghiên cứu với SPSS
của Khoa Toán – Thống kê Đại học Đại học Kinh tế TP Hồ Chí Minh (EUH)[1] Số liệu cụ thể như sau:
Hình 19 Cơ sở dữ liệu mức tiêu thụ xăng VD: Sử dụng cơ sở dữ liệu trên hãy so sánh mức tiêu thụ xăng giữa các máy động cơ có số cylinder khác nhau với độ tin cậy 95%
Theo đó hai biến cần quan tâm là ttxang (mức tiêu thụ xăng) và may (số cylinder
trong máy) Ở ví dụ này biến định lượng là mức tiêu thụ xăng, còn biến định tính là
số cylinder gồm năm giá trị là 3, 4, 5, 6, 8 Vậy ở đây để kiểm định giá trị trung bình
giữa năm yếu tố định tính này ta không thể sử dụng kiểm định Independent-Sample
T Test được vì sẽ rất dài dòng phức tạp khi phải đi so sánh từng cặp giá trị định tính
với nhau Thay vào đó kiểm định One-Way ANOVA là phương án phù hợp hơn
Trang 38Thực hiện kiểm định:
Chọn lệnh One-Way ANOVA → đưa biến định lượng vào ô Dependent List →
đưa biến định tính vào ô Factor → Chọn Options và tích chọn hai mục Homogeneity
of variance test và Welch → Continue → OK
Hình 20 Kiểm định One-Way ANOVA
Trang 39Kết quả:
Test of Homogeneity of Variances
muc tieu thu xang (km/lit)
ANOVA
muc tieu thu xang (km/lit)
Robust Tests of Equality of Means
muc tieu thu xang (km/lit)
Bảng 8 Kết quả kiểm định One-Way ANOVA
Đánh giá kết quả:
Quy trình phân tích One-Way ANOVA được thực hiện như sau:
Hình 21 Đánh giá kết quả kiểm định One-Way ANOVA[25][18]
Khi phương sai của các nhóm giá trị không đồng nhất thì phải sử dụng kiểm
định Welch để đánh giá kiểm định trung bình Với kết quả VD trên Sig Levene
Statistic = 0.009 < 0.05 nghĩa là phương sai giữa các nhóm giá trị không đồng nhất
nên sử dụng kết quả của kiểm định Welch Quan sát Sig Welch = 0.008 < 0.05, kết
luận có sự khác biệt trung bình giữa các biến định lượng
Trang 402.5 Phân tích tương quan
Trước khi xem xét phân tích tương quan chúng ta cùng tìm hiểu qua về hai chỉ
số rất quan trọng trong phân tích thống kê là Reliability (Độ tin cậy) và Validity (Độ chuẩn xác)
+ Reliability (Độ tin cậy) là độ ổn định của thang đo với các kết quả sai biệt không quá lớn trong một mẫu khảo sát đủ lớn Khi thực hiện khảo sát với nhiều biến quan sát (biến độc lập) để đánh giá một biến tổng (biến phụ thuộc) thì độ ổn định trong các kết quả thu được giữa các biến quan sát là vô cùng quan trọng Nó cho các nhà nghiên cứu biết được thang đo của họ có độ hiệu quả và độ tin cậy cao nếu không
có sự sai khác lớn giữa các đáp án Chỉ số này được đánh giá thông qua hệ số
Cronbach’s Alpha sẽ được trình bày kỹ hơn ở dưới
+ Validity (Độ chuẩn xác) là độ hội tụ các kết quả khảo sát của các biến quan sát với biến tổng cần đánh giá Nói cách khác chính là độ tương quan giữa các biến quan sát với biến tổng nhằm chỉ ra biến quan sát có thực sự đang đánh giá đúng biến tổng Như vậy nếu các biến quan sát đều có mối tương quan với biến tổng thì thang
đo có độ chuẩn xác cao Ngược lại biến quan sát không có tương quan với biến tổng thì ta cần loại bỏ biến quan sát đó Chỉ số này được đánh giá thông qua phân tích
tương quan Pearson về độ tương quan giữa các biến quan sát với biến tổng
+ VD: Một ví dụ đơn giản để thấy được sự khác nhau và tầm quan trọng của hai thông số này trong phân tích thống kê như sau: để đánh giá mức độ hiệu quả của phương pháp dạy học tích cực vào việc nâng cao kiến thức và kỹ năng cho học sinh, một nhà nghiên cứu đưa ra các câu hỏi cho các biến quan sát như sau: Học sinh có hài lòng về giáo viên giảng dạy? Thời gian học sinh tự học ở nhà? Học sinh thích môn học nào nhất? Giả sử kết quả khảo sát trong 3 lớp học đều cho kết quả gần tương
tự nhau Từ đó ta có thể nhận xét độ ổn định của thang đo này là rất lớn dẫn đến hệ
số Cronbach’s Alpha cao Tuy nhiên các biến quan sát này chưa thể đánh giá được
biến tổng là mức độ hiện quả của phương pháp dạy học tích cực Chính vì thế chỉ số
tương quan giữa các biến quan sát với biến tổng trong phân tích tương quan Pearson
sẽ không cao Do đó để đánh giá một thang đó là chính xác và tin cậy để có thể đánh giá đúng về biến tổng thì cả hai chỉ số Reliability và Validity đều phải đạt mốc
Chính bởi tầm quan trọng của phân tích tương quan mà SPSS cũng cung cấp các công cụ phân tích tương quan trong Menu Analyze → Correlate, trong đó thường
dùng nhất là: