Sử dụng phần mềm sử lý số liệu SPSS và r trong nghiên cứu về khoa học giảng dạy vật lý

Một trong các phương pháp nghiên cứu trong khoa học giáo dục là Thống kê và sử dụng phần mềm xử lý số liệu thống kê.. Với các câu hỏi như trên, chúng tôi quyết định chọn đề tài “Sử dụng

Trang 1

KHOA VẬT LÝ

KIM VĂN THANH

KHÓA LUẬN TỐT NGHIỆP

SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU SPSS VÀ R TRONG NGHIÊN CỨU VỀ KHOA HỌC GIẢNG DẠY VẬT LÝ

Chuyên ngành: Sư phạm Vật lý

TP Hồ Chí Minh, năm 2020

Trang 2

TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH

KHOA VẬT LÝ

SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU SPSS VÀ R TRONG NGHIÊN CỨU VỀ KHOA HỌC GIẢNG DẠY VẬT LÝ

Người thực hiện: Kim Văn Thanh Người hướng dẫn khoa học: ThS Tô Thị Hoàng Lan

TP Hồ Chí Minh, năm 2020

Trang 3

LỜI CẢM ƠN

Trong suốt thời gian học tập và hoàn thành khóa luận tốt nghiệp, với sự

cố gắng nỗ lực của bản thân, tôi đã nhận được sự giúp đỡ, hướng dẫn tận tình của nhiều cá nhân và tập thể Cho phép tôi được tỏ lòng biết ơn và gửi lời cảm

ơn chân thành tới:

Ban Giám hiệu Trường Đại học Sư phạm Thành phố Hồ Chí Minh cùng toàn thể cán bộ quản lý và giảng viên của Trường nói chung và của Khoa Vật

lý nói riêng Với sự giúp đỡ, tạo điều kiện của nhà Trường, tôi đã có một môi trường thuận lợi để học tập, nghiên cứu và tiếp thu kiến thức cho bản thân Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc tới giảng viên hướng dẫn ThS

Tô Thị Hoàng Lan đã tận tình hướng dẫn, giúp đỡ, quan tâm và động viên tôi trong quá trình tìm hiểu và xây dựng khóa luận tốt nghiệp

Xin chân thành cảm ơn các tác giả của các tài liệu tham khảo mà tôi đã trích dẫn trong khóa luận của mình Đặc biệt là GS Nguyễn Văn Tuấn bởi những bài giảng cùng sự tư vấn, giải đáp các khó khăn, khúc mắc mà tôi gặp phải trong quá trình tìm hiểu về phần mềm R

Xin chân thành cảm ơn sự nhận xét và góp ý tận tình của ThS Lê Hải Mỹ Ngân, TS Phan Thị Ngọc Loan, cùng sự giúp đỡ của bạn Nguyễn Thị Thảo Trang đã giúp tôi hoàn thành sản phẩm cho khóa luận

Tôi xin chân thành cảm ơn bạn Phan Thanh Trà đã luôn đồng hành, giúp

đỡ, nhận xét và góp ý để giúp tôi hoàn thành khóa luận

Cuối cùng, nhân dịp hoàn thành khóa luận tốt nghiệp, cho phép tôi được gửi lời cảm ơn sâu sắc tới gia đình, người thân cùng bạn bè đã hỗ trợ, động viên, giúp đỡ và tạo điều kiện thuận lợi cho tôi vượt qua mọi khó khăn trong quá trình học tập kiến thức, tìm hiểu và xây dựng khóa luận tốt nghiệp này.

TP Hồ Chí Minh, tháng 06 năm 2020

Tác giả

Kim Văn Thanh

Trang 4

DANH MỤC CÁC TỪ VIẾT TẮT

Ký hiệu Ý nghĩa XSTK Xác suất thống kê

Trang 5

MỤC LỤC

LỜI CẢM ƠN i

DANH MỤC CÁC TỪ VIẾT TẮT ii

MỤC LỤC iii

DANH MỤC BẢNG BIỂU 1

DANH MỤC HÌNH ẢNH 2

PHẦN MỞ ĐẦU 5

1 Lý do chọn đề tài 5

2 Tổng quan nghiên cứu 5

3 Định hướng nghiên cứu của đề tài 8

3.1 Mục tiêu đề tài 8

3.2 Câu hỏi nghiên cứu 8

4 Phương pháp, đối tượng nghiên cứu 8

4.1 Phương pháp nghiên cứu 8

4.2 Đối tượng nghiên cứu 9

5 Cấu trúc khóa luận 9

CHƯƠNG 1 SỬ DỤNG PHẦN MỀM SPSS 11

1 Giới thiệu phần mềm SPSS 11

1.1 Lịch sử hình thành và phát triển 11

1.2 Khả năng của SPSS 11

1.3 Giao diện 12

1.4 Khai báo biến 12

1.5 Nhập dữ liệu 13

2 Các chức năng cơ bản của SPSS 14

2.1 Tạo biến mới từ các biến sẵn có 14

2.2 Thống kê mô tả 16

2.3 Tạo bảng tương quan nhiều chiều 21

2.4 So sánh trung bình 22

2.5 Phân tích tương quan 33

2.6 Kiểm định độ tin cậy của thang đo 36

Trang 6

2.7 Phân tích hồi quy 39

2.8 Biểu đồ 46

CHƯƠNG 2 SỬ DỤNG PHẦN MỀM R 48

1 Giới thiệu phần mềm R 48

1.1 Lịch sử hình thành và phát triển 48

1.2 Khả năng của R 48

1.3 Giao diện 49

1.4 Dẫn nhập 51

1.5 Nhập dữ liệu 54

2 Các chức năng cơ bản của R 58

2.1 Tạo biến mới từ các biến sẵn có 58

2.2 Thống kê mô tả 61

2.3 So sánh trung bình 66

2.4 Phân tích tương quan 75

2.5 Kiểm định độ tin cậy của thang đo 77

2.6 Phân tích hồi quy 79

2.7 Biểu đồ 84

3 Các lỗi thường gặp trong sử dụng R và RStudio 85

3.1 Lỗi đọc file 85

3.2 Lỗi không tìm thấy dataset, không tìm thấy lệnh 85

3.3 Lỗi trùng tên biến 85

4 Tổng kết các lệnh thường dùng trong R 85

CHƯƠNG 3 ỨNG DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU PHỤC VỤ NGHIÊN CỨU KHOA HỌC GIẢNG DẠY VẬT LÝ 89

1 So sánh phần mềm SPSS và R 89

1.1 Giống nhau 89

1.2 Khác nhau 89

2 Ưu và nhược điểm của phần mềm SPSS và R 90

2.1 Ưu và nhược điểm của phần mềm SPSS 90

2.2 Ưu và nhược điểm của phần mềm R 91

3 Ứng dụng phần mềm SPSS và R vào các nghiên cứu Khoa học giảng dạy Vật lý 92

KẾT LUẬN VÀ KIẾN NGHỊ 94

Trang 7

TÀI LIỆU THAM KHẢO 97 PHỤ LỤC 99

Trang 8

DANH MỤC BẢNG BIỂU

Bảng 1 Thống kê mô tả biến Diemthi 19

Bảng 2 Bảng chéo Xeploai và Lop 20

Bảng 3 Bảng tương quan giữa Xeploai với Gioitinh và Lop 22

Bảng 4 Kết quả tính giá trị trung bình theo biến định tính 23

Bảng 5 Kết quả kiểm định Paired-Samples T-Test 25

Bảng 6 Kết quả kiểm định One-Sample T Test 27

Bảng 7 Kết quả so sánh trung bình giữa hai nhóm 29

Bảng 8 Kết quả kiểm định One-Way ANOVA 32

Bảng 9 Kết quả phân tích tương quan đơn 35

Bảng 10 Đánh giá hệ số Cronbach’s Alpha 39

Bảng 11 Bảng Model Summary 42

Bảng 12 Bảng ANOVA 43

Bảng 13 Bảng Coecients 44

Bảng 14 Tổng hợp các lệnh cơ bản thường dùng trong R 88

Trang 9

DANH MỤC HÌNH ẢNH

Hình 1 Giao diện làm việc của SPSS 12

Hình 2 Cửa sổ khai báo biến 13

Hình 3 Nhập dữ liệu vào SPSS 14

Hình 4 Mã hóa biến 15

Hình 5 Mã hóa biến Xeploai 15

Hình 6 Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu 16

Hình 7 Tính tần suất biến Diemthi 17

Hình 8 Kết quả tính tần số biến Diemthi 18

Hình 9 Các tùy chọn trong lệnh Options của Descriptives 18

Hình 10 Tạo bảng chéo hai biến 19

Hình 11 Đồ thị bảng chéo Xeploai và Lop 20

Hình 12 Tạo bảng nhiều chiều 21

Hình 13 Tính giá trị trung bình theo biến định tính 23

Hình 14 Bảng số liệu so sánh cặp 24

Hình 15 Kiểm định Paired-Samples T-Test 25

Hình 16 Kiểm định One-Sample T Test 26

Hình 17 So sánh trung bình giữa hai nhóm 28

Hình 18 Phân nhóm giá trị so sánh trung bình giữa hai nhóm 28

Hình 19 Cơ sở dữ liệu mức tiêu thụ xăng 30

Hình 20 Kiểm định One-Way ANOVA 31

Hình 21 Đánh giá kết quả kiểm định One-Way ANOVA 32

Hình 22 Phân tích tương quan đơn 34

Hình 23 Đánh giá hệ số Cronbach’s Alpha 38

Hình 24 Bảng số liệu phân tích hồi quy tuyến tính 40

Hình 25 Phân tích hồi quy tuyến tính bội 40

Hình 26 Cài đặt thông số phân tích 41

Trang 10

Hình 27 Cài đặt biểu đồ kiểm tra giả thiết hồi quy 41

Hình 28 Bảng ý nghĩa giá trị Durbin-Watson 43

Hình 29 Đồ thị Histogram 45

Hình 30 Đồ thị Normal P-P Plot 45

Hình 31 Đồ thị Scatter Plot 46

Hình 32 Vẽ đồ thị với SPSS 47

Hình 33 Giao diện sử dụng của R 49

Hình 34 Giao diện sử dụng của RStudio 50

Hình 35 Cài đặt Packages trực tiếp cho R 53

Hình 36 Cài packages tự động với RStudio 54

Hình 37 Hợp nhất các biến thành dataset 55

Hình 38 Nhập dữ liệu trực tiếp 56

Hình 39 Đọc file vào RStudio 57

Hình 40 Xem trước dữ liệu trước khi đọc 57

Hình 41 Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu 58

Hình 43 Tạo biến mới đơn giản 59

Hình 44 Lệnh mã hóa biến Xeploai 60

Hình 45 Mã hóa biến Xeploai 60

Hình 46 Trích dữ liệu từ dataset cũ 61

Hình 47 Dữ liệu lớp thực nghiệm trích từ dataset Dulieu 61

Hình 48 Thông báo package và dataset sẽ làm việc 62

Hình 49 Bảng phân tích tần số biến Diem 62

Hình 50 Lệnh vẽ đồ thị phân bố tần số 63

Hình 51 Đồ thị phân bố tần số biến Diem 63

Hình 52 Lệnh vẽ biểu đồ beeswarm 64

Hình 53 Biểu đồ phân bố điểm theo từng lớp 64

Hình 54 Bảng chéo phân tích hai biến 66

Trang 11

Hình 55 Phân tích tham số thống kê theo nhóm 67

Hình 56 Dữ liệu so sánh cặp 68

Hình 57 Kiểm định Paired T Test 69

Hình 58 Lệnh kiểm định trung bình tổng thể điểm lớp thực nghiệm 70

Hình 59 Lệnh kiểm định trung bình tổng thể điểm lớp đối chiếu 70

Hình 60 Kiểm định trung bình tổng thể điểm lớp thực nghiệm 71

Hình 61 Kiểm định trung bình tổng thể điểm lớp đối chiếu 71

Hình 62 So sánh phương sai giữa điểm của hai nhóm lớp 72

Hình 63 Kiểm định Two Sample T Test giữa điểm của hai nhóm lớp 73

Hình 65 Kiểm định ANOVA 74

Hình 66 Tương quan giữa mức tiêu thụ xăng và công suất động cơ 76

Hình 67 Tương quan giữa mức tiêu thụ xăng và khối lượng xe 76

Hình 68 Tương quan giữa mức tiêu thụ xăng và số cylinder 77

Hình 69 Tương quan giữa mức tiêu thụ xăng và dung tích động cơ 77

Hình 70 Hệ số Cronbach's Alpha của cơ sở dữ liệu mức tiêu thụ xăng 78

Hình 71 Phân tính hồi quy tuyến tính với R 79

Hình 72 Biểu đồ Histogram về phân bố phần dư 81

Hình 73 Biểu đồ Normal Q-Q Plot về phân bố phần dư 81

Hình 74 Biểu đồ studentized residuals về phương sai và giá trị tiên lượng 82

Hình 75 Biểu đồ Component + Residual Plot về mối tương quan tuyến tính 83 Hình 76 Kiểm tra giả định độc lập durbinWatsonTest 84

Trang 12

PHẦN MỞ ĐẦU

1 Lý do chọn đề tài

Ngày 26/12/2018, Bộ Giáo dục và Đào tạo đã chính thức công bố chương trình giáo dục phổ thông mới bao gồm chương trình giáo dục tổng thể và chương trình giáo dục từng bộ môn Đây là bước đổi mới toàn điện trên quy mô cả nước về chương trình dạy và học ở phổ thông Chương trình giáo dục phổ thông mới sẽ tập trung phát triển về phẩm chất và năng lực cho các em học sinh Qua đó, chương trình giáo dục phổ thông mới tập trung trả lời câu hỏi: “Học xong chương trình, học sinh làm được những gì?” Việc đổi mới chương trình cũng đồng thời đặt ra yêu cầu và thách thức đối với đội ngũ giáo viên trong việc đổi mới phương pháp dạy học và cách thức tổ chức dạy học nhằm phát triển tối đa phẩm chất và năng lực cho từng đối tượng học sinh

Trong bối cảnh có rất nhiều thay đổi và mới mẻ về tổ chức dạy học các môn học

ở phổ thông nói chung và Vật lý nói riêng, cần có những nghiên cứu khoa học trong lĩnh vực này trở nên là một việc cần thiết và cũng là cơ hội để mở ra nhiều hướng nghiên cứu trong lĩnh vực khoa học giáo dục mà môn Vật lý là một phần trong đó Một trong các phương pháp nghiên cứu trong khoa học giáo dục là Thống kê và sử dụng phần mềm xử lý số liệu thống kê Hiện nay, các phần mềm thống kê cũng rất phát triển với nhiều phần mềm khác nhau có thể tính toán và xử lý lượng lớn dữ liệu Tuy

nhiên, được sử dụng rộng rãi trên thị trường có thể kể đến hai phần mềm là SPSS và R (cùng các gói package của R) Cả hai phần mềm này có đáp ứng được phần lớn nhu cầu

xử lý số liệu trong nghiên cứu khoa học giáo dục hay không? Mỗi phần mềm có ưu điểm

và nhược điểm nào, đặc biệt với đối tượng sử dụng là sinh viên, học viên cao học hoặc giáo viên phổ thông? Cách sử dụng mỗi phần mềm này ra sao và để cho hiệu quả? Với

các câu hỏi như trên, chúng tôi quyết định chọn đề tài “Sử dụng phần mềm xử lý số

liệu SPSS và R trong nghiên cứu về khoa học giảng dạy Vật lý” để làm đề tài nghiên

cứu

2 Tổng quan nghiên cứu

Các đề tài nghiên cứu về khoa học dạy học Vật lý đều ít nhiều sử dụng Thống

kê Những mô thức phổ biến là sử dụng thống kế mô tả, so sánh trung bình mẫu, kiểm định giả thuyết thống kê Có thể thấy rõ mô thức này trong luận văn Thạc sĩ Khoa

học giáo dục của tác giả Hà Thị Trúc Linh (2016) “Xây dựng và sử dụng hệ thống

câu hỏi TNKQ theo định hướng phát triển năng lực chuyên biệt và dạy học chương

“Cảm ứng điện từ” – Vật lý 11”[11]; Banhnalak Bosanthay (2017) “Tổ chức dạy

Trang 13

học chương “Dòng điện một chiều” – Vật lý lớp 9 THCS ở nước CHDCND Lào theo hướng phát huy tính tích cực, tự lực học tập của học sinh”[3]; Bùi Xuân Dương

(2017) “Tổ chức dạy học giải quyết vấn đề một số kiến thức của chương “Các định

luật bảo toàn” – Vật lý 10 với sự hỗ trợ của phần mềm Crocodile PHYsics”[5]

Những số liệu này cần thiết cho việc nghiên cứu mẫu can thiệp và mẫu đối chứng Các tham số được sử dụng như điểm trung bình, phương sai, độ lệch chuẩn, tần số điểm, tần số tích lũy,… của điểm các lớp trước và sau khi áp dụng phương pháp mới Các tác giả kết so sánh kết quả, vẽ biểu đồ từ đó kết luận độ hiệu quả của phương pháp mới được nêu ra

Nếu chỉ dừng ở thống kê mô tả thì việc xử lý số liệu khá đơn giản, có thể tính bằng tay hoặc dùng phần mềm Excel Tuy nhiên, để xử lý số liệu với các bước phức tạp hơn thì các đề tài nghiên cứu cần đến phần mềm chuyên dụng xử lý số liệu

Trước tiên, xét đến phần mềm SPSS SPSS là một phần mềm thương mại có phí

bản quyền khoảng 99$/tháng Đó là một khó khăn với sinh viên, học viên cao học hay giáo viên phổ thông nếu muốn sử dụng phần mềm này cho nghiên cứu của mình

Tuy nhiên, tính năng của SPSS giúp việc sử lý số liệu phức tạp được tiến hành dễ

dàng và có mức độ sâu hơn là thống kê mô tả Trong luận văn Thạc sĩ Khoa học giáo

dục của các tác giả: Hoàng Thị Hạnh (2016) “Vận dụng mô hình PEER

INSTRUCTION trong dạy học một số kiến thức chương “Chất khí” – Vật lý 10”[7],

tác giả đã giới thiệu mô hình Peer Instruction và phân tích ưu điểm, hạn chế và những thuận lợi, khó khăn khi áp dụng mô hình vào dạy học Vật lý phổ thông ở Việt Nam Dựa vào đó tác giả đã phân tích kiến thức và xây dựng tiến trình dạy học chương

“Chất khí” – Vật lý 10 theo mô hình Peer Instruction Từ đó tổ chức thực nghiệm sư

phạm và khảo sát số liệu đánh giá kết quả của mô hình Tác giả đã dùng SPSS để tính

toán các tham số của thống kê mô tả như điểm trung bình, phương sai, độ lệch chuẩn, tần suất và tần suất tích lũy, … Ngoài ra với số liệu khảo sát là điểm của hai lớp gồm lớp thực nghiệm và lớp đối chiếu tác giả đã sử dụng kiểm định Independent-Sample

T Test để so sánh trung bình giữa hai nhóm Từ đó thấy được sự khác nhau về ý nghĩa thống kê giữa điểm của lớp thực nghiệm và điểm của lớp đối chiếu Điểm trung bình của lớp thực nghiệm cao hơn so với lớp đối chiếu nên có thể thấy được độ hiệu quả của việc áp dụng mô hình Peer Instruction vào dạy học Vật lý phổ thông ở nước ta Thao tác này sẽ khó khăn hơn nếu không sử dụng một phần mềm chuyên dụng cho việc xử lý số liệu

Trang 14

Ngoài SPSSI, có thể sử dụng phần mềm Transana để phân tích các đoạn phim

trong quá trình giảng dạy Phần mềm Transana được sử dụng trong luận văn Thạc sĩ

Khoa học giáo dục của tác giả Đinh Vũ Nguyên Chương (2017) “Tổ chức dạy học

chủ đề tích hợp “Năng lượng” cho sinh viên chuyên ngành kỹ thuật”[4] Trong đó

phần mềm Transana được sử dụng để phân tích các clip được quay lại trong quá trình giảng dạy bằng phương pháp mới Từ đó đánh giá được sự tích cực làm việc, hoạt động của học sinh được nâng cao

Bên cạnh đó, cũng có những đề tài không sử dụng phân tích thống kê để đánh giá kết quả mà thay vào đó, tác giả chấm điểm sản phẩm của học sinh và thu thập những nhận xét của học sinh, giáo viên và các chuyên gia để kết luận độ hiệu quả của

mô hình Ví dụ như luận văn Thạc sĩ Khoa học giáo dục của tác giả: Đàm Việt Thắng

(2017) “Tổ chức hoạt động ngoại khóa về ứng dụng kỹ thuật chương “Cơ học chất

lưu” – Vật lý 10 theo hướng phát huy tính tích cực và phát triển năng lực sáng tạo của học sinh”[15]; luận văn tốt nghiệp của tác giả Nguyễn Thanh Huy (2017) “Xây dựng cơ sở học liệu cho việc dạy và học học phần thiên văn và quang học trong môn khoa học tự nhiên ở bậc tiểu học”[9] Phương pháp đánh giá này không thuyết phục

do đây chỉ là đánh giá trên một mẫu nhỏ và chưa đủ cơ sở để đánh giá độ hiệu quả của đề tài trên phạm vi quần thể

Như vậy, qua tìm hiểu và phân tích một vài luận văn, khóa luận về khoa học dạy học môn Vật lý được bảo vệ tại Khoa Vật lý trường Đại học Sư phạm Tp.HCM

trong khoảng 3 năm trở lại đây các tác giả có sử dụng SPSS và một số phần mềm khác

để xử lý số liệu Tuy nhiên trong phạm vi tìm hiểu, chúng tôi chưa ghi nhận đề tài

nào có sử dụng phần mềm R để xử lý số liệu

Trong khi sử dụng SPSS cần phải trả phí bản quyền, R là một phần mềm thống

kê miễn phí Tuy nhiên R có thể xem như là một ngôn ngữ thống kê vì người dùng phải lập trình với rất nhiều câu lệnh và nhiều gói Packages khá phức tạp Điều này

có lẽ là một nguyên nhân dù được sử dụng miễn phí nhưng không nhiều đề tài dành

cho sinh viên, học viên cao học sử dụng, mặc dù tìm hướng dẫn sử dụng R không khó Trong các hướng dẫn chi tiết về R, có thể kể đến sách của Giáo sư Nguyễn Văn Tuấn (2014) “Phân tích dữ liệu với R”[14] Trong quyển sách này, tác giả đã trình bày rất chi tiết về các chức năng và hướng dẫn sử dụng phần mềm R để phân tích số

liệu Giáo sư đã trình bày rõ ràng và đầy đủ về cách sử dụng kèm theo các ví dụ cụ

thể về các chức năng của R trong sách Tuy nhiên, chính vì đầy đủ nên tài liệu khá

Trang 15

dài, lên đến 517 trang, phù hợp cho học tập và nghiên cứu với R nhưng lại không

thân thiện với một người mới bắt đầu dùng và chỉ dùng như một công cụ nghiên cứu Chính vì lẽ đó, trong khóa luận này chúng tôi sẽ trình bày cách sử dụng các chức năng quan trọng, cần thiết cho phân tích số liệu trong lĩnh vực Khoa học giáo dục nói

chung và Khoa học giảng dạy Vật lý nói riêng của phần mềm SPSS và R Một quyển

cẩm nang vừa phải là rất cần thiết cho những người dùng ban đầu Đồng thời chúng tôi cũng phân tích ưu và nhược điểm của từng phần mềm để người dùng có thể lựa chọn phần mềm nào phù hợp với bản thân

3 Định hướng nghiên cứu của đề tài

3.1 Mục tiêu đề tài

Phân tích hai phần mềm xử lý số liệu SPSS và R để phục vụ cho các nghiên cứu

về khoa học giảng dạy Vật lý và tạo ra một quyển cẩm nang sử dụng cho hai phần mềm này với các chức năng quan trọng và cơ bản nhất

3.1.1 Mục tiêu cụ thể

- Giới thiệu và phân tích ưu, nhược điểm của phần mềm SPSS

- Giới thiệu và phân tích ưu, nhược điểm của phần mềm R

- So sánh sự khác nhau giữa hai phần mềm SPSS và R

- Phân tích số liệu thực tế để đưa ra sự phù hợp của từng phần mềm với các đề tài nghiên cứu khác nhau về khoa học giảng dạy Vật lý

- Thiết kế cẩm nang hướng dẫn sử dụng

3.2 Câu hỏi nghiên cứu

- Sử dụng phần mềm SPSS và R trong xử lý số liệu nghiên cứu như thế nào?

- Ưu, nhược điểm của hai phần mềm SPSS và R là gì?

- Đâu là sự khác nhau giữa SPSS và R? Tại sao hai phần mềm này có thể tồn tại

song song với nhau trên trị trường mà không nghiêng hẳn về một phần mềm nào?

- Từng phần mềm SPSS và R phù hợp với đề tài nghiên cứu nào?

4 Phương pháp, đối tượng nghiên cứu

4.1 Phương pháp nghiên cứu

4.1.1 Phương pháp nghiên cứu lý luận

- Phân tích và nghiên cứu các tài liệu liên quan đến phần mềm SPSS và R

Trang 16

- Nghiên cứu các tài liệu về khoa học giảng dạy Vật lý

- Mô hình hóa các hệ thống số liệu thực tế

- Nghiên cứu các tài liệu về xử lý số liệu, các luận văn, luận án liên quan đến

xử lý số liệu và khoa học giảng dạy Vật lý

4.1.2 Phương pháp nghiên cứu thực tiễn

- Nghiên cứu các số liệu thực tiễn liên quan đến khoa học giảng dạy Vật lý

- Nghiên cứu việc xây dựng hướng xử lý và sử dụng phần mềm xử lý số liệu

SPSS và R để phân tích số liệu thực tế liên quan đến khoa học giảng dạy Vật lý

4.2 Đối tượng nghiên cứu

Hai phần mềm SPSS và R cùng số liệu của các đề tài nghiên cứu về khoa học

giảng dạy Vật lý

5 Cấu trúc khóa luận

Để đạt được mục tiêu đã đề ra, khóa luận sẽ nghiên cứu thực tế tình hình sử dụng phần mềm xử lý số liệu trong các nghiên cứu về khoa học giảng dạy Vật lý; đưa

ra ưu, nhược điểm của hai phần mềm SPSS và R; so sánh đặc điểm khác nhau giữa

hai phần mềm; rút ra nhận xét về sự phù hợp của từng phần mềm với các đối tượng nghiên cứu khác nhau trong lĩnh vực khoa học giảng dạy Vật lý Với các nhiệm vụ như trên khóa luận này được chia làm ba chương không kể phần mở đầu và kết luận

Chương 1: Sử dụng phần mềm SPSS

Trong chương này khóa luận sẽ giới thiệu phần mềm SPSS, và các chức năng

cơ bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý Song song

đó, khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên các số liệu thực tế

Chương 2: Sử dụng phần mềm R

Trong chương này khóa luận sẽ giới thiệu phần mềm R, và các chức năng cơ

bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý Song song đó, khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên các

số liệu thực tế

Chương 3: Ứng dụng phần mềm xử lý số liệu phục vụ nghiên cứu khoa học giảng dạy Vật lý

Trong chương này khóa luận sẽ tập trung vào việc đánh giá hai phần mềm SPSS

và R Từ kết quả thu được khi phân tích các VD với số liệu thực tế ở Chương 1 và

Trang 17

Chương 2 rút ra kết luận về ưu, nhược điểm của hai phần mềm này Qua đó trình bày

về những đặc điểm giống và khác nhau của hai phần mềm trên để trả lời câu hỏi tại sao hai phần mềm này lại cùng tồn tại song song với nhau mà không nghiêng hẳn về một phần mềm nào? Đồng thời đưa ra kết luận về sự phù hợp của từng phần mềm với các đối tượng sử dụng khác nhau, các đối tượng nghiên cứu khác nhau trong lĩnh vực khoa học giảng dạy Vật lý

Trang 18

CHƯƠNG 1 SỬ DỤNG PHẦN MỀM SPSS

1 Giới thiệu phần mềm SPSS

1.1 Lịch sử hình thành và phát triển

SPSS là một phần mềm phổ biết đã được xây dựng từ những năm 1968 và được

hoàn thiện dần theo thời gian

SPSS (viết tắt của Statistical Package for the Social Sciences) là một

chương trình máy tính phục vụ cho công tác phân tích thống kê SPSS được

sử dụng rộng rãi trong công tác thống kê kinh tế - xã hội và được sử dụng rộng rãi trong kinh tế lượng.[2]

Thế hệ đầu tiên của SPSS được đưa ra từ những năm 1968 chuyên sử dụng cho các máy chủ ở Mỹ SPSS được sử dụng bởi các nhà nghiên cứu

thị trường, nghiên cứu y khoa, công ty điều tra, các nhà nghiên cứu giáo dục và những lĩnh vực khác Sau đó phần mềm không ngừng cải tiến và

nâng cao các tính năng của mình, ngày càng có nhiều thế hệ mới của SPSS

ra đời, với các tiện ích ngày càng phong phú, đa dạng hơn Thế hệ mới

nhất cho đến nay được xem là SPSS 22.0 được giới thiệu từ tháng 8 năm

2008, có cả phiên bản cho các hệ điều hành Microsoft Windows, Mac, và

Linux/ UNIX SPSS 22.0, nhiều chức năng đa dạng và linh hoạt nên được

sử dụng rộng rãi trong nhiều ngành khoa học khác nhau như: Xã hội học,

Y học, Nhân học, Tâm lý học, Kinh tế học, Marketing…[2]

1.2 Khả năng của SPSS

Phần mềm SPSS cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích

thống kê với giao diện thân thiện cho người dùng trong môi trường đồ hoạ, sử dụng các trình đơn mô tả và các hộp thoại đơn giản

Chức năng cơ bản của SPSS:

+ Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số liệu tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics)

+ Thống kê 2 biến số (Bivariate statistics): trung bình (Means), tương quan (bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests), kiểm định

sự tin cậy của thang đo bằng Cronbach Alpha phân tích tương quan, kiểm định trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh) bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing)

Trang 19

+ Dự báo (Prediction): Hồi quy (regression), phân tích nhân tố (Factor analysis), cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant)

1.3 Giao diện

Giao diện của SPSS trực quan và quen thuộc nhờ có nét tương đồng với các

phần mềm Office thường dùng, trong đó:

Hình 1 Giao diện làm việc của SPSS

1 Thanh menu chức năng,

2 Biểu tượng một số chức năng thông dụng,

3 Cột hiển thị tên các biến,

4 Số thứ tự các dòng,

5 Data View (cửa sổ nhập liệu và thể hiện dữ liệu) Variable View (cửa sổ khai

báo biến)

1.4 Khai báo biến

SPSS yêu cầu người sử dụng phải khai báo đầy đủ các biến trước khi thực hiện

các bước tính toán với dữ liệu Công việc này được thực hiện trong của sổ Variable

View, với:

Trang 20

Hình 2 Cửa sổ khai báo biến

+ Name: tên biên, ký tự liên tục, không có khoảng trắng,

+ Type: kiểu dữ liệu, số (numeric), chữ (string), ngày tháng (date), tiền tệ (dollar),…

+ Width: độ rộng kiểu dữ liệu, nêu type là string thì width là số ký tự tối đa, + Decimals: lượng số thập phân,

+ Label: nhãn biến (chú thích cho tên biến, là tên cột hiển thị ở bảng kết quả), + Values: giá trị mã hóa dữ liệu: ví dụ 1 là Nam, 2 là Nu,

+ Missing: khai báo giá trị khuyết (khai báo khi bản khảo sát có dữ liệu sai hoặc

không đúng cấu trúc), các giá trị này sẽ bị bỏ đi để tránh làm ảnh hướng tới kết quả,

+ Columns: độ rộng cột tên biến,

+ Align: vị trí hiển thị dữ liệu trong cột (căn lề),

+ Measure: loại thang đo dữ liệu:

• Scale (thang đo tỉ lệ): có thể cộng, trừ, nhân, chia,

• Ordinal (thang đo thứ bậc): có thể cộng, trừ nhưng hạn chế về nhân chia,

SPSS cung cấp nhiều công cụ nhập số liệu khảo sát rất tiện dụng, trong đó phổ

biến là nhập dữ liệu thủ công và nhập từ phần mềm Excel

Trang 21

Hình 3 Nhập dữ liệu vào SPSS + Nhập dữ liệu thủ công được thực hiện trực tiếp trên cửa sổ Data View Thực hiện khai báo các biến trong cửa sổ Variable View sau đó nhập số liệu cho các biến trong cửa sổ Data View

+ Để đọc dữ liệu từ file Excel ta vào File → Open → Data…→ Chọn all file →

Chọn file dữ liệu cần sử dụng Ngoài ra SPSS còn cho phép sao chép dữ liệu trực tiếp

từ Excel bằng lệnh Copy/Paste

* Lưu ý: dữ liệu đưa vào SPSS nên là số hoặc ký tự không dấu, không khoảng trắng để tránh lỗi Để SPSS có thể mở được file thì tên file và tên đường dẫn đến file

đều phải là ký tự tiếng Anh hoặc tiếng Việt không dấu

2 Các chức năng cơ bản của SPSS

2.1 Tạo biến mới từ các biến sẵn có

SPSS cung cấp nhiều tính năng để tạo biến mới trong Menu Transform, trong

đó thường dùng nhất là:

+ Compute Variable…: dùng để tạo một biến mới từ các biến đã có sẵn VD: có

thể tạo thêm một biến “điểm hệ số 2” = 2* “điểm”

Trang 22

+ Recode into Same Variables…: dùng để mã hóa lại giá trị của biến có sẵn và

thêm điều kiện lọc nếu cần Biến mới tạo ra sẽ thay thế biến cũ

+ Recode into Different Variables…: dùng để mã hóa lại giá trị của biến có sẵn

và thêm điều kiện lọc nếu cần Biến mới tạo sẽ độc lập với biến cũ

VD: Mã hóa biến Diemthi để tạo biến mới Xeploai

Hình 4 Mã hóa biến 1: Dùng để đặt tên và mô tả cho biến mới,

2: Dùng để mã hóa các giá trị của biến cũ,

3: Dùng để thêm điều kiện lọc cho biến mới

Chọn Old and New Values… để mã hóa biến Xeploai với điều kiện mã hóa như

sau:

Hình 5 Mã hóa biến Xeploai

Trang 23

Kết quả sẽ xuất ra biến mới Xeploai với các giá trị 1, 2, 3, 4, 5 lọc theo các giá trị của biến Diemthi Sau khi có biến mới ta có thể tiếp tục vào cửa sổ Variable View

→ Values để mã hóa tiếp thành các bậc xếp hạng A, B, C, D, F nếu cần

2.2 Thống kê mô tả

Thống kê mô tả gồm các chức năng tính toán cơ bản như tính tần suất, giá trị

trung bình, phương sai, độ lệch chuẩn,… Các chức năng thống kê mô tả được SPSS cung cấp trong Menu Analyze → Descriptive Statistics Để VD cho các chức năng

thống kê chúng ta xét cơ sở dữ liệu là số liệu thống kê về lớp thực nghiệm và lớp đối chiếu được khảo sát trong luận văn Thạc sĩ Khoa học giáo dục của các tác giả: Hoàng

Thị Hạnh (2016) “Vận dụng mô hình PEER INSTRUCTION trong dạy học một số

kiến thức chương “Chất khí” – Vật lý 10”[7]

Hình 6 Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu

Trang 24

Trong đó các lệnh thường dùng là:

* Frequencies…: Tính tần suất

Hình 7 Tính tần suất biến Diemthi

Để lập bảng tần suất ta chọn lệnh Frequencies… → chuyển biến cần tính vào ô Variable(s) → OK Ngoài ra có thể sử dụng các lệnh bên phải để thêm các yêu cầu

cho phép toán, các lệnh thường sử dụng như sau:

+ Lệnh Statistics để tính thêm các tham số thống kê như giá trị trung bình,

phương sai, độ lệch chuẩn, độ nhọn, giá trị lớn nhất, nhỏ nhất, khoảng biến thiên, tính đối xứng,… Để tính các thông số này, chúng ta chọn lệnh và tích vào các thông số muốn tính

+ Lệnh Charts để vẽ đồ thị biểu diễn tần suất của các giá trị trong biến đã lựa

chọn, có nhiều dạng đồ thì như cột, tròn, đường Để sử dụng ta chọn lệnh và chọn loại đồ thị cần vẽ

Kết quả:

Trang 25

Hình 8 Kết quả tính tần số biến Diemthi

* Descriptives…: Tính các tham số thống kê mô tả như: giá trị trung bình,

phương sai, độ lệch chuẩn, độ nhọn, giá trị lớn nhất, nhỏ nhất, khoảng biến thiên, tính đối xứng,…

Để sử dụng ta chọn lệnh Descriptives → chuyển biến cần mô tả vào ô Variable(s) → chọn Options để tùy chọn các giá trị cần tính → Continue → OK để

phần mềm bắt đầu tính toán

Hình 9 Các tùy chọn trong lệnh Options của Descriptives

Trang 26

Kết quả mô tả biến Diemthi

Descriptive Statistics

Statistic Statistic Statistic Statistic Statistic Std Error Statistic Statistic

Valid N (listwise) 89

Bảng 1 Thống kê mô tả biến Diemthi

* Crosstabs: Tạo bảng chéo hai biến (phân tích hai biến)

Để tạo bảng chéo hai biến chúng ta chọn lệnh Crosstabs → chuyển biến vào ô Row và Column để tạo bảng chéo Lưu ý có thể chọn nhiều biến nhưng một bảng sẽ

chỉ gồm 2 biến phụ thuộc nhau Có thể tích chọn Display clustered bar charts để tạo

đồ thị dạng cột cho bảng

VD: Tạo bảng chéo hai biến Lop và biến Xeploai vừa tạo ở phần trước

Hình 10 Tạo bảng chéo hai biến

Trang 27

Bảng 2 Bảng chéo Xeploai và Lop

Hình 11 Đồ thị bảng chéo Xeploai và Lop

Trang 28

2.3 Tạo bảng tương quan nhiều chiều

SPSS cung cấp công cụ để tạo bảng tương quan giữa các biến có tương quan với

nhau trong Menu Analyze → Tables Để tạo bảng ta chọn lệnh Custom Tables → kéo

các biến vào ô Rows và Columns → OK để tạo bảng mong muốn

VD: Sử dụng cơ sở dữ liệu về lớp đối chiếu và lớp thực nghiệm để tạo bảng

tương quan giữa biến Xeploai với Gioitinh của các học sinh trong hai Lop

Hình 12 Tạo bảng nhiều chiều

Trang 29

So sánh trung bình là một công để phân tích số liệu có liên quan đến so sánh

điểm trước và sau hoặc so sánh điểm giữa các nhóm học sinh SPSS cũng cung cấp những công cụ so sánh trung trong Menu Analyze → Compare Means Trong công

cụ này chúng ta cũng xét các VD dựa trên cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu đã nêu ở trên Các chức năng thường được sử dụng là:

* Means: Tính giá trị trung bình của một biến định lượng theo một biến định

tính

Để tính giá trị trung bình của một biến định lượng theo một biến định tính chúng

ta sử dụng chức năng Means của SPSS Chọn lệnh Means trong Menu Analyze →

Trang 30

Hình 13 Tính giá trị trung bình theo biến định tính Kết quả:

Sử dụng khi so sánh giá trị trung bình của hai nhóm tổng thể riêng biệt nhưng

có sự tương quan theo cặp giữa các phần tử của hai nhóm, thường được sử dụng để khảo sát sự thay đổi của một nhóm đối tượng sau một thời gian, hoặc sau khi có biến

cố gì xảy ra VD: So sánh sự thay đổi của điểm số các nhóm học sinh trước và sau khi áp dụng phương pháp dạy học mới

Điều kiện áp dụng là kích cỡ mẫu giữa hai nhóm đối tượng phải bằng nhau và giá trị của hai mẫu phải có phân bố chuẩn hoặc kích cỡ mẫu lớn để xem như xấp xỉ phân bố chuẩn

Kiểm định Paired-Sample T Test bắt đầu tính toán sự chênh lệch của từng cặp

rồi tính toán sự chênh lệch trung bình của hai mẫu Kết quả nhận được bằng 0 tức là hai mẫu không có sự khác biệt và khác 0 là hai mẫu có sự sai khác so với nhau

Các bước khi thực hiện phân tích Paired-Samples T-Test bao gồm:

+ Bước 1: Đặt giả thuyết Ho: “Không có sự khác nhau về trị hai trung bình tổng thể”, tức là khác biệt giữa hai trung bình là bằng 0

Trang 31

+ Bước 2: Thực hiện kiểm định Paired-Samples T-Test

+ Bước 3: So sánh giá trị sig của kiểm định t được xác định ở bước 2 với 0.05

(mức ý nghĩa 5% = 0.05 | độ tin cậy 95%) Nếu sig > 0.05 thì ta chấp nhận giả thuyết

Ho nghĩa là trung bình hai tổng thể là bằng nhau, không có sự khác biệt Nếu sig <

0.05 thì ta bác bỏ giả thuyết Ho nghĩa là có khác biệt trung bình hai tổng thể

VD: Thực hiện so sánh cặp giữa điểm của các học sinh ở hai lớp thực nghiệm

và lớp đối chiếu Mỗi lớp lấy 43 học sinh và xem như lớp thực nghiệm chính là lớp đối chiếu sau khi áp dụng phương pháp dạy học mới

Với giả thuyết như vậy, chúng ta được bảng số liệu mới như sau:

Hình 14 Bảng số liệu so sánh cặp

Thực hiện kiểm định: chọn Paired-Sample T Test → đưa hai biến muốn kiểm

định trị trung bình vào khung Paired Variables → Chọn Options và nhập độ tin cậy

(sử dụng độ tin cậy 95% tương đương mức ý nghĩa là 5%) → OK

Trang 32

Hình 15 Kiểm định Paired-Samples T-Test

Kết quả:

Paired Samples Statistics

Paired Samples Test

Deviation

Std

Error Mean

95% Confidence Interval of the Difference

+ Đầu tiên cần quan tâm bảng Paired Samples Test: giá trị Sig = 0,000 < 0,05

tức là chúng ta bác bỏ giả thiết Ho tức là có sự khác biệt giữa điểm của hai lớp

Trang 33

+ Tiếp theo đánh giá bảng Paired Samples Statistics: dễ thấy điểm trung bình

của lớp thực nghiệm là 7,551 cao hơn so với 6,407 của lớp đối chiếu

+ Cuối cùng bảng Paired Samples Correlations: cho biết mối tương quan của

dữ liệu giữa hai nhóm khảo sát Giá trị sig = 0,855 > 0,05 cho thấy dữ liệu của hai

nhóm này có sự tương quan rất gần với nhau

* One-Sample T Test: Kiểm định trung bình tổng thể

Sử dụng để so sánh trung bình của tổng thể với một giá trị nào đó

VD: So sánh điểm của lớp thực nghiệm với điểm 7

Quy trình kiểm định:

+ Bước 1: Đặt ra giả thuyết Ho là điểm trung bình của lớp thực nghiệm là 7 điểm

+ Bước 2: Thực hiện kiểm định One-Sample T Test

+ Bước 3: So sánh giá trị sig của kiểm định t được xác định ở bước 2 với 0.05

(mức ý nghĩa 5% = 0.05 | độ tin cậy 95%) Nếu sig > 0.05 thì ta chấp nhận giả thuyết

Ho nghĩa là điểm trung bình tổng thể bằng 7 Nếu sig < 0.05 thì ta bác bỏ giả thuyết

Ho nghĩa là điểm trung bình tổng thể khác 7, từ đó dựa vào cột Mean Difference có

giá trị dương hay âm để kết luận điểm trung bình lớp hơn hay nhỏ hơn 7

Thực hiện kiểm định: Chọn lệnh One-Sample T Test → đưa các biến cần kiểm

định vào khung Test Variable → nhập giá trị muốn so sánh vào ô Test Value → OK

Hình 16 Kiểm định One-Sample T Test

Trang 34

+ Đánh giá cột Mean Difference: điểm trung bình lớp thực nghiệm có hiệu số

dương và lớp hơn 7 Ngược lại điểm trung bình lớp đối chiếu có hiệu số âm và nhỏ hơn 7

Lưu ý ở đây One-Sample T Test đưa ra giá trị sig để chấp nhận hay bác bỏ giả

thuyết Ho không chỉ dựa vào điểm trung bình mà còn dựa vào các yếu tố về kích thước mẫu, độ lệch chuẩn, khoảng biến thiên, độ tin cậy,… Do đó, khi muốn so sánh

trung bình của biến với một giá trị nào đó, chúng ta cần tiến hành kiểm định

One-Sample T Test chứ không thể kết luận dựa vào giá trị trung bình của biến đó được

* Independent-Sample T Test: So sánh trung bình giữa hai nhóm

Independent-Sample T Test chỉ dùng để kiểm định sự khác biệt trung bình trong

trường hợp chỉ có hai biến định tính VD: lớp thực nghiệm, lớp đối chiếu; nam, nữ;

cô giáo A dạy, cô giáo B dạy;… Trong trường hợp ta có từ ba biến định tính trở lên

thì ta phải sử dụng kiểm định ANOVA nếu không sẽ rất mất thời gian khi đi so sánh

từng cặp biến định tính với nhau

Independent-Sample T Test dùng để kiểm định sự khác biệt trung bình của biến

định lượng với các giá trị khác nhau của biến định tính VD: Có sự khác nhau về điểm

số giữa lớp chuyên và lớp không chuyên hay không? Có sự khác nhau về mức độ chi tiêu giữa sinh viên thành phố với sinh viên các tỉnh hay không?

Trang 35

VD: Thực hiện kiểm định trên cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu

với hai biến định tính là Lop gồm “lopthucnghiem” và “lopdoichieu” cùng biến định lượng là Diemthi với độ tin cậy 95%

Hình 17 So sánh trung bình giữa hai nhóm

Chọn Independent-Sample T Test → đưa biến định lượng vào ô Test Variable

và đưa biến định tính và ô Grouping Variable → chọn Define Groups… để phân

nhóm giá trị (với giá trị của lopthucnghiem là 1 và giá trị của lopdoichieu là 2 đã mã

hóa ban đầu) → Continue → OK

Hình 18 Phân nhóm giá trị so sánh trung bình giữa hai nhóm

Trang 36

Independent Samples Test

Levene's Test for Equality of Variances

t-test for Equality of Means

(2-tailed)

Mean Difference

Std Error Difference

95% Confidence Interval of the Difference Lower Upper

t-test (hàng đầu tiên Equal variances assumed):

+ sig T-test < 0,05 : kết luận có sự khác biệt về điểm số của hai lớp

+ sig T-test  0,05 : kết luận không có sự khác biệt về điểm số của hai lớp

Nếu giá trị Sig Levene's Test lớn hơn hoặc bằng 0,05 thì phương sai giữa hai lớp không có sự khác nhau nhiều Tiếp tục quan sát giá trị Sig (2-tailed) ở cột t-test (hàng thứ 2 Equal variances not assumed):

+ sig T-test < 0,05 : kết luận có sự khác biệt về điểm số của hai lớp

+ sig T-test  0,05 : kết luận không có sự khác biệt về điểm số của hai lớp

Trang 37

* One-Way ANOVA: Phân tích phương sai một chiều (kiểm định ANOVA)

dùng khi có nhiều nhóm cần so sánh

Kiểm định One-Way ANOVA cũng dùng để kiểm định trung bình giống như kiểm định Independent-Sample T Test ở trên Tuy nhiên với One-Way ANOVA chúng

ta có thể so sánh trung bình về một tiêu chí nào đó với hai hay nhiều đối tượng nghiên

cứu chứ không bó buộc trong hai đối tượng như Independent-Sample T Test

VD: Có sự khác nhau về trường học giữa các học sinh có số điểm thi tốt nghiệp khác nhau hay không, có sự khác nhau giữa giáo viên giảng dạy giữa các học sinh đạt mức điểm thi khác nhau hay không

Ở chức năng này chúng ta sử dụng cơ sở dữ liệu về mức tiêu thụ xăng của các

máy công nghiệp Dữ liệu được lấy từ bài tập Phân tích dữ liệu nghiên cứu với SPSS

của Khoa Toán – Thống kê Đại học Đại học Kinh tế TP Hồ Chí Minh (EUH)[1] Số liệu cụ thể như sau:

Hình 19 Cơ sở dữ liệu mức tiêu thụ xăng VD: Sử dụng cơ sở dữ liệu trên hãy so sánh mức tiêu thụ xăng giữa các máy động cơ có số cylinder khác nhau với độ tin cậy 95%

Theo đó hai biến cần quan tâm là ttxang (mức tiêu thụ xăng) và may (số cylinder

trong máy) Ở ví dụ này biến định lượng là mức tiêu thụ xăng, còn biến định tính là

số cylinder gồm năm giá trị là 3, 4, 5, 6, 8 Vậy ở đây để kiểm định giá trị trung bình

giữa năm yếu tố định tính này ta không thể sử dụng kiểm định Independent-Sample

T Test được vì sẽ rất dài dòng phức tạp khi phải đi so sánh từng cặp giá trị định tính

với nhau Thay vào đó kiểm định One-Way ANOVA là phương án phù hợp hơn

Trang 38

Thực hiện kiểm định:

Chọn lệnh One-Way ANOVA → đưa biến định lượng vào ô Dependent List →

đưa biến định tính vào ô Factor → Chọn Options và tích chọn hai mục Homogeneity

of variance test và Welch → Continue → OK

Hình 20 Kiểm định One-Way ANOVA

Trang 39

Kết quả:

Test of Homogeneity of Variances

muc tieu thu xang (km/lit)

ANOVA

Robust Tests of Equality of Means

Bảng 8 Kết quả kiểm định One-Way ANOVA

Đánh giá kết quả:

Quy trình phân tích One-Way ANOVA được thực hiện như sau:

Hình 21 Đánh giá kết quả kiểm định One-Way ANOVA[25][18]

Khi phương sai của các nhóm giá trị không đồng nhất thì phải sử dụng kiểm

định Welch để đánh giá kiểm định trung bình Với kết quả VD trên Sig Levene

Statistic = 0.009 < 0.05 nghĩa là phương sai giữa các nhóm giá trị không đồng nhất

nên sử dụng kết quả của kiểm định Welch Quan sát Sig Welch = 0.008 < 0.05, kết

luận có sự khác biệt trung bình giữa các biến định lượng

Trang 40

2.5 Phân tích tương quan

Trước khi xem xét phân tích tương quan chúng ta cùng tìm hiểu qua về hai chỉ

số rất quan trọng trong phân tích thống kê là Reliability (Độ tin cậy) và Validity (Độ chuẩn xác)

+ Reliability (Độ tin cậy) là độ ổn định của thang đo với các kết quả sai biệt không quá lớn trong một mẫu khảo sát đủ lớn Khi thực hiện khảo sát với nhiều biến quan sát (biến độc lập) để đánh giá một biến tổng (biến phụ thuộc) thì độ ổn định trong các kết quả thu được giữa các biến quan sát là vô cùng quan trọng Nó cho các nhà nghiên cứu biết được thang đo của họ có độ hiệu quả và độ tin cậy cao nếu không

có sự sai khác lớn giữa các đáp án Chỉ số này được đánh giá thông qua hệ số

Cronbach’s Alpha sẽ được trình bày kỹ hơn ở dưới

+ Validity (Độ chuẩn xác) là độ hội tụ các kết quả khảo sát của các biến quan sát với biến tổng cần đánh giá Nói cách khác chính là độ tương quan giữa các biến quan sát với biến tổng nhằm chỉ ra biến quan sát có thực sự đang đánh giá đúng biến tổng Như vậy nếu các biến quan sát đều có mối tương quan với biến tổng thì thang

đo có độ chuẩn xác cao Ngược lại biến quan sát không có tương quan với biến tổng thì ta cần loại bỏ biến quan sát đó Chỉ số này được đánh giá thông qua phân tích

tương quan Pearson về độ tương quan giữa các biến quan sát với biến tổng

+ VD: Một ví dụ đơn giản để thấy được sự khác nhau và tầm quan trọng của hai thông số này trong phân tích thống kê như sau: để đánh giá mức độ hiệu quả của phương pháp dạy học tích cực vào việc nâng cao kiến thức và kỹ năng cho học sinh, một nhà nghiên cứu đưa ra các câu hỏi cho các biến quan sát như sau: Học sinh có hài lòng về giáo viên giảng dạy? Thời gian học sinh tự học ở nhà? Học sinh thích môn học nào nhất? Giả sử kết quả khảo sát trong 3 lớp học đều cho kết quả gần tương

tự nhau Từ đó ta có thể nhận xét độ ổn định của thang đo này là rất lớn dẫn đến hệ

số Cronbach’s Alpha cao Tuy nhiên các biến quan sát này chưa thể đánh giá được

biến tổng là mức độ hiện quả của phương pháp dạy học tích cực Chính vì thế chỉ số

tương quan giữa các biến quan sát với biến tổng trong phân tích tương quan Pearson

sẽ không cao Do đó để đánh giá một thang đó là chính xác và tin cậy để có thể đánh giá đúng về biến tổng thì cả hai chỉ số Reliability và Validity đều phải đạt mốc

Chính bởi tầm quan trọng của phân tích tương quan mà SPSS cũng cung cấp các công cụ phân tích tương quan trong Menu Analyze → Correlate, trong đó thường

dùng nhất là:

Định dạng
Số trang	109
Dung lượng	2,69 MB