SPSS sử dụng rộng rãi trong công tác thống kê kinh tế .xã hội, cung cấp một hệ thống quản lý dữ liệu và phân tích thống kê trong một môi trường đồ họa dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình.bày đẹp, linh hoạt.
Trang 1TIN HỌC ỨNG DỤNG
Chương 2: Phân tích dữ liệu với SPSS
Phan Minh Trung
Trung tâm Tin học – Đại học An Giang
Email: pmtrung@agu.edu.vn
Website: http://staff.agu.edu.vn/pmtrung
1 Tin học ứng dụng quản lý
Trang 22
Giới thiệu SPSS
Viết tắt Statistical Package for the Social Sciences
Sử dụng rộng rãi trong công tác thống kê kinh tế -
xã hội
SPSS cung cấp một hệ thống quản lý dữ liệu và
phân tích thống kê trong một môi trường đồ họa
Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo
thả và câu lệnh, các bảng biểu, báo cáo được trình
bày đẹp, linh hoạt
Cài đặt SPSS
Cài đặt SPSS V20
Trang 3Mã hóa dữ liệu & Nhập liệu
Mã hóa dữ liệu & Nhập liệu
Ta qui ước như sau
Trang 4Ví dụ: Mã hóa bảng câu hỏi!
đề tài nghiên cứu cứu “Các yếu tố ảnh hưởng
đến sự hài lòng của khách hàng: trường hơp
nghiên cứu ở Ngân hàng Nông nghiệp PTNT,
chi nhánh TPHCM” Trong đó bao gồm các
biến độc lập, phụ thuộc, nhân khẩu học
Xem phụ lục 2.1
Trang 5ASS_1 ASS_2 ASS_3 ASS_4 ASS_5 ASS_6 ASS_7
EMP_1 EMP_2 EMP_3 EMP_4 EMP_5 EMP_6 EMP_7 EMP_8 EMP_9
SAT_1 SAT_2 SAT_3
INFO_1 INFO_2 INFO_3 INFO_4
Để nhập dữ liệu nhanh ta thực hiện như sau:
Nhập dữ liệu bằng Excel theo cột
Chuyển dòng thành cột
Kiểm tra dữ liệu
Chuyển dữ liệu qua SPSS:
Khai báo biến đã mã hóa
Copy dữ liệu từ Excel qua SPSS
Trang 7Kiểm tra dữ liệu bằng Filter trong Excel
Khai báo biến bên SPSS
Trang 88
Giải thích giao diện khai báo biến
Name Tên biến, liên tục không có khoảng trắng
Type Kiểu dữ liệu (Số, chuỗi,…)
Width Độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự tối đa
Decimals Llượng số thập phân
Label Nhãn biến (chú thích cho tên biến)
Values Định nghĩa giá trị cho các biến
Missing Khai báo giá trị khuyết
Columns Độ rộng cột tên biến
Align Canh lề dữ liệu nhập trong cột
Measure Loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc), Nominal (thang đo danh nghĩa), Scale (gồm cả Interval và Ratio)
Role Vai trò của biến
Xử lý biến„
Đðnh nghïa giá trð cho các biến
Trang 9Mô hình Phân tích nhân tố khám phá (EFA)
Qui trình phân tích nhân tố khám phá
(Exploratory Factor Analysis):
Bước 1: Kiểm đðnh chất lượng thang đo
Bước 2: Phân tích nhân tố khám phá (EFA)
Kiểm đðnh tính thích hợp của EFA (chî số 0,5 < KMO
<1); Kaiser – Meyer - Olkin
Kiểm đðnh tương quan giữa các biến: kiểm đðnh
Bartlett với Sig < 0,05
Kiểm đðnh mức độ giải thích (% cumulative variance –
phương sai trích) lớn hơn 50%
Tương quan từng phần, mức ý nghïa của HSHQ Sig.<0,05
Mức độ phù hợp của mô hình R 2 và R 2 đều chînh: sử dụng
phân tích phương sai ANOVA Sig.<0,05
Hiện tượng đa cộng tuyến VIF < 10
Trang 1010
Kiểm đðnh thang đo
AnalyzeScale Reliability Analysis
Xuất hiện hình dưới vả đưa thang đo cần kiểm đðnh như
hình:
Kiểm đðnh thang đo (tt)
Hệ số Cronbach Alpha >= 0,6 và tương quan
biến tổng ≥ 0,3
Nếu nhỏ hơn 0,6 ta loại bỏ biến ở bảng dưới
và thực hiện lại kiểm đðnh như ban đầu
Trang 11Phân tích nhân tố khám phá
Phân tích nhân tố khám phá (tt)
Trang 13Kiểm đðnh tương quan của các biến quan sát
trong thang đo (Bartlett với Sig < 0,05)
Kiểm đðnh mức độ giải thích các biến đặc trưng
đối với nhân tố (% Cumulative ≥ 50% - Phương
sai trích)
Trang 14Kiểm đðnh Bartlett có Sig = 0,000 < 0,05, các
biến đặc trưng có tương quan tuyến tính với
nhân tố đại diện
Phân tích nhân tố khám phá (tt)
Phương sai trích 63,6% Điều này có nghïa
63,6% thay đổi của các nhân tố được giải
thích bởi các biến quan sát
Trang 154 Tin cậy (REL)
Bước tiếp theo là Phân tích hồi
qui bội
Phân tích hồi qui bội
Mô hình tổng thể: SAT = f(EMP, TAN, RES, REL)
Để thực hiện hồi qui:
Lấy trung bình hoặc tổng các thành phần
Chạy mô hình hồi qui
Phương trình hồi qui:
SAT = B 0 + B 1 EMP + B 2 TAN + B 3 RES + B 4 REL
Trang 17Phân tích kiểm đðnh hồi qui (tt)
Kiểm đðnh HSHQ: tất cả các biến đều có Sig
nhỏ hơn 0,05 Như vậy các biến tương quan
có ý nghïa với SAT với độ tin cậy 95%
Phân tích kiểm đðnh hồi qui (tt)
Kiểm đðnh mức độ phù hợp của mô hình: R 2
điều chînh là 0,594 Như vậy 59,4% thay đổi
sự hài lòng củ KH được giải bởi các biến độc
lập của mô hình
Trang 1818
Phân tích kiểm đðnh hồi qui (tt)
Mức độ phù hợp: Phân tích phương sai, với
Sig < 0,05 có thể kết luận rằng mô hình đưa
ra phù hợp với dữ liệu thực tế
Phân tích kiểm đðnh hồi qui (tt)
Đa cộng tuyến: hệ số phương sai phóng đại
VIF < 2, hiện tượng đa cộng tuyến không bð vi
phạm
Trang 19Thảo luận kết quả hồi qui
Kết luận giả thuyết đưa ra: quan hệ dương
giữa các thành phần đến sự hài lòng
Hệ số hồi qui chưa chuẩn hóa:
EMP: 0,135 (EMP tăng 1 thì hài lòng tăng 0,135)
TAN: 0,375 (TAN tăng 1 thì hài lòng tăng 0,375)
RES: 0,419 (RES tăng 1 thì hài lòng tăng 0,419)
REL: 0,199 (REL tăng 1 thì hài lòng tăng 0,199)
Trang 2020
Vẽ biểu đồ
Vẽ biểu đồ trong phần thống kê
Vẽ biểu đồ với GraphsChart Builder„
Kiểm đðnh tham số
Kiểm đðnh T-Test đối với tham số trung bình
của 2 nhóm độc lập:
H 0 : không có sự khác biệt về sự hài lòng của
khách hàng theo giới tính (nam – nữ)
H a : Có sự khác nhau
AnalyzeCompare meansIndependent-Samples T Test
Trang 21Kiểm đðnh tham số (tt)
Kiểm đðnh tham số (tt)
Kết quả: nếu thống kê Levence Sig > 0,05 thì
khẳng đðnh giả đðnh phương sai đồng nhất, khi đó
các giá trð thống kê (T-Test) tham chiếu theo dòng
Equal Variances Assumed và ngược lại
và Sig.=0,36> α =0,05 nên khẳng đðnh phương sai
đồng nhất
có sự khác nhau về sự hài lòng theo giới tính
Trang 2222
Kiểm đðnh tham số (tt)
Kiểm đðnh ANOVA: kiểm đðnh sự khác nhau
trung bình có hơn 2 nhóm trở lên
Giả thuyết H 0 : Không có sự khác biệt về hài lòng
Trang 23Kiểm đðnh tham số (tt)
Bảng Test of Homogenetiny of Variances
Sig.=0,554 không có sự khác nhau phương sai