CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO CROSSTABULATION Ý NGHĨA Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình
Trang 1CÁC NỘI DUNG PHÂN TÍCH CHÍNH SỬ DỤNG SPSS 16.0
1 Tạo biến mới: Lệnh Recode, Compute
2 Thống kê mô tả (Frequency)
3 Bảng tùy chỉnh (Custom table) => nhận diện khách hàng tiềm năng
4 Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh - thứ bậc ==> sử dụng
đại lượng Chi-square (trong lệnh Crosstab)
5 Kiểm định mối liên hệ giữa hai biến thứ bậc ==> sử dụng đại lượng Gamma, Kendall
Tau-b hoặc Tau-c (trong lệnh Crosstab)
6 Kiểm định tỷ lệ tổng thể: (Sử dụng Chi-bình phương hoặc/và Binomial Test)
Điều kiện:
+ Mẫu được chọn ngẫu nhiên
+ Biến nhị phân (chỉ có 2 tình huống) Nếu có nhiều hơn, nên dùng lệnh Recode để chuyển thành biến có 2 lựa chọn
Ho: Tỷ lệ đánh giá hài lòng trở lên đối với chuyến tham quan Đại Nội của toàn bộ khách nội địa là 80%
H1: Tỷ lệ này nhỏ hơn 80%
Chọn Analyze/ Nonparametric tests/Binomial
7 Phân tích nhân tố khám phá (EFA)
8 Kiểm định độ tin cậy thang đo (Cronbach's alfa)
9 Kiểm định phân phối chuẩn (2 cách: Sử dụng kiểm định Kolmogorov Smirnov hoặc
Skewness, Kurtosis)
10 Các kiểm định tham số (One sample test, Independent Sample test, Paired Sample
t-test, One way ANOVA) ==> điều kiện cơ bản nhất là mẫu phải có phân phối chuẩn
11 Các kiểm định phi tham số
Kiểm định tham số Kiểm định phi tham số
12 Phân tích tương quan (Correlation) => Correlate/Bivariate
13 Hồi quy tương quan => gồm Hồi quy tuyến tính (Linear) và Hồi Quy phi tuyến (Binary,
Non-Linear)
14 Bản đồ định vị thương hiệu (MDS)
Lưu ý: Ngoài ra, nâng cao thì có thể có thêm Time Serie, chuỗi lệnh Survival, Các xử lý liên quan đến Utility,
Trang 2MỘT SỐ KIẾN THỨC NỀN TẢNG
A Dữ liệu và thang đo dữ liệu tương ứng
Trong SPSS, thang đo dữ liệu định lượng được quy định là Scale
==> các dạng câu hỏi tương ứng với từng dạng thang đo và cách mã hóa các dạng câu hỏi đó?
Chú ý các dạng câu hỏi dưới đây:
- Câu hỏi nhiều sự lựa chọn
- Câu hỏi sắp xếp thứ tự
- Câu hỏi thuộc thang đo likert
B Cách mã hóa dữ liệu
C Cách làm sạch dữ liệu
Trang 31 TẠO BIẾN MỚI (RECODE, COMPUTE)
2 CÁCH THỨC TIẾN HÀNH LỆNH FREQUENCIES (Tính tần số)
Ý NGHĨA
- thống kê tần số và tần suất của mẫu
CÁCH CHẠY
B1: Analyze -> Descriptive Statistic -> Frequencies
B2: đưa biến qua
B3: Tùy chọn Statistic (chọn Mean)
B4: OK
1 Sau khi mở file dữ liệu, vào menu Analyze Descriptive Statistics Frequencies
Màn hình sẽ xuất hiện hộp thoại sau:
Vẽ biểu đồ
Trang 42 Chọn biến muốn tính tần số (biến Place V1) bằng cách click chuột vào tên biến rồi đưa sang khung Variable(s)
3 Click Ok Trường hợp muốn vẽ biểu đồ thực hiện thêm bước 4 trước khi click Ok
4 Để vẽ biểu đồ click chuột vào ô Charts… Chọn dạng biểu đồ ở Chart type, chọn giá trị thể hiện trên biểu đồ là số đếm (frequencies) hay phần trăm (percentages) Click Continue để trở lại hộp thoại Frequencies Ok để thực hiện lệnh
Trang 5CÁCH THỨC TIẾN HÀNH LỆNH DESCRIPTIVES (Tính điểm trung bình)
Ý NGHĨA
CÁCH CHẠY
1 Vào menu Analyze Descriptive Statistics Descriptives…, xuất hiện hộp thoại
2 Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung Variable(s)
3 Click vào ô Options… để xuất hiện hộp thoại Descriptive Options Chọn các đại lượng thống kê muốn tính toán bằng cách click vào ô vuông cần thiết
4 Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách biến (Variable list), thứ tự Alphabetic của nhãn biến, thứ tự tăng dần (Ascending list), và thứ tự giảm dần (Descending list)
5 Click Continue để trở về hộp thoại Descriptive Ok để thực hiện lệnh
Trang 61.00 - 1.80 Rất không đồng ý/Rất không hài lòng/Rất không quan trọng
Trang 74 CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO (CROSSTABULATION)
Ý NGHĨA
Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình phương (Chi-square)
CÁCH CHẠY
1 Vào menu Analyze Descriptive Statistics Crosstabs…,
2 Xuất hiện hộp thoại sau:
Trang 83 Chọn và đưa các biến vào khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of 1 (đối với trường hợp trên 2 biến)
4 Click vào ô Statistics, xuất hiện hộp thoại sau:
5 Chọn các kiểm định cần thiết Trong trường hợp này ta dùng kiểm định Chi – bình phương (Chi-square)
- Các kiểm định ở ô Norminal dùng để kiểm định mối liên hệ giữa các biến biểu danh
- Các kiểm định ở ô Ordinal dùng để kiểm định mối liên hệ giữa các biến thứ tự
6 Click vào continue để trở lại hộp thoại Crosstabs Click vào ô Cells, hộp thoại sau xuất hiện:
7 Ở ô Counts chọn Observed (thể hiện tần số quan sát) Trong trường hợp muốn thể hiện tần số mong đợi chọn Expected
8 Chọn cách thể hiện phần trăm theo dòng hay theo cột ở ô Percentages
9 Click Continue để trở lại hộp thoại Crosstabs Ok để thực hiện lệnh
Trang 9CÁCH ĐỌC KẾT QUẢ KIỂM ĐỊNH
Khi thực hiện kiểm định, ta có 2 giả thuyết
H0: không có mối quan hệ giữa các biến
H1: có mối quan hệ giữa các biến
Để kết luận là chấp nhận hay bác bỏ giả thuyết H0, ta sẽ dùng các kiểm định phù hợp
Dựa vào giá trị P (p-value) (SPSS viết tắt p-value là sig.) để kết luận là chấp nhận hay bác
bỏ giả thuyết H0
p-value (sig.) ≤ α (mức ý nghĩa) bác bỏ giả thuyết H0 Có nghĩa là có mối quan hệ
có ý nghĩa giữa các biến cần kiểm định
p-value (sig.) > α (mức ý nghĩa) chấp nhận H0 Không có mối quan hệ giữa các biến cần kiểm định
ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG
a 8 cells (44.4%) have expected count less than 5 The minimum expected count is 1.69
Cuối bảng Chi-Square tests SPSS sẽ đưa ra dòng thông báo cho biết % số ô có tần suất mong đợi dưới 5 Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị chi-bình phương không còn đáng tin cậy
Trong ví dụ trên có đến 44.4% số ô có tần số mong đợi dưới 5, biện pháp cho trường hợp này là ta sẽ gom các biểu hiện trên các biến lại để tăng số quan sát trong mỗi nhóm
p-value
Trang 107 PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EXPLORATORY FACTOR ANALYSIS)
- Nhằm hai mục đích chính: nhóm biến và rút gọn biến
CÁCH CHẠY
B1: Analyze -> Data Reduction -> Factor
B2: đưa tất cả các biến vào ô Variables (biến phụ thuộc và biến độc lập chạy riêng) B3: Tùy chọn
+ Descriptive: chọn Anti-image và KMO and
+ Rotation: chọn Varimax và Loading plots
+ Scores: chọn Save as variables
+ Options: chọn sorted by size và suppress small coefficient (chỉnh từ 10 lên 50)
1 Từ menu Analyze Data Reduction Factor
2 Xuất hiện hộp thoại sau:
Trang 113 Chọn tất cả các biến cần gom nhóm vào ô Variables
4 Click chọn ô Descriptives…, xuất hiện hộp thoại sau:
- Chọn các tham số thống kê mô tả
- Chọn tính các ma trận hệ số tương quan
- Chọn kiểm định Bartlett Trong phân tích nhân tố, cần kiểm định mối tương quan của các biến với nhau (H0: các biến không có tương quan với nhau trong tổng thể) Nếu giả thuyết H0 không được bác bỏ thì phân tích nhân tố có khả năng không thích hợp
- Click continue để trở lại hộp thoại Factor analysis
5 Click chọn ô Extraction để mở hộp thoại sau:
Trang 12- Chọn phương pháp rút trích nhân tố, phương pháp mặc định là rút các thành phần chính – Principal components
- Phân tích ma trận tương quan hay hiệp phương sai ở ô Analyze
- Thể hiện phương án nhân tố chưa xoay và vẽ biểu đồ dốc ở ô Display
- Xác định tiêu chuẩn rút trích nhân tố hay số lượng nhân tố cần rút trích
Có 2 cách để xác định tiêu chuẩn này ở ô Extract:
nghiên cứu trước Nhà nghiên cứu xác định số nhân tố ở ô Number of factors
Xác định dựa vào Eigenvalue (Determination based on eigenvalue Chỉ có những nhân tố nào lớn hơn 1 mới được giữ lại trong mô hình phân tích
- Click Continue để trở lại hộp thoại Factor Analysis
6 Click chọn ô Rotation (Xoay nhân tố) để mở hộp thoại sau:
Xoay nhân tố là thủ tục giúp ma trận nhân tố trở nên đơn giản và dễ giải thích hơn
Có nhiều phương pháp xoay khác nhau trong đó được sử dụng rộng rãi nhất là
Varimax procedure (xoay nguyên góc các nhân tố để tối thiểu hoá số lượng biến có hệ số
lớn tại cùng một nhân tố, vì vậy sẽ tăng cường khả năng giải thích các nhân tố)
Trang 13Nếu nhà nghiên cứu muốn xác định tập hợp nhân tố ít hơn để sử dụng trong các phương pháp phân tích đa biến tiếp theo (phân tích ANOVA, hồi quy…), ta có thể tính toán
ra các nhân số (trị số của các biến tổng hợp) cho từng trường hợp quan sát một Nhân số của nhân tố thứ i bằng:
Fi = Wi1X1 + Wi2X2 + Wi3X3 + … + WikXk
Máy tính sẽ tính các nhân số này và tự động save vào file dữ liệu những biến mới này
- Mặc định của chương trình là phương pháp tính nhân số Regression (theo đơn vị
đo lường độ lệch chuẩn)
- Chọn thể hiện bảng trọng số nhân tố bằng cách click vào ô Display factor …
- Click Continue để trở lại hộp thoại ban đầu click Ok để thực hiện lệnh
CÁCH ĐỌC KẾT QUẢ
Điều kiện 1: Bảng KMO and Bartlett’s Test:
+ KMO > 0.5 + Sig < 0.05
Điều kiện 2: Bảng Total Variance Explained:
+ Intial Eigevalues >1 (Total) + Cumulative > 50% (tổng phương sai trích)
Điều kiện 3: Kết quả EFA: bảng Rotated Component Matrix
Trang 14VD: xác định nhân tố ảnh hưởng đến quyết định chọn nhà trọ của sinh viên khoa QTKD trường Đại học Kinh tế Huế
gan truong
gan khu vui choi, giai tri
phong co gac lung
co nha ve sinh trong phong noi qui
dien, nuoc gia ca 1.000 522 528 313 238 291 209 288 123 402
ve sinh 522 1.000 801 581 392 096 337 298 198 393
an ninh 528 801 1.000 607 303 191 129 281 378 535
moi truong song 313 581 607 1.000 372 174 021 257 307 315
gan truong 238 392 303 372 1.000 569 325 219 034 275
gan khu vui
choi, giai tri
Bảng 1 thể hiện đại lượng thống kê mô tả
Bảng 2 thể hiện ma trận tương quan giữa các biến Ta thấy hệ số tương quan giữa các biến trong ma trận này tương đối cao
Trang 15Bảng 3 thể hiện kết quả của kiểm định Barlett Dựa vào kết quả này ta có thể bác bỏ H0 (Các
biến không có tương quan với nhau) Phân tích nhân tố là phương pháp phù hợp để phân
tích ma trận tương quan ở bảng 2
Bảng 3 KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .714
Bartlett's Test of Sphericity Approx Chi-Square 167.933
Dựa vào bảng 5 và theo tiêu chuẩn eigenvalue lớn hơn 1 thì chỉ có 3 nhân tố được rút trích
ra Giá trị Cumulative % cho biết 3 nhân tố đầu giải thích 66.78% biến thiên của dữ liệu
Bảng số 4 (bảng Cummunalities) cho biết thông tin về phần biến thiên được giải thích bởi các nhân tố chung
Bảng số 6 là bảng thể hiện các nhân tố chưa xoay Để dễ dàng giải thích các nhân tố hơn ta
Trang 16an ninh 814 -.379 -.205
moi truong song 667 -.324 -.206
gan khu vui choi, giai tri 514 661 179
phong co gac lung 369 529 -.184
co nha ve sinh trong phong 601 127 525
gan khu vui choi, giai tri (6) -.015 358 778
phong co gac lung (7) 119 -.014 660
co nha ve sinh trong phong (8) 124 746 285
Trang 17Bảng 8 Component Transformation Matrix
Extraction Method: Principal Component Analysis
Rotation Method: Varimax with Kaiser
gan khu vui choi, giai tri -.191 143 448
phong co gac lung -.034 -.108 397
co nha ve sinh trong phong -.134 418 076
Extraction Method: Principal Component Analysis
Rotation Method: Varimax with Kaiser Normalization
Extraction Method: Principal Component Analysis
Rotation Method: Varimax with Kaiser
Normalization
Component Scores
Dựa vào bảng 8, 9 và 10 ta xác định nhân số như sau:
F1 = 0.218*giá cả + 0.386*vệ sinh + 0.354*an ninh + 0.309*môi trường sống
F2 = 0.418*có nhà vệ sinh trong phòng + 0.515*nội quy + 0.341*điện nước
F3 = 0.430*gần trường + 0.448*gần khu vui chơi + 0.397*có gác lửng
Trang 188 KIỂM ĐỊNH ĐỘ TIN CẬY THANG ĐO
(SỬ DỤNG KIỂM ĐỊNH CRONBACH'S ALFA)
Ý NGHĨA
Đánh giá xem thang đo có đồng nhất hay không => xem xét xem thang đo đó có ĐO CÙNG MỘT KHÁI NIỆM hay không
- Nguyên tắc cơ bản:
Số lượng biến càng lớn -> Giá trị Cronbach Alpha càng cao
Chạy cronbach's alfa dựa trên các nhóm biến từ kết quả EFA
CÁCH CHẠY
B1: Analyze -> Scale -> Reliability Analyze
B2: đưa các biến thuộc 1 thang đo vào Item
B1: Đọc giá trị Cronbach Alpha của nhóm (0,7;0,95)
+ Nếu < 0,7: kém tin cậy + Nếu > 0,95: thừa biến
B2: < 0,7 -> loại biến
Xem 2 cột tiêu chí + Cronbach alpha if item deleted: giá trị nào cao hơn Cronbach alpha của nhóm -> loại
+ Correct Item total correlation: giá trị nào < 0,3 -> loại
Lý do vì sao nên chạy Cronbach' alfa trước & sau:
- “Cronbach alpha phải được thực hiện trước để loại các biến rác (garbage items) trước khi thực hiện phân tích EFA Quá trình này có thể giúp chúng ta tránh được các biến rác vì các biến rác này có thể tạo nên các nhân tố giả (artifical factors) khi phân tích EFA (Churchill 1979)” (Nguyễn Đình Thọ, Phương pháp nghiên cứu trong kinh doanh, tr.304)
==> Trong một thang đo các bạn đưa ra chắc chắn sẽ có sai số đo lường (do bảng câu hỏi,
Trang 19thang đo có thể tạo thành các biến giả - biến giả ở đây là các biến đo lường niệm nhưng khái niệm này không liên quan gì đến vấn đề đang nghiên cứu (không có trong
cùng-một-khái-mô hình)
Vậy thì trường hợp các bạn chạy phân tích nhân tố (EFA) trước, giả sử trong thang đo có
3-5 biến giả và được SPSS vô tình nhóm cùng một nhóm Và lúc đó bạn sẽ phải đặt tên cho nhóm biến đó trong khi nó hoàn toàn không có giá trị cho bài nghiên cứu
Sau đó bạn lại tiếp tục đánh giá Cronbach alpha cho những “nhân tố” đã được EFA sắp xếp lại Vậy thì sau khi đã EFA, các nhân tố đo lường cùng một khái niệm đã được sắp xếp chung, các bạn đánh giá Cronbach alpha thì HIỂN NHIÊN nó sẽ ĐO LƯỜNG CÙNG
KHÁI NIỆM và cho kết-quả-tốt thôi Các bạn có thể kiểm chứng bằng cách cho chạy thử Cronbach alpha cho những “nhân tố” đã được EFA sắp xếp Thì Cronbach alpha luôn cao,
và sẽ KHÔNG có một biến nào mà khi delete có thể làm tăng Cronbach alpha được (có thể chênh lệch 1 chút nhưng sẽ không đáng để bạn loại biến đó ra)
Như vậy việc kiểm định Cronbach alpha sau là vô nghĩa!
9 KIỂM ĐỊNH PHÂN PHỐI CHUẨN
Thông thường có 2 cách (khuyến cáo nên sử dụng cách 2)
- C1: dựa trên cặp giá trị kiểm định về phân phối chuẩn Skewness và Kurtosis
Trang 20 CÁCH CHẠY (kiểm định Kolmogorov-Smirnov)
B1: Analyze -> Nonparametric Tests -> 1-sample K-S
B2: Đưa biến vào (lấy output của EFA hoặc dùng lệnh Compute để tạo ra nhân tố đại diện cho nhóm biến)
CÁCH ĐỌC KẾT QUẢ
Dựa trên cặp giả thiết:
H0: có phân phối chuẩn
H1: không có phân phối chuẩn
Bảng One sample Kolmogorov Smirnov Test:
Asymp Sig > 0,05 -> có phân phối chuẩn (chấp nhận H0)
10 CÁC KIỂM ĐỊNH THAM SỐ (One sample t-test, Independent Sample t-test, Paired
Sample t-test, One way ANOVA) ==> điều kiện cơ bản nhất là mẫu phải có phân phối chuẩn
KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ
(Kiểm định One sample T test)
Ý NGHĨA
Kiểm định giá trị trung bình của tổng thể để xem giá trị của tổng thể rơi vào khoảng nào?
H0: giá trị trung bình của tổng thể = 4
H1: giá trị trung bình của tổng thể # 4
CÁCH CHẠY
B1: Analyze -> Compare Mean -> One sampleT test
B2: đưa từng nhóm biến vào -> chọn test value = 4 ->OK
CÁCH ĐỌC KẾT QUẢ
+ Sig > 0,05 -> không đủ cơ sở để bác bỏ H0 -> KL = 4, đồng ý
+ Sig < 0,05 -> bác bỏ H0 -> dựa vào giá trị Mean để kết luận