Hướng dẫn sử dụng SPSS - Hảo

CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO CROSSTABULATION  Ý NGHĨA Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình

Trang 1

CÁC NỘI DUNG PHÂN TÍCH CHÍNH SỬ DỤNG SPSS 16.0

1 Tạo biến mới: Lệnh Recode, Compute

2 Thống kê mô tả (Frequency)

3 Bảng tùy chỉnh (Custom table) => nhận diện khách hàng tiềm năng

4 Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh - thứ bậc ==> sử dụng

đại lượng Chi-square (trong lệnh Crosstab)

5 Kiểm định mối liên hệ giữa hai biến thứ bậc ==> sử dụng đại lượng Gamma, Kendall

Tau-b hoặc Tau-c (trong lệnh Crosstab)

6 Kiểm định tỷ lệ tổng thể: (Sử dụng Chi-bình phương hoặc/và Binomial Test)

Điều kiện:

+ Mẫu được chọn ngẫu nhiên

+ Biến nhị phân (chỉ có 2 tình huống) Nếu có nhiều hơn, nên dùng lệnh Recode để chuyển thành biến có 2 lựa chọn

 Ho: Tỷ lệ đánh giá hài lòng trở lên đối với chuyến tham quan Đại Nội của toàn bộ khách nội địa là 80%

 H1: Tỷ lệ này nhỏ hơn 80%

Chọn Analyze/ Nonparametric tests/Binomial

7 Phân tích nhân tố khám phá (EFA)

8 Kiểm định độ tin cậy thang đo (Cronbach's alfa)

9 Kiểm định phân phối chuẩn (2 cách: Sử dụng kiểm định Kolmogorov Smirnov hoặc

Skewness, Kurtosis)

10 Các kiểm định tham số (One sample test, Independent Sample test, Paired Sample

t-test, One way ANOVA) ==> điều kiện cơ bản nhất là mẫu phải có phân phối chuẩn

11 Các kiểm định phi tham số

Kiểm định tham số Kiểm định phi tham số

12 Phân tích tương quan (Correlation) => Correlate/Bivariate

13 Hồi quy tương quan => gồm Hồi quy tuyến tính (Linear) và Hồi Quy phi tuyến (Binary,

Non-Linear)

14 Bản đồ định vị thương hiệu (MDS)

Lưu ý: Ngoài ra, nâng cao thì có thể có thêm Time Serie, chuỗi lệnh Survival, Các xử lý liên quan đến Utility,

Trang 2

MỘT SỐ KIẾN THỨC NỀN TẢNG

A Dữ liệu và thang đo dữ liệu tương ứng

Trong SPSS, thang đo dữ liệu định lượng được quy định là Scale

==> các dạng câu hỏi tương ứng với từng dạng thang đo và cách mã hóa các dạng câu hỏi đó?

Chú ý các dạng câu hỏi dưới đây:

- Câu hỏi nhiều sự lựa chọn

- Câu hỏi sắp xếp thứ tự

- Câu hỏi thuộc thang đo likert

B Cách mã hóa dữ liệu

C Cách làm sạch dữ liệu

Trang 3

1 TẠO BIẾN MỚI (RECODE, COMPUTE)

2 CÁCH THỨC TIẾN HÀNH LỆNH FREQUENCIES (Tính tần số)

 Ý NGHĨA

- thống kê tần số và tần suất của mẫu

 CÁCH CHẠY

B1: Analyze -> Descriptive Statistic -> Frequencies

B2: đưa biến qua

B3: Tùy chọn Statistic (chọn Mean)

B4: OK

1 Sau khi mở file dữ liệu, vào menu Analyze  Descriptive Statistics  Frequencies

Màn hình sẽ xuất hiện hộp thoại sau:

Vẽ biểu đồ

Trang 4

2 Chọn biến muốn tính tần số (biến Place V1) bằng cách click chuột vào tên biến rồi đưa sang khung Variable(s)

3 Click Ok Trường hợp muốn vẽ biểu đồ thực hiện thêm bước 4 trước khi click Ok

4 Để vẽ biểu đồ click chuột vào ô Charts… Chọn dạng biểu đồ ở Chart type, chọn giá trị thể hiện trên biểu đồ là số đếm (frequencies) hay phần trăm (percentages) Click Continue để trở lại hộp thoại Frequencies  Ok để thực hiện lệnh

Trang 5

CÁCH THỨC TIẾN HÀNH LỆNH DESCRIPTIVES (Tính điểm trung bình)

 Ý NGHĨA

1 Vào menu Analyze  Descriptive Statistics  Descriptives…, xuất hiện hộp thoại

2 Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung Variable(s)

3 Click vào ô Options… để xuất hiện hộp thoại Descriptive Options Chọn các đại lượng thống kê muốn tính toán bằng cách click vào ô vuông cần thiết

4 Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách biến (Variable list), thứ tự Alphabetic của nhãn biến, thứ tự tăng dần (Ascending list), và thứ tự giảm dần (Descending list)

5 Click Continue để trở về hộp thoại Descriptive  Ok để thực hiện lệnh

Trang 6

1.00 - 1.80 Rất không đồng ý/Rất không hài lòng/Rất không quan trọng

Trang 7

4 CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO (CROSSTABULATION)

 Ý NGHĨA

Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình phương (Chi-square)

1 Vào menu Analyze  Descriptive Statistics  Crosstabs…,

2 Xuất hiện hộp thoại sau:

Trang 8

3 Chọn và đưa các biến vào khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of 1 (đối với trường hợp trên 2 biến)

4 Click vào ô Statistics, xuất hiện hộp thoại sau:

5 Chọn các kiểm định cần thiết Trong trường hợp này ta dùng kiểm định Chi – bình phương (Chi-square)

- Các kiểm định ở ô Norminal dùng để kiểm định mối liên hệ giữa các biến biểu danh

- Các kiểm định ở ô Ordinal dùng để kiểm định mối liên hệ giữa các biến thứ tự

6 Click vào continue để trở lại hộp thoại Crosstabs  Click vào ô Cells, hộp thoại sau xuất hiện:

7 Ở ô Counts chọn Observed (thể hiện tần số quan sát) Trong trường hợp muốn thể hiện tần số mong đợi chọn Expected

8 Chọn cách thể hiện phần trăm theo dòng hay theo cột ở ô Percentages

9 Click Continue để trở lại hộp thoại Crosstabs  Ok để thực hiện lệnh

Trang 9

CÁCH ĐỌC KẾT QUẢ KIỂM ĐỊNH

Khi thực hiện kiểm định, ta có 2 giả thuyết

H0: không có mối quan hệ giữa các biến

H1: có mối quan hệ giữa các biến

Để kết luận là chấp nhận hay bác bỏ giả thuyết H0, ta sẽ dùng các kiểm định phù hợp

Dựa vào giá trị P (p-value) (SPSS viết tắt p-value là sig.) để kết luận là chấp nhận hay bác

bỏ giả thuyết H0

p-value (sig.) ≤ α (mức ý nghĩa)  bác bỏ giả thuyết H0 Có nghĩa là có mối quan hệ

có ý nghĩa giữa các biến cần kiểm định

p-value (sig.) > α (mức ý nghĩa)  chấp nhận H0 Không có mối quan hệ giữa các biến cần kiểm định

ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG

a 8 cells (44.4%) have expected count less than 5 The minimum expected count is 1.69

Cuối bảng Chi-Square tests SPSS sẽ đưa ra dòng thông báo cho biết % số ô có tần suất mong đợi dưới 5 Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị chi-bình phương không còn đáng tin cậy

Trong ví dụ trên có đến 44.4% số ô có tần số mong đợi dưới 5, biện pháp cho trường hợp này là ta sẽ gom các biểu hiện trên các biến lại để tăng số quan sát trong mỗi nhóm

p-value

Trang 10

7 PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EXPLORATORY FACTOR ANALYSIS)

- Nhằm hai mục đích chính: nhóm biến và rút gọn biến

B1: Analyze -> Data Reduction -> Factor

B2: đưa tất cả các biến vào ô Variables (biến phụ thuộc và biến độc lập chạy riêng) B3: Tùy chọn

+ Descriptive: chọn Anti-image và KMO and

+ Rotation: chọn Varimax và Loading plots

+ Scores: chọn Save as variables

+ Options: chọn sorted by size và suppress small coefficient (chỉnh từ 10 lên 50)

1 Từ menu Analyze  Data Reduction  Factor

2 Xuất hiện hộp thoại sau:

Trang 11

3 Chọn tất cả các biến cần gom nhóm vào ô Variables

4 Click chọn ô Descriptives…, xuất hiện hộp thoại sau:

- Chọn các tham số thống kê mô tả

- Chọn tính các ma trận hệ số tương quan

- Chọn kiểm định Bartlett Trong phân tích nhân tố, cần kiểm định mối tương quan của các biến với nhau (H0: các biến không có tương quan với nhau trong tổng thể) Nếu giả thuyết H0 không được bác bỏ thì phân tích nhân tố có khả năng không thích hợp

- Click continue để trở lại hộp thoại Factor analysis

5 Click chọn ô Extraction để mở hộp thoại sau:

Trang 12

- Chọn phương pháp rút trích nhân tố, phương pháp mặc định là rút các thành phần chính – Principal components

- Phân tích ma trận tương quan hay hiệp phương sai ở ô Analyze

- Thể hiện phương án nhân tố chưa xoay và vẽ biểu đồ dốc ở ô Display

- Xác định tiêu chuẩn rút trích nhân tố hay số lượng nhân tố cần rút trích

Có 2 cách để xác định tiêu chuẩn này ở ô Extract:

nghiên cứu trước Nhà nghiên cứu xác định số nhân tố ở ô Number of factors

 Xác định dựa vào Eigenvalue (Determination based on eigenvalue Chỉ có những nhân tố nào lớn hơn 1 mới được giữ lại trong mô hình phân tích

- Click Continue để trở lại hộp thoại Factor Analysis

6 Click chọn ô Rotation (Xoay nhân tố) để mở hộp thoại sau:

Xoay nhân tố là thủ tục giúp ma trận nhân tố trở nên đơn giản và dễ giải thích hơn

Có nhiều phương pháp xoay khác nhau trong đó được sử dụng rộng rãi nhất là

Varimax procedure (xoay nguyên góc các nhân tố để tối thiểu hoá số lượng biến có hệ số

lớn tại cùng một nhân tố, vì vậy sẽ tăng cường khả năng giải thích các nhân tố)

Trang 13

Nếu nhà nghiên cứu muốn xác định tập hợp nhân tố ít hơn để sử dụng trong các phương pháp phân tích đa biến tiếp theo (phân tích ANOVA, hồi quy…), ta có thể tính toán

ra các nhân số (trị số của các biến tổng hợp) cho từng trường hợp quan sát một Nhân số của nhân tố thứ i bằng:

Fi = Wi1X1 + Wi2X2 + Wi3X3 + … + WikXk

Máy tính sẽ tính các nhân số này và tự động save vào file dữ liệu những biến mới này

- Mặc định của chương trình là phương pháp tính nhân số Regression (theo đơn vị

đo lường độ lệch chuẩn)

- Chọn thể hiện bảng trọng số nhân tố bằng cách click vào ô Display factor …

- Click Continue để trở lại hộp thoại ban đầu  click Ok để thực hiện lệnh

 CÁCH ĐỌC KẾT QUẢ

 Điều kiện 1: Bảng KMO and Bartlett’s Test:

+ KMO > 0.5 + Sig < 0.05

 Điều kiện 2: Bảng Total Variance Explained:

+ Intial Eigevalues >1 (Total) + Cumulative > 50% (tổng phương sai trích)

 Điều kiện 3: Kết quả EFA: bảng Rotated Component Matrix

Trang 14

VD: xác định nhân tố ảnh hưởng đến quyết định chọn nhà trọ của sinh viên khoa QTKD trường Đại học Kinh tế Huế

gan truong

gan khu vui choi, giai tri

phong co gac lung

co nha ve sinh trong phong noi qui

dien, nuoc gia ca 1.000 522 528 313 238 291 209 288 123 402

ve sinh 522 1.000 801 581 392 096 337 298 198 393

an ninh 528 801 1.000 607 303 191 129 281 378 535

moi truong song 313 581 607 1.000 372 174 021 257 307 315

gan truong 238 392 303 372 1.000 569 325 219 034 275

gan khu vui

choi, giai tri

Bảng 1 thể hiện đại lượng thống kê mô tả

Bảng 2 thể hiện ma trận tương quan giữa các biến Ta thấy hệ số tương quan giữa các biến trong ma trận này tương đối cao

Trang 15

Bảng 3 thể hiện kết quả của kiểm định Barlett Dựa vào kết quả này ta có thể bác bỏ H0 (Các

biến không có tương quan với nhau)  Phân tích nhân tố là phương pháp phù hợp để phân

tích ma trận tương quan ở bảng 2

Bảng 3 KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy .714

Bartlett's Test of Sphericity Approx Chi-Square 167.933

Dựa vào bảng 5 và theo tiêu chuẩn eigenvalue lớn hơn 1 thì chỉ có 3 nhân tố được rút trích

ra Giá trị Cumulative % cho biết 3 nhân tố đầu giải thích 66.78% biến thiên của dữ liệu

Bảng số 4 (bảng Cummunalities) cho biết thông tin về phần biến thiên được giải thích bởi các nhân tố chung

Bảng số 6 là bảng thể hiện các nhân tố chưa xoay Để dễ dàng giải thích các nhân tố hơn ta

Trang 16

an ninh 814 -.379 -.205

moi truong song 667 -.324 -.206

gan khu vui choi, giai tri 514 661 179

phong co gac lung 369 529 -.184

co nha ve sinh trong phong 601 127 525

gan khu vui choi, giai tri (6) -.015 358 778

phong co gac lung (7) 119 -.014 660

co nha ve sinh trong phong (8) 124 746 285

Trang 17

Bảng 8 Component Transformation Matrix

Extraction Method: Principal Component Analysis

Rotation Method: Varimax with Kaiser

gan khu vui choi, giai tri -.191 143 448

phong co gac lung -.034 -.108 397

co nha ve sinh trong phong -.134 418 076

Rotation Method: Varimax with Kaiser Normalization

Rotation Method: Varimax with Kaiser

Normalization

Component Scores

Dựa vào bảng 8, 9 và 10 ta xác định nhân số như sau:

F1 = 0.218*giá cả + 0.386*vệ sinh + 0.354*an ninh + 0.309*môi trường sống

F2 = 0.418*có nhà vệ sinh trong phòng + 0.515*nội quy + 0.341*điện nước

F3 = 0.430*gần trường + 0.448*gần khu vui chơi + 0.397*có gác lửng

Trang 18

8 KIỂM ĐỊNH ĐỘ TIN CẬY THANG ĐO

(SỬ DỤNG KIỂM ĐỊNH CRONBACH'S ALFA)

 Ý NGHĨA

Đánh giá xem thang đo có đồng nhất hay không => xem xét xem thang đo đó có ĐO CÙNG MỘT KHÁI NIỆM hay không

- Nguyên tắc cơ bản:

Số lượng biến càng lớn -> Giá trị Cronbach Alpha càng cao

Chạy cronbach's alfa dựa trên các nhóm biến từ kết quả EFA

B1: Analyze -> Scale -> Reliability Analyze

B2: đưa các biến thuộc 1 thang đo vào Item

B1: Đọc giá trị Cronbach Alpha của nhóm (0,7;0,95)

+ Nếu < 0,7: kém tin cậy + Nếu > 0,95: thừa biến

B2: < 0,7 -> loại biến

Xem 2 cột tiêu chí + Cronbach alpha if item deleted: giá trị nào cao hơn Cronbach alpha của nhóm -> loại

+ Correct Item total correlation: giá trị nào < 0,3 -> loại

Lý do vì sao nên chạy Cronbach' alfa trước & sau:

- “Cronbach alpha phải được thực hiện trước để loại các biến rác (garbage items) trước khi thực hiện phân tích EFA Quá trình này có thể giúp chúng ta tránh được các biến rác vì các biến rác này có thể tạo nên các nhân tố giả (artifical factors) khi phân tích EFA (Churchill 1979)” (Nguyễn Đình Thọ, Phương pháp nghiên cứu trong kinh doanh, tr.304)

==> Trong một thang đo các bạn đưa ra chắc chắn sẽ có sai số đo lường (do bảng câu hỏi,

Trang 19

thang đo có thể tạo thành các biến giả - biến giả ở đây là các biến đo lường niệm nhưng khái niệm này không liên quan gì đến vấn đề đang nghiên cứu (không có trong

cùng-một-khái-mô hình)

Vậy thì trường hợp các bạn chạy phân tích nhân tố (EFA) trước, giả sử trong thang đo có

3-5 biến giả và được SPSS vô tình nhóm cùng một nhóm Và lúc đó bạn sẽ phải đặt tên cho nhóm biến đó trong khi nó hoàn toàn không có giá trị cho bài nghiên cứu

Sau đó bạn lại tiếp tục đánh giá Cronbach alpha cho những “nhân tố” đã được EFA sắp xếp lại Vậy thì sau khi đã EFA, các nhân tố đo lường cùng một khái niệm đã được sắp xếp chung, các bạn đánh giá Cronbach alpha thì HIỂN NHIÊN nó sẽ ĐO LƯỜNG CÙNG

KHÁI NIỆM và cho kết-quả-tốt thôi Các bạn có thể kiểm chứng bằng cách cho chạy thử Cronbach alpha cho những “nhân tố” đã được EFA sắp xếp Thì Cronbach alpha luôn cao,

và sẽ KHÔNG có một biến nào mà khi delete có thể làm tăng Cronbach alpha được (có thể chênh lệch 1 chút nhưng sẽ không đáng để bạn loại biến đó ra)

Như vậy việc kiểm định Cronbach alpha sau là vô nghĩa!

9 KIỂM ĐỊNH PHÂN PHỐI CHUẨN

Thông thường có 2 cách (khuyến cáo nên sử dụng cách 2)

- C1: dựa trên cặp giá trị kiểm định về phân phối chuẩn Skewness và Kurtosis

Trang 20

 CÁCH CHẠY (kiểm định Kolmogorov-Smirnov)

B1: Analyze -> Nonparametric Tests -> 1-sample K-S

B2: Đưa biến vào (lấy output của EFA hoặc dùng lệnh Compute để tạo ra nhân tố đại diện cho nhóm biến)

Dựa trên cặp giả thiết:

H0: có phân phối chuẩn

H1: không có phân phối chuẩn

 Bảng One sample Kolmogorov Smirnov Test:

Asymp Sig > 0,05 -> có phân phối chuẩn (chấp nhận H0)

10 CÁC KIỂM ĐỊNH THAM SỐ (One sample t-test, Independent Sample t-test, Paired

Sample t-test, One way ANOVA) ==> điều kiện cơ bản nhất là mẫu phải có phân phối chuẩn

KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ

(Kiểm định One sample T test)

 Ý NGHĨA

Kiểm định giá trị trung bình của tổng thể để xem giá trị của tổng thể rơi vào khoảng nào?

H0: giá trị trung bình của tổng thể = 4

H1: giá trị trung bình của tổng thể # 4

B1: Analyze -> Compare Mean -> One sampleT test

B2: đưa từng nhóm biến vào -> chọn test value = 4 ->OK

+ Sig > 0,05 -> không đủ cơ sở để bác bỏ H0 -> KL = 4, đồng ý

+ Sig < 0,05 -> bác bỏ H0 -> dựa vào giá trị Mean để kết luận

Tiêu đề	Hướng dẫn thực hành spss cơ bản
Tác giả	Dương Đắc Quang Hảo
Trường học	Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành	Kinh tế
Thể loại	Hướng dẫn
Thành phố	Hà Nội

Định dạng
Số trang	35
Dung lượng	1,8 MB