Hướng dẫn thực hiện phân tích tương quan và mô hình hồi quy tuyến tính trên SPSS, Hướng dẫn thực hiện phân tích tương quan và mô hình hồi quy tuyến tính trên SPSS, Hướng dẫn thực hiện phân tích tương quan và mô hình hồi quy tuyến tính trên SPSS, Hướng dẫn thực hiện phân tích tương quan và mô hình hồi quy tuyến tính trên SPSS, Hướng dẫn thực hiện phân tích tương quan và mô hình hồi quy tuyến tính trên SPSS
Trang 1Phân tích tương quan Pearson trên SPSS (Đọc & Giải thích kết quả sau khi thực hiện phân tích tương quan Pearson)
PHÂN TÍCH DỮ LIỆU KHOA HỌC
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 2Hướng dẫn chạy mô hình hồi quy tuyến tính
(Thống kê, Cronbach’s Alpha, EFA, Tương quan, Mô hình, T-Test & ANOVA)
Lưu ý: Chuyên mục này chỉ hướng dẫn thực hiện, đọc & giải thích kết quả phân tích tương quan Pearson,
các bước khác xem thêm nội dung đào tạo khác
Trang 3Trình bày: NKH NGÔ ĐỨC CHIẾN
Phân tích tương quan Pearson
Hệ số tương quan Pearson, được kí hiệu bằng chữ “r”, giá trị trong khoảng -1 ≤ r ≤ +1.
Nếu r > 0 thể hiện tương quan đồng biến, ngược lại, r < 0 thể hiện tương quan nghịch biến,giá trị r = 0 chỉ ra rằng hai biến không có mối liên hệ tuyến tính (Hair & cộng sự, 2014)
r +/-1: quan hệ giữa hai biến càng chặt
r 0: quan hệ giữa hai biến càng yếu
Lý thuyết cần biết
Trang 4Trình bày: NKH NGÔ ĐỨC CHIẾN
Phân tích tương quan Pearson
Ý nghĩa của hệ số tương quan Pearson “r”:
+/- 0,01 đến +/-0,1: Mối tương quan quá thấp, không đáng kể
+/- 0,2 đến +/-0,3: Mối tương quan thấp
+/- 0,4 đến +/-0,5: Mối tương quan trung bình
+/- 0,6 đến +/-0,7: Mối tương quan cao
+/- 0,8 trở lên: Mối tương quan rất cao
Ví dụ: r = 0,525 thể hiện mối tương quan dương/tích cực ở mức độ trung bình
Lý thuyết cần biết
Trang 5Trình bày: NKH NGÔ ĐỨC CHIẾN
Hệ số tương quan biểu thị trên đồ thị phân tán Scatter
Trang 6Trình bày: NKH NGÔ ĐỨC CHIẾN
Phân tích tương quan Pearson
Mức ý nghĩa “Sig.” của hệ số tương quan, cụ thể như sau:
Sig < 5 %: mối tương quan khá chặt chẽ
Sig < 1 %: mối tương quan rất chặt chẽ
Sig > 5 %: không có mối tương quan
Thông thường các nhà nghiên cứu chọn mức ý nghĩa 5% để đánh giá!
Lý thuyết cần biết
Trang 7Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 8Trình bày: NKH NGÔ ĐỨC CHIẾN
Phân tích tương quan Pearson
1 Đặt tênbiếnmuốn tính(VD: Atb)
2 Nhập công thứctính vào (Trungbình cộng cácbiến thành phần)
3 Bấm Ok
Tương tự cho các biến Btb, Ctb, Dtb,
Etb, FtbBước 2
Trang 9Trình bày: NKH NGÔ ĐỨC CHIẾN
Phân tích tương quan Pearson
1 Vào Sheet này nhé!
2 Quan sát dướicùng có các biếnmới tạo ra
Bước 3
Trang 10Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 11Trình bày: NKH NGÔ ĐỨC CHIẾN
1 Đưa cácbiến/nhân
tố vào đây!
2 Chọn cácmục nhưdưới đây
3 BấmOptions…
Trang 12Trình bày: NKH NGÔ ĐỨC CHIẾN
Chọn mục này nếu các bạn muốn thể hiện số mẫu quan sát lên trong bảng & ở tất cả các biến
Chọn mục này nếu các bạn không muốn thể hiện số mẫu quan sát lên trong bảng & ở tất cả các biến, mà chỉ muốn hiển thị ghi chú cuối bảng
Trang 13Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 14Trình bày: NKH NGÔ ĐỨC CHIẾN
Phân tích tương quan Pearson
Căn cứ vào kết quả phân tích tương quan ta thấy, nhân tố phụ thuộc Ftb có mối tương quandương/cùng chiều với các nhân tố độc lập Atb, Btb, Ctb, Dtb, Etb; điều đó thể hiện qua hệ số tươngquan Pearson của các mối quan hệ này đều lớn hơn 0, cụ thể, hệ số tương quan Pearson của nhân tốphụ thuộc Ftb với các nhân tố độc lập Atb, Btb, Ctb, Dtb, Etb lần lượt là 0,222; 0,251; 0,592;0,573; 0,210
Cùng với đó, hệ số Sig trong mối tương quan giữa nhân tố phụ thuộc Ftb với các nhân tố độc lậpAtb, Btb, Ctb, Dtb, Etb lần lượt là 0,002; 0,000; 0,000; 0,000; 0,003 đều nhỏ hơn 0,05 (tức nhỏ hơn5%); điều này cho thấy mối tương quan giữa nhân tố phụ thuộc Ftb với các nhân tố độc lập Atb,Btb, Ctb, Dtb, Etb đều có ý nghĩa thống kê
Kết quả minh họa
Trang 15.39.2489 Chuyên gia Phân tích dữ liệu định lượng
Dịch vụ Phân tích và Đào tạo
SPSS, AMOS, STATA, R Hình thức Online hoặc Offline
Phạm vi Toàn Quốc
0905.39.2489
Big Data (R @ 2020)
Trang 16“Chúng tôi rất tự hào được đồng hành cùng các bạn trong việc tìm hiểu và chia
sẻ các kiến thức Phân tích định lượng Đó sẽ luôn luôn là nguồn cảm hứng cho
sự hoàn thiện bản thân của chúng tôi!”
Trang 17Bản quyền thuộc về:
Mr Corn’s Official
Tư vấn nội dung:
Trung tâm Đào tạo Phân tích SPSS AMOS STATA R
Thiết kế & Trình bày ý tưởng:
Trung tâm Đào tạo Phân tích SPSS AMOS STATA R
Trang 18Mô hình hồi quy tuyến tính trên SPSS
(Đọc & Giải thích kết quả sau khi chạy mô hình)
PHÂN TÍCH DỮ LIỆU KHOA HỌC
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 19Phần 1: Các tiêu chí cần biết trong mô hình hồi quy Phần 2: Hướng dẫn các bước thực hiện mô hình hồi quy Phần 3: Đọc & Giải thích kết quả mô hình hồi quy tuyến tính
PHÂN TÍCH DỮ LIỆU KHOA HỌC
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 20Hướng dẫn chạy mô hình hồi quy tuyến tính
(Thống kê, Cronbach’s Alpha, EFA, Tương quan, Mô hình, T-Test & ANOVA)
Lưu ý: Chuyên mục này chỉ hướng dẫn thực hiện, đọc & giải thích kết quả mô hình hồi quy,
các bước khác xem thêm nội dung đào tạo khác
Trang 21Phần 1: Các tiêu chí cần biết trong mô hình hồi quy
PHÂN TÍCH DỮ LIỆU KHOA HỌC
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 22 Sig của kiểm định t: Xem xét ý nghĩa thống kê các biến/nhân tố trong mô hình
R bình phương, R bình phương hiệu chỉnh: Độ tin cậy của mô hình
Giá trị Sig trong kiểm định F: Kiểm định sự phù hợp của mô hình
Durbin – Watson: Kiểm định sự tự tương quan
Hệ số phóng đại phương sai VIF: Kiểm định hiện tượng đa cộng tuyến
Trang 23Giá trị Sig của kiểm định t trong bảng Coefficients được sử dụng để kiểm định ý nghĩacủa hệ số hồi quy Nếu Sig kiểm định t của hệ số hồi quy của một biến/nhân tố độc lập nhỏ hơn0,05; ta kết luận biến/nhân tố độc lập đó có tác động đến biến/nhân tố phụ thuộc.
Nếu Sig kiểm định t của biến/nhân tố độc lập lớn hơn 0,05; chúng ta kết luận biến/nhân tốđộc lập đó không có sự tác động lên biến/nhân tố phụ thuộc, và không cần loại bỏ biến đó đểchạy lại hồi quy lần tiếp theo, nhưng nếu muốn, bạn có thể loại biến/nhân tố có Sig > 0,05 đểchạy lại mô hình hồi quy mới Mỗi biến/nhân tố độc lập tương ứng với một hệ số hồi quy riêng,
do vậy mà ta cũng có từng kiểm định t riêng (Hair & cộng sự, 2014)
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 24Giá trị R 2 (R Square), R 2 hiệu chỉnh (Adjusted R Square)
Giá trị R2và R2hiệu chỉnh phản ánh mức độ giải thích biến phụ thuộc của các biến độc lậptrong mô hình hồi quy R2 hiệu chỉnh phản ánh sát hơn so với R2 Mức dao động của 2 giá trịnày là từ 0 đến 1, tuy nhiên việc đạt được mức giá trị bằng 1 là gần như không tưởng dù môhình đó tốt đến nhường nào Giá trị này thường nằm trong bảng Model Summary
Cần chú ý, không có tiêu chuẩn chính xác R2 hiệu chỉnh ở mức bao nhiêu thì mô hình mớiđạt yêu cầu, chỉ số này nếu càng tiến về 1 thì mô hình càng có ý nghĩa, càng tiến về 0 thì ýnghĩa mô hình càng yếu Thường chúng ta chọn mức trung gian là 0,5 để phân ra 2 nhánh ýnghĩa mạnh/ý nghĩa yếu, từ 0,5 đến 1 thì mô hình là tốt, bé hơn 0,5 là mô hình chưa tốt
Tuy nhiên, tùy vào dạng nghiên cứu và dạng dữ liệu, không phải lúc nào cũng bắt buộc rằng
mô hình hồi quy phải đạt giá trị R2 hiệu chỉnh lớn hơn 0.5 mới có ý nghĩa
Trang 25Giá trị sig của kiểm định F được sử dụng để kiểm định độ phù hợp của mô hình hồi quy.Nếu sig nhỏ hơn 0,05, ta kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và cóthể sử đụng được Giá trị này thường nằm trong bảng ANOVA.
Nếu giá trị Sig của kiểm định F < 0,05 (tức nhỏ hơn 5%), thì kết quả mô hình hồi quy tuyếntính là phù hợp, tức là sự kết hợp của các biến/nhân tố độc lập có trong mô hình có thể giải thíchđược sự thay đổi của biến/nhân tố phụ thuộc, hay nói cách khác có ít nhật một biến/nhân tố độclập ảnh hưởng đến biến/nhân tố phụ thuộc Cùng với đó, chúng ta có thể kết luận R bìnhphương của tổng thể khác 0 => Mô hình hồi quy tuyến tính có thể có thể suy rộng và áp dụngcho tổng thể (Hair & cộng sự, 2014)
Giá trị Sig của kiểm định F
Trang 26Trị số Durbin – Watson (DW) dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất(kiểm định tương quan của các sai số kề nhau) DW có giá trị biến thiên trong khoảng từ 0 đến4; nếu các phần sai số không có tương quan chuỗi bậc nhất với nhau thì giá trị sẽ gần bằng 2,nếu giá trị càng nhỏ, gần về 0 thì các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 cónghĩa là các phần sai số có tương quan nghịch.
Theo Field (2009), nếu DW nhỏ hơn 1 và lớn hơn 3, chúng ta cần thực sự lưu ý bởi khả năngrất cao xảy ra hiện tượng tự tương quan chuỗi bậc nhất Theo Yahua Qiao (2011), thường giá trị
DW nằm trong khoảng 1,5 – 2,5 sẽ không xảy ra hiện tượng tự tương quan, đây cũng là mức giá
trị tiêu chuẩn chúng ta sử dụng phổ biến hiện nay.
Để đảm bảo chính xác, chúng ta sẽ tra ở bảng thống kê Durbin-Watson (có thể tìm bảng thống
kê DW trên Internet) Giá trị này thường nằm trong bảng Model Summary
Trang 27Trình bày: NKH NGÔ ĐỨC CHIẾN
Link tra cứu hệ số Durbin – Watson:
https://drive.google.com/file/d/1VMLZuFXj8TImYQJOa0AhY4V9XIh2dhyg/view?usp=sharing
Theo Yahua Qiao (2011)
Nếu 1,5 < d < 2,5 thì kết luận mô hình không có tự tương quan
Nếu 0 < d < 1,5 thì kết luận mô hình có tự tương quan dương
Nếu 2,5 < d < 4 thì kết luận mô hình có tự tương quan âm
Lý thuyết cần biết
Trang 28Hệ số phóng đại phương sai VIF dùng để kiểm tra hiện tượng đa cộng tuyến.
Thông thường, nếu VIF của một biến/nhân tố độc lập lớn hơn 10 nghĩa là đang có đa cộngtuyến xảy ra với biến/nhân tố độc lập đó Khi đó, biến/nhân tố này sẽ không có giá trị giải thíchbiến thiên của biến/nhân tố phụ thuộc trong mô hình hồi quy (Hair & cộng sự, 2014)
Với các đề tài sử dụng thang đo Likert, nếu hệ số VIF > 2 thì khả năng rất cao đang xảy rahiện tượng đa cộng tuyến giữa các biến độc lập Giá trị này thường nằm trong bảng Coefficients(Hair & cộng sự, 2014)
Hệ số phóng đại phương sai VIF
Trang 29Phần 2: Hướng dẫn các bước thực hiện mô hình hồi quy
PHÂN TÍCH DỮ LIỆU KHOA HỌC
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 30Các bước thực hiện mô hình hồi quy tuyến tính
Trang 31Các bước thực hiện mô hình hồi quy tuyến tính
2 Đưa các biếnđộc lập vào đây
3 Bấm nútStatistics
Trang 32Các bước thực hiện mô hình hồi quy tuyến tính
2 Bấm nútContinue,
ra bấm nútPlots
Trang 33Các bước thực hiện mô hình hồi quy tuyến tính
X như hình
2 Chọn 2 mục này
3 Bấm nútContinue,
ra bấm nútSave
Trang 34Các bước thực hiện mô hình hồi quy tuyến tính
Trang 35Phần 3: Đọc & Giải thích kết quả mô hình hồi quy tuyến tính
PHÂN TÍCH DỮ LIỆU KHOA HỌC
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 36Bảng Model Summary cho chúng ta kết quả R bình phương (R Square) và R bình phương hiệu
chỉnh (Adjusted R Square) để đánh giá mức độ phù hợp của mô hình Giá trị R bình phương hiệuchỉnh bằng 0,521 cho thấy các biến độc lập đưa vào phân tích hồi quy ảnh hưởng 52,1% sự biếnthiên của biến phụ thuộc, còn lại 47,9% là do các biến ngoài mô hình và sai số ngẫu nhiên
Kết quả bảng này cũng đưa ra giá trị Durbin–Watson để đánh giá hiện tượng tự tương quan
chuỗi bậc nhất Giá trị DW = 1,582; nằm trong khoảng 1,5 đến 2,5 nên kết quả không vi phạm giảđịnh tự tương quan chuỗi bậc nhất
Trình bày: NKH NGÔ ĐỨC CHIẾN
Kết quả minh họa
Trang 37Bảng ANOVA cho chúng ta kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi
quy Giá trị F = 43,867 và Sig kiểm định F bằng 0,000 < 0.05 (tức nhỏ hơn 5%), do đó, kết quả môhình hồi quy tuyến tính là phù hợp, tức là sự kết hợp của các nhân tố độc lập có trong mô hình có thểgiải thích được sự thay đổi của nhân tố phụ thuộc, hay nói cách khác có ít nhật một nhân tố độc lậpảnh hưởng đến nhân tố phụ thuộc Ftb Cùng với đó, chúng ta có thể kết luận R bình phương của tổngthể khác 0 => Mô hình hồi quy tuyến tính có thể có thể suy rộng và áp dụng cho tổng thể
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 38Kết quả phân tích các hệ số hồi quy tuyến tính cho thấy giá trị Sig tổng thể của các nhân tố độc lập đều nhỏ hơn 5%, điều này chứng tỏ 4 nhân tố Atb, Btb, Ctb, Dtb, Etb đều có ý nghĩa ở mức 5 % hay nói cách khác đạt mức độ tin cậy 95% trong mô hình và đều có tác động đến nhân tố Ftb.
Lưu ý: Nếu có nhân tố độc lập nào có Sig > 5% thì loại đi và chạy lại mô hình
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 39Phương trình hồi quy thể hiện mối quan hệ giữa các nhân tố
Theo hệ số chưa chuẩn hóa : Ftb = -0,508 + 0,212*Atb + 0,109*Btb + 0,344*Ctb + 0,292*Dtb + 0,174*Etb + ei
Theo hệ số đã chuẩn hóa : Ftb = 0,206*Atb + 0,123*Btb + 0,406*Ctb + 0,308*Dtb + 0,191*Etb + ei
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 40Căn cứ vào kết quả mô hình hồi quy cho thấy, nhân tố Ctb tác động cùng chiều/tác động dương và mạnh nhất đến nhân tố Ftb, điều đó thể hiện qua hệ số hồi quy đã chuẩn hóa là +0,406; tức khi nhân tố Ctb tăng thêm 1 đơn vị thì nhân tố Ftb tăng thêm 0,406 đơn vị.
Lưu ý: Giải thích tương tự cho các nhân tố khác
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 41Kiểm tra đa cộng tuyến là một trong những vấn đề quan trọng trong việc phân tích môhình hồi quy, nếu VIF lớn hơn 2 thì có thể xảy ra hiện tượng đa cộng tuyến (Hair & cộng
sự, 2014) Kết quả cho thấy, hệ số VIF của các nhân tố Atb, Btb, Ctb, Dtb, Etb lần lượt là1,102; 1,081; 1,346; 1,418; 1,048 đều nằm trong mức cho phép (tức nhỏ hơn 2), cho thấy
mô hình không bị đa cộng tuyến, nghĩa là hiện tượng đa cộng tuyến không xảy ra.
Trình bày: NKH NGÔ ĐỨC CHIẾN
Trang 42Đối với đồ thị Histogram, nếu giá trị trung
bình Mean gần bằng 0, độ lệch chuẩn Std Dev gần bằng 1, các cột giá trị phần dư phân bố theo dạng hình chuông, ta có thể khẳng định phân phối là xấp xỉ chuẩn, giả định phân phối chuẩn của phần
dư không bị vi phạm Cụ thể kết quả cho thấy, Mean = 8.16E-16 = 8.16 * 10 -16 = 0.00000 gần bằng 0, độ lệch chuẩn là 0.987 gần bằng 1 Như
vậy có thể nói, phân phối phần dư xấp xỉ chuẩn,
giả định phân phối chuẩn của phần dư không bị vi phạm Mô hình hồi quy tuyến tính là phù hợp.
Trình bày: NKH NGÔ ĐỨC CHIẾN
Kết quả minh họa
Trang 43Trình bày: NKH NGÔ ĐỨC CHIẾN
Ngoài cách kiểm tra bằng đồ thị Histogram, thì P-P Plotcũng là một dạng đồ thị được sử dụng phổ biến giúp nhận
diện sự vi phạm giả định phần dư chuẩn hóa Đối với đồ
thị Normal P-P Plot, nếu các điểm dữ liệu trong phân
phối của phần dư bám sát vào đường chéo, phần dư càng
có phân phối chuẩn Nếu các điểm dữ liệu phân bố xađường chéo, phân phối càng “ít chuẩn”
Kết quả đồ thị cho thấy, các điểm dữ liệu phần dư tập trung khá sát với đường chéo, như vậy, phần dư có phân phối xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm Mô hình hồi quy tuyến tính là phù hợp
Trang 44Một giả định trong mô hình hồi quy là phải có mối liên hệ tuyến tính giữa biến phụ thuộc với các biến độc
lập Đồ thị phân tán Scatter Plot giữa các phần dư
chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta
dò tìm xem dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không.
Nếu các điểm dữ liệu phân bố tập trung xung quanh đường tung độ 0 và có xu hướng tạo thành một đường thẳng, giả định liên hệ tuyến tính không bị vi phạm Cách bố trí của điểm dữ liệu trên đồ thị scatter sẽ tùy thuộc vào bản chất biến phụ thuộc, khi đánh giá, chúng ta cần nhìn tổng quát xu hướng của đám mây điểm dữ liệu.
Trình bày: NKH NGÔ ĐỨC CHIẾN
Cụ thể với kết quả cho thấy, phần dư chuẩn hóa
phân bổ tập trung xunh quanh đường tung độ 0, do vậy giả định quan hệ tuyến tính không bị vi phạm.
Trang 45.39.2489 Chuyên gia Phân tích dữ liệu định lượng
Dịch vụ Phân tích và Đào tạo
SPSS, AMOS, STATA, R Hình thức Online hoặc Offline
Phạm vi Toàn Quốc
0905.39.2489
Big Data (R @ 2020)
Trang 46“Chúng tôi rất tự hào được đồng hành cùng các bạn trong việc tìm hiểu và chia
sẻ các kiến thức Phân tích định lượng Đó sẽ luôn luôn là nguồn cảm hứng cho
sự hoàn thiện bản thân của chúng tôi!”
Trang 47Bản quyền thuộc về:
Mr Corn’s Official
Tư vấn nội dung:
Trung tâm Đào tạo Phân tích SPSS AMOS STATA R
Thiết kế & Trình bày ý tưởng:
Trung tâm Đào tạo Phân tích SPSS AMOS STATA R