TƯƠNG QUAN VÀHỒI QUYCORRELATION & REGRESSIONTươngquantuyếntínhHồi quytuyếntínhKiểmtracác điềukiệnápdụngmôhìnhSốliệusai lệchHồi quyvớibiếngiả(dummy)Phươngphápstepwise
Trang 1TƯƠNG QUAN VÀ HỎI QUY CORRELATION & REGRESSION
TS LỄ VĂN HUY Email: levanhuy@vnn.vn
Trang 2i
NOI DUNG
Tương quan tuyên tính
Hồi quy tuyên tính
Kiễm tra các điều kiện áp dụng mô hình
Số liệu sai lệch
Hỏi quy với biên giả (dummy)
Phuong phap stepwise
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 3TUONG QUAN (CORRELATION)
e Xem xét môi quan hệ giữa hai hay nhiều biên
e lương quan có:
$ Tương quan 2 bién — Bivariate Correlations
4 Twong quan riéng phan — Partial Correlations
Trang 4TUONG QUAN (CORRELATION)
Mục tiêu nghiên cứu: Giả định nhà nghiên cứu
muôn tìm hiểu có mỗi quan hệ như thê nào giữa
Giả thuyết H,: Trình độ học vẫn và thu nhập
không có liên hệ với nhau
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 5h.Sav | DataSet! | - SPSS Data Editor
Numeri¢ Tables ` lân viên được sự hd tro
Numeric Compare Means )_ông ty hoạt động có hiệt
Numeric General Linear Model ) hân viên được tồn trong
Numerig Generalized Linear Models jnh đạo có tác phong lịc
Numerig Mixed Models ` lân viên được đối xử c£
Numeri¢ ¬x: i lau
Numeri¢ Regression > "25 Partial i dé
Numeric Loglinear > & Distances , 8T
Numeric Neural Networks > phận công tác
: Bivariate Correlations
@b Báo thường đọc [BA
đò Báo thường đạc [BA
đò Báo thường đạc [BA
đò Báo thường đạc [BA
đò Báo thường đạc [BA
› Báo thường đọc [BA
4# Địa điểm DN [ĐI^ĐIEM 4# Lương [LUONG]
Pearson | |Kendall'stau-b [| | Spearman
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 6TUONG QUAN RIENG TUNG PHAN
(PARTIAL CORRELATION)
e Nghiên cứu mỗi quan hệ tuyến tính của hai biên
có loại trừ ảnh hưởng của các yêu tô khác
[DAfASETT | “ SPSS Data Editor ss: [d[ lái COITEIAI(iBNS
hò Công việc cho phép ^' £Ê Tuổi [TUOI] ————
Ÿ Công việc rất thú vị[ LẺ ¿ÊŸ Thu nhập [THUNHAP]
# công việc có nhiều 1
>
>
>
: @ Khi công việc hoản †
#? anh: chị được trã lư Controlling for:
` lân viên được tôn trọng € Anhi chi thudng dug ofl Chitiéu thang [CHITIEU]
Generalized Linear Models > jnh đạo có tác phong lic #? Anh: chị có thể sống
Reports
Descriptive Statistics
General Linear Model Ae ? - hà “+
Mixed Models an vién duoc déi xir ce |] | Tn wong tuong xứ
‘2 Bivariate i lat
Regression
“ce Partial ‘hi de Statistics
8 Distances ar ©) Iwo-tailed (|) One-tailed
| Test of Significance
Loglinear |_| Means and standard deviations
ñ nhân rầnn tá: Display actual significance level
% _|Ì Easte BỊ Reset JL -Missing Values
(2) Exclude cases listwise
Neural Networks
Trang 7
TUONG QUAN RIENG TUNG PHAN
(PARTIAL CORRELATION)
Significance (2-tailed) | | 294 O41
Trang 8HOI QUY DON
e Mục địch:
%_ Tìm môi quan hệ giữa hai biên (mỗi quan hệ nhân quả)
e Diệu kiện
® Hai biên định lượng
% Hai biên phải tuân theo quy luật phân phối chuẩn
e Mô hình lý thuyết:
Y,= Bo+B¿X,.+e
# Xi: trị quan sát thứ i của biên độc lập
®Y,: giá trị dự đoán thứ ¡ của biên phụ thuộc
®_ Bạ và B„: hệ sô hôi quy
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 9DIEN GIAI DU’ LIEU
« Các hệ số góc (b)
® Sự biên đôi của giá trị trung bình của các Y khi X; tang
thêm 1 đơn vị, mọi yêu tô khác không đôi
$ Kiêm định: tương tự như hồi qui đơn với (n-p-1) bậc tự
Trang 10HOI QUY DON
e Mục tiêu nghiên cứu: Nên tác động thê nào đến phong cách lãnh đạo đề tạo ra sự trung thành của nhân viên
e Câu hỏi nghiên cứu: Lòng trung thành của nhân
viên có phụ thuộc và phong cách lãnh đạo?
e Hai biên được chọn: Lãnh đạo là biên độc lập và Lòng trung thành là biên phụ thuộc
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 11HOI QUY DON
Residual 290.907 198 1.469 bac bo Họ nghĩa la
Total 401.906 199 2 biến có mối
a Predirtnrs: (Œnnstanh Lãnh đan na
Model B Std Error Beta t Sid _
1 (Constant) 957 386 2.480 014 LTT; = 0,957
Lanh dao 667 O77 526 9.692 000 +0,667*lanh dao +
a Dependent Variable: Long trung thanh
Model Summary
Mode Adjusted R Std Error of ( R2=0,276 MQH
526° 276 273 1.21212 —_ giưa len fa
a Predictors: (Constant), Lanh dao
- Nếu 0.5 < R<9.7 - Nêu 0,25 < R”<0,5 Tương quan khá chặt chẽ lanh đạo giải
- Nêu 0.7 = R<0,9 - Néu 0,5 < R'<0,8 Tuong quan chat ché thich 27, 6%
Trang 13HE SO XAC DINH DIEU CHINH R2a
stant), Lanh dao
R2 diéu chinh (R2a)
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 14KIEM ĐỊNH MỨC Y NGHĨA (DUNG F)
Trang 15MO HINH HOI! QUY (BỘI)
e Môi liên hệ giữa một biên phụ thuộc với ít nhật hai
Trang 16MO HINH HOI QUY BOI (2 BIEN) — TREN TONG THE
Trang 17MO HINH HOI QUY BOI (2 BIEN) — TREN MAU
Trang 18DIEU KIEN VAN DUNG MO HINH
e Các điều kiện về dạng mô hình :
$ MQH tuyến tính giữa các biên độc lập với biên phụ
thuộc
ác điêu kiện vê sai sô mô hình (error):
Các sai số mô hình là độc lập (không tự tương quan)
Các sai số phân phối theo phân phối chuẩn
ac diéu kiện về các sô dự đoán:
Các biên độc lập không ngẫu nhiên
Các giá trị của các biên độc lập được đo lường không
CO Sai sO
®$ Các số dự đoán là độc lập theo đường thẳng, (không
Trang 19MÔ HÌNH NGHIÊN CỨU VÀ CÁC KHÁI NIỆM
Trang 20Vi DU VE HOI QUY BOI (PP ENTER)
Save
@ Khi công việc hoàn † | ˆ Next
2 anh: chị được trả lư Independent(s): Options
ea eee w adios ÊŸ? Anh/ chị thường đượ |” ‹Ê Lãnh đạo [F1] ^
Graphs Utilities Add-ons YVindow Help @ anhi chi 06 thé séng # Co hii dao tao vai thang tién [F2] m
— — 1 — — Ê Tiền lương tương xứ ? Lương và thưởng [F3] v
Reports > 5 @®% € Tién lwong, thu nhap ˆ
Descriptive Statistics > ÊŸ Công ty có chế độ p Method:
Tables ` lân viên được sự hỗ trợ củ: : : 4Ề Công ty thực hiện ch Ÿ Công ty thực hiện ch Selection Variable: l
Compare Means > Sng ty hoạt động có hiệu qu: GP Anh chi hai long voi | > | | Rule
General Linear Model > Aan vién duce tén trong va ti $ Céng việc không bị á areal Pareree
Generalized Linear Models => jnh dao cé tac phong lich sy ‹Ê Công việc không đời Ss [ |
Mixed Models > han viên được đối xử công || Trang thiết bị nơi lâm WLS Weight:
Loglinear > Curve Estimation
Neural Networks > R Partial Least Squares
Trang 211 Regression 197.128 ? 28.161 26.404 000
Residual 204.778 192 1.067 Total Soo +99
”ñ-Predictors: (Constant), Môi trường làm việc, Cơ hội đào tạo và thằng tiến, Phúc lợi,
ng nghiệp, Lương vả thường, Lãnh đạn, Bản chất công việc
b Dependent Variable: Como tromp tram
a Predictors: (Constant), Mai trudéng lam viéc, Co hdi dao tao va thang tiến, Phúc
lựi, Đũng nghiệp, Lương vả thường, Lãnh đạn, Bản chãt cũng việc
Coefficients”
Standardized Unstandardized Coefficients Coefficients Model B Std Error Beta t Sig
Cg hol dao tao va thang 220 088 188 2.494 013
Mode Adjusted R Std Error of
| R R Square Square the Estimate
Phuong trinh hồi quy bội
LTT = -0,745
+0,245 F1 + 0,220 F2 + 0,476 F3 -0,105 F4
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 22VÁN ĐÈ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN
Đa cộng tuyến là trạng thái các biên độc lập trong
mô hình có tương quan chat chẽ với nhau
e Đề kiểm tra hiện tượng đa cộng tuyên, có thể sử
dung bang ma trận tương quan hoặc kiêm tra bằng lựa chọn Collinearity Diagnostic
Kiễm tra tự tương quan, kích vào Durbin-Watson
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 23VÁN ĐÈ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN
CC yr mde sso
? Công việc rất thú vị [
@ Anh chị được trả lư
@ Tiền lương tương xứ
@ Công ty cá chế độ
E Céng việc ỗn định, k
| eo awa
# công việc có nhiều 1 `
` Khi công việc hoàn t | ˆ
#2 Anh/ chị thường đượ
⁄#? Anh/ chị có thể sống
@ Tiền lương, thu nhập
` Công ty thực hiện ch
# Công ty thực hiện ch
# anh chị hải lòng với
` công việc không bị 4
# Công việc không đòi
4# Trang thiết bi nơi làm
Trang 24VÁN ĐÈ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN
Std Error of the Estimate
Durbin- /atsnn
.#[]®
490 472 1.03274\ 1.661
a Predictors: (Constant), Môi trường làm việc, Cơ hội đảo † tao và Ang tiến, Phúc
lợi, Đẳng nghiện, Lương và thưởng, Lãnh đạn, Ban chất công việc
b Dependent Variable: Long trung thành
Néu Di>4/(n-p-1), quan
sát được xem như có
Trang 25HÒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
Phương pháp này là kết hợp đưa vào dân và loại trừ dân
Biên nào có tương quan riêng cao nhất sẽ được xem xét đưa vào mô hình trước với xác suất là
0,05
Đề ngăn chặn hiện tượng 1 biên được chọn vào
rồi chọn ra lặp lại thì SPSS mặc định xác suất F vào nhỏ hơn F ra
Thủ tục chọn biên sẽ kết thúc khi không còn biên
nào thỏa tiêu chuẩn chọn vào, chọn ra nữa
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 26HÒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
‹Ê Công việc rất thú vị[ | | plock 4 øf 4
Ê#` công việc có nhiều t a Save
Ê Khi công việc hoàn t | ˆ 7
€ Anhi chi duge tra lw Independents): a
E Anhi chi thudng đượ € L&nh đạo [F1]
Ê Anh! chị có thể sống Ÿ Cơ hội đào tạo và thắng tiến [F2]
4# Tiền lương tương xứ ? Lương và thưởng [F3]
4# Tiền lương, thu nhập ˆ 4| |⁄:|?
eso ae elas tes
# Céng ty thuc hién ch —— -Regression Coefficienf - r21 voael tụ
@ Công ty thực hiện ch | all Selection Variable: ee -
Iv] |_| R squared change
|_| Confidence intervals | [~] Descriptives
Covariance matrix [_] Part and partial correlations
Trang 27HÒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
ANOVA‘
Sum of Model Squares df Mean Square F Sig
1 Regression 139.589 1 139.589 | 105.363 000
Residual 262.317 198 1.325 Total 401.906 199
a Predictors: (Canstanb, Lương vả thưởng
h Predictors: (Constanb, Lương và thưởng, Cơ hội đản tạo và thăng tiến
c Predictors: (Constant), Lương và thưởng, Cơ hội đào tạo và thăng tiến, Lãnh đạn
d Dependent Variable: Long trung thành
Mode Adjusted R Std Error of Durbin-
| R R Square Square the Estimate ¥vatson
a Predictors: (Constant), Luong va thuéng
b Predictors: (Constant), Luong va thuéng, Co hdi dao tao va thang tién
c Predictors: (Constant), Lương và thưởng, Cơ hội đào tạo và thăng tiễn, Lãnh đạn
d Dependent Variable: Long trung thành
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 28HÒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE
FP hol dao tao va thang 292 081 243 3.499 001 589 1.758
Mô hình:
LTT = -0,247 + 0,459 Lương và thưởng + 0,282 CH Đào tạo
và thăng tiến + 0,260 Lãnh đạo
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 29DIEU KIEN VAN DUNG MO HINH
e Các điều kiện về dạng mô hình :
$ MQH tuyến tính giữa các biên độc lập với biên phụ
thuộc
ác điêu kiện vê sai sô mô hình (error):
Các sai số mô hình là độc lập (không tự tương quan)
Các sai số phân phối theo phân phối chuẩn
ac diéu kiện về các sô dự đoán:
Các biên độc lập không ngẫu nhiên
Các giá trị của các biên độc lập được đo lường không
CO Sai sO
®$ Các số dự đoán là độc lập theo đường thẳng, (không
Trang 30CAU HOI
e Nêu có một biên (độc lập) không thỏa các điêu
kiện để thực hiện một phân tích tương quan thì
thê nào?
—> Có khả năng chuyền về biên đính tính không?
e Nêu muôn phân tích tương quan, trong cac biên
độc lập có một biên định tính (biên 2 hoặc nhiêu
lựa chọn) thì có thê thực hiện được không?
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 31BIEN GIA (DUMMY)
e Cac vi du:
# Bién giới tính: nam-nữ,
có mặt —- vắng mặt
miền Bắc, Trung, Nam
e Được mã hóa ÔÖ hoặc 1
e Vé mat ly thuyết,
# cac hang sd (hệ số chặn) phải khác nhau
e SỐ các biên giả cần thiết bằng sô lựa chọn (của
biên định tính) - 1
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 32BIEN GIA (DUMMY)
Trang 33BIEN GIA (dummy)
Y (Long trung thanh)
Trang 34MA HOA BIEN DUMMY
Trang 35TRÌNH TỰ THỰC HIỆN
s== Recode into Different Variables
Numeric Yariable -> Output Variable: Output Variable
Công việc cho phép ^ > A
@ Khi công việc hoàn † F—”
?? anh: chị được trã lư
#2 Anh: chị thường đượ | «
2 Anh chị có thể song ==: Recode into Different Variables: Old and New Values
Tiền lương tương xứ
#` Tiền lương, thu nhập -Old Value New Value
ˆ + £ “
ông ty thực hiện ch
@ Công ty thực hiện ch | Old and New Values | | oe System-missing
Ê? Anh chị hải lòng với © System-missing © Copy old value(s)
@ ca iệc không bị á |) (-If J(epljonal case selÌ
0ng việc không bị a ©) System- or user-missing
Old > New:
| Ri | | Paste | | Reset ˆ | of © Range: Add 1 > 1
| | = ELSE > 0
through
©) Range, LOYVEST through value:
©) Range, value through HIGHEST:
[ |_| Output variables are strings Wiatth:
Copyright @ 2009, LE VAN HUY, PhD., Danang University of Economics
Trang 36TRÌNH TỰ THỰC HIỆN
sẽ: “TTIÚÊ HÃANH 5PSS - MHA.sav |IDã1456ETT| - 5/55 Dã1A4 Ldiför
File Edit View Data Transform Analyze Graphs Utilities Add-ons VAndaw Help
@ Tiền lương tương xứ
@ Tiền lương, thu nhập
@ Công ty cá chế độ
Ê Công ty thực hiện ch
? Công ty thực hiện ch
#? anh chị hải lòng với
@® Công việc không bị á
Ê Công việc không đồi
# Trang thiết bị nơi làm
# công việc dn định, k |—
_ ,@ n> oe” x Yj
Name Type Width | Decimals Label Values Missing Columns
62 THUONG Numeric 8 ere Myler tm toe
63 THUNHAP Numeric 8
@ Anh! chi được tra lự Independert(s):
2 Anhí chị thường đượ @® Bắn chat công việc [FB] =