TÀI LIỆU THAM KHẢO
12.7. PHAN TICH HOI QUY TUONG QUAN SU’ DUNG EXCEL VA SPSS
Sử dưng Excel
Trên thanh công cụ chọn Data => Data Analysis ta có hộp thoại sau:
Data Analysis -
Analysis Tools Fourier Analysis Histogram Moving Average
Random Number Generation Rank and Percentile Redression Sampling
t-Test: Paired Two Sample for Means t-Test: Two-Sample Assuming Equal Variances
t-Test: Two-Sample Assuming Unequal Variances wp `”
aT a eR
Chọn mục Regression ta có hộp thoại sau:
Khai báo miền dữ liệu
cho biến kết quả
—
Inout x Range: |8 — — lÌ: dE)ebes cra 2 Eleongtante dere : eas
, Wiconfidence Level.
Khai báo miền dữ liệu
cho biến nguyên nhân
"© Quput Ranger - :
¡: 6 New Worksheet BiysSi cf oe - wtp esl.
© New Workbook Hung Ct |, Mute y nghiia
Residuals
©) Residuals
'| . Standardized Residuals
| Nami picbatatiy= 8905 2S ait. Dee Phân tích phần dư
' fPẽNemal Probabity Plots
495
Sau khi lựa chọn các yêu cầu phân tích cần thiết chọn OK ta thu được bảng kết quá như sau:
SUMMARY OUTPUT
Regression Statistics Multiple R 0.9983
R Square 0.9966
Adjusted R
Square 0.9957
Standard Error 2.5760
Observations 10
ANOVA
Significanc
Of SS MS F eF
Regression 2 13803.54 6901.77 1040.07 0.000
Residual 7 46.45 6.63
Total 9 13850
Coefficien Standard Lower Upper
ts Error tStat P-value 95% 95%
Intercept 124642 312434 0.3989 0.7018 -61.4147 86.3431 X Variable 1 4.1156 16329 2.5204 0.0398 0.2543 7.9769 X Variable 2 6.0074 1.5598 3.8515 0.0063 2.3192 9.6957
So sánh các kết quả được tính ra từ Excel thay chính xác với kết quả được tính ra ở từng ví dụ trong phần lý thuyết.
Sử dụng SPSS
Phân tích hồi qui - tương quan bội trong SPSS được thực hiện như sau:
Analyze > Regression > Linear...
496
Biến phụ thuộc
Các biến độc lập
(7 Cofnedety daa rei
Giá trị lý thuyết.
[ng | T1 | Khoảng tin cậy
Ma trận hiệp phương sai
Phân tích phương sai
Hệ số xác định điều chỉnh
Thống kê mô tả
Kết quá phân tích như sau:
Descriptive Statistics
mz \
và hệ số tương quan riêng Hệ số tương quan từng phần
Kiểm định đa cộng tuyến
Kiểm định tự tương quan
Mean Std. Deviation N GTSX 255.0000 39.22867 10 Laodong 34.7000 3.77271 10
VonDT 16.6000 3.94968 10
497
Correlations
GTSX Laodong VonDT
Pearson Correlation GTSX 1.000 .995 997
Laodong 995 1.000 990
VonDT 997 990 1.000
Sig. (1-taited) GTSX . .000 000
Laodong .000 .000
VonDT .000 .000 :
N GTSX 10 10 10
Laodong 10 40 10
VonDT 10 10 10
Model Summary
Change Statistics.
Adjusted Std. Error of | R Square Durbin- Model R R Square | R Square | the Estimate | Change | Ƒ Change đít đí2 Sig. F Change Watson
“9088 997 998 2.57602 997 | 1040.071 2 7 000 2234
8. Predictors: (Constant), VonDT, Laodong
b. Dependent Variable: GTSX
ANOVA
Sum of
Model Squares df Mean Square F Sig.
1 Regression |13603.540 2 6901.774 | 1040.071 .000 Residuat 46.451 7 6.636
Total 3850.000 9
@. Predictors: (Constant), VonDT, Laodong b. Dependent Variable: GTSX
Coefficients*
Unatendardized Standardized
=..ỘỘ..5...15 99% Conhdence Interve) lo; B_ Correlations Collinearty Stata
Model B SId Error Beta + ‘Sig. Lower Bound | Uj Bo Zero-orger, Partint Part Tote MIF.
7 Constant) 12.464 31.243, a8 702 81,415 tệ. Ì Laodong 4.118 1834 _ v 2.520 40 254 7977 o5 680 065 019 51.475
006 2.319 9996 396,
VonDT 6007 1.560 605. 3.051 997 824 084 019 51475
‘© Dependent Variable: GTSX
Kết quả từ bảng tính Excel va SPSS déu cho ra kết quả chính xác như với kết quả tính ra từ các ví dụ trong phần lý thuyết. Tuy nhiên, bảng tính của Excel không cho phép tính toán các kiểm định đa cộng tuyến hay tự
tương quan còn SPSS tính cho chúng ta tất các các thống kê này.
498
TOM TAT CHUONG
Phương trình hồi qui tổng thé chung và phương trình hồi qui tổng thể mẫu trong phân tích hồi qui - tương quan bội. được thực hiện tương tự như trong phần tích hồi qui tương quan đơn. Hệ số hồi quy: Ý nghĩa, ước lượng và kiểm định. Hệ số hồi qui phản ánh ảnh hưởng trực tiếp của tiêu thức nguyên nhân nghiên cứu tới tiêu thức kết quả. Do hệ số hồi qui được tìm ra trên số liệu điều tra mẫu nên việc tìm khoảng tin cậy hay ước lượng được thực hiện như bài toán ước lượng và kiểm định thông thường. Tuy nhiên,
khi giải thích ý nghĩa của các hệ số hồi qui riêng cần phải có giả định là trong trường hợp các nhân tô khác không đổi.
Do có sự tham gia của nhiều tiêu thức nguyên nhân nên để đánh giá
trình độ chặt chẽ của mối liên hệ ngoài việc tính hệ số tương quan chung thì trong phân tích hồi qui tương quan bội còn tính các hệ số tương quan riêng của từng tiêu thức nguyên nhân tới tiêu thức kết quả trong trưởng hợp loại trừ ảnh hưởng của các tiêu thức nguyên nhân khác.
Ngoài các tiêu thức nguyên nhân là các tiêu thức số lượng thì trong
tực tế phân tích có nhiều tiêu thức là tiêu thức thuộc tính như giới tính, nghề
nghiệp, trình độ học vấn, khu vực,... với các tiêu thức thuộc tính thì cần sử
dụng biến giả D để lượng hóa theo các giá trị 0; 1 tương ứng, rồi tiến hành
phân tích như với tiêu thức số lượng.
Tương tự như với hồi qui tương quan đơn hệ số xác định giải thích % sự biến động của tiêu thức kết quả được giải thích bởi tiêu thức nguyên nhân
nghiên cứu trong phương trình. .
“Cũng do có sự tham gia của nhiều tiêu thức nguyên nhân nện trong phương trình có thể xảy ra hiện tượng là các tiêu thức nguyên nhân có tồn
tại mối liên hệ với nhau, đó là hiện tượng đa cộng tuyến. Ngoài ra trong
phương trình hồi qui bội cũng có những hiện tượng như tự tương quan, phương sai sai số thay đổi,... do vậy cần phát hiện, thấy được hậu quả của
các hiện tượng đó và có những phương pháp khắc phục hiệu quả để có được phương trình phù hợp và tốt nhất. Chăng hạn như, nếu phương trình gặp phải hiện tượng đa cộng tuyến thì sẽ dẫn đến việc ước lượng các hệ số trong
phương trình không còn chính xác dẫn đến sự sai lệch trong suy rộng kết 499
quả. Có rất nhiều cách để có thể nhân ra được là phương trình có hiện tượng đa cộng tuyến hay không, như sử dụng nhân tử phóng đại phương sai (VIF) hay độ chấp nhận của biến (tolerance),... để khắc phục hiện tượng này có thể sử dụng phương pháp loại biến cụ thể từng phương pháp như loại trừ dan, từng bước,..hoặc nghiêm trọng hơn là cần phải điều tra lại một mẫu khác hay điều tra bổ sung thêm quan sát cho mẫu. Tương tự như với hiện tượng đa cộng tuyến thì hiện tượng tự tương quan cũng gây ra những sai lệch trong ước lượng và suy rộng kết quả, thống kê D trong kiểm định Durbin - Watson là một trong nhiều cách thường được sử dụng.
Kết quả từ xây dựng phương trình hồi qui cho phép dự đoán điểm và dự đoán khoảng các giá trị cá biệt và giá trị trung bình của tiêu thức kết quả ứng với một giá tri cy thể của tiêu thức nguyên nhân.