Khởi động SPSSMở File : C:\PROGRAM FILES\SPSS\Employee data TƯƠNG QUAN VÀ HỒI QUY Salary : Lương hiện tại Educ : số năm đi học Prevexp : Số Năm kinh nghiệm Hệ số tương quan xem 02 biến c
Trang 1Khởi động SPSS
Mở File : C:\PROGRAM FILES\SPSS\Employee data
TƯƠNG QUAN VÀ HỒI QUY
Salary : Lương hiện tại
Educ : số năm đi học
Prevexp : Số Năm kinh nghiệm
Hệ số tương quan xem 02 biến có quan hệ với nhau không r
Không có quan hệ nhân quả, không phân biệt cái nào là nguyên nhân của cái nào
Kết quả của phân tích tương quan là tính được hệ số tương quan cho biết chặt hay không chặt
Trang 2|r| 0 : càng yếu
>= 0.6 : chặt ( khối KHXH)
< 0.3 : lỏng
Vẽ đồ thị :
Trang 2/8
Trang 4Ý nghĩa thống kê : của tổng thể
Ho : P salary,edu = 0
Ho : P salary,edu # 0
0 < Sig <= & Bác bỏ Ho ( sig luôn nhỏ hơn 1)
0.05
2) Hồi Quy Đơn
Salary = f ( edu)
Xây dựng một mô hình
Salary = Bo + B1 edu + E
Dependent ( phụ thuộc , được giải thích)
Máy tính sẽ tìm cho chúng ta đường OLS, hồi quy là quy
Trang 4/8
Trang 519.115 = 3909.907 / 204.547
Salary = - 18331.2 + 3909.9 * edu : SRF
Salary = - 18331.2 + 3909.9 * edu + E : SRF
E chính là sai số giữa : Salary và Salary
Trang 6Kiểm định
Ho : β 1 = 0
H1 : β 1 # 0
0 < Sig ( B1) <= & Bác bỏ Ho ( sig luôn nhỏ hơn 1)
B1 có ý nghĩa thống kê ở độ tin cậy 1 -
X1 có ý nghĩa thống kê
X1 Y
Mục tiêu của Hồi Quy :
Kiểm định
Dự Báo
Vì thế quan tâm nhất đến kết quả kiểm định chứ không quan tâm đến phương trình
Trong hồi quy đơn : r bình phương = R bình phương = 0.436
Mô hình giải thích được 43,6 % sự biến thiên thay đổi của biến phụ thuộc salary
Biến edu có ý nghĩa thống kê vì sig = 0.000 < 0.05 ( xác xuất mắc sai lầm tối đa)
&
Edu tăng 1 năm trung bình salary tăng 3909.9 và ngược lại
Để chạy hồi quy người ta yêu cầu bậc tự do df > = 30
Df == n – k = 474 – 2 = 472 phải lớn hơn 30
Có thể nhìn thống kê t , nếu | t | > = t &/2 , n-k thì bác bỏ Ho
Kiểm định F trong hồi quy đơn
Ho : R2 =0 : mô hình không có quan hệ tuyến tính
H1 : R2 #0
Trang 6/8
Trang 7Sig (F) <= & Bác bỏ Ho
F >= F &, k-1,n-k = FINV (&, k-1,n-k)
Nhìn bảng ta thấy : 0.000 < 0.05
R2 # 0
Hàm không phù hợp với dữ liệu
Hồi Quy Bội
PRF : Y = βo + β1 X1 + β2 X2 + ……… + βm Xm + E
SRF : Y = βo + β1 X1 + β2 X2 + ……… + βm Xm + E
Kiểm định T :
Ho : βi = 0
H1 : βi # 0
Sig (βi) <= anfa Bác bỏ Ho
> anfa chưa đủ cơ sở để bác bỏ Ho , có thể chấp nhận Ho
Kiểm định F trong hồi quy bội
Ho : R2 =0 :
(Β1 = β2 = … = βm = 0)
H1 : R2 #0
(ton tai mot βi # 0 , i = 1,m )
Sig (F) <= & Bác bỏ Ho
F >= F &, k-1,n-k = FINV (&, k-1,n-k)
Ví dụ :
Trang 8Con số 4020 : Khi edu tăng (giảm) Trung bình Salary tăng (giảm) 4020 $
Con số 1207 : Khi exp tăng (giảm) Trung bình Salary tăng (giảm) 12.07 $
Trong điều kiện các yếu tố khác không đổi
Biến nào không có ý nghĩa thống kê thì lọai nó ra để tìm mô hình tốt nhất
R2 = 0.439 2 biến edu và exp giải thích được sự thay đổi salary 43% là do edu và exp
R2 không giải thích tốt được mô hình bằng R2
R2 = 1 – ESS / n-k
TSS / n - 1
Để so sánh giữa 02 mô hình (cùng cỡ mẫu, cùng Y) người ta dựa vào R2
Bài tập về nhà
1) Xây dựng mô hình xem Salary bị phụ thuộc bởi các yếu tố nào : gender (mã hóa
thành 02 biến giả Nam 1, Nữ 0 ), jobcat ( mã hóa thành 03 biến giả D1, D2, D3) , edu, exp
Đọc Chương 3 hoặc 4
2) Đa Cộng Tuyến
Trang 8/8