Bài giảng Nhập môn Kinh tế lượng: Chương 4 Phân tích hồi quy bội: Vấn đề suy diễn thống kê do Phạm Trí Cao biên soạn trình bày các nội dung sau: Phân phối mẫu của ước lượng OLS, kiểm định giả thuyết về từng tham số tổng thể, khoảng tin cậy, kiểm định giả thuyết về tổ hợp tuyến tính của các tham số,....
Trang 1© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Chương 4
Phân tích hồi quy bội:
Vấn đề suy diễn thống kê
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Suy diễn thống kê trong mô hình hồi quy Kiểm định giả thuyết về tham số tổng thể Xây dựng các khoảng tin cậy (đối xứng) 4.1 Phân phối mẫu của ước lượng OLS Ước lượng OLS là các biến ngẫu nhiên
Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này Tuy nhiên, chúng ta cần biết về phân phốicủa chúng để kiểm định giả thuyết thống kê
Để suy luận về phân phối, chúng ta cần thêm giả thiết Giả thiết về phân phối của sai số: sai số có phân phối chuẩn
Phân tích hồi quy bội Vấn đề suy diễn
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Giả thiết MLR.6 (Phân phối chuẩn của sai số)
độc lập với các biến
Giả sử rằng phần sai số của hồi quy tổng thể có phân phối chuẩn.
Dạng phân phối và phương sai không phụ thuộc vào bất kỳ biến giải thích nào.
Suy ra:
Phân tích hồi quy bội
•Định lý giới hạn trung tâm (CLT)
• Biến ngẫu nhiên tổng x = x1+…+xk với x1, , xklà các biến ngẫu nhiên
Nếu các điều kiện sau thỏa:
•Các xilà độc lập
•Các xicó cùng phân phối xác suất
•Các xicó cùng kỳ vọng và phương sai (hữu hạn)
•k lớn (thường k 30)
• thì x sẽ có phân phối xấp xỉ chuẩn
Trang 2© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Thảo luận về giả thiết phân phối chuẩn Phần sai số được xem là tổngcủa “nhiều“ yếu tố không quan sát được Tổng của các yếu tố độc lập có phân phối xấp xỉchuẩn (Định lý giới hạn trung tâm -Central Limit Theorem - CLT)
Các vấn đề nảy sinh:
• Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không?
• Có thể phân phối của từng yếu tố này sẽ không đồng nhất với nhau
• Các yếu tố này độc lập với nhau ở mức nào?
Phân phối của sai số là một vấn đề thuộc về thực nghiệm
Ít nhất là phân phối của sai số “xấp xỉ “ với phân phối chuẩn Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo
Phân tích hồi quy bội Vấn đề suy diễn
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Thảo luận về giả thiết phân phối chuẩn (tt)
Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn:
• Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu)
• Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm)
• Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1) Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua việc
biến đổi dạng biến phụ thuộc(chẳng hạn như dùng log(wage) thay cho wage) Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt nhất(kể
cả ước lượng phi tuyến) Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối chuẩn
có thể thay thế bằng cỡ mẫu lớn (xem Chương 5)
Phân tích hồi quy bội Vấn đề suy diễn
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6) Tập tin gpa1.wf1
Dependent Variable: COLGPA Method: Least Squares Included observations: 141 Variable Coefficient Std Error t-Statistic Prob
C 0.902058 0.650366 1.387001 0.1677 HSGPA 0.433794 0.097088 4.468031 0.0000 ACT 0.014486 0.010578 1.369538 0.1731 SKIPPED -0.080661 0.026173 -3.081854 0.0025 AGE 0.019904 0.022838 0.871566 0.3850 R-squared 0.237850 Mean dependent var 3.056738
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
H0: phần dư có phân phối chuẩn
H1: phần dư không có phân phối chuẩn p-value = 0,458586 > 0,05 : chấp nhận H0 Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
Trang 3© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Một số thuật ngữ
Định lý 4.1 (Phân phối chuẩn trong mẫu) Dưới các giả thiết MLR.1 – MLR.6:
Các ước lượng OLS có phân phối mẫu với phương sai như đã thiết lập trong chương trước Ước lượng chuẩn hóa tuân theo phân phối
chuẩn tắc
“các giả thiết Gauss-Markov“ Các giả thiết của “mô hình hồi quy tuyến tính cổ
điển (CLM - classical linear model )“
Phân tích hồi quy bội Vấn đề suy diễn
4.1
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4.2 Kiểm định giả thuyết về từng tham số tổng thể Định lý 4.2 (phân phối t cho các ước lượng chuẩn hóa)
Giả thuyết không (trường hợp giả thuyết tổng quát sẽ đề cập sau)
Dưới các giả thiết MLR.1 – MLR.6:
Nếu việc chuẩn hóa được thực hiện bằng dùng độ lệch chuẩn ước lượng (nghĩa là dùng sai số chuẩn), phân phối chuẩn tắc sẽ được thay thế bằng phân phối t
Tham số tổng thể bằng 0, nghĩa là sau khi kiểm soát các biến độc lập khác, x j không tác động đến y Lưu ý: Phân phối t sẽ rất gần với phân phối chuẩn tắc khi bậc tự do n-k-1 lớn
Phân tích hồi quy bội Vấn đề suy diễn
4.3
4.4
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Thống kê t (hay tỷ số t)
Phân phối của thống kê t nếu giả thuyết không là đúng
Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%)
Thống kê t sẽ được sử dụng để kiểm định giả thuyết không
đã đề cập ở trên Hệ số ước lượng càng xa giá trị 0 thì giả thuyết không càng ít khả năng đúng Nhưng khi nào thì được gọi là “xa“ giá trị 0?
Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được, nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số Thống kê đo lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0 bằng bao nhiêu lần độ lệch chuẩn
Phân tích hồi quy bội Vấn đề suy diễn
4.5
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kiểm định với giả thuyết đối một phía (lớn hơn 0 – phía phải)
Kiểm định với giả thuyết đối Bác bỏ giả thuyết không và ủng hộ giả thuyết đối một phía này nếu hệ số hồi quy ước lượng được là quá lớn (cụ thể là lớn hơn giá trị tới hạn t (n-k-1)).
Xây dựng giá trị tới hạn sao cho, nếu giả thuyết không là đúng thì khả năng giả thuyết không bị bác bỏ, chẳng hạn, là 5% trong tổng số các trường hợp.
Trong ví dụ đã cho, đây là giá trị của phân phối t với 28 bậc tự do mà 5% số các trường hợp sẽ lớn hơn giá trị này
Bác bỏ H 0 nếu thống kê t lớn hơn 1,701
Phân tích hồi quy bội : Vấn đề suy diễn
4.7
4.6
t0,05(28)= 1,701
0
( 1) :
t t n k bacbo H
Trang 4© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.1: Phương trình tiền lương
Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên chức vụ, những công nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn hay không
Kiểm định với giả thuyết đối
Sai số chuẩn
Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lương (USD/giờ) hoặc không tác động gì cả.
Phân tích hồi quy bội Vấn đề suy diễn
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.1: Phương trình tiền lương (tt)
“Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có ý nghĩa thống kê ở mức 5% (thậm chí có ý nghĩa ở mức 1%).“
Thống kê t Bậc tự do;
Ở đây, sự xấp xỉ phân được áp dụng Giá trị tới hạn ứng với mức ý nghĩa 5% và 1% - phân phối t xấp
xỉ chuẩn tắc (Đây là những mức ý nghĩa thường gặp)
Giả thuyết không sẽ bị bác bỏ vì thống kê t lớn hơn giá trị tới hạn t (n-k-1) t exper = 2,41 > t 0,05 (522)= 1,645 : bác bỏ H 0
Phân tích hồi quy bội Vấn đề suy diễn
0,05(522) 1,645
t
0,01(522) 2,326
t
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kiểm định với giả thuyết đối một phía (nhỏ hơn 0 – phía trái)
Kiểm định với giả thuyết đối .
Bác bỏ giả thuyết không với giả thuyết đối một phía này nếu hệ số ước lượng được là “quá nhỏ“
(nghĩa là, nhỏ hơn so với giá trị tới hạn -t (n-k-1)).
Xây dựng giá trị tới hạn sao cho nếu giả thuyết không là đúng thì giả thuyết này sẽ bị bác bỏ, chẳng hạn, trong 5% tổng số các trường hợp.
Trong ví dụ đã cho, đây là điểm giá trị mà tại đó phân phối t với 18 bậc tự do sẽ có 5% các trường hợp nhỏ hơn giá trị này.
Bác bỏ H 0 nếu thống kê t nhỏ hơn -1,734
Phân tích hồi quy bội Vấn đề suy diễn
4.8
4.9
t0,05(18)= 1,734
0
( 1) :
t t n k bacbo H
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kiểm định với giả thuyết đối
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học
Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả học tập của sinh viên sẽ tốt hơn hay không
Trường học càng lớn càng làm giảm kết quả học tập sinh viên hoặc quy mô trường học không hề có tác động đến kết quả học tập?
Phần trăm sinh viên vượt qua bài kiểm tra môn Toán Thu nhập trung bình hàng năm của giáo viênTỷ lệ giáo viên trên 1000 sinh viên Lượng sinh viên theo học(= quy mô trường học) Phân tích hồi quy bội
Vấn đề suy diễn
Trang 5© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có tác động đến kết quả học tập của sinh viên (thâm chí là ở mức ý nghĩa 15%)
Thống kê t Bậc tự do;
Trường hợp này có thể áp dụng xấp xỉ phân phối chuẩn tắc Giá trị tới hạn với mức ý nghĩa 5% và 15%.
Giả thuyết không không bị bác bỏ vì thống kê t không nhỏ hơn giá trị tới hạn t enroll = -0,91 > -t 0,05 (404)= -1,645 : chấp nhận H 0
Phân tích hồi quy bội Vấn đề suy diễn
0,05(404) 1,645
0,15(404) 1,04
t
Bảng z:
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt) Một dạng hàm khác:
Kiểm định với giả thuyết đối
R 2 cao hơn một chút
Phân tích hồi quy bội Vấn đề suy diễn
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học tập của sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác động là ngược chiều
Thống kê t Giá trị tới hạn ở mức ý nghĩa 5%, bác bỏ giả thuyết không
Độ lớn của tác động ra sao? Nếu số sinh viên tăng lên 10 (%) thì số sinh viên vượt qua bài
kiểm tra sẽ giảm một lượng là 0,0129*10 = 0,129 (%)
(tác động rất nhỏ)
Phân tích hồi quy bội Vấn đề suy diễn
Ví dụ:
tlog(enroll)= -1,87 < -t0,05(404)= -1,645 : bác bỏ H0
0,05(404) 1,645
t
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kiểm định với giả thuyết đối hai phía
Kiểm định với Bác bỏ giả thuyết không với giả thiết đối hai phía nếu giá trị tuyệt đối của hệ số ước lượng quá lớn.
Xây dựng giá trị tới hạn sao cho nếu giả thuyết không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5%
trong tổng số các trường hợp.
Trong ví dụ đã cho, những điểm ứng với 5% các trường hợp này nằm ở hai phía đuôi của hàm phân phối.
Bác bỏ H 0 nếu giá trị tuyệt đối của thống kê lớn hơn 2,06
Phân tích hồi quy bội Vấn đề suy diễn
4.10
4.11
t0,025(25)= 2,06
| |t t (n k 1) :bacbo H
Trang 6© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.3: Các yếu tố tác động đến điểm GPA Số buổi cúp học
Tác động của hsGPA và số buổi cúp học khác 0 có ý nghĩa ở mức ý nghĩa 1%
Tác động của ACT khác 0 không có ý nghĩa thống kê, thậm chí ở mức ý nghĩa 10%.
Dùng phân phối chuẩn tắc để tìm giá trị tới hạn
Phân tích hồi quy bội Vấn đề suy diễn
0,005 0
|thsGPA| 4,38 t (137) 2,576 : bacbo H
| tACT| 1,36 t (137) 1,645: chap nhan H
0,005 0
| tskipped| 3,19 t (137) 2,576 : bacbo H
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Biến độc lập “có ý nghĩa thống kê“ trong hồi quy
Nếu một hệ số hồi quy khác 0 trong một kiểm định haiphía, biến độc lập tương ứng với hệ số hồi quy đó được gọi là “có ý nghĩa thống kê“
Nếu số bậc tự do đủ lớn sao cho có thể áp dụng xấp xỉ phân phối chuẩn thì quy tắc sau đây có thể áp dụng:
“có ý nghĩa thống kê ở mức 10% “
“có ý nghĩa thống kê ở mức 5%“
“có ý nghĩa thống kê ở mức 1%“
Phân tích hồi quy bội Vấn đề suy diễn
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn của
hệ số để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế hoặc
ý nghĩa thực tiễn!
Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị “sai“ dấu,
mô hình hồi quy có thể bị định dạng sai Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường (10%, 5%, 1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm hồi quy (cẩn thận bởi vấn đề chệch do bỏ sót biến có liên quan)
Nếu quy mô mẫu nhỏ, thì sự tác động có thể bị ước lượng “kém chính xác“
(imprecise) vì vậy bằng chứng để bỏ biến sẽ yếu hơn
Phân tích hồi quy bội Vấn đề suy diễn
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kiểm định các giả thuyết tổng quát về hệ số hồi quy
Giả thuyết không
Thống kê t
Việc kiểm định được thực hiện giống hệt như trước, ngoại trừ việc lấy giá trị ước lượng trừ cho giá trị cần kiểm định khi tính toán các thống kê kiểm định
Giá trị cần kiểm định của các hệ số hồi quy
Phân tích hồi quy bội Vấn đề suy diễn
4.12
4.13
Trang 7© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.4: Vấn đề tội phạm trong trường học và số sinh viên theo học Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% khi số sinh viên theo học tăng 1%
Giả thuyết bị bác bỏ ở mức ý nghĩa 5%
Giá trị ước lượng là khác 1 nhưng sự khác nhau có ý nghĩa thống kê hay không?
Phân tích hồi quy bội Vấn đề suy diễn
0,025 0
1,27 1
| | 2,45 (95) 1,987 : 0,11
t t bacbo H
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Tính toán p-value cho các kiểm định t
Nếu mức ý nghĩa càng nhỏ, sẽ có một điểm giá trị mà tại đó giả thuyết khôngkhông thể bị bác bỏ
Lý do là, bằng cách hạ thấp mức ý nghĩa, người ta muốn tránh sai lầm bác bỏ một giả thuyết H0đúng
Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0bị bác bỏ, được gọi là p-value của kiểm định giả thuyết
Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0vì người ta sẽ bác
bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không
p-value giúp dễ dàng kết luận hơn so với các giá trị thống kê ở những mức ý nghĩa cho trước
Phân tích hồi quy bội Vấn đề suy diễn
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Cách tính p-value (trường hợp kiểm định hai phía)
Trong trường hợp kiểm định hai phía, p-value
là xác suất sao cho các biến ngẫu nhiên có phân phối t sẽ nhận giá trị tuyệt đối lớn hơn giá trị thực tế, nghĩa là:
Khi đó, giả thuyết không sẽ bị bác bỏ nếu p-value tương ứng nhỏ hơn mức ý nghĩa.
Ví dụ, với mức ý nghĩa 5%, thống kê t sẽ không nằm trong miền bác bỏ.
Giá trị thống kê kiểm định
Những giá trị này là giá trị tới hạn cho mức ý nghĩa 5%
Phân tích hồi quy bội Vấn đề suy diễn
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
Tóm tắt kiểm định t
Mô hình y 0 1 1x k kx u
Phía phải Phía trái Hai phía
H0: βj = aj H0: βj = aj H0: βj = aj
H1: βj > aj H0: βj < aj H0: βj ≠ aj
ˆ ˆ ( )
j j j
a t se
t(n-k-1) t(n-k-1) t/2(n-k-1)
t > t(n-k-1) t < -t(n-k-1) |t| > t/2(n-k-1) Quy tắc bác bỏ H0
= 5%, n= 27, k+1= 7 t(n-k-1) = t0,05(20) = 1,725
t/2(n-k-1) = t0,025(20) = 2,086 Tra bảng thống kê
= 5%, n= 207, k+1= 7 t0,05() = 1,645
t0,025() = 1,960 p-value(1p) = P(T>|t|) p-value(2p) = P(|T|>|t|) Tính p-value p-value(1p) < (0,05) p-value(2p) < (0,05) Quy tắc bác bỏ H0
p-value(1p) = p-value(2p)/2
Trang 8PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
Trong EXCEL: Phân phối Student t
Các phân vị t/2, t được xác định theo công thức:
=TINV(xác suất, bậc tự do)
Thí dụ với công thức =TINV(0.05,6) ta được t0,025(6) = 2.4469
Để tính p–value cho kiểm định hai phía và một phía ta sử dụng công thức sau:
=TDIST(|t|, bậc tự do, đuôi) với đuôi=1: một phía, đuôi=2: hai phía
Với thí dụ n= 6, t= 2.4469 thì trong EXCEL ta gõ công thức sau:
=TDIST(2.4469,6,2) kết quả ta được p–value(2p) = 0.05
=TDIST(2.4469,6,1) ta được p–value(1p) = 0.025
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
Trong EVIEWS: Phân phối Student t
Các phân vị t/2, t được xác định theo công thức:
@abs(@qtdist(xác suất, bậc tự do)) Với thí dụ scalar a=@abs(@qtdist(0.025,6)) show a ta được t0.025(6)= 2.4469
Để tính p–value tương ứng với hai phía, ta dùng công thức:
@tdist((|t0|, bậc tự do) Với thí dụ scalar b=@tdist(2.44691185114,6) show b ta được p-value(2p) = 0.05
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Giá trị tới hạn của kiểm định hai phía
4.3 Khoảng tin cậy (đối xứng) Định lý 4.2 giúp rút ra kết quả hàm ý rằng
Diễn giải ý nghĩa của khoảng tin cậy (1- = 0,95)
Các giới hạn trên và dưới của khoảng tin cậy là ngẫu nhiên
Trong trường hợp lặp lại việc lấy mẫu, khoảng tin cậy như trên sẽ chứa hệ số hồi quy tổng thể trong 95% các trường hợp
Giới hạn dưới của khoảng tin cậy Giới hạn trên của khoảng tin cậy Độ tin cậy
Phân tích hồi quy bội Vấn đề suy diễn
ˆj /2( 1) ( ) ˆj j ˆj /2( 1) ( ) 1 ˆj
P t n k se t n k se
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Các khoảng tin cậy ứng với các mức ý nghĩa thơng thường
Liên hệ giữa khoảng tin cậy và việc kiểm định giả thuyết 2 phía
Quy tắc kinh nghiệm
Phân tích hồi quy bội Vấn đề suy diễn
Nếu ajthuộc khoảng tin cậy chấp nhận H0: βj= aj
ˆj 0,005( 1) ( )ˆj j ˆj 0,005( 1) ( ) 0,99ˆj
P t n k se t n k se
ˆj 0,025( 1) ( )ˆj j ˆj 0,025( 1) ( ) 0,95ˆj
P t n k se t n k se
ˆj 0,05( 1) ( )ˆj j ˆj 0,05( 1) ( ) 0,90ˆj
P t n k se t n k se
0,005( ) 2,576;0,025( ) 1,96;0,05( ) 1,645
t t t
Nếu ajkhơngthuộc khoảng tin cậy bác bỏ H0: βj= aj; ủng hộ H1: βj≠ aj
4.16
Trang 9© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 4.8: Mô hình hồi quy về chi phí R&D của doanh nghiệp
Chi tiêu cho R&D Doanh thu hàng năm Phần trăm lợi nhuận trên doanh thu
Tác động của doanh thu đến chi phí R&D ước lượng được có khoảng tin cậy 95% khá hẹp Ngoài ra, tác động này khác 0
có ý nghĩa thống kê vì số 0 nằm ngoài khoảng tin cậy
Tác động ước lượng được của profmarg có khoảng tin cậy 95% rất rộng Thậm chí tác động này không có ý nghĩa thống kê vì số 0 nằm trong khoảng tin cậy.
Phân tích hồi quy bội Vấn đề suy diễn
2
0,025
32; 0,918; 32 2 1 29; (29) 2,045
n R df t
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
•Tập tin rdchem.wf1
Dependent Variable: LOG(RD) Method: Least Squares Included observations: 32 Variable Coefficient Std Error t-Statistic Prob
C -4.378348 0.468013 -9.355183 0.0000 LOG(SALES) 1.084228 0.060194 18.01219 0.0000 PROFMARG 0.021659 0.012782 1.694526 0.1009 R-squared 0.917958 Mean dependent var 3.602825
Khoảng tin cậy 95% của β1: 1.084228 2.045*0.060194 Hay (0.961131 ; 1.207325)
Coefficient Confidence Intervals Included observations: 32
95% CI Variable Coefficient Low High
C -4.378348 -5.335543 -3.421154 LOG(SALES) 1.084228 0.961117 1.207339 PROFMARG 0.021659 -0.004483 0.047801
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4.4 Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học (4 năm)
Kiểm định với giả thuyết đối
Số năm đi học khi học hệ 2 năm Số năm đi học khi học hệ 4 năm
Một thống kê kiểm định có thể dùng là :
Chênh lệch giữa các ước lượng được chuẩn hóa bằng cách chia cho
độ lệch chuẩn của khoảng chênh lệch này Giả thuyết H 0 sẽ bị bác bỏ nếu giá trị thống kê t mang giá trị âm quá lớn để tin rằng sự khác nhau thực sự trong tổng thể giữa hai ước lượng là bằng 0.
Phân tích hồi quy bội Vấn đề suy diễn
4.17 4.19 4.18
4.20
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Không thể tính toán với các kết quả hồi quy bình thường
Cách làm khác
Thêm đại lượng này vào hàm hồi quy ban đầu
Không có sẵn trong kết quả hồi quy thông thường
Tính và kiểm định với
Biến độc lập mới (= tổng số năm đi học ở cả hai hệ)
Phân tích hồi quy bội Vấn đề suy diễn
4.23
4.24 4.25
Trang 10© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kết quả ước lượng
Cách làm này luôn áp dụng được với các giả thuyết tuyến tính đơn
Tổng số năm đi học
Giả thuyết bị bác bỏ tại mức ý nghĩa 10%, nhưng không bị bác bỏ tại 5%
Phân tích hồi quy bội Vấn đề suy diễn
t= -1,48 < -t0,1()= - 1,282 hayp-value(1p)= 0,07 < 0,1 : bác bỏ H0
4.27
t= -1,48 > -t0,05()= - 1,645 hayp-value(1p)= 0,07 > 0,05 : chấp nhận H0
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
•Tập tin twoyear.wf1
Dependent Variable: LWAGE (EQ01) Method: Least Squares
Included observations: 6763 Variable Coefficient Std Error t-Statistic Prob
C (β0) 1.472326 0.021060 69.91020 0.0000
JC (β1) 0.066697 0.006829 9.766984 0.0000 UNIV (β2) 0.076876 0.002309 33.29808 0.0000 EXPER (β3) 0.004944 0.000157 31.39717 0.0000 R-squared 0.222442 Mean dependent var 2.248096
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
Wald Test:
Equation: EQ01 Test Statistic Value df Probability t-statistic -1.467657 6759 0.1422 F-statistic 2.154016 (1, 6759) 0.1422 Chi-square 2.154016 1 0.1422 Null Hypothesis: C(2)-C(3)=0
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std Err
C(2) - C(3) -0.010180 0.006936 Restrictions are linear in coefficients
p-value(1p) = 0,1422 /2 = 0,0711 > 0,05: chấp nhận H0
PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
var( ) 4,66.10 ;var( ) 5,33.10 ;cov( , ) 1,93.10
Ma trận hiệp phương sai của hệ số hồi quy