Với kết quả ước lượng trên ta thấy hệ số ước lượng của biến P là – 2,927431 < 0 và hệ số ước lượng của biến PC là 1,838563 > 0 nên kết quả ước lượng phù hợp với lý thuyết kinh tế[r]
Trang 1Bài 4: Suy diễn từ mô hình hồi quy
Hướng dẫn học
Đây là bài học thứ tư của môn học, tên gọi của nó “Suy diễn từ mô hình hồi quy”, vậy suy diễn từ mô hình hồi quy nghĩa là như thế nào? Ta xét ví dụ: chi tiêu (CT) của hộ gia đình phụ thuộc vào thu nhập (TN) của hộ và số người (SN) trong hộ với mô hình hồi quy tổng thể sau:
CT = β1 + β2TN + β3SN + u
Trong đó: Biến phụ thuộc CT là chi tiêu của hộ gia đình, biến độc lập TN là thu nhập của
hộ gia đình, biến độc lập SN là số người trong hộ
Với mẫu:
Wn = {(CT1, TN1, SN1), (CT2, TN2, SN2),…, (CTn, TNn, SNn)}
Ta tìm được mô hình hồi quy mẫu:
CT 12TN 3SNe
Là ước lượng của mô hình hồi quy tổng thể (xem lại bài 3 đã học) Tuy nhiên các hệ số hồi quy ˆ ˆ1, 2, ˆ3 trong mô hình hồi quy mẫu lần lượt là các ước lượng điểm của β1, β2,
β3 trong mô hình hồi quy tổng thể, tức là ta dùng để suy diễn cho βˆ ˆ1, 2, ˆ3 1, β2, β3
theo nghĩa lấy ˆ ˆ1, 2, ˆ3 thay cho β1, β2, β3 Tuy nhiên trong thực tế bên cạnh việc dùng
ước lượng điểm ta còn muốn đánh giá được sai số thì cần có ước lượng khoảng hay ước
xây dựng một khoảng chứa các tham số β1, β2, β3 của mô hình hồi quy tổng thể với một
độ tin cậy cho trước Đối với bài toán kiểm định giả thuyết, ta chưa có tổng thể nên ta chưa biết β1, β2, β3 tuy nhiên ta có thể giả định các tham số này có thể nhận một giá trị cho trước hay không? Để trả lời câu hỏi này ta cần đến kiến thức ở nội dung thứ 2 của bài này Nội dung thứ 3 của bài này là kiểm định sự phù hợp của hàm hồi quy Ta xét mô hình hồi quy 3 biến
CT = β1 + β2TN + β3SN + u Nếu cả hai biến độc lập trong mô hình là TN và SN không giải thích được cho sự biến động của biến phụ thuộc CT, khi ấy ta nói mô hình hồi quy không phù hợp Ngược lại nếu có ít nhất một biến độc lập TN hay SN có giải thích cho sự biến động của biến phụ thuộc CT, khi ấy ta nói mô hình hồi quy phù hợp
Bài này trình bày lý thuyết và áp dụng lý thuyết thực hành làm bài tập tương ứng với ba nội dung cơ bản của bài toán suy diễn thống kê: Đó là (1) Bài toán xây dựng khoảng tin cậy cho các hệ số hồi quy và (2) Bài toán kiểm định giả thuyết thống kê về các hệ số hồi quy và (3) Bài toán kiểm định sự phù hợp của mô hình hồi quy
Trang 2Để học tốt bài này sinh viên cần thực hiện:
Học đúng lịch trình của môn học theo tuần, đọc kĩ các khái niệm
Theo dõi các ví dụ và tính toán lại các kết quả
Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân
Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên
Tham khảo các thông tin từ trang Web của môn học
Nội dung:
Quy luật phân phối xác suất của một số thống kê mẫu;
Xây dựng khoảng tin cậy cho các hệ số hồi quy;
Kiểm định giả thuyết về các hệ số hồi quy;
Kiểm định sự phù hợp của hàm hồi quy
Mục tiêu
Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:
Hiểu rõ ý nghĩa của công thức ước lượng
Vận dụng công thức ước lượng làm được bài tập với tình huống cụ thể
Biết kết luận hoặc biết trả lời câu hỏi từ kết quả ước lượng
Hiểu rõ ý nghĩa của từng cặp giả thuyết
Tính được giá trị quan sát của tiêu chuẩn kiểm định và xác định được miền bác bỏ giả thuyết H0 tương ứng với từng cặp giả thuyết
Biết so sánh giá trị quan sát của tiêu chuẩn kiểm định với giá trị tới hạn để xác định giá trị đó có thuộc miền bác bỏ giả thuyết H0 hay không
Biết kết luận và trả lời câu hỏi
Trang 3Bài 4: Suy diễn từ mô hình hồi quy
T ình huống dẫn nhập
Tình huống 1: Giả sử ta có số liệu của 100 hộ gia đình
Trang 438 278 396 3 78 236 263 5
Ước lượng mô hình:
CT = β1 + β2TN + β3SN + u (1)
bằng phương pháp bình phương nhỏ nhất ta có kết quả ước lượng sau:
Dependent Variable: CT Included observations: 100
Với kết quả ước lượng trên ta có hàm hồi quy mẫu và mô hình hồi quy mẫu tương ứng:
CT = 3,961605 + 0,612508TN + 18,43248SN
CT = 3,961605 + 0,612508TN + 18,43248SN + e Theo lý thuyết kinh tế khi thu nhập của hộ gia đình tăng lên một đơn vị (số người trong hộ không đổi) thì chi tiêu của hộ gia đình tăng lên, đồng thời mức tăng thêm của chi tiêu không tăng bằng mức tăng thêm của thu nhập (bởi vì một phần còn để tiết kiệm) Với kết quả ước lượng trên ta thấy
hệ số ước lượng của biến TN là 0,6125 thuộc khoảng (0; 1) nên kết quả ước lượng phù hợp với lý thuyết kinh tế, tuy nhiên đấy mới là kết quả ước lượng mô hình dựa trên số liệu của 100 hộ gia đình được khảo sát, vậy nếu xét toàn bộ cho tất cả các hộ trên toàn quốc thì liệu thu nhập tăng lên
có dẫn đến chi tiêu tăng hay không? Mà nếu có tăng thì dự đoán chi tiêu sẽ tăng trong khoảng nào?
Để tìm câu trả lời cho những câu hỏi này ta cần đến kiến thức trong bài 4 này
Tình huống 2:
Khảo sát 52 đại lý có bán các loại kem đánh răng, nhóm khảo sát hỏi các chủ đại lý về số lượng
hộp kem đánh răng nhãn hiệu PS bán được trong một tháng (ký hiệu là biến Q đơn vị hộp), giá của một hộp kem đánh răng nhãn hiệu PS (ký hiệu là biến P – đơn vị nghìn đồng/hộp) và giá của một hộp kem đánh răng nhãn hiệu COLGATE (ký hiệu là biến PC – đơn vị nghìn đồng/hộp) Xét mô hình hồi quy tổng thể:
Q = β1 + β2P + β3PC+ u (2)
Với số liệu của 52 đại lý:
Trang 5Bài 4: Suy diễn từ mô hình hồi quy
Trang 625 287 30 38
Ước lượng mô hình (2) bằng phương pháp bình phương nhỏ nhất ta có kết quả ước lượng sau:
Dependent Variable: Q Included observations: 52
R–
Với kết quả ước lượng trên ta có hàm hồi quy mẫu và mô hình hồi quy mầu tương ứng:
Trang 7Bài 4: Suy diễn từ mô hình hồi quy
PC P
Q 302,98272,927431 1,838563
Q = 302,9827 – 2,927431P + 1,838563PC + e
Theo lý thuyết kinh tế khi giá của một hộp kem đánh răng nhãn hiệu PS tăng lên một đơn vị (1 nghìn đồng/ hộp) (giá của một hộp kem nhãn hiệu COLGATE không đổi) thì lượng bán hộp kem đánh răng nhãn hiệu PS sẽ giảm Mặt khác ta nhận thấy 2 loại kem đánh răng này có thể coi là 2 hàng hóa thay thế nhau nên khi giá của một hộp kem nhãn hiệu COLGATE tăng lên 1 đơn vị (1 nghìn đồng/ hộp) (giá của một hộp kem nhãn hiệu PS không đổi) thì lượng bán hộp kem đánh răng nhãn hiệu PS sẽ tăng Với kết quả ước lượng trên ta thấy hệ số ước lượng của biến P là – 2,927431 < 0 và hệ số ước lượng của biến PC là 1,838563 > 0 nên kết quả ước lượng phù hợp với lý thuyết kinh tế, tuy nhiên đấy mới là kết quả ước lượng mô hình dựa trên số liệu của 52 đại lý được khảo sát, vậy nếu xét toàn bộ cho tất cả các đại lý trên toàn quốc thì liệu giá một hộp kem đánh răng PS tăng lên có dẫn đến lượng bán hộp kem đánh răng loại này giảm xuống hay không?
Mà nếu có giảm thì dự đoán lượng bán sẽ giảm trong khoảng nào? Để tìm câu trả lời cho những câu hỏi này ta cần đến kiến thức trong bài 4 này
Hai tình huống trên là ta xét với hai tình huống cụ thể, xét trong trường hợp tổng quát ta xét mô hình với Y là biến phụ thuộc, biến Y phụ thuộc tuyến tính vào các biến X2, …, Xk theo mô hình
Y = β1 + β2X2 + … + βkXk + u
Gọi là mô hình hồi quy tổng thể (xét trường hợp tổng quát) với mẫu:
Wn = {(Yi, X2i,…, Xki), i = 1, 2,…, n}
Ta có mô hình hồi quy mẫu:
e X X
Y 12 2k k
Là ước lượng của mô hình hồi quy tổng thể Ba nội dung cụ thể của bài 4 này là (1) Xây dựng khoảng tin cậy cho các hệ số βj, (2) Kiểm định giả thuyết về các hệ số hồi quy βj, (3) Kiểm định
sự phù hợp của mô hình hồi quy tổng quát
Trang 84.1 Quy luật phân phối xác suất của một số thống kê mẫu
Xuất phát từ các j(j1,2,,k)trong mô hình hồi quy mẫu ta muốn suy đoán thống
kê về các tham số βj (j = 1, 2,…, k) trong mô hình hồi quy tổng thể thì ta cần phải biết quy luật phân phối xác suất của các j Do quy luật phân phối xác suất của các j
đều có liên quan trực tiếp với quy luật phân phối xác suất của sai số ngẫu nhiên u, do vậy ta giả thiết sai số ngẫu nhiên u có phân phối chuẩn
Giả thiết 5:
Sai số ngẫu nhiên phân phối chuẩn: u~N(0;2)
Do j là ước lượng tuyến tính, tức là j là hàm tuyến tính của các sai số ngẫu nhiên
ui nên:
j j
j
j
) 1 , 0 (
~ N
Var
U
j
j j
j
j j
(j= 1, …, k)
Khi thay
j
bởi Se(j) ta có:
ˆ ( )
~ ˆ ( )
j
Se
4.2 Bài toán xây dựng khoảng tin cậy cho các hệ số hồi quy β j
Với mẫu ngẫu nhiên và với độ tin cậy 1 – α cho trước, tìm được α1, α2 không âm thỏa mãn α1 + α2 = α đồng thời tìm được các giá trị tới hạn
(n k), (n k)
t t sao cho:
Khoảng tin cậy thường dùng cho βj là khoảng tin cậy hai phía hay khoảng tin cậy đối xứng với 1 2
2
Ví dụ 4.1:
Với số liệu của 100 hộ gia đình đã cho, ước lượng mô hình (1) ta có kết quả ước lượng:
CT = 3,961605 + 0,612508TN + 18,43248SN + e
Se (5,07) (0,014314) (1,003414)
Với kết quả ước lượng trên, ta đặt ra câu hỏi khi số người trong hộ không đổi, thu nhập của hộ tăng lên một đơn vị (hay tăng lên một triệu đồng) thì chi tiêu của hộ tăng trong khoảng nào? Với độ tin cậy 95%
Trang 9Bài 4: Suy diễn từ mô hình hồi quy
Lời giải:
Theo đầu bài biến thu nhập tăng lên một đơn vị mà hệ số của biến thu nhập (TN) là β2
nên ta áp dụng công thức:
ˆ Se( )ˆ tn k ˆ Se( )ˆ tn k
Theo đầu bài cho: kích thước mẫu: n = 100, số tham số của mô hình: k = 3, độ tin cậy
1 – α = 0,95 hay α = 0,05 ta tìm được giá trị tới hạn
0,05
( ) (100 3) (97)
0,025 0,025 1,96 ( 97 30)
n k
Theo kết quả ước lượng ta có:
ˆ20,612508 Se( )ˆ2 0,014314
Thay vào công thức:
0,612508 – 0,014314 1,96 < 2 < 0,612508 + 0,014314 1,96
0,58445 <2 < 0,64056
Vậy với độ tin cậy 95% thu nhập hộ gia đình tăng 1 đơn vị (hay 1 triệu đồng) (số người trong hộ không đổi) thi chi tiêu trung bình của hộ tăng từ 0,58 đơn vị đến 0,64 đơn vị
Ví dụ 4.2:
Với số liệu của 52 đại lý đã cho, ước lượng mô hình (2) có kết quả ước lượng:
Q = 302,9827 2,927431P + 1,838563PC + e
Se (2,943162) (0,106426) (0,073989)
Với kết quả ước lượng trên, ta đặt ra câu hỏi khi giá của một hộp kem đánh răng nhãn hiệu COLGATE không đổi, giá của một hộp kem đánh răng nhãn hiệu PS tăng lên một đơn vị (1.000 đồng/hộp) thì lượng bán hộp kem đánh răng nhãn hiệu PS giảm trong khoảng nào? Với độ tin cậy 95%
Lời giải:
Theo đầu bài biến P tăng lên một đơn vị mà hệ số của biến P là β2 nên ta áp dụng công thức:
ˆ Se( )ˆ tn k ˆ Se( )ˆ tn k
Theo đầu bài cho: kích thước mẫu: n = 52, số tham số của mô hình: k = 3, độ tin cậy 1 – α = 0,95 hay α = 0,05 ta tìm được giá trị tới hạn:
0,05
( ) (52 3) (49)
0,025 0,025 1,96 ( 49 30)
n k
Theo kết quả ước lượng ta có:
927431 ,
2
2
Se
Thay vào công thức ta có:
96 , 1 106426 , 0 927431 , 2 96
, 1 106426 , 0 927431
,
3,1362 2,7188
Vậy với độ tin cậy 95% giá của một hộp kem nhãn hiệu PS tăng lên 1.000 đồng/1 hộp (PC không đổi) thì lượng bán kem đánh răng nhãn hiệu PS trung bình giảm từ 2,7188 hộp đến 3,136 hộp
Trang 104.3 Bài toán kiểm định giả thuyết thống kê về các hệ số hồi quy
Do chưa có tổng thể nên ta chưa biết được các βj, nhưng có thể cho rằng nó bằng β*
(với β* cho trước) hay không? khi ấy ta đưa ra giả thuyết H0: βj = β* Để kiểm định giả thuyết này ta chọn tiêu chuẩn kiểm định:
ˆ *
ˆ ( )
j j
T Se
Nếu giả thuyết H0: βj = β* là đúng thì:
ˆ * ( )
~ ˆ ( )
j
Se
Do vậy với mức ý nghĩa α cho trước tùy thuộc vào giả thuyết đối H1 mà ta xây dựng được các miền bác bỏ giả thuyết H0 tương ứng với các trường hợp sau:
Trường hợp 1: Nếu ta kiểm định cặp giả thuyết:
0 *
* 1
: :
j j
H H
thì miền bác bỏ giả thuyết H0 là:
2
* ( )
ˆ
ˆ ( )
j
T t
Với mẫu cụ thể và với α cho trước mà ( )
2
k n
qs t
T thì ta bác bỏ H0, chấp nhận H1 và ngược lại
Ví dụ 4.3:
Từ kết quả ước lượng mô hình (1), với mức ý nghĩa α = 5% có thể cho rằng khi thu nhập của hộ gia đình tăng 1 đơn vị (số người trong hộ không thay đổi) thì chi tiêu của
hộ tăng 0,5 đơn vị hay không?
Lời giải:
Theo yêu cầu của đầu bài ta cần kiểm định cặp giả thuyết sau:
0 2
1 2
H H
Tiêu chuẩn kiểm định:
2
2
ˆ 0,5 ˆ ( )
T Se
Với kết quả ước lượng ta có:
0,612508 0,5 7,86
0,014314
qs
T
Với mức ý nghĩa α = 0,05 ta có:
0,05
( ) (100 3) (97)
0,025 0,025
(97) 0,025 0,025
1,96 ( 97 30) 7,86 7,86 1,96
n k
qs
Trang 11Bài 4: Suy diễn từ mô hình hồi quy
Bác bỏ H0, vậy với mức ý nghĩa α = 0,05 có thể cho rằng khi thu nhập của hộ gia đình tăng 1 đơn vị (số người trong hộ không thay đổi) thì chi tiêu của hộ tăng khác 0,5 đơn vị
Trường hợp 2: Nếu ta kiểm định cặp giả thuyết:
hay
thì:
* ( )
ˆ
ˆ
j
T t Se
Với mẫu cụ thể và với α cho trước mà:
T qst(n k )
thì ta bác bỏ H0.
Ví dụ 4.4:
Từ kết quả ước lượng mô hình (2), với mức ý nghĩa α = 5% có thể cho rằng khi giá của một hộp kem đánh răng nhãn hiệu COLGATE tăng 1 nghìn đồng/1 hộp (giá của một hộp kem đánh răng nhãn hiệu PS không thay đổi) thì lượng bán hộp kem đánh răng nhãn hiệu PS tăng hơn 1 hộp hay không?
Lời giải:
Theo yêu cầu của đầu bài ta cần kiểm định cặp giả thuyết sau:
0 3
1 3
H H
Tiêu chuẩn kiểm định:
3
3
ˆ ( )
T Se
Với kết quả ước lượng ta có:
1,838563 1 11,33
0,073989
qs
Với mức ý nghĩa α = 0,05 ta có:
0,05 0,05 0,05 1,645 ( 49 30) 11,33 1,645
n k
qs
T
Bác bỏ H0, vậy với mức ý nghĩa α = 0,05 có thể cho rằng khi giá của một hộp kem đánh răng nhãn hiệu COLGATE tăng 1.000 đồng/1 hộp (giá của một hộp kem đánh răng nhãn hiệu PS không thay đổi) thì lượng bán hộp kem đánh răng nhãn hiệu PS tăng hơn 1 hộp
Trường hợp 3: Nếu ta kiểm định cặp giả thuyết:
hay
thì:
Trang 12( )
ˆ
( )
j
T t Se
Với mẫu cụ thể và với α cho trước mà:
(n k)
qs
T t thì ta bác bỏ H0
Ví dụ 4.5:
Cũng từ kết quả ước lượng mô hình (2), với mức ý nghĩa α = 5% có thể cho rằng khi giá của một hộp kem đánh răng nhãn hiệu PS tăng 1.000 đồng/1 hộp (giá của một hộp kem đánh răng nhãn hiệu COLGATE không thay đổi) thì lượng bán hộp kem đánh răng nhãn hiệu PS giảm hơn 2 hộp hay không?
Lời giải:
Theo yêu cầu của đầu bài ta cần kiểm định cặp giả thuyết sau:
0 2
1 2
H H
Tiêu chuẩn kiểm định:
2
2
ˆ ( 2) ˆ ( )
T Se
Với kết quả ước lượng ta có:
2,927431 ( 2) 8,7
0,106426
qs
Với mức ý nghĩa α = 0,05 ta có:
( ) (52 3) (49) 0,05 0,05 0,05
(49) 0,05 0,05
1,645 ( 49 30) 8,7 1,645
n k
qs
Bác bỏ H0, vậy với mức ý nghĩa α = 0,05 có thể cho rằng khi giá của một hộp kem đánh răng nhãn hiệu PS tăng 1000 đồng/1 hộp (giá của một hộp kem đánh răng nhãn hiệu COLGATE không thay đổi) thì lượng bán hộp kem đánh răng nhãn hiệu PS giảm hơn 2 hộp
Trường hợp riêng: 0
1
j j
H H
với mẫu cụ thể ta tính được: ˆˆ
( )
j qs
j
T Se
Với trường hợp riêng ta có các chú ý sau:
Nếu ta bác bỏ H0 thì ta nói hệ số ˆ
j
khác 0 một cách có ý nghĩa, hay hệ số ˆ
j
có ý nghĩa thống kê Nếu hệ số ˆ
j
không có ý nghĩa thống kê thì có nghĩa là biến độc lập Xj không giải thích cho biến phụ thuộc Y, ngược lại nếu hệ số ˆ
j
có ý nghĩa thống kê thì có nghĩa là biến độc lập Xj có giải thích cho biến phụ thuộc Y