Nội dung của học phần - Mở đầu; - Chương I: Mô hình hồi quy hai biến, một vài tư tưởng cơ bản; - Chương II: Mô hình hồi quy hai biến, ước lượng và kiểm định giả thuyết; - Chương III: Mô
Trang 1Giới thiệu học phần kinh tế lượng
1 Phân bố thời gian
- Lý thuyết: 45 tiết;
- Thực hành trên máy tính: 15 tiết
2 Nội dung của học phần
- Mở đầu;
- Chương I: Mô hình hồi quy hai biến, một vài tư tưởng cơ bản;
- Chương II: Mô hình hồi quy hai biến, ước lượng và kiểm định giả thuyết;
- Chương III: Mô hình hồi quy bội;
- Chương IV: Mô hình hồi quy với biến giả;
- Chương IV: Đa cộng tuyến;
- Chương VI: Phương sai của sai số thay đổi;
- Chương VII: Tự tương quan;
- Chương VIII: Chọn mô hình và kiểm định việc định dạng mô hình
3 Giáo trình và tài liệu tham khảo
- Bài giảng Kinh tế lượng 2006, Tg: PGS.TS Nguyễn Quang Dong, NXB thống kê;
- Hướng dẫn sử dụng Microfit 4.1 For Windows 2006, Tg: ThS Bùi Dương Hải;
- Giáo trình: Lý thuyết Xác suất & Thống kê toán 2005, Tg: PGS.TS NguyễnCaoVăn (chủ biên) - TS Trần Thái Ninh, NXB thống kê;
- Bài tập Kinh tế lượng với sự trợ giúp của phần mềm Eviews 2002, Tg: PGS.TSNguyễn Quang Dong, NXB khoa học kỹ thuật;
- Các phương pháp phân tích và dự báo trong kinh tế 2005, Tg: PGS TS NguyễnKhắc Minh, NXB khoa học kỹ thuật;
- Basic Econometrics, Tg: Damodar N Gujarati
4 Điều kiện tiên quyết cần học trước
- Đại số tuyến tính và giải tích toán học;
- Kinh tế vi mô và kinh tế vĩ mô;
- Lý thuyết xác suất và thống kê toán;
- Tin học đại cương và tin học ứng dụng
5 Mục tiêu của học phần
- Cung cấp hệ thống các kiến thức cơ bản để ước lượng một cách đúng đắn cácquan hệ kinh tế và kiểm định giả thuyết về các mối quan hệ kinh tế Trên cơ sở đóđưa ra mô hình phù hợp với thực tế phản ánh được bản chất các quan hệ kinh tế
Mô hình sẽ được dùng trong phân tích, dự báo và hoạch định chính sách
- Sau khi học xong, sinh viên có kiến thức lý thuyết và kỹ năng xây dựng mô hìnhmột phương trình với các tình huống kinh tế cơ bản và sẽ là cơ sở để học chương
Trang 2trỡnh Kinh tế lượng nõng cao ở bậc đào tạo sau đại học.
Mở Đầu
1 Kinh tế lượng là gỡ?
- Thuật ngữ Kinh tế lượng trong tiếng Anh là “ Econometrics” được ghộp từ hai
gốc từ: “Econo” cú nghĩa là “kinh tế” và “Metrics” cú nghĩa là “đo lường” Theo
nghĩa đen thuật ngữ này được dịch sang tiếng Việt cú nghĩa là “ đo lường kinh tế”.
- Cho đến nay chưa cú một định nghĩa nào về Kinh tế lượng được mọi người thốngnhất nhưng cú thể hiểu một cỏch khỏi quỏt Kinh tế lượng là mụn khoa học mà ở đúngười ta dựng cỏc cụng cụ toỏn học (chủ yếu là Thống kờ toỏn) để củng cố về mặtthực nghiệm cho cỏc lý thuyết kinh tế Như vậy về bản chất Kinh tế lượng sẽ thựcchứng cho cỏc lý thuyết kinh tế và qua đú chứng minh hoặc bỏc bỏ cỏc lý thuyếtkinh tế này
- Mục đớch của Kinh tế lượng là tỡm ra cỏc kết luận về mặt định lượng cho cỏc lýthuyết kinh tế trong điều kiện, hoàn cảnh cụ thể để phục vụ cho việc phõn tớch, dựbỏo và hoạch định chớnh sỏch
2 Phõn biệt Kinh tế lượng và một số mụn khoa học liờn quan
- Kinh tế lượng và Kinh tế học: Kinh tế học chủ yếu nghiờn cứu về mặt định tớnh
của cỏc quan hệ kinh tế trong khi đú Kinh tế lượng nghiờn cứu về mặt lượng củacỏc quan hệ đú vỡ vậy về cơ bản Kinh tế lượng dựa trờn cỏc lý thuyết kinh tế để xõydựng phương phỏp luận cho mỡnh
- Kinh tế lượng và Kinh tế toỏn: Kinh tế toỏn trỡnh bày cỏc lý thuyết kinh tế bằng
ngụn ngữ toỏn học (cỏc phương trỡnh và bất phương trỡnh) trong khi đú Kinh tếlượng sử dụng cỏc phương phỏp thống kờ toỏn để ước lượng cỏc tham số của mụhỡnh và kiểm định xem mụ hỡnh đú cú phự hợp hay khụng
- Kinh tế lượng và Thống kờ kinh tế: Thống kờ kinh tế nghiờn cứu việc thu thập,
xử lý, lưu trữ và trỡnh bày số liệu dưới dạng biểu đồ và bảng Cỏc số liệu thống kờ
là số liệu đầu vào sơ cấp cho cỏc mụ hỡnh Kinh tế lượng Kinh tế lượng sử dụngcỏc số liệu này để kiểm chứng lại cỏc lý thuyết kinh tế
- Kinh tế lượng và Tin học: Tin học nghiờn cứu về thụng tin và cỏc quỏ trỡnh xử lý
thụng tin tự động bằng mỏy tớnh điện tử Nhờ cú tin học mà Kinh tế lượng ngàycàng phỏt triển với sự trợ giỳp của cỏc phần mềm chuyờn dụng như: Microfit,Eviews, Stata, SPSS,
3 Phương phỏp luận của Kinh tế lượng
Quỏ trỡnh nghiờn cứu và phõn tớch Kinh tế lượng thường được tiến hành theo cỏcbước cơ bản như sau:
- Bước 1: Phỏt biểu một luận thuyết kinh tế
- Bước 2: Xõy dựng mụ hỡnh Toỏn kinh tế
- Bước 3: Xõy dựng mụ hỡnh Kinh tế lượng
- Bước 4: Thu thập số liệu thống kờ
- Bước 5: Ước lượng cỏc tham số của mụ hỡnh Kinh tế lượng
Trang 3- Bước 6: Kiểm định các giả thuyết
- Bước 7: Dự báo
- Bước 8: Sử dụng mô hình để kiểm soát hoặc đề xuất các chính sách kinh tế
4 Thí dụ minh hoạ
- Giả sử chúng ta cần nghiên cứu tính quy luật trong tiêu dùng của cá nhân
- Để nghiên cứu vấn đề này bằng mô hình Kinh tế lượng chúng ta tiến hành theocác bước sau:
Bước 1: Phát biểu luận thuyết kinh tế về tiêu dùng
- Luận thuyết về tiêu dùng của Keynes: Một cá nhân sẽ tăng tiêu dùng khi thu nhậptăng lên tuy nhiên mức tăng của tiêu dùng sẽ nhỏ hơn mức tăng của thu nhập
- Nội dung của luận thuyết sau:
+ Có nhiều nhân tố tác động đến tiêu dùng trong đó nhân tố quan trọng nhất là thunhập;
+ Khi thu nhập tăng ( hay giảm) thì tiêu dùng sẽ tăng ( hay giảm);
+ Tốc độ tăng của tiêu dùng nhỏ hơn tốc độ tăng của thu nhập
- Kinh tế học xác lập quan hệ về mặt định tính giữa tiêu dùng và thu nhập và biểudiễn quan hệ này bằng khái niệm khuynh hướng tiêu dùng biên (MPC - MarginalPropensity to Consume): 0 < MPC < 1
Bước 2: Xây dựng mô hình Toán kinh tế tương ứng
- Ký hiệu: Y là tiêu dùng, X là thu nhập
- Giả sử Y phụ thuộc vào X dưới dạng hàm tuyến tính: Y = β β1+ 2X gọi là hàmtiêu dùng Keynes (Keynes consumption function) Trong đó β β1, 2 là các tham số
và β1 gọi là hệ số chặn hay hệ số tự do, β2 gọi là hệ số góc
- Hàm tiêu dùng Keyness được biểu diễn bằng đồ thị sau:
- Mô hình Toán kinh tế biểu diễn sự phụ thuộc của Y vào X dưới dạng hàm số, tức
là với mỗi giá trị của X cho tương ứng duy nhất một giá trị của Y, nói chung quan
hệ này thường không đúng trong thực tế và dựa vào mô hình này chúng ta khôngtìm được giá trị cụ thể của các tham số β β1, 2
Trang 4Bước 3: Xây dựng mô hình Kinh tế lượng tương ứng
- Mô hình Kinh tế lượng biểu diễn sự phụ thuộc tương quan (quan hệ thống kê)giữa mức tiêu dùng trung bình và thu nhập, tức là ứng với mỗi giá trị của X có thể
có nhiều giá trị khác nhau của Y được đại diện bởi giá trị trung bình của nó:
Bước 4: Thu thập số liệu thống kê
- Giả sử có các số liệu theo chuỗi thời gian của nước Mỹ trong thời kỳ 1980 – 1991
về GDP (X) và tổng tiêu dùng cá nhân (Y) với đơn vị là tỷ $ theo giá năm 1987
Nguồn số liệu: Báo cáo kinh tế của chính phủ Mỹ năm 1993
Trang 5- Trên cơ sở chuỗi số liệu thu thập được tiến hành ước lượng các tham số β β1, 2.
Bước 5: Ước lượng các tham số của mô hình
- Sử dụng phương pháp OLS ( Oridinary Least Squares) ta tìm được các ước lượngđiểm của β β1, 2 Ký hiệu là β βˆ ˆ1, 2: βˆ1 = −231,8;βˆ2 =0,7194
- Với các ước lượng này ta tìm được một ước lượng của tiêu dùng:
Bước 6: Kiểm định mô hình
- Kiểm định sự phù hợp của các ước lượng thu được với lý thuyết kinh tế:
β β
β β
::
H H
Ui phân phối chuẩn
Ui không phân phối chuẩn
- Kiểm định mô hình giúp chúng ta trả lời 2 câu hỏi sau:
+ Nếu lý thuyết kinh tế là đúng thì việc kiểm định cho biết mô hình là đúng haysai? Nếu mô hình là sai quay trở lại bước 2 để sửa
+ Nếu mô hình là đúng thì việc kiểm định cho biết lý thuyết kinh tế là đúng haysai? Nếu sai quay trở lại bước 1 xem xét lại lý thuyết kinh tế
Bước 7: Dự báo
- Nếu mô hình trên là phù hợp thì có thể được sử dụng để dự báo
- Giả sử có cơ sở cho rằng GDP của nước Mỹ năm 1994 là 6000 tỷ $ Hãy dự báomức tiêu dùng cá nhân của Mỹ vào năm đó
- Dựa vào mô hình ước lượng được, ta có một ước lượng điểm của tiêu dùng:
Bước 8: Kiểm soát hoặc đề xuất chính sách
- Giả sử chính phủ Mỹ có cơ sở cho rằng: Nếu tiêu dùng năm 1994 đạt mức 4000
tỷ $ thì sẽ duy trì được tỷ lệ thất nghiệp ở mức 6,5% Như vậy, cần kiểm soát hoặc
đề xuất chính sách để đảm bảo GDP ở mức nào đó để duy trì được tỷ lệ thất nghiệpđó
- Từ mô hình, ta có: 4000= −231,8 0,7194+ X1994 ⇒ X1994 =5882,4 (tỷ $)
- Vậy GDP cần đạt mức 5882,4 tỷ $ để duy trì tỷ lệ thất nghiệp ở mức 6,5%
1 Phát biểu một luận thuyết kinh tế Luận thuyết về tiêu dùng của Keynes
2 Xây dựng mô hình Toán kinh tế Y =β β1+ 2X (hàm tuyến tính)
Trang 63 Xây dựng mô hình Kinh tế lượng Y i = +β β1 2X i +U i
4 Thu thập số liệu thống kê Bảng số theo chuỗi thời gian
5 Ước lượng các tham số
- Thuật ngữ Kinh tế lượng trong tiếng Anh là “ Econometrics” được ghép từ hai
gốc từ: “Econo” có nghĩa là “kinh tế” và “Metrics” có nghĩa là “đo lường” Theo
nghĩa đen thuật ngữ này được dịch sang tiếng Việt có nghĩa là “ đo lường kinh tế”.
- Cho đến nay chưa có một định nghĩa nào về Kinh tế lượng được mọi người thốngnhất nhưng có thể hiểu một cách khái quát Kinh tế lượng là môn khoa học mà ở đóngười ta dùng các công cụ toán học (chủ yếu là Thống kê toán) để củng cố về mặtthực nghiệm cho các lý thuyết kinh tế Như vậy về bản chất Kinh tế lượng sẽ thựcchứng cho các lý thuyết kinh tế và qua đó chứng minh hoặc bác bỏ các lý thuyếtkinh tế này
- Mục đích của Kinh tế lượng là tìm ra các kết luận về mặt định lượng cho các lýthuyết kinh tế trong điều kiện, hoàn cảnh cụ thể để phục vụ cho việc phân tích, dựbáo và hoạch định chính sách
2 Phân biệt Kinh tế lượng và một số môn khoa học liên quan
- Kinh tế lượng và Kinh tế học: Kinh tế học chủ yếu nghiên cứu về mặt định tính
của các quan hệ kinh tế trong khi đó Kinh tế lượng nghiên cứu về mặt lượng củacác quan hệ đó vì vậy về cơ bản Kinh tế lượng dựa trên các lý thuyết kinh tế để xâydựng phương pháp luận cho mình
- Kinh tế lượng và Kinh tế toán: Kinh tế toán trình bày các lý thuyết kinh tế bằng
ngôn ngữ toán học (các phương trình và bất phương trình) trong khi đó Kinh tếlượng sử dụng các phương pháp thống kê toán để ước lượng các tham số của môhình và kiểm định xem mô hình đó có phù hợp hay không
- Kinh tế lượng và Thống kê kinh tế: Thống kê kinh tế nghiên cứu việc thu thập,
xử lý, lưu trữ và trình bày số liệu dưới dạng biểu đồ và bảng Các số liệu thống kê
là số liệu đầu vào sơ cấp cho các mô hình Kinh tế lượng Kinh tế lượng sử dụngcác số liệu này để kiểm chứng lại các lý thuyết kinh tế
- Kinh tế lượng và Tin học: Tin học nghiên cứu về thông tin và các quá trình xử lý
thông tin tự động bằng máy tính điện tử Nhờ có tin học mà Kinh tế lượng ngàycàng phát triển với sự trợ giúp của các phần mềm chuyên dụng như: Microfit,
Trang 73 Phương pháp luận của Kinh tế lượng
Quá trình nghiên cứu và phân tích Kinh tế lượng thường được tiến hành theo cácbước cơ bản như sau:
- Bước 1: Phát biểu một luận thuyết kinh tế
- Bước 2: Xây dựng mô hình Toán kinh tế
- Bước 3: Xây dựng mô hình Kinh tế lượng
- Bước 4: Thu thập số liệu thống kê
- Bước 5: Ước lượng các tham số của mô hình Kinh tế lượng
- Bước 6: Kiểm định các giả thuyết
- Bước 7: Dự báo
- Bước 8: Sử dụng mô hình để kiểm soát hoặc đề xuất các chính sách kinh tế
4 Thí dụ minh hoạ
- Giả sử chúng ta cần nghiên cứu tính quy luật trong tiêu dùng của cá nhân
- Để nghiên cứu vấn đề này bằng mô hình Kinh tế lượng chúng ta tiến hành theocác bước sau:
Bước 1: Phát biểu luận thuyết kinh tế về tiêu dùng
- Luận thuyết về tiêu dùng của Keynes: Một cá nhân sẽ tăng tiêu dùng khi thu nhậptăng lên tuy nhiên mức tăng của tiêu dùng sẽ nhỏ hơn mức tăng của thu nhập
- Nội dung của luận thuyết sau:
+ Có nhiều nhân tố tác động đến tiêu dùng trong đó nhân tố quan trọng nhất là thunhập;
+ Khi thu nhập tăng ( hay giảm) thì tiêu dùng sẽ tăng ( hay giảm);
+ Tốc độ tăng của tiêu dùng nhỏ hơn tốc độ tăng của thu nhập
- Kinh tế học xác lập quan hệ về mặt định tính giữa tiêu dùng và thu nhập và biểudiễn quan hệ này bằng khái niệm khuynh hướng tiêu dùng biên (MPC - MarginalPropensity to Consume): 0 < MPC < 1
Bước 2: Xây dựng mô hình Toán kinh tế tương ứng
- Ký hiệu: Y là tiêu dùng, X là thu nhập
- Giả sử Y phụ thuộc vào X dưới dạng hàm tuyến tính: Y = β β1+ 2X gọi là hàmtiêu dùng Keynes (Keynes consumption function) Trong đó β β1, 2 là các tham số
và β1 gọi là hệ số chặn hay hệ số tự do, β2 gọi là hệ số góc
- Hàm tiêu dùng Keyness được biểu diễn bằng đồ thị sau:
Trang 8- Mô hình Toán kinh tế biểu diễn sự phụ thuộc của Y vào X dưới dạng hàm số, tức
là với mỗi giá trị của X cho tương ứng duy nhất một giá trị của Y, nói chung quan
hệ này thường không đúng trong thực tế và dựa vào mô hình này chúng ta khôngtìm được giá trị cụ thể của các tham số β β1, 2
Bước 3: Xây dựng mô hình Kinh tế lượng tương ứng
- Mô hình Kinh tế lượng biểu diễn sự phụ thuộc tương quan (quan hệ thống kê)giữa mức tiêu dùng trung bình và thu nhập, tức là ứng với mỗi giá trị của X có thể
có nhiều giá trị khác nhau của Y được đại diện bởi giá trị trung bình của nó:
Trang 9- Giả sử có các số liệu theo chuỗi thời gian của nước Mỹ trong thời kỳ 1980 – 1991
về GDP (X) và tổng tiêu dùng cá nhân (Y) với đơn vị là tỷ $ theo giá năm 1987
Nguồn số liệu: Báo cáo kinh tế của chính phủ Mỹ năm 1993
- Trên cơ sở chuỗi số liệu thu thập được tiến hành ước lượng các tham số β β1, 2
Bước 5: Ước lượng các tham số của mô hình
- Sử dụng phương pháp OLS ( Oridinary Least Squares) ta tìm được các ước lượngđiểm của β β1, 2 Ký hiệu là β βˆ ˆ1, 2: βˆ1 = −231,8;βˆ2 =0,7194
- Với các ước lượng này ta tìm được một ước lượng của tiêu dùng:
Bước 6: Kiểm định mô hình
- Kiểm định sự phù hợp của các ước lượng thu được với lý thuyết kinh tế:
β β
β β
::
H H
Ui phân phối chuẩn
Ui không phân phối chuẩn
- Kiểm định mô hình giúp chúng ta trả lời 2 câu hỏi sau:
+ Nếu lý thuyết kinh tế là đúng thì việc kiểm định cho biết mô hình là đúng haysai? Nếu mô hình là sai quay trở lại bước 2 để sửa
+ Nếu mô hình là đúng thì việc kiểm định cho biết lý thuyết kinh tế là đúng haysai? Nếu sai quay trở lại bước 1 xem xét lại lý thuyết kinh tế
Bước 7: Dự báo
Trang 10- Nếu mô hình trên là phù hợp thì có thể được sử dụng để dự báo.
- Giả sử có cơ sở cho rằng GDP của nước Mỹ năm 1994 là 6000 tỷ $ Hãy dự báomức tiêu dùng cá nhân của Mỹ vào năm đó
- Dựa vào mô hình ước lượng được, ta có một ước lượng điểm của tiêu dùng:
Bước 8: Kiểm soát hoặc đề xuất chính sách
- Giả sử chính phủ Mỹ có cơ sở cho rằng: Nếu tiêu dùng năm 1994 đạt mức 4000
tỷ $ thì sẽ duy trì được tỷ lệ thất nghiệp ở mức 6,5% Như vậy, cần kiểm soát hoặc
đề xuất chính sách để đảm bảo GDP ở mức nào đó để duy trì được tỷ lệ thất nghiệpđó
- Từ mô hình, ta có: 4000= −231,8 0,7194+ X1994 ⇒ X1994 =5882,4 (tỷ $)
- Vậy GDP cần đạt mức 5882,4 tỷ $ để duy trì tỷ lệ thất nghiệp ở mức 6,5%
1 Phát biểu một luận thuyết kinh tế Luận thuyết về tiêu dùng của Keynes
2 Xây dựng mô hình Toán kinh tế Y =β β1+ 2X (hàm tuyến tính)
3 Xây dựng mô hình Kinh tế lượng Y i = +β β1 2X i +U i
4 Thu thập số liệu thống kê Bảng số theo chuỗi thời gian
5 Ước lượng các tham số
1 Phân tích hồi quy (Regression analysis)
1.1 Bản chất của phân tích hồi quy
- Có nhiều phương pháp để lượng hoá các mối quan hệ kinh tế trong đó phân tíchhồi quy là phương pháp quan trọng và phổ biến nhất hiện nay
- Phân tích hồi quy là phân tích mối liên hệ phụ thuộc của một hay một số biến gọi
là biến phụ thuộc (biến được giải thích, biến nội sinh) với một hoặc nhiều biến khác gọi là biến độc lập (biến giải thích, biến ngoại sinh hoặc biến hồi quy).
+ Biến phụ thuộc là biến được xác định bởi mô hình và giá trị của nó phụ thuộcvào giá trị của các biến độc lập trong mô hình
+ Biến độc lập là biến mà giá trị của chúng được xác định ngoài mô hình
+ Tham số là nhân tố phản ánh xu hướng, mức độ ảnh hưởng của biến độc lập đếnbiến phụ thuộc
Trang 11- Chú ý: Một biến số trong các mô hình khác nhau có thể đóng vai trò khác nhau,
thậm chí trong cùng một mô hình nó cũng có thể có vai trò khác nhau do mục đích
+ Một kỹ sư nông nghiệp muốn nghiên cứu mối liên hệ phụ thuộc của năng suấtlúa (biến phụ thuộc) vào lượng phân bón và lượng mưa (các biến độc lập)
- Trong thực tế với mỗi giá trị xác định của biến độc lập, biến phụ thuộc không chỉnhận một giá trị tương ứng duy nhất vì chịu tác động của nhiều nhân tố ngoài cácbiến độc lập do đó trong phân tích hồi quy ta phải đại diện cho biến phụ thuộcbằng giá trị trung bình của nó Như vậy phân tích hồi quy nghiên cứu mối liên hệphụ thuộc hàm số giữa giá trị trung bình của biến phụ thuộc vào giá trị của biếnđộc lập
- Ký hiệu:
Y là biến phụ thuộc (Dependent variable)
X1, X2, ,Xk là các biến độc lập (Independent variables)
- Các biến độc lập là các biến phi ngẫu nhiên, giá trị của chúng được cho trước.Trong điều kiện đó biến phụ thuộc là một biến ngẫu nhiên có quy luật phân bố xácsuất nào đó
+ Hàm E Y X( / )= f X( ) gọi là hàm hồi quy đơn - Simple regression (hàm hồiquy có một biến độc lập)
+ Hàm E Y X X( / 1, 2, ,X k)= f X X( ,1 2, ,X k) gọi là hàm hồi quy bội- Multipleregression (hàm hồi quy có hơn một biến độc lập)
- Mục đích của phân tích hồi quy:
+ Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập,tức là phải ước lượng các tham số của mô hình
+ Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc vàbiến độc lập mà lý thuyết kinh tế đưa ra Trong trường hợp này phải trả lời hai câuhỏi:
+> Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập hay không?
+> Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
+ Dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập
1.2 Phân tích hồi quy và các quan hệ khác
- Phân tích hồi quy và quan hệ hàm số: Trong quan hệ hàm số thì các biến không
phải là các biến ngẫu nhiên vì ứng với mỗi giá trị xác định của biến độc lập có mộtgiá trị duy nhất của biến phụ thuộc, trong phân tích hồi quy các biến phụ thuộc làcác biến ngẫu nhiên
Trang 12- Phân tích hồi quy và phân tích tương quan: Phân tích tương quan đo mức độ kết
hợp tuyến tính giữa hai biến bằng hệ số tương quan và không phân biệt giữa cácbiến, chúng có tính chất đối xứng, trong khi đó phân tích hồi quy ước lượng và dựbáo một biến trên cơ sở giá trị đã cho của các biến khác, các biến không có tínhchất đối xứng
- Phân tích hồi quy và quan hệ nhân quả: Quan hệ nhân quả là quan hệ hai chiều
giữa hai đối tượng trong đó vai trò của các đối tượng được xác định rõ đâu lànguyên nhân và đâu là kết quả, trong phân tích hồi quy biến giải thích không nhấtthiết là nguyên nhân gây lên biến phụ thuộc, mối quan hệ giữa các biến được xáclập tuỳ thuộc vào mục đích nghiên cứu
1.3 Bản chất nguồn số liệu cho phân tích hồi quy
+ Số liệu kết hợp (Pooled data) là số liệu tổng hợp của hai loại trên
- Nguồn gốc của số liệu
+ Số liệu từ các nguồn được phát hành như: Niên giám thống kê, tạp chí,
+ Số liệu từ các cuộc điều tra thực tế hoặc đi mua
- Bản chất chung của số liệu kinh tế – xã hội
+ Có sẵn để thu thập, tính toán phù hợp với mục đích nghiên cứu
+ Phần lớn là các số liệu phi thực nghiệm mang tính ngẫu nhiên, kém tin cậy
2 Hàm hồi quy tổng thể
- Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tínhhoặc định lượng nào đó được gọi là tổng thể nghiên cứu hay tổng thể
- Giả sử có một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu:
X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y)
- Để nghiên cứu BNN (X, Y) ta lập các bảng phân phối xác suất:
+ Bảng phân phối xác suất đồng thời của X và Y:
X
Y
Y1 P(Y1, X1) P(Y1, X2) P(Y1, Xk)
Y2 P(Y2, X1) P(Y2, X2) P(Y2, Xk)
Yh P(Yh, X1) P(Yh, X2) P(Yh, Xk)
Trang 13+ Các bảng phân phối xác suất có điều kiện của Y theo Xi (i = ÷1 k)
P(Y/Xi) P(Y1/Xi) P(Y2/Xi) P(Yh/Xi)
- Kỳ vọng toán của Y với điều kiện của X = Xi:
- Giả sử PRF có dạng tuyến tính:
E Y X = +β β X i= ÷k hoặc E Y X( / )= +β β1 2X
Trong đó β β1, 2 gọi là các hệ số hồi quy (Regression Coefficient):
+ Hệ số β1 = E Y X( / i =0) gọi là hệ số chặn (Intercept - INPT) Nó cho biết giá trịtrung bình của Y khi biến Xi = 0
+ Những yếu tố không biết
+ Những yếu tố không có số liệu
+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
- Sự tồn tại của sai số ngẫu nhiên là tất yếu khách quan và nó có vai trò đặc biệtquan trọng trong phân tích hồi quy, nó phải thoả mãn những điều kiện nhất định thìthì việc phân tích trên mô hình hồi quy mới có ý nghĩa
3 Hàm hồi quy mẫu
- Trong thực tế chúng ta không có được tổng thể hoặc có nhưng không thể (khôngcần thiết) nghiên cứu toàn bộ tổng thể vì vậy không thể tìm được PRF mặc dù dạngcủa PRF có thể biết
- Mẫu ngẫu nhiên là một bộ phận mang thông tin của tổng thể được lấy ra từ tổngthể theo những nguyên tắc nhất định
- Giả sử từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = {(Xi, Yi): i= ÷1 n}
Trang 14- Trong mẫu W = {(Xi, Yi): i = ÷1 n)} tồn tại một hàm số có dạng giống như PRF
mô tả xu thế biến động của trung bình biến phụ thuộc theo biến độc lập, thực chất
nó là một ước lượng điểm của PRF, ký hiệu: ˆ ˆ1 ˆ2 ;( 1 )
Y = +β β X i= ÷n và gọi làhàm hồi quy mẫu (Sample Regression Function - SRF)
- Trong đó:β βˆ ˆ1, 2 gọi là các hệ số hồi quy ước lượng được (Estimated regressioncoeffcient), thực chất chúng là các ước lượng điểm của β β1, 2 và ˆ
i
Y là các giá trịước lượng được (Fitted value), thực chất nó là các ước lượng điểm của E(Y/Xi)
- Tại một giá trị cá biệt của Y ta có: ˆ1 ˆ2 ;( 1 )
Y = +β β X +e i= ÷n và gọi là môhình hồi quy mẫu (Sample Regression Model – SRM)
- Đặt: e i = −Y Y i i ˆ ;( 1 )i = ÷n gọi là phần dư (Residual), thực chất chúng là các ướclượng điểm của các sai số ngẫu nhiên Ui Nó phản ánh chênh lệch giữa giá trị cábiệt Yi trong mẫu W với giá trị ước lượng được ˆ
i
Y
- Bản chất của các phần dư ei giống như các sai số ngẫu nhiên Ui
- Tương ứng với mỗi mẫu rút ra từ tổng thể ta sẽ tìm được một hàm hồi quy mẫu(SRF), tức là có rất nhiều SRF khác nhau mà chúng đều là các ước lượng điểm củaPRF Vậy SRF nào là ước lượng tốt nhất cho PRF?
(Tham khảo các thí dụ 1.1 (T 9), thí dụ 1.3 ( T16), Giáo trình)
Chương II
Mô hình hồi quy hai biến, Ước lượng và kiểm định giả thuyết
1 Phương pháp bình phương nhỏ nhất (Ordinary Least Squares - OLS)
1.1 Nội dung của phương pháp OLS
Trang 15- Xét mô hình hồi quy đơn dạng tuyến tính:
PRF: E Y X( / i) = +β β1 2X i
PRM: Y i = +β β1 2X i +U i i;( = ÷1 N)
- Từ tổng thể ta lập mẫu kích thước n: W ={( , ) :X Y i i i = ÷1 n} Dựa vào mẫu này
ta tìm được một ước lượng điểm của PRF:
- Nội dung của phương pháp OLS là tìm các ước lượng điểm β βˆ ˆ1, 2 của β 1 vàβ 2
sao cho tổng bình phương các phần dư là nhỏ nhất
- Tổng bình phương các phần dư được xác định như sau:
- Ta cần xác định β βˆ ˆ1, 2 sao cho: f ( ,β βˆ ˆ1 2)→Min
- Các hệ số β βˆ ˆ1, 2 là nghiệm của hệ phương trình sau:
Trang 16- Các hệ số β βˆ ˆ1, 2 tìm được bằng phương pháp trên gọi là các ước lượng bìnhphương nhỏ nhất.
1.2 Tính chất của các ước lượng
- Tính chất 1: SRF đi qua điểm trung bình mẫu ( , )X Y : Y = +β βˆ1 ˆ2X (?)
- Tính chất 2: Trung bình số học của các giá trị ước lượng bằng trung bình mẫu củacác giá trị quan sát
Trang 171.3 Các giả thiết cơ bản của phương pháp OLS
Giả thiết 1: Mô hình hồi quy có dạng tuyến tính đối với tham số
- Mô hình tuyến tính theo cả tham số và biến số:
Q =β K L eβ β (Mô hình hàm sản xuất gộp dạng Cobb – Douglas)
- Khi nói hàm hồi quy tuyến tính thì người ta quy ước rằng đó là hàm tuyến tính
đối với tham số, nó có thể không phải là tuyến tính đối với biến số
- Đối với hàm hồi quy tuyến tính ta có thể sử dụng trực tiếp phương pháp OLS đểước lượng các tham số còn đối với các hàm phi tuyến thì cần phải tuyến tính hóa
nó nếu có thể sau đó áp dụng phương pháp OLS để ước lượng các tham số
Giả thiết 2: Các biến giải thích là phi ngẫu nhiên
- Để phân tích sự phụ thuộc của Y vào X thì ta giả thiết giá trị của biến X là xácđịnh trước, tức là phi ngẫu nhiên
- Nếu X và Y đều là biến ngẫu nhiên thì khi đó quan hệ giữa X và Y là quan hệtương quan
Giả thiết 3: Kỳ vọng toán của các sai số ngẫu nhiên bằng không
- Các sai số ngẫu nhiên có thể ảnh hưởng âm hoặc ảnh hưởng dương đến E(Y/ X)hoặc có ảnh hưởng nhưng chúng không ảnh hưởng một cách hệ thống đến giá trịtrung bình của biến phụ thuộc, tức là về mặt trung bình thì các ảnh hưởng đó bằngkhông
- Từ giả thiết này suy ra: E Y X( / i)= β β1+ 2X i(?)
Giả thiết 4: Phương sai của các sai số ngẫu nhiên là đồng đều
- Từ giả thiết này suy ra: Var Y( )i =σ2( )∀i (?)
Giả thiết 5: Các sai số ngẫu nhiên không tương quan với nhau
Trang 18- Nếu giả thiết này được thoả mãn thì mô hình cần ước lượng gọi là không có hiệntượng tự tương quan ơ [ No Autocorrelation (No Serial correlation) ].
- Nếu giả thiết này không được thoả mãn thì mô hình cần ước lượng gọi là có hiệntượng tự tương quan [ Autocorrelation (Serial correlation) ]
Giả thiết 6: Các sai số ngẫu nhiên không tương quan với biến giải thích
Nếu giả thiết 2 được thoả mãn thì giả thiết 6 cũng được thoả mãn (?)
Giả thiết 7: Kích thước của mẫu phải lớn hơn số tham số của mô hình
- Nếu mô hình hồi quy hai biến thì số quan sát phải lớn hơn 2 (n > 2)
- Nếu mô hình hồi quy k biến thì số quan sát phải lớn hơn k (n > k)
Giả thiết 8: Các giá trị của biến giải thích phải khác nhau và càng khác nhau nhiều càng tốt.
Giả thiết 9: Mô hình được chỉ định đúng
- Dạng hàm của mô hình được lựa chọn đúng
- Số biến được lựa chọn đưa vào mô hình là phù hợp
Giả thiết 10: Không có đa cộng tuyến giữa các biến giải thích của mô hình hồi quy bội (No multicolinearty).
- Chú ý: Trong thực tế các giả thiết trên có những giả thiết thường được thoả mãnnhưng cũng có những giả thiết không được thỏa mãn và dẫn đến những hậu quảnhất định đối với mô hình ước lượng được
2 Các tham số đặc trưng của ước lượng
2 1
ˆ( )
n i i n i i
X Var
2 1
ˆ( )
n i i n i i
X SD
- Chú ý: Var( ),βˆ1 SD( )βˆ1 chỉ là các khái niệm lý thuyết không bao giờ tính được
vì σ2 là phương sai của các Ui của tổng thể
- Do không xác định được σ2 nên nó được thay thế bằng một ước lượng điểm:
Trang 19∑ gọi là sai số chuẩn của đường hồi quy (Standard error of
regression), nó chính là độ lệch chuẩn của các giá trị Y quanh đường hồi quy mẫu
- Khi thay σ2 bằng σˆ2 thì SD( )βˆ1 trở thành Se( )βˆ1 :
2 1 1
2 1
( )
n i i n i i
X Se
2 1
ˆ
i i
Var
x
σ β
n i i
SD
x
σ β
( )
n i i
Se
x
σ β
=
=
∑
- Nhận xét: Theo giả thiết 8 thì các biến giải thích càng khác nhau càng tốt vì khi
đó giá trị của biểu thức 2 2
ˆ
β là ước lượng càng chính xác hơn cho tham số β2
2.3 Hiệp phương sai của β βˆ ˆ1, 2
2
2 1
ˆ
i i
Trang 20+ Nếu X > 0 thì Cov( ,β βˆ ˆ1 2) < 0 khi đó β βˆ ˆ1, 2 có quan hệ ngược chiều, tức lànếu βˆ1 là ước lượng thừa của β1 thì βˆ2 là ước lượng thiếu của β2 và ngược lại.+ Nếu X < 0 thì Cov( ,β βˆ ˆ1 2) > 0 khi đó β βˆ ˆ1, 2 có quan hệ thuận chiều, tức là nếu1
1 1 2 2
ˆ ˆ,
β ββ β>>
Y
Trang 21=∑ =∑ − (Residual sum of squares)
+ TSS là tổng bình phương chung của toàn bộ các sai lệch giữa các giá trị quan sát
Yi (trong mẫu) với giá trị trung bình của nó
+ ESS là tổng bình phương các sai lệch giữa các giá trị ước lượng được ˆ
i
Y với giátrị trung bình của nó
+ RSS là tổng bình phương của các phần dư, tức là tổng bình phương các sai lệchgiữa các giá trị quan sát Yi với giá trị ước lượng được ˆ
- (TSS) Toàn bộ sự biến thiên của biến phụ thuộc Y xung quanh giá trị trung bìnhcủa nó có thể tách thành hai bộ phận:
+ (ESS) Các biến thiên của Y được giải thích thông qua hàm hồi quy, tức là thôngqua các biến giải thích có mặt trong hàm hồi quy
+ (RSS) Các biến thiên của Y được giải thích bên ngoài mô hình, tức là khôngthông qua các biến giải thích có mặt trong hàm hồi quy
- Ký hiệu: R2 ESS 1 RSS
= = − gọi là hệ số xác định của mô hình (Determinationcoeffcient – R-Squares) Hệ số này đo tỷ lệ % sự biến thiên của Y được giải thíchthông qua hàm hồi quy, tức là được giải thích thông qua biến độc lập của mô hình
Nó được sử dụng để đặc trưng cho mức độ thích hợp của hàm hồi quy
n i
n
Y i
i
x
S R
S y
+ Nếu R2 = 0: Hàm hồi quy hoàn toàn không giải thích sự biến thiên của Y
+ Nếu R2 = 1: Hàm hồi quy giải thích 100% sự biến thiên của Y
+ Nếu R2 = 0,9: Hàm hồi quy giải thích 90% sự biến động của Y, tức là sự biếnđộng của biến giải thích trong hàm hồi quy chi phối 95% sự biến động của Y
Trang 224 Hệ số tương quan
- Hệ số tương quan là căn bậc hai của hệ số xác định, ký hiệu: R= R2
- Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa biến X và Y
+ Tính chất 3: R = 0 tức là X và Y không phụ thuộc tương quan tuyến tính;
+ Tính chất 4: R= ±1 tức là X và Y có quan hệ phụ thuộc hàm số tuyến tính
5 Phân phối xác suất của sai số ngẫu nhiên
- Để có thể phân tích về mặt thống kê đối với mô hình ta cần phải biết phân phốixác suất của các ước lượng, các phân phối này tuỳ thuộc vào phân phối xác suấtcủa các sai số ngẫu nhiên
- Giả thiết 11: Các sai số ngẫu nhiên có phân phối chuẩn: U i : Normal,( )∀i
- Các căn cứ để đưa ra giả thiết này:
+ Ui thường là tổng hợp của một số lớn các yếu tố ngẫu nhiên độc lập cùng tuântheo một quy luật phân phối xác suất nào đó và ảnh hưởng đến Y bé đều như nhau
do đó Ui có phân phối chuẩn (định lý giới hạn trung tâm);
+ Quy luật phân phối chuẩn chỉ có hai tham số là kỳ vọng toán và phương sai nên
Trang 23(Normal Independent)
- Mô hình thoả mãn toàn bộ 11 giả thiết nêu trên gọi là mô hình hồi quy tuyến tính
cổ điển (Classic Linear Regression Model – CLRM) và từ chương I đến chương IVchúng ta chỉ nghiên cứu mô hình CLRM
6 Định lý Gauss – Markov
- Nếu mô hình thoả mãn các giả thiết nêu trên (CLRM) thì khi đó:
+ Các ước lượng β βˆ ˆ1, 2 thu được từ phương pháp OLS là các ước lượng tuyếntính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tínhkhông chệch của β β1, 2 (Best Linear Unbiassed Estimator – BLUE) (?)
+ Ước lượng σˆ2 là ước lượng phi tuyến, không chệch và có phương sai nhỏ nhấttrong lớp các ước lượng phi tuyến không chệch của σ2 (Best UNlinear UnbiassedEstimator – BUE).(?)
- Phân phối của các ước lượng:
+ βˆ1 và βˆ2 có phân phối chuẩn: βˆ1 : N( ,β1 Var( ))βˆ1 và βˆ2 : N( ,β2 Var( ))βˆ2
+> Khi đó biến ngẫu nhiên: 1 1 1
1
ˆ
(0,1)ˆ
( )
SD
β β β
n
Se
β β β
+ Biến phụ thuộc Yi có phân phối chuẩn: Y i : N(β β1+ 2X i,σ2);( )∀i (?)
- Nhận xét: β βˆ ˆ1, 2,σˆ2 là các ước lượng điểm của β β σ1, 2, 2nên tính đại diệnkhông cao do đó cần phải tìm các ước lượng khoảng tin cậy và kiểm định các giảthuyết thống kê của chúng
7 Khoảng tin cậy và kiểm định giả thuyết về các hệ số hồi quy
7.1 Đối với βj;(j = ÷1 2)
a Phương pháp ước lượng khoảng tin cậy
Trang 24- Thống kê: ( 2)
ˆˆ( )
= : do đó với độ tin cậy 1−α cho trước ta tìm được
cặp giá trị α α1, 2 sao cho:α α1+ 2 =α và hai giá trị tới hạn T1(−nα−12),Tα(2n−2) thoả mãn
(đây là công thức tổng quát, nó đúng cho mọi cặp α α 1 ; 2 thỏa mãn α α1+ 2 = α )
- Chú ý: Phân phối Student là phân phối đối xứng nên T1(−nα−12) = −Tα(1n−2)
- Trong thực tế người ta thường sử dụng một trong ba công thức sau:
+ Khoảng tin cậy đối xứng ( 1 2
b Phương pháp kiểm định giả thuyết
- Kiểm định các cặp giả thuyết:
* 0
* 1
:
(1):
H H
* 1
:
(2):
H H
* 1
:
(3):
H H
ˆˆ( )
= : nếu giả thuyết H0 là đúng
-Miền bác bỏ với mức ý nghĩa α cho trước được xác định như sau:
+ Với cặp giả thuyết (1) ta tìm được giá trị 1( 2) ( 2)
Trang 25β β
β β
β β
- Quy tắc kết luận với mức ý nghĩa α cho trước như sau:
+ Với cả 3 cặp giả thuyết :
+> Nếu α > p thì bác bỏ giả thuyết H0
+> Nếu α < p thì không có sơ sở bác bỏ giả thuyết H0
Trang 26- Trong thực tế người ta thường sử dụng một trong ba công thức sau:
+ Khoảng tin cậy hai phía ( 1 2
2 1
b Phương pháp kiểm định giả thuyết
- Kiểm định các cặp giả thuyết:
H H
H H
H H
= : − nếu giả thuyết H0 là đúng
-Miền bác bỏ tốt nhất với mức ý nghĩa α cho trước được xác định như sau:
+ Với cặp giả thuyết (1) ta tìm được các giá trị 2 12
1 2
:
n W
n
α α
Trang 27- Các kiểm định trên được gọi là kiểm định khi bình phương (χ2 −Test).
7.3 Kiểm định về sự phù hợp của hàm hồi quy
- Kiểm định cặp giả thuyết sau:
x U
ˆ
ˆ
n i i
- Miền bác bỏ được xác định như sau : Wα ={ F F: > Fα(1,n−2)}
- Kiểm địn F có thể tiến hành bằng phương pháp p-value theo quy tắc:
+> Nếu α > p thì bác bỏ giả thuyết H0
+> Nếu α < p thì không có sơ sở bác bỏ giả thuyết H0
- Quá trình kiểm định F thường được cho trong bảng ANOVA sau đây:
Nguồn biến thiên Tổng bình phương Bậc tự do Phương sai
Trang 28Từ hàm hồi quy (ESS) 2 2 2
2
ˆˆ
i i x
8.1 Dự báo giá trị trung bình của biến phụ thuộc
- Giả sử trong tương lai biết X = X0 khi đó cần dự báo giá trị E(Y/X0)
- SRF cho ta một ước lượng điểm của E(Y/X0) trên mẫu là Yˆ0 = β βˆ1+ ˆ2X0
- Để dự báo cho E(Y/X0) cho tổng thể ta cần ước lượng khoảng tin của nó:
- Biến ngẫu nhiên Yˆ0 phân phối chuẩn (?) với:
= : (?) Do đó với độ tin cậy 1−α cho trước
ta tìm được một cặp giá trị α α1, 2 sao cho:α α1+ 2 =α và hai giá trị tới hạn
Trang 29- Khoảng tin cậy đối xứng: 0 0 ( 2) 0 0 0 ( 2)
- Khoảng tin cậy bên trái: E Y X( / 0)< +Yˆ0 Se Y T( )ˆ0 α(n−2)
8.2 Dự báo giá trị cá biệt của biến phụ thuộc
- Giả sử trong tương lai biết X = X0 khi đó ta cần dự báo giá trị (Y0 = Y/X0)
- SRF cho ta một ước lượng điểm của Y0 trên mẫu là Yˆ0 = β βˆ1+ ˆ2X0
- Biến ngẫu nhiên (Y0 −Yˆ0) phân phối chuẩn (?) với:
Mô hình hồi quy bội
1 Mô hình hồi quy ba biến
- Hàm hồi quy tổng thể (PRF) và mô hình hồi quy tổng thể (PRM) có dạng:
PRF:E Y X( / 2i,X3i) =β β1+ 2X2i +β3X3i
Trang 30β β là các hệ số góc riêng phần (hệ số hồi quy riêng)
- Hệ số β1 = E Y X( / 2i = X3i =0) là giá trị trung bình của Y khi X2i = X3i = 0
- Hệ số 2 2 3
2
E Y X X X
β = ∂
∂ cho biết khi X3 tăng một đơn vị thì trung bình của Ythay đổi như thế nào trong điều kiện X2 không thay đổi
- Giả sử mọi giả thiết của phương pháp OLS đều được thoả mãn
1.1 Ước lượng mô hình
ei là các phần dư, thực chất là các ước lượng điểm của sai số ngẫu nhiên Ui
- Tổng bình phương các phần dư được xác định như sau:
- Theo phương pháp OLS ta phải tìm β β βˆ ˆ ˆ1, 2, 3 sao cho: f( ,β β βˆ ˆ ˆ1 2, )3 →Min
- Các hệ số β β βˆ ˆ ˆ1, 2, 3 là nghiệm của phương trình:
Trang 311 2 3
1 1
1 2 3
1 2
1 2 3
1 3
i n
1.2 Các tham số đặc trưng của các ước lượng
- Phương sai và sai số chuẩn
Trang 322 3
2 1
x Var
2 1
x Var
e n
Trang 332 2
+ Hệ số r12 đo mức độ tương quan tuyến tính giữa Y và X2
+ Hệ số r13 đo mức độ tương quan tuyến tính giữa Y và X3
+ Hệ số r23 đo mức độ tương quan tuyến tính giữa X2 và X3
- Các hệ số tương quan cặp được xác định trong ma trận hệ số tương quan:
+ Hệ số r12,3 đo mức độ tương quan tuyến tính giữa Y và X2 khi X3 không đổi
+ Hệ số r13,2 đo mức độ tương quan tuyến tính giữa Y và X3 khi X2 không đổi
+ Hệ số r23,1 đo mức độ tương quan tuyến tính giữa X2 và X3 khi Y không đổi
2 Mô hình hồi quy k biến
- Hàm hồi quy tổng thể (PRF) và mô hình hồi quy tổng thể (PRM) có dạng:
β β β gọi là các hệ số góc riêng phần (các hệ số hồi quy)
- Giá trị của k cho biết: Số biến và số tham số cần ước lượng của mô hình
- Hệ số β1 = E Y X( / 2i = X3i = = X ki =0) là giá trị trung bình của Y khi
- Ký hiệu các véc tơ:
Trang 34- Giả sử mọi giả thiết của phương pháp OLS đều được thoả mãn
2.1 Ước lượng mô hình
ˆˆ
e Y
β β β
f β β
Trang 35- Phương sai và hiệp phương sai được xác định bởi ma trận hiệp phương sai:
- Khi số biến giải thích của mô hình tăng lên thì R2 tăng chậm hơn so với R2
- R2 ≤ R2 ≤1 vì R2 không phụ thuộc vào số bậc tự do của ESS và TSS
- Hệ số R2 được dùng làm căn cứ để xem xét việc đưa thêm biến giải thích vào môhình Một biến mới sẽ được đưa vào mô hình nếu: Hệ số của biến mới đưa vào môhình có ý nghĩa thống kê và hệ số R2 còn tăng
2.5 Hệ số tương quan
- Hệ số tương quan bội R = R2 đo mức độ tương quan tuyến tính chung giữa Y
và các biến giải thích trong mô hình
- Các hệ số tương quan cặp được xác định bởi ma trận hệ số tương quan:
Trang 36- Các hệ số tương quan cặp r ij;( ,∀i j = ÷2 n) cho biết mức độ tương quan tuyếntính giữa biến Xi và Xj
- Các hệ số tương quan cặp r1j;(j = ÷2 n) cho biết mức độ tương quan tuyến tínhgiữa biến Y và Xj
- Hệ số tương quan riêng phần
+ Xét mô hình: Y i = +β β1 2X2i +β3X3i +β4X4i +U i
+ Các hệ số tương quan riêng phần bậc 2: r12,34, r13,24, r14,23, r23,14, r24,13, r34,12
+ Hệ số r12,34 cho biết mức độ tương quan tuyến tính giữa Y và X2 trong điều kiện
X3 và X4 không thay đổi
+ Hệ số r23,14 cho biết mức độ tương quan tuyến tính giữa X2 và X3 trong điều kiện
Y và X4 không thay đổi
- Các hệ số trương quan cặp có thể xem là hệ số tương quan riêng phần bậc 0
3 Khoảng tin cậy và kiểm định giả thuyết về các hệ số hồi quy
3.1 Đối với βj;(j = ÷1 k)
a Phương pháp ước lượng khoảng tin cậy
- Thống kê: ( )
ˆˆ( )
- Trong thực tế người ta thường sử dụng một trong ba trường hợp sau:
+ Khoảng tin cậy đối xứng ( 1 2
b Phương pháp kiểm định giả thuyết.
- Kiểm định các cặp giả thuyết: