1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Kinh tế lượng nâng cao

99 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 99
Dung lượng 2,24 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Chương 1: Bản chất của phân tích hồi qui 1.1 Sự diễn giải hiện đại về khái niệm hồi qui 1.2 Các mối quan hệ thống kê không phải quan hệ xác định 1.3 Hồi qui không có tính nhân quả 1.4 Hồ

Trang 1

K inh tế lượng nâng cao

(Biên soạn lần thứ nhất cho lớp cao học kinh tế TN & MT 17K)

Tiến sĩ Kinh tế Nguyễn Thế Hòa

Khoa Kinh tế và Quản lý trường Đại học Thủy lợi

Hà Nội -2010 Mục lục

Trang 2

Chương 1: Bản chất của phân tích hồi qui

1.1 Sự diễn giải hiện đại về khái niệm hồi qui

1.2 Các mối quan hệ thống kê không phải quan hệ xác định

1.3 Hồi qui không có tính nhân quả

1.4 Hồi qui không phải tương quan

1.5 Bản chất và nguồn số liệu cho phân tích kinh tế lượng

Chương 2: Mô hình hồi qui hai biến

2.1 Ví dụ giả định

2.2 Hàm hồi qui tổng thể (PRF)

2.3 Chỉ định ngẫu nhiên về hàm PRF

2.4 Tầm quan trọng của sai số ngẫu nhiên

2.5 Hàm hồi quy mẫu SRF

2.6 Phương pháp bình phương nhỏ nhất (OLS)

2.7 Tính chất của các ước lượng

2.8 Các giả thiết của phương pháp bình phương bé nhất

2.9 Độ chính xác hay sai số chuẩn của các ước lượng OLS

2.10 Hệ số xác định r2đo độ phù hợp của hàm hồi quy mẫu SRF

2.11 Tính chất của các ước lượng dưới giả thiết chuẩn của mô hình

2.12 Khoảng tin cậy và kiểm định các hệ số hồi qui

2.13 Kiểm định sự phù hợp của hàm hồi qui- Phân tích hồi qui và phân tích

phương sai: Kiểm định F 2.14 Phân tich hồi qui và dự báo

Chương 3: Mô hình hồi qui nhiều biến

3.1 Mô hình hồi quy ba biến

3.2 Các giả thiết của mô hình

3.3 Ước lượng tham số của mô hình hồi qui ba biến

3.4 Ước lượng tham số của mô hình hồi quy k biến

3.5 Các tính chất của ước lượng bình phương bé nhất

Hệ số xác định bội R2và hệ số xác định bội đã được điều chỉnh

Trang 3

3.7 Khoảng tin cậy và kiểm định về các hệ số hồi quy riêng - kiểm định T

3.8 Kiểm định ý nghĩa chung của hồi qui mẫu: Phân tích phương sai - kiểm định F

3.9 Hồi qui có điều kiện ràng buộc – Kiểm định F

3.10 Dự báo

3.11 Ví dụ

3.12 Một số dạng hàm hồi qui

Chương 4: Hồi qui với các biến giả

4.1 Bản chất của biến giả

4.2 Hồi quy với một biến định lượng và một biến định tính với hai phạm trù 4.3 Hồi quy với một biến định lượng và một biến định tính với nhiều hơn hai phạm trù

4.4 Hồi quy với một biến định lượng và hai biến định tính

4.5 So sánh hai hồi quy: Tiếp cận bằng biến giả

4.6 Ảnh hưởng của sự tương tác giữa các biến giả

4.7 Sử dụng biến giả trong phân tích mùa

4.8 Hồi qui tuyến tính từng khúc

Chương 5: Chuỗi thời gian

5.1 Ví dụ về một số chuỗi thời gian về kinh tế

5.2 Quá trình ngẫu nhiên

5.3 Các quá trình ngẫu nhiên dừng

5.4 Các quá trình ngẫu nhiên không dừng

5.5 Các quá trình ngẫu nhiên không dừng

5.6 Các quá trình ngẫu nhiên có xu thế dừng và có sai phân dừng

5.7 Kiểm định nghiệm đơn vị

5.8 Kiểm định đồng tích hợp

3

Trang 4

Chương 1 Bản chất của phân tích hồi qui

1.1 Sự diễn giải hiện đại về khái niệm hồi qui

Có nhiều khái niệm nói về kinh tế lượng Nhưng có thể định nghĩa kinh tế lượng như một môn khoa học xã hội trong đó các công cụ của lý thuyết kinh tế, toán, suy luận thống kê được áp dụng để phân tích các vấn đề kinh tế

Các lý thuyết kinh tế thường đưa ra các mệnh đề hay các giả thuyết mà hầu hết chỉ nói về chất Ví dụ, lý thuyết kinh tế vi mô khẳng định rằng khi các yếu tố khác không thay đổi, nếu giảm giá của hàng hoá nào đó thì lượng cầu của hàng hoá đó sẽ tăng Như vậy, lý thuyết kinh tế đưa ra một mệnh đề về mối quan hệ nghịch biến giữa giá và lượng cầu của một hàng hoá Nhưng chính lý thuyết này lại không đưa ra một

sự đánh giá lượng hóa nào về mối quan hệ đó giữa hai biến; tức là nó không nói được lượng cầu một hàng hóa sẽ tăng hoặc giảm bao nhiêu khi giá của nó thay đổi một lượng nhất định

Mối quan tâm chính của kinh tế toán là trình bày lý thuyết kinh tế dưới dạng toán học (các phương trình) mà không chú ý tới khả năng đo lường hay thẩm định thực nghiệm lại lý thuyết Kinh tế lượng quan tâm chủ yếu tới việc thẩm định thực nghiệm các lý thuyết kinh tế Các nhà kinh tế lượng thường sử dụng các phương trình toán học

do các nhà kinh tế toán đề xuất nhưng lại đặt các phương trình này dưới dạng mà chính chúng có thể dùng để kiểm định thực nghiệm Và sự chuyển đổi mang tính toán học này thành các phương trình kinh tế lượng đòi hỏi rất lớn sự khéo léo và kỹ năng thực hành

Thống kế kinh tế chủ yếu quan tâm tới việc thu thập, xử lý, và trình bày số liệu dưới dạng sơ đồ và bảng biểu Đó là công việc của các nhà thống kê kinh tế Họ chịu rách nhiệm thu thập số liệu về GNP, việc làm, thất nghiệp, giá cả, vân vân Các số liệu được thu thập này lại là số liệu thô cho nghiên cứu kinh tế lượng

Các số liệu kinh tế không phải được tạo ra từ các cuộc thí nghiệm có kiểm soát Các nhà kinh tế lượng giống như các nhà thiên văn học phụ thuộc vào số liệu mà chúng không thể được kiểm soát trực tiếp Số liệu này chứa sai số của phép đo Kinh tế lượng sử dụng các công cụ, phương pháp của thống kê toán để tìm ra bản chất của các

số liệu thống kê

Hồi qui là một công cụ cơ bản của đo lường kinh tế ý tưởng trọng tâm của phân tích hồi qui nhiều biến là nghiên cứu mối liên hệ phụ thuộc có tính thống kê của một biến ngẫu nhiên với nhiều biến giải thích khác

Trang 5

Mục tiêu của phân tích hồi qui là đi ước lượng và dự báo giá trị trung bình của biến phụ thuộc Y, dựa trên các giá trị đã biết của biến giải thích; tức là trước hết đi tìm hàm kỳ vọng có điều kiện của biến phụ thuộc với các giá trị đã biết của biến giải thích dưới dạng E(Y/Xi) = f(Xi) Từng giá trị riêng của biến phụ thuộc Yi sẽ biến động xung quanh E(Y/Xi) và lệch gọi giá trị trung bình có điều kiện này một lượng ui, mối quan

hệ này có dạng mô hình hồi qui tổng thể:

Yi = E(Y/Xi) + ui, (1-1) Khái niệm hồi qui đã được Francis Galton đưa ra khi ông phát hiện ra qui luật chiều cao của các cháu trai phụ thuộc vào chiều cao của bố chúng Ông quan tâm tìm kiếm tại sao lại có sự ổn định về phân bố chiều cao trong một nhóm dân số Nhưng theo cách nhìn hiện đại mối quan quan tâm của chúng ta là khám phá ra chiều cao trung bình của những bé trai thay đổi như thế nào căn cứ chiều cao của bố chúng Nói cách khác, chúng ta quan tâm tới việc dự báo chiều cao trung bình của những bé trai khi biết chiều cao của bố chúng Trong hình 1.1 là đồ thị phân rải cho biết phân bố chiều cao của những bé trai trong một tập dân số tương ứng với các giá trị cho trước về chiều cao của bố chúng Lưu ý rằng ứng với chiều cao cho trước của một người bố, có một khoảng (phân bố) chiều cao của những bé trai Tuy nhiên, cũng lưu ý chiều cao trung bình của những bé trai tăng lên khi chiều cao của bố chúng tăng lên Để thấy rõ điều này, chúng ta vẽ xuyên qua đồ thị phân rải một đường thẳng minh họa chiều cao trung bình của những bé trai tăng lên như thế nào cùng với sự tăng lên về chiều cao của bố chúng Đường thẳng này được gọi là đường hồi qui

Hãy xét đồ thị phân rải trong hình 1.2, nó cho biết phân bố về chiều cao của những bé trai trong một tập dân số theo những độ tuổi cố định Lưu ý rằng, ứng với mỗi độ tuổi cho trước chúng ta có một khoảng các chiều cao Rõ ràng không phải tất

cả những bé trai trong cùng một độ tuổi cho trước thì có cùng chiều cao Nhưng chiều cao trung bình tăng lên theo độ tuổi Như vậy, nếu biết độ tuổi thì chúng ta có thể đoán được chiều cao trung bình tương ứng với độ tuổi đó

5

Trang 6

Hình 1.1 Phân phối giả thuyết về chiều cao của con trai tương ứng với chiều cao

cho trước của bố

Hình 1.2 Phân phối giả thuyết về chiều cao tương ứng với lứa tuổi

Quay sang ví dụ về kinh tế, một nhà kinh tế có thể quan tâm nghiên cứu về sự phụ thuộc của chi tiêu cá nhân vào thu nhập khả dụng cá nhân sau thuế Một phân tích như vậy có thể giúp cho việc ước lượng khuynh hướng tiêu dùng biên (MPC), tức là sự thay đổi trung bình về chi tiêu cho tiêu dùng khi thay đổi một đô la thu nhập thực

Trang 7

Một nhà độc quyền có thể cố định giá hay sản lượng (nhưng không phải cả hai) muốn khám phá xem phản ứng của cầu về một sản phẩm thay đổi theo giá Một thí nghiệm như vậy có thể tạo điều kiện để ước lượng độ co giãn của cầu theo giá của sản phẩm đó và giúp xác định mức giá có khả năng mang lại lợi nhuận lớn nhất

Một nhà kinh tế lao động có thể muốn nghiên cứu tỉ lệ thay đổi mức lương danh nghĩa có quan hệ với tỉ lệ thất nghiệp Số liệu lịch sử được cho ở đồ thị phân rải trong hình 1.3 là một ví dụ về đường cong Philip nổi tiếng thiết lập mối quan hệ giữa sự thay đổi tiền lương danh nghĩa và tỉ lệ thất nghiệp Một đồ thị phân rải như vậy có thể giúp nhà kinh tế lao động dự đoán sự thay đổi trung bình về mức lương danh nghĩa dựa vào một tỉ lệ thất nghiệp nhất định Những kiến thức như vậy có thể giúp khẳng định một điều gì đó về quá trình lạm phát trong một nền kinh tế, vì tăng mức lương danh nghĩa

có khả năng phản ánh sự tăng giá

Hình 1.3 Đường cong Philip giả thuyết

Một nhà kinh tế về tiền tệ cho biết rằng, khi các yếu tố khác không đổi nếu mức làm phát π càng cao thì tỉ lệ thu nhập mà mọi người muốn giữ lại dưới dạng tiền mặt k càng thấp, như minh họa trong hình 1.4 Một phân tích lượng hóa về mối quan hệ này

sẽ tạo khả năng cho nhà kinh tế về tiền tệ dự đoán lượng tiền mặt, như là môt tỉ lệ thu nhập của họ, mà mọi người muốn giữ lại tại các mức lạm phát khác nhau

Giám đốc marketing của một công ty muốn biết cầu về sản phẩm của công ty có mối quan hệ như thế nào với với chi tiêu cho quảng cáo Một nghiên cứu như vậy sẽ giúp ích rất nhiều cho việc tìm ra độ co giãn của cầu theo chi tiêu cho quảng cáo, tức là

số phần trăm thay đổi về cầu phản ứng lại khi thay đổi một phần trăm trong ngân sách quảng cáo Kiến thức này rất hữu ích trong việc xác định ngân sách chi cho quảng cáo tối ưu

7

Trang 8

Giám đốc marketing của một công ty muốn biết cầu về sản phẩm của công ty có mối quan hệ như thế nào với với chi tiêu cho quảng cáo Một nghiên cứu như vậy sẽ giúp ích rất nhiều cho việc tìm ra độ co giãn của cầu theo chi tiêu cho quảng cáo, tức là

số phần trăm thay đổi về cầu phản ứng lại khi thay đổi một phần trăm trong ngân sách quảng cáo Kiến thức này rất hữu ích trong việc xác định ngân sách chi cho quảng cáo tối ưu

Hình 1.4 Tỉ lệ giữ tiền mặt trong thu nhập có quan hệ với tỉ lệ lạm phát π

Một nhà kinh tế nông nghiệp có thể quan tâm nhiên cứu sự phụ thuộc của sản lượng lúa vào nhiệt độ, lượng mưa, lượng ánh sáng mặt trời, và phân bón Việc phân tích như vậy có thể tạo điều kiện để dự báo về thu hoạch lúa trung bình dựa trên thông tin của các biến giải thích

Bạn đọc có thể đưa ra nhiều ví dụ như vậy về sự phụ thuộc của một biến vào một hay nhiều biến Phương pháp phân tích hồi qui bàn tới ở đây được trình bày cụ thể nhằm nghiên cứu sự phụ thuộc như vậy giữa các biến

1.2 Các mối quan hệ thống kê không phải quan hệ xác định

Từ các ví dụ trích dẫn ở trên chúng ta lưu ý rằng trong phân tích hồi qui những

gì được quan tâm là sự phụ thuộc giữa các biến mang tính thống kê, chứ không mang tính hàm số hay xác định như những mối quan hệ trong vật lý cổ điển Trong những mối quan hệ thống kê chúng ta chủ yếu xử lý với các biến ngẫu nhiên, tức là các biến

có phân phối xác suất Ngược lại, trong sự phụ thuộc hàm số hay xác định chúng ta cũng xử lý với các biến, nhưng các biến này không mang tính ngẫu nhiên

Ví dụ, sự phụ thuộc của sản lượng lúa vào nhiệt độ, lượng mưa, lượng ánh sáng mặt trời, và phân bón về thực chất là mang tính thống kê theo nghĩa các biến giải thích này mặc dù có tầm quan trọng nhất định nhưng không thể giúp nhà kinh tế nông

Trang 9

nghiệp dự đoán chính xác sản lượng lúa vì những sai số có liên quan trong việc đo lường các biến này cũng như hàng loạt các yếu tố khác (các biến) tác động đồng thời tới sản lượng nhưng có thể rất khó để xác định riêng từng cái một Do đó, có sự chấp nhận khả năng biến thiên “nội tại” hay ngẫu nhiên nhất định trong biến phụ thuộc sản lượng lúa, nó không thể được giải thích hoàn toàn không cần biết chúng ta xem xét bao nhiêu biến giải thích

1.3 Hồi qui không có tính nhân quả

Mặc dù phân tích hồi qui đề cập đến sự phụ thuộc của một biến vào những biến khác, nhưng nó không nhất thiết hàm ý đến tính nhân quả Kendall và Stuart đã nói:

“Một mối quan hệ thống kê dù rất mạnh và dù rất nhiều hàm ý không thể thiết lập mối liên hệ nhân quả: các ý tưởng về tính nhân quả của chúng ta phải đến từ bên ngoài thống kê, xét cho cùng phải đến từ một lý thuyết nào đó hoặc từ lĩnh vực khác.”

Trong ví dụ về sản lượng lúa trên đây, không có lý do thống kê nào để cho rằng lượng mưa không phụ thuộc vào sản lượng lúa Vấn đề ở chỗ chúng ta xem sản lượng lúa như là biến phụ thuộc vào lượng mưa (trong số những thứ khác) là do việc xem xét không có tính thống kê: ý nghĩa chung là mối quan hệ này không thể đảo ngược được,

vì chúng ta không thể kiểm soát lượng mưa bằng cách thay đổi sản lượng lúa

Trong các ví dụ trên điểm đáng lưu ý là một mối quan hệ thống kê về thực chất không thể ám chỉ lôgic đến tính nhân quả Để qui cho tính nhân quả, người ta phải yêu cầu đến những xem xét trước đó hoặc lý thuyết Do đó, trong ví dụ thứ ba người ta có thể viện dẫn lý thuyết kinh tế để nói rằng chi tiêu cho tiêu dùng phụ thuộc vào thu nhập thực tế

1.4 Hồi qui không phải tương quan

Phân tích tương quan tuy có mối quan hệ rất gần nhưng về mặt khái niệm lại rất khác nhau với phân tích hồi qui, mục tiêu chính của phân tích tương quan là đo lường mức độ của mối quan hệ tuyến tính giữa hai biến Ví dụ, chúng ta có thể quan tâm tìm kiếm (hệ số) tương quan giữa việc hút thuốc và ung thư phổi, giữa các điểm thi thống

kê và toán, giữa điểm tốt nghiệp phổ thông và điểm tốt nghiệp đại học, vân vân Trong phân tích hồi qui, chúng ta về cơ bản không quan tâm tới một số đo như vậy Thay vào

đó, chúng ta cố gắng ước lượng hay dự báo giá trị trung bình của một biến dựa trên các giá trị cố định của những biến khác Chẳng hạn, chúng ta có thể muốn biết liệu có thể

dự đoán được điểm thi thống kê trung bình khi biết điểm thi toán của một sinh viên

Hồi qui và tương quan có một số khác nhau cơ bản rất đáng chú ý Trong phân tích hồi qui, có tính bất đối xứng trong cách mà biến phụ thuộc và các biến giải thích được xử lý Biến phụ thuộc được cho là có tính thống kê và ngẫu nhiên, tức là có một phân phối xác suất Ngược lại, các biến giải thích được cho là những giá trị cố định (trong việc lấy mẫu lặp), chúng được đưa ra rõ ràng trong định nghĩa về hồi qui Chắng hạn, chúng ta giả sử rằng biến lứa tuổi được cố định ở các mức cho trước và các

9

Trang 10

số đo chiueeuf cao nhận được tại các mức đó Ngược lại trong phân tích tương quan, chúng ta xử lý các (hai) biến có tính đối xứng; không có sự phân biệt nào giữa biến phụ thuộc và các biến giải thích Xét cho cùng, mối tương quan giữa điểm thi toán và điểm thi thống kê cũng giống như mối tương quan giữa điểm thi thống kê và điểm thi toán Hơn nữa, cả hai biến được cho là ngẫu nhiên Như chúng ta sẽ thấy, hầu hết lý thuyết tương quan dựa trên giả thiết về tính ngẫu nhiên của các biến, trong khi hầu hết

lý thuyết hồi qui được giải thích dựa trên giả thiết cho là biến phụ thuộc mang tính ngẫu nhiên nhưng các biến giải thích là cố định hay không ngẫu nhiên

1 5 Bản chất và nguồn số liệu cho phân tích kinh tế lượng

Sự thành công của phân tích kinh tế lượng cuối cùng phụ thuộc vào sự sẵn có của số liệu phù hợp Do đó chúng ta cần dành thời gian bàn về bản chất, tạo nguồn, và những hạn chế của số liệu mà có thể gặp phải trong phân tích thực nghiệm

1 Các kiểu số liệu

Có 3 kiểu số liệu có thể sẵn có trong phân tích thực nghiệm: số liệu chuỗi thời gian, số liệu chéo theo vùng, và số liệu hỗn hợp (kết hợp số liệu chuỗi thời gian và số liệu chéo theo vùng)

Số liệu chuỗi thời gian Chuỗi thời gian là một tập hợp những quan sát về những giá

trị mà một biến có thể nhận tại các thời điểm khác nhau Số liệu như vậy có thể được thu thập đều đặn trong những khoảng thời gian nhất định, chẳng hạn như hàng ngày (ví dụ, giá cổ phiếu), hàng tuần (ví dụ, mức cung tiền của nhà nước), hàng tháng (ví

dụ, tỉ lệ thất nghiệp, chỉ số giá tiêu dùng), hàng quí (ví dụ, GNP), hàng năm (ví dụ, ngân sách của chính phủ), cứ năm năm một lần (ví dụ điều tra về sản xuất), cứ mười năm một lần (ví dụ điều tra về dân số) Đôi khi các số liệu là sẵn có cả theo quí và hàng năm như trong trường hợp số liệu về GDP hay chi tiêu cho tiêu dùng

Như vậy các số liệu được thu thập có thể là số lượng (ví dụ, thu nhập, giá cả, mức cung tiền) hoặc chất lượng (ví dụ, nam hoặc nữ, có việc làm hoặc không có việc làm, có hôn nhân hoặc chưa có hôn nhân, có trình độ đại học hoặc không) Như chúng

ta sau này sẽ thấy, các biến chất lượng được gọi là các biến giả và có thể quan trọng không kém các biến về số lượng

Mặc dù số liệu chuỗi thời gian được dùng trong rất nhiều các nghiên cứu kinh

tế lượng, nhưng chúng cũng thể hiện một số vấn đề đối với các nhà kinh tế lượng Hầu hết các công trình thực nghiệm dựa vào chuỗi thời thời gian đều giả thiết rằng các chuỗi thời gian đang dùng là các chuỗi dừng Ý nghĩa mang tính kỹ thuật chính xác của tính dừng của một chuỗi thời gian là giá trị trung bình và phương sai của nó là không đổi một cách hệ thống theo thời gian Hãy luôn ghi nhớ mỗi khi bạn xử lý với

số liệu chuỗi thời gian, thì tính dừng của nó luôn được xem xét

Trang 11

Số liệu chéo theo vùng Số liệu chéo theo vùng là số liệu cho các biến được thu thập

theo không gian vào cùng một thời điểm, như số liệu điều tra dân số cứ 10 năm một lần, số liêu điều tra về chi tiêu cho tiêu dùng hay số liệu về ý kiến cử tri do rất nhiều tổ chức tiến hành Trong bảng 1.1 minh họa số liệu về sản lượng trứng và giá trứng cho

50 bang của Mỹ năm 1990 và 1991 Với mỗi năm, số liệu này trên 50 bang là số liệu chéo theo vùng Như vậy, trong bảng 1.1 có hai mẫu số liệu chéo theo vùng

Cũng giống như số liệu chuỗi thời gian có vấn đề đặc biệt riêng của chúng về tính dừng, số liệu chéo theo vùng cũn có vấn đề riêng của chúng, cụ thể là phương sai của sai số không đồng nhất Chúng ta có một số bang sản xuất rất nhiều trứng (ví dụ, bang Pennsylvania) và môt số bang sản xuất rất ít Khi đưa các đơn vị không đồng đều vào một phân tích thống kê, cần phải tính đến đến ảnh hưởng của độ lớn hay qui mô cũng giống như không thể trộn lẫn táo với cam

Số liệu hỗn hợp Trong số liệu hỗn hợp, có cả những phân tử số liệu chuỗi thời gian

và cả số liệu chéo theo vùng Số liệu trong bảng 1.1 là một ví dụ về số liệu hỗn hợp Với mỗi năm chún ta có 50 quan sát chéo theo vùng và với mỗi bang chúng ta có hai quan sát theo thời gian về giá và sản lượng của trứng, tổng cộng là 100 quan sát hỗn

hợp

2 Nguồn gốc của số liệu

Các số liệu được sử dụng trong phân tích thực nghiệm có thể do các cơ quan nhà nước, các tổ chức quốc tế, các công ty tư nhân hay các cá nhân thu thập

Chúng có thể là các số liệu thực nghiệm và không thực nghiệm Các số liệu thực nghiệm thường được thu thập trong khoa học tự nhiên Các số liệu không thực nghiệm thường được thu thập trong khoa học xã hội nói chung, không phải do thực nghiệm mà

có, không nằm dưới sự kiểm soát của kỹ thuật viên (ví dụ GDP, giá cả, số người thất nghiệp )

3 Tính chính xác của số liệu

Mặc dù có rất nhiều số liệu sẵn có trong nghiên cứu kinh tế, nhưng chất lượng của các số liệu thu thập được thường không tốt Đó là do một số nguyên nhân Hầu hết các số liệu trong khoa học xã hội thường là các số liệu phi thực nghiệm nên có thể có nhiều sai số do quan sát hay bỏ sót quan sát, hay do cả hai Ngay cả các số liệu thu thập được bằng thực nghiệm cũng có sai số của phép đo Các mẫu được thu thập trong các cuộc điều tra rất khác nhau về kích cỡ cho nên rất khó khăn trong việc so sánh các kết quả giữa các đợt điều tra Các loại số liệu kinh tế thường có sẵn ở mức tổng hợp cao, không đi sâu vào các đơn vị nhỏ Một số các số liệu thuộc bí mật quốc gia, không phải ai cũng có thể sử dụng được

Bảng 1.1 Sản lượng trứng của Mỹ

11

Trang 13

xấp xỉ nhau và kiểm tra xem chi tiêu tiêu dùng của các gia đình trong mỗi nhóm Ta có bảng số liệu sau (tính bằng $):

Bảng 2-1: Thu nhập và chi tiêu trong 1 tuần của tổng thể

có năm gia đình mà chi tiêu tiêu dùng của họ trong khoảng từ 55 $ đến 75 $ Tương tự, cho X = 240 $ thì có sáu gia đình mà chi tiêu tiêu dùng của họ trong khoảng từ 137 $ đến 189 $ Nói cách khác, mỗi cột trong bảng 2.1 cho biết một phân phối chi tiêu tiêu dùng Y tương ứng với một mức thu nhập cố định;tức là nó cho biết phân phối có điều kiện của Y với các giá trị cho trước của X Như vậy, ta có bảng phân phối Y với X đã cho Ta có bảng phân phối xác suất có điều kiện P(Y| X = Xi) Ví dụ, với X = 80 $ có năm giá trị của Y: 55 $, 60 $, 65 $, 70 $ và 75 $ Do đó, cho trước X = 80, xác suất của mỗi mức trong số các chi tiêu tiêu dùng này bằng 1/5; kí hiệu p(Y= 55| X = 80) = 1/5 Tương tự, p(Y= 150| X = 260) = 1/7, vân vân Các xác suất có điều kiện cho số liệu trong bảng 2.1 được thể hiện trong bảng 2.2

Bảng 2-2: Các xác suất có điều kiện p(Y| X i) cho số liệu trong bảng 2.1

X

p(Y│X i ) 80 100 120 140 160 180 200 220 240 260

13

Trang 14

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

i i

i) P(Y| X ).YX

X

|E(Y

E(Y| Xi = 80) = (55 + 60 + 65 + 70 + 75) 1/5 = 65 E(Y| Xi = 200) = (120 + 136 + 140 + 144 + 145) 1/5 = 137

Số liệu ở bảng 2.1 được minh họa bằng đồ thị phân giải trong hình 2.1

Đồ thị phân giải này cho thấy phân phối có điều kiện của Y tương ứng với các giá trị khác nhau của X Mặc dù có những biến thiên về chi tiêu tiêu dùng của riêng từng gia đình, nhưng hình 2.1 cho thấy rõ ràng rằng chi tiêu tiêu dùng tính trung bình tăng lên khi thu nhập tăng lên Ở khía cạnh khác, đồ thị này biểu lộ giá trị trung bình (có điều kiện ) của Y tăng lên khi X tăng Quan sát này có thể thấy sinh động hơn nếu chúng ta tập trung vào những điểm in đậm thể hiện các giá trị trung bình có điều kiện khác nhau của Y Đồ thị phân giải này cho thấy các giá trị trung bình có điều kiện này

nằm trên một đường thẳng với độ dốc dương Đường thẳng này được gọi là đường hồi qui tổng thể Đó chính là hồi qui của Y theo X

Hình 2.1 Phân phối có điều kiện về chi tiêu với các mức thu nhập khác nhau

Trang 15

Khi đó, về mặt hình học một đường hồi qui tổng thể đơn giản là quĩ tích các điểm giá trị trung bình có điều kiện hay kỳ vọng có điều kiện của biến phụ thuộc với những giá trị cố định của các biến giải thích Như minh họa trong hình 2.2 cho thấy với mỗi Xi có một tổng thể các giá trị của Y (được giả thiết là có phân phối chuẩn) và một giá trị trung bình (có điều kiện) tương ứng Đường hồi qui đi qua các giá trị trung bình có điều kiện này

2.2 Hàm hồi qui tổng thể (PRF)

Từ thảo luận ở trên đặc biệt trong hình 2.1 và 2.2 thì rõ ràng là mỗi giá trị trung bình có điều kiện E(Y| Xi ) là một hàm của Xi Bằng ký hiệu, thì

E(Y| Xi) = f(Xi) (2.1) trong đó f(Xi) ký hiệu là một hàm của biến giải thích Xi Phương trình (2.1) được gọi

là hàm hồi quy tổng thể (hai biến) PRF Nó đơn thuần khẳng định rằng trung bình (tổng thể) của phân phối Y với X đã biết là một hàm của biến Xi Nói cách khác, nó cho biết giá trị trung bình của Y thay đổi theo X như thế nào

Hàm f(Xi) được giả thiết có dạng như thế nào? Câu hỏi này là quan trọng vì trong những tình huống thực tế chúng ta không sẵn có toàn bộ tổng thể để kiểm tra Do

đó dạng hàm PRF là một vấn đề thực nghiệm, mặc dù trong các trường hợp cụ thể lý thuyết có thể có điều gì đó để nói Ví dụ, các nhà kinh tế có thể thừa nhận rằng chi tiêu tiêu dùng có mối quan hệ tuyến tính với thu nhập Vì vậy, như là một sự xấp xỉ đầu tiên hay giả thuyết để tiến hành nghiên cứu, ta có thể giả sử rằng PRF E(Y| Xi) là một hàm tuyến tính của Xi, hay có dạng

E(Y| Xi) = f(Xi) = β1 + β2 Xi (2.2) trong đó β1 và β2 là các tham số cố định chưa biết gọi là các hệ số hồi qui: ta cũng còn gọi β1 là hệ số chặn và β2 là hệ số góc Phương trình (2.2) gọi là hàm hồi qui tổng thể

15

Trang 16

tuyến tính hay hồi qui tổng thể tuyến tính Đôi khi nó cũng được gọi là mô hình hồi qui tổng thể tuyến tính

Hình 2.2 Đường hồi qui tổng thể

Thuật ngữ tuyến tính ở đây được diễn giải theo hai cách:

1 Tuyến tính theo các biến Điều đầu tiên có lẽ rất “ tự nhiên” của ý nghĩa tuyến

tính là kỳ vọng có điều kiên của Y là một hàm tuyến tính của Xi , ví dụ như (2.2) Trong trường hợp này đường tuyến tính là một đường thẳng Theo sự diễn giải này, thì một hàm hồi qui như E(Y | Xi) = β1 + β2 Xi2 không phải là một hàm tuyến tính vì biến

X xuất hiện với số mũ 2

2 Tuyến tính theo tham số Cách diễn giải về tuyến tính thứ hai là kỳ vọng có

điều kiên của Y, E(Y|Xi), là một hàm tuyến tính của βi Theo cách diễn giải này, E(Y|Xi)= β1 + β2Xi2 là một mô hình hồi qui tuyến tính nhưng E(Y | X i ) = β1+ β2 X ithì không tuyến tính Mô hình thứ hai là một ví dụ về mô hình hồi qui phi tuyến (theo các tham số) mà chúng ta không xử lý với những mô hình như vậy trong tài liệu này

2.3 Chỉ định ngẫu nhiên về hàm PRF

Rõ ràng trong hình 2.1 khi thu nhập gia đình tăng lên thì chi tiêu tiêu dùng gia đình tính trung bình cũng tăng lên Nhưng còn chi tiêu tiêu dùng của một gia đình cụ thể có mối quan hệ như thế nào với mức thu nhập (cố định) của gia đình đó? Ta thấy

từ bảng 2.1 và hình 2.1 chi tiêu tiêu dùng của một gia đình cụ thể không nhất thiết tăng lên khi mức thu nhập tăng lên Ví dụ, ứng với mức thu nhập 100$ có một gia đình mà chi tiêu tiêu dùng bằng 65$ thấp hơn chi tiêu tiêu dùng của hai gia đình có thu nhập hàng tuần chỉ 80$ Nhưng lưu ý rằng, mức chi tiêu tiêu dùng trung bình của các gia

Trang 17

đình có thu nhập hàng tuần 100$ là lớn hơn mức chi tiêu tiêu dùng trung bình của các gia đình có thu nhập hàng tuần 80$ (77$ lớn hơn 65$)

Vậy thì chúng ta có thể nói gì về mối quan hệ giữa chi tiêu tiêu dùng của một gia đình cụ thể và một mức thu nhập cho trước? Từ hình 2.1 ta thấy, với mức thu nhập

Xi cho trước thì chi tiêu tiêu dùng của một gia đình cụ thể dao động xung quanh mức chi tiêu dùng trung bình của tất cả các gia đình tại mức Xi, tức là xung quanh kỳ vọng

có điều kiện của nó Do đó, chúng ta có thể biểu diễn biến thiên này của một gia đình

cụ thể xung quanh kỳ vọng của nó như sau:

ui = Yi – E(Y│Xi) hay Yi = E(Y│Xi) + ui (2.3)

trong đó biến thiên uilà một biến ngẫu nhiên không thể quan sát được nhận các giá trị dương hoặc âm ui là sai số ngẫu nhiên hoặc nhiễu ngẫu nhiên

Như vậy, chúng ta có thể nói chi tiêu dùng của một gia đình cụ thể với mức thu nhập của nó cho trước có thể được biểu diễn thành tổng của hai phần: (1) E(Y | Xi) ám chỉ đơn giản là mức chi tiêu dùng trung bình của tất cả các gia đình cùng một mức thu nhập đó Thành phần này có tính hệ thống và xác định được (2) thành phần thứ hai là

ui, nó là ngẫu nhiên và không có tính hệ thống Nếu E(Y│Xi) được giả thiết là tuyến tính theo Xi, thì phương trình (2.3) có thể viết là:

Yi = E(Y│Xi) + ui = β1 + β2Xi + ui (2.4)

E(Yi|Xi) = E[E(Y|Xi)] + E(ui|Xi) = E(Y| Xi) + E(ui|Xi) (2.5)

Do E(Yi|Xi) cũng chính là E(Y|Xi), nên phương trình (2.4) hàm ý rằng

E(ui|Xi) = 0 (2.6) Như vậy, giả thiết cho rằng đường thẳng hồi qui đi qua các giá trị trung

17

Trang 18

bình có điều kiện của Y hàm ý rằng các giá trị trung bình có điều kiện của ui(với

Xi đã cho)là bằng 0 Vì vậy không cần phải đưa yếu tố này vào mô hình

2.4 Tầm quan trọng của sai số ngẫu nhiên

Như đã lưu ý ở trên, biểu thức sai số ngẫu nhiên ui là đại diện cho tất

cả các biến bị bỏ qua không đưa vào mô hình nhưng có tác động đồng thời tới Y Câu hỏi đặt ra là: Tại sao chúng ta không đưa tất cả các biến đó vào mô hình? Hay nói cách khác, tại sao không phát triển mô hình hồi quy bội với thật nhiều biến tối đa có thể được? Chúng ta có thể xây dựng được mô hình hồi quy bội nhưng dù có đưa thêm vào bao nhiêu biến độc lập thì sai số ngẫu nhiên vẫn tồn tại với nhiều lý do Cụ thể:

1 Tính mơ hồ của lý thuyết: Lý thuyết này đi xác định hành vi của Y nhưng có thể hoặc thường là không hoàn thiện Chúng ta có thể biết chắc chắn thu nhập hàng tuần X có ảnh hưởng tới chi tiêu dùng Y, nhưng có thể bỏ qua hoặc không biết chắc chắn về những biến khác tác động tới Y Do đó, ui được sử dụng để thay thế cho tất cả các biến bị bỏ qua không đưa vào mô hình

2 Không đầy đủ số liệu: ngay cả khi biết rõ các biến bị bỏ qua không đưa vào mô hình và khi tiến hành xây dựng mô hình hồi quy nhiều biến chúng ta cũng không có đầy đủ thông tin về các biến này Kinh nghiệm nói chung trong phân tích thực nghiệm là số liệu chúng ta thích như lý tưởng thường không sẵn có Ví

dụ, chúng ta có thể đưa sự giàu có của gia đình như là một biến giải thích thêm vào biến thu nhập để giải thích chi tiêu dùng gia đình Nhưng thật không may, thông tin về sự giàu có gia đình là không sẵn có Do đó chúng ta buộc phải bỏ qua biến về sự giàu có này không đưa vào mô hình dù cho sự liên quan của nó

về mặt lý thuyết là rất lớn để giả thích chi tiêu tiêu dùng

3 Biến cơ bản khác với biến phụ Giả sử trong ví dụ tiêu dùng-thu nhập của chúng

ta bên cạnh thu nhập X1, còn có số con trong gia đình X2, giới tính X3, tôn giáo

X4, trình độ văn hóa X5, và vùng địa lý X6 cũng tác động tới chi tiêu tiêu tiêu dùng Nhưng rất có thể là ảnh hưởng chung của tất cả hay một số biến này là rất nhỏ đến mức mà không ảnh hưởng đáng kể khi đưa chúng vào mô hình Người

ta hy vọng rằng ảnh hưởng kết hợp của chúng có thể được xem như là biến ngẫu nhiên ui

4 Sự ngẫu nhiên mang tính nội tâm trong hành vi con người Ngay cả khi chúng

ta thành công trong việc đưa tất cả các biến có liên quan vào mô hình, thì vẫn

có giới hạn về sự ngẫu nhiên mang tính nội tâm nào đó trong từng cá nhân mà

Y không thể được giải thích dù chúng ta cố gắng đến mấy Nhiễu uicó thể phản ánh rất tốt sự ngẫu nhiên mang tính nội tâm này

Trang 19

5 Các biến có sự ủy thác kém Mặc dù trong mô hình hồi qui cổ điển giả sử rằng các biến Y và X được đo chính xác, nhưng trong thực tế số liệu có thể bị sai số

đo lường rất tai hại

6 Về khía cạnh kinh tế Ta muốn có mô hình hồi qui càng đơn giản càng tốt Nếu

ta có thể giải thích hành vi của biến Y bằng một số nhỏ nhất các biến và ta không biết tường minh các biến khác thì ta dùng yếu tố uiđể thay cho tất cả các biến này

7 Dạng hàm sai Chúng ta thường không biết chính xác dạng hàm về mối quan hệ giữa các biến giải thích và phụ thuộc, đó là mối quan hệ tuyến tính hay, phi tuyến

2.5 Hàm hồi quy mẫu SRF

Cho đến giờ chúng ta mới hạn chế thảo luận ở tập tổng thể các giá trị của Y tương ứng với các giá trị X cố định để thận trọng tránh việc lấy mẫu các quan sát (lưu

ý số liệu của bảng 2.1 minh họa tập tổng thể, chứ không phải một mẫu) Nhưng đã đến lúc phải đối mặt với các vấn đề lấy mẫu, vì hầu hết trong các tình huống thực tế mà chúng ta có là một mẫu các giá trị của Y tương ứng với các giá rị X cố định nào đó Do

đó nhiệm vụ của chúng ta bây giờ là đi ước lượng hàm hồi qui tổng thể PRF trên cơ sở thông tin mẫu

Để minh họa, giả sử rằng tập tổng thể của bảng 2.1 chúng ta không biết mà chỉ có thông tin là một mẫu được chọn ngẫu nhiên về các giá trị của Y với các giá trị X cho trước như trong bảng 2.3 Không giống trong bảng 2.1, bây giờ chúng ta chỉ có một giá trị của Y tương ứng với các giá trị của X cho trước; mỗi Y (cho trước Xi) trong bảng 2.3 được chọn ngẫu nhiên từ các giá trị Y tương ứng với cùng một Xitừ bảng 2.1

B ảng 2.3 Một mẫu ngẫu nhiên từ tập tổng thể trong bảng 2.1

Trang 20

Bảng 2.4 Một mẫu ngẫu nhiên khác từ tập tổng thể trong bảng 2.1

chắn tuyệt đối là đường nào Các đường trong hình 2.3 được gọi là các đường hồi qui mẫu Do có những dao động trong việc lấy mẫu nên chúng là xấp xỉ của hồi qui tổng

thể PR Nói chung, chúng ta có thể có được N hàm hồi qui mẫu khác nhau SRFi với N mẫu khác nhau, và các hàm hồi qui mẫu không trùng nhau

Tương tự hàm hồi qui tổng thể PRF ở (2.2), hàm hồi qui mẫu có thể viết là

Trang 21

Yi = β∧1+β∧2Xi (2.7) trong đó

-

i

Y là ước lượng của E(Y│Xi),

- β∧1 là ước lượng của β1,

-

∧ 2

β là ước lượng của β2

Lưu ý rằng, cũng giống như như hàm hồi qui tổng thể PRF được biểu diễn dưới hai dạng tương đương (2.2) và (2.4), ta có thể biểu diễn hàm hồi qui mẫu SRF (2.7) dưới dạng ngẫu nhiên của nó như sau:

Yi = β∧1+β∧2Xi + ui (2.8)

trong đó ký hiệu thêm vào ui như đã được được định nghĩa, gọi là phần dư (của mẫu)

Về mặt khái niệm ui tương tự với ui và có thể được xem như là một ước lượng của ui

Nó được đưa vào hàm hồi qui mẫu SRF với cùng lý do như ui được đưa vào hàm hồi qui tổng thể PRF

Hình 2.3 Các đường hồi qui dựa trên hai mẫu khác nhau

Tóm lại, chúng ta tìm thấy mục tiêu ban đầu trong phân tích hồi qui là ước

21

Trang 22

hàm PRF (2.4) đượcựa trên hàm hồi qui mẫu (2.8), vì thường thường phân tích của chúng ta đượcựa trên việc lấy một mẫu từ tập tổng thể Nhưng do các dao động lấy mẫu nên ước lượng hàm hồi qui tổng thể PRF dựa trên hàm hồi qui chỉ là một xấp xỉ Xấp xỉ này được minh họa trong hình 2.4

Với X = Xi , chúng ta có một quan sát (mẫu) Y = Yi Theo hàm hồi qui mẫu SRF, giá trị quan sát Yicó thể được biểu diễn là

việc ước lượng cao hơn hay nhỏ hơn như vậy là không thể tránh khỏi vì các dao động của việc lấy mẫu

Câu hỏi then chốt bây giờ là: Nếu như muốn đảm bảo SRF là một xấp xỉ của PRF thì có thể đưa ra một qui tắc hay một cách nào để làm cho xấp xỉ này là “gần

nhất” có thể được hay không? Nói cách khác, SRF được xây dựng như thế nào sao choβ∧1 là “gần nhất” có thể được với β1,β∧2 là “gần nhất” có thể được với β2 dù cho chúng ta sẽ không bao giờ biết được giá trị thật sự của β1 và β2?

Hình 2.4 Các đường hồi qui mẫu và hồi qui tổng thể

Trang 23

2.6 Phương pháp bình phương nhỏ nhất (OLS)

Phương pháp bình phương nhỏ nhất đã được nhà toán học Đức Carl Friedrich Gauss đưa ra là một trong những phương pháp phân tích hồi qui nổi tiếng và có hiệu lực nhất Nguyên lý của phương pháp như sau:

Giả sử có hàm hồi qui tổng thể PRF như sau:

Nhưng hàm SRF được ước lượng như thế nào? Để thấy được điều này chúng

ta tiếp tục như sau

Trước hết, ta biểu diễn (2.9) lại như sau

∧ 1

β

-∧ 2

ở hình 2.5

Hình 2.5 Tiêu chuẩn bình phương nhỏ nhất

23

Trang 24

Nếu chúng ta tuân theo tiêu chuẩn cực tiểu hóa ∑ui, thì hình 2.5 cho thấy các phần dư u∧2 và u∧3cũng như các phần dư u∧1và u∧4 có cùng trong số trong tổng (u∧1+u∧2+u∧3 +u∧4), nhưng hai phần dư đầu tiên lại gần với SRF hơn so với hai phần dư sau Nói cách khác, các phần dư này có tầm quan trọng như nhau không không liên quan tới việc từng quan sát riêng là gần hay xa với SRF như thế nào Hậu quả của điều này là hoàn toàn có thể xảy ra tổng của các ui rất nhỏ (thậm chí bằng 0) nhưng có ui

bị rải ra rất xa SRF Để thấy điều này, giả sử cho u∧1,u∧2,u∧3 , và u∧4các giá trị tương ứng

là 10, +2, -2, và -10 Tổng của các phần dư bằng 0 nhưng u∧1và

∧ 4

u lại rải ra xa hơn rất nhiều so với u∧2và u∧3 Để tránh được điều này nếu chúng ta tuân theo tiêu chuẩn bình phương nhỏ nhất, nó khẳng định rằng SRF có thể được xác định theo cách mà

∑ ∧2

i

u = ∑ − ∧ 2

)(Y i Y i

u trọng số lớn hơn so với các phần dư u∧2và

∧ 3

u ở hình 2.5

Tiếp theo, chúng ta lấy đạo hàm (2.12) theoβ∧1 vàβ∧2 và cho chúng bằng 0 để thu được hệ phương trình xác định các ước lượng cho β1 và β2 như sau:

Trang 25

β được xác định duy nhất ứng với n cặp quan sát (Xi, Yi)

các mẫu khác nhau chúng có giá trị khác nhau

III Hàm hồi quy mẫu SRF có các tính chất sau

1 SRF đi qua trung bình mẫu (X , Y), nghĩa là Y =

∧ 1

β +

∧ 2

β X , như minh họa trong hình 2.6

Hình 2.6: Đường thẳng hồi qui mẫu đi qua các giá trị trung bình mẫu của Y và X

25

Trang 26

2 Giá trị trung bình của Yibằng giá trị trung bình của các giá trị (quan sát) cụ thể của Y, nghĩa là Y∧ = Y

3 Giá trị trung bình của các phần dư bằng 0, tức là n i

Ví dụ: Bảng sau đây cho số liệu về lãi suất (Y) và tỷ lệ lạm phát (X) trong năm 1988 ở

chín nước, giả sử rằng sự phụ thuộc E(Y|X) có dạng tuyến tính Hãy xây dựn hàm hồi quy và xác định các đặc trưng của nó (SRF)

Bảng 2.5: Số liệu về lãi suất (Y) và tỷ lệ lạm phát (X)

Trang 27

i i i

x

y x

1 2

1

8489,1973

14,2466

1,2494;

β∧1=Y-β∧2 X = 14,5 – 1,2494.9,411≈ 2,7418

Từ đó suy ra : SRF có dạng

Y = 2,7418 + 1,2494 Xi

2.8 Các gi ả thiết của phương pháp bình phương bé nhất

Căn cứ vào phương pháp bình phương tối thiểu (OLS), ta đã tính được các ước lượng của mô hình dựa vào mẫu đã cho Một câu hỏi đặt ra là liệu các ước lượng tìm được có đáng tin cậy hay không? Và chất lượng các ước lượng phụ thuộc vào:

- Dạng hàm được chọn trong mô hình (tuyến tính, phi tuyến)

27

Trang 28

- Các giá trị quan sát (Xi, Yi)

- Kích thước mẫu (n)

- Các giả thiết về sai số ngẫu nhiên (nhiễu) ui

Giả thiết 1: Mô hình hồi qui là tuyến tính theo các tham số

Giả thiết 2: Các giá trị của X được xác định khi lấy mẫu

Giả thiết 3: Kỳ vọng của nhiễu ngẫu nhiên uiphải bằng 0, tức (E(ui|Xi) =0), như minh họa trong hình 2.7

Giả thiết 4: Phương sai của ui là bằng nhau:

var(ui│Xi) = E[ui-E(ui)│Xi]2 = σ 2

Trường hợp ngược lại: var(ui) ≠ var(uj) gọi là phương sai không thuần nhất

Hình 2.7 Phân phối xác suất có điều kiện của các nhiễu u i

Giả thiết 5: không có sự tương quan giữa các nhiễu ui, tức

cov (ui, uj│Xi, Xj) = 0 ∀i ≠ j

Giả thiết 6: không có sự tương quan giữa ui và Xi, tức cov(ui, Xj) = 0

Giả thiết 7: Có sự biến động giữa các giá trị X, tức var(X) phải là một số dương

hữu hạn

Giả thiết 8: Mô hình hồi qui được chỉ định đúng

Giả thiết 9: Không có đa cộng tuyến chặt chẽ, tức là giữa các biến giải thích

không có mối quan hệ tuyến tính chặt chẽ

Trang 29

2.9 Độ chính xác hay sai số chuẩn của các ước lượng OLS

Từ các phương trình (2.14) và (2.15) ta thấy các ước lượng β∧1và

∧ 2

β là hàm

số của các số liệu mẫu Nhưng do các số liệu có khả năng thay đổi từ mẫu này sang mẫu khác, nên các ước lượng này tự thân chúng cũng thay đổi theo Do đó, cần có cái

gì đó là thước đo độ tin cậy hay độ chính xác của các ước lượng này Trong thống kê,

độ chính xác của một ước lượng được đo bằng độ lệch chuẩn (se), nó được tính như sau:

(2.16) trong đó var là phương sai, se là độ lệch chuẩn và σ2 là phương sai không đổi của ui

theo giả thiết 4 Chính σ2cũng được ước lượng theo công thức:

Trang 30

nữa, qua mối mẫu chúng còn phụ thuộc lẫn nhau Sự phụ thuộc này được đo bằng công thức:

(2.20)

Tính chất của các ước lượng OLS: Định lý Gauss-Markov

Một ước lượng chẳng hạn β∧2 được gọi là ước lượng tuyến tính không chệch tốt nhất (BLUE) cho β2 nếu có các tính chất sau:

1 Nó là tuyến tính, tức là có một hàm tuyến tính của một biến ngẫu nhiên như biến phụ thuộc Y trong mô hình hồi qui

2 Nó là không chệch, tức là E(β∧2) = β2

3 Nó có phương sai nhỏ nhất trong lớp tất cả các ước lượng tuyến tính không

chệch như vậy Một ước lượng không chệch có phương sai nhỏ nhất gọi là ước lượng hiệu quả

Định lý Gauss- Markov: Dựa vào các giả thiết đã cho của mô hình hồi qui tuyến tính,

thì các ước lượng OLS thuộc lớp các ước lượng tuyến tính không chệch và có phương sai nhỏ nhất, tức chúng là BLUE

2.10 Hệ số xác định r 2 đo độ phù hợp của hàm hồi quy mẫu SRF

e

1 2

(2.21)

Trang 31

2

) ( = ∑

=

i i

y

1

2

= TSS (total sum of squares) là tổng bình

phương của tất cả các sai lệch giữa các giá trị quan sát cụ thể Yi với giá trị trung bình của chúng

1

2)

1

2

) ( = ∑

=

n

i i

=

n

i i

Ký hiệu ∑

=

n

i i

1

2)( = RSS (residual sum of squares) là tổng bình phương của tất cả các sai lệch giữa các quan sát Yi và các giá trị ước lượng nhận được

từ hàm hồi quy (tổng bình phương của các phần dư) Khi đó, (2.21) là:

n

i i

Y Y

Y Y

1

2 1

2

)(

)(

n

i i

Y Y e

1

2 1 2

)(

Bây giờ chúng ta định nghĩa r2

n

i i

Y Y

Y Y

1

2 1

2

)(

)(

=

TSS ESS

n

i i

Y Y e

1

2 1 2

)(

Trang 32

Số r2 được xác định và gọi là hệ số xác định, nó được sử dụng rất phổ biến để đo

độ phù hợp của hàm hồi quy mẫu SRF Ta thấy r2tỉ lệ toàn bộ sai lệch của Y với giá trị trung bình của chúng được giải thích bằng mô hình hồi qui Nó là một số không âm và 0≤r2≤1 Đại lượng r2 càng gần 1 càng tốt vì thành phần sai số do yếu ngẫu nhiên nhỏ

r2 có thể tính nhanh chóng từ công thức:

(2.25) Nếu chia cả tử số và mẫu số của (2.25) cho cỡ mẫu n (hoặc n-1 nếu cỡ mẫu nhỏ), thì ta có:

(2.26) trong đó S2

Y và S2X tương ứng là các phương sai mẫu của Y và X

Do β∧2 = ∑xiyi/∑xi2nên (2.25) có thể viết là:

(2.27) Căn cứ vào định nghĩa r2, chúng ta có thể biểu diễn ESS và RSS như sau:

Trang 33

1

2

(2.28) RSS = TSS – ESS

Bảng 2.7: Số liệu về chi tiêu tiêu dùng Y và thu nhập hàng tuần X

Kết quả tính toán cho trong bảng 2.8 như sau:

Bảng 2.8: Tính SRF từ số liệu về chi tiêu dùng Y và thu nhập hàng tuần X

hay ta có:

33

Trang 34

Do đó, hàm hồi qui mẫu được ước lượng là:

nó được minh họa trong hình 2.9

Hình 2.9: Đường hồi qui chi tiêu dùng trung bình Y với thu nhập đã cho X

2.11 Các tín h chất của các ước lượng dưới giả thiết chuẩn của mô hình

1 Phân phối chuẩn của u i

+ Giả thiết 6: ui có phân phối chuẩn N(0,σ 2), tức là có kỳ vọng bằng 0 và phương sai 2

x

eπσ2

1f(x)

σ là phương sai,σxlà độ lệch chuẩn

M là kỳ vọng (tức giá trị trung bình)

Trang 35

(nguyên nhân sử dụng phân phối chuẩn là từ định lý giới hạn trung tâm)

Với giả thiết trên thì khi đó chính Yicũng có phân phối chuẩn có:

E(Yi) = β1 +β2 Xivar(Yi) = σ2

2 i

2 2

2 n

1 i

2 i

n

1 i

2 i 2

x

σ σ

σ x n

X σ

2

1

β β

− σ ∼ χ2(n−2)

2.12 Khoảng tin cậy và kiểm định các hệ số hồi qui

35

Trang 36

1 Khoảng tin cậy choβ 1 , β 2 và σ 2

Các ước lượng β∧1,

∧ 2

σ chưa biết Đây là những ước ước điểm Độ tin cậy của những ước lượng này như

thế nào? Do mẫu thay đổi nên các ước lượng này khác với giá trị thực của tham số mà chúng ước lượng mặc dù giá trị trung bình của chúng được kỳ vọng là bằng với giá trị thực (E(β∧i) = βi và E(

Chẳng hạn, khi xây dựng khoảng tin cậy của ước lượngβ∧2 cho β2 với độ tin cậy hay xác xuất (1- α) với 0 < α < 1 thì ta cần xác định số dương δ sao cho xác suất để cho khoảng ngẫu nhiên (β∧2 - δ, β∧2 + δ) chứa giá trị thật β2 đúng bằng 1-α:

P[β∧2 - δ ≤ β2 ≤ β∧2 + δ] = 1 - α Trong đó: [

∧ 2

β - δ, β∧2 +δ] gọi là khoảng tin cậy;

1 - α gọi là độ tin cậy;

βt

(nte

S

β2)

(nP[-t

2 α i

i i 2

Khoảng tin cậy (1-α)100% của các βicó dạng:

Trang 37

Các phân vị t (n−2)

2

α được tra theo Bảng 2 ở phần phụ lục

Ví dụ, với cỡ mẫu n = 10 β∧2= 0,5091 ;se(

∧ 2

β ) = 0,0357; giả sử α = 5%, tra bảng phân phối được t0,025(8) = 2,036 thì khi đó khoảng tin cậy 95% của là khoảng:

(0,5091 – 2,036.0,0357); 0,5091+ 2,036.0,0357) hay

Hình 2.10 Các phân vị -t 0,025 (8) và t 0,025 (8)

Với khoảng tin cậy của phương sai σ2

ta có đại lượng thống kê

Trang 38

2 Kiểm định giả thuyết đối với β 1 , β 2 và σ 2

Vấn đề kiểm định giả thuyết thống kê đơn giản là xem xét một giá trị quan sát có “đủ” gần với một giá trị giả thuyết để chúng ta không bác bỏ giả thuyết đã đưa

ra Giả thuyết đưa ra gọi là giả thuyết không hay H0 nếu bác bỏ giả thuyết này thì ta chấp giả thuyết ngược lại gọi là H1 (còn gọi là đối thuyết) Nói cách khác, một kiểm định là một thủ tục trong đó các kết quả của mẫu được sử dụng để thẩm tra lại sự đúng đắn hoặc sai lầm của của giả thuyết H0

Kiểm định giả thuyết đối với β 1 , β 2 : Kiểm định t

Giả sử đưa ra giả thuyết β2 = β*

2, nếu giả thuyết này đúng thì

−)se(

β2

* 2 2β

Từ ví dụ đã tính ở trên, ta có β∧2 = 0,5091, se(β∧2) = 0,0357, n -2 = 8 Nếu mức

ý nghĩa α = 5%, thì tα/2(8) = 2,036 Chẳng hạn đưa ra H0: β2 = β*

2= 0,3 và H1:

∧ 2

β ≠ 0,3, thì (2.33) sẽ là

P(0,2177 ≤β∧2 ≤ 0,3823) = 0,95 (2.34)

như minh họa trong hình 2.11 Do giá trị quan sátβ∧2nằm trong miền bác bỏ nên ta bác

bỏ giả thuyết H0 cho rằng giá trị đúng của β2 = 0,3

Trang 39

Trong thực tế ta không ần tính (2.33) tường minh mà chỉ cần tính

t =

0357,0

3,05091,

giá trị t này rõ ràng nằm trong miền bác bỏ như trong hình 2.12

Hình 2.11 Khoảng tin cậy 95% cho β∧2 dưới giả thuyết H 0 cho là β 2 = 0,3

Hình 2.12 Khoảng tin cậy 95% cho t 0,025 (8)

Chúng ta có thể tóm tắt kiểm định choβi như trong bảng 2.1

Bảng 2.9: Kiểm định giả thiết với β i (i = 1, 2)

Loại giả thiết Giả thiết Ho Giả thiết H1 Miền bác bỏ

Trang 40

Kiểm định giả thuyết đối với phương sai σ 2: kiểm định χ2

Giả thiết đưa ra giá trị thực σ2 = σ02

Nếu phương trình này đúng thì 2

2 2

σ

2)(nχ

2)(nχσ

2)-(n

2

α 1 2 α 2

0 2

2 α 2

2

α 1 2

Ví dụ: sử dụng lại ví dụ đã tính ở trên ta có σ∧2= 42,1591 và n-2 = 8 Nếu đưa ra giả thuyết H0: σ2 = 85 đối thuyết H1: σ2 ≠ 85 Thì biểu thức (2.35) giá trị thống

kê χ2 để kiểm định H0 Thế các giá trị thích hợp vào (2.35, ta thấy dưới giả thuyết

H0 , giá trị tính toán χ2 = 3,97 Nếu lấy mức ý nghĩa α bằng 5%, thì các giá trị χ2

tra từ bảng χ2

0,0755 (8) và χ2

0,025 tương ứng là 2,1797 và 17,5396 Do giá trị tính toán nằm giữa hai giá trị giới hạn này nên chúng ta không bác bỏ giả thuyết H0

Lựa chọn mức ý nghĩa chính xác: Giá trị p

Ta đa thấy việc bác bỏ hay không giả thuyết H0 phụ thuộc vào việc lựa

chọn mức ý nghĩa α Mỗi mức ý nghĩa này chính là xác suất phạm phải sai lầm loại I – sai lầm do bác bỏ một giả thuyết đúng Để lựa chọn một mức ý nghĩa chính xác người ta đưa ra khái niệm giá trị p, nó được định nghĩa là mức ý nghĩa thấp nhất tại đó một giả thuyết H 0 có thể bị bác bỏ

Ngày đăng: 07/01/2021, 09:50

🧩 Sản phẩm bạn có thể quan tâm

w