LỜ I N Ó I ĐẦU Kinh tế lượng được đưa vào giảng dạy cho sình viên tất cả các chuyên ngành Kinh tế và Quản trị kinh doanh của trườniị Đại học Kinh tế quốc dân từ K37. Sau một số năm giảnq dạy, trên cở sở giáo trình Kinh tế lượng của các giá: GS.TSKH. Vũ Thiếu, PGS.TS. Nguyễn Quang Dong và PGS.TS. Nguyễn Khắc Minh Nhà xuất bán Khoa học và Kỹ thuật 2001 chúng tôi biên soạn tài liệu này phục vụ sinh viên và bạn đọc. Tài liệu nảy trình bày những nội dung cơ bản theo chương trình mồn học Kinh tế lượng1 60 tiết (45 tiết lý thuyết và 15 tiết thực hành trên máy) cho sinh viên các ngành Kinh tế và Quản trị kỉnh doanh. Nhằm giúp sinh viên hiểu các vấn đề lý thuyết, chuẩn bị cho những tiết thực hành trên máy có hiệu quả cũnạ như hoàn thành các bài tập theo cuốn Bài tập và hướng dẫn phầnmềm thực hành Kinh tế lượng, sau mỗi chương đều có các thí dụ, bài tập khá tổng hợp, tính toán chi tiết, có giải thích các thuật ngữ. Hy vọng tài liệu này góp phấn tạo điều kiện thuận lợi cho sinh viên trong học tập, góp phần nâng cao chất lượng đào tạo. Mặc dù đã có nhiều cố gắng dể trình bày, nhưng không tránh khỏi các thiếu sót, rất mong nhận được ý kiến đóng góp cua hạn đọc.
Trang 1TRƯỜNG ĐẠI HỌC KINH TÊ QUỐC DÂN
K H O A TOÁN KINH T Ề
B ộ MÓN Đ IẾU KH IỂN H Ọ C KIN H T Ê
N G U YỄN Q U A N G DONG
BÀI GIẢNG
Trang 3L Ờ I N Ó I Đ ẦU
Kinh tế lượng được đưa vào giảng dạy cho sình viên tất cả các chuyên ngành Kinh t ế và Quản trị kinh doanh của trườniị Đại học Kinh t ế quốc dân từ K37 Sau một s ố năm giảnq dạy, trên cở
sở giáo trình " Kinh t ế lượng" của các giá: GS.TSKH Vũ Thiếu, PGS.TS Nguyễn Quang Dong và PGS.TS Nguyễn Khắc Minh - Nhà xuất bán Khoa học và Kỹ thuật 2001 - chúng tôi biên soạn tài liệu này phục vụ sinh viên và bạn đọc.
Tài liệu nảy trình bày những nội dung cơ bản theo chương trình mồn học " Kinh t ế lượng'1 60 tiết (45 tiết lý thuyết và 15 tiết thực hành trên máy) cho sinh viên các ngành Kinh t ế và Quản trị kỉnh doanh Nhằm giúp sinh viên hiểu các vấn đ ề lý thuyết, chuẩn
bị cho những tiết thực hành trên máy có hiệu quả cũnạ như hoàn thành các bài tập theo cuốn " Bài tập và hướng dẫn phần-mềm thực hành Kinh t ế lượng", sau mỗi chương đều có các thí dụ, bài tập khá tổng hợp, tính toán chi tiết, có giải thích các thuật ngữ.
Hy vọng tài liệu này góp phấn tạo điều kiện thuận lợi cho sinh viên trong học tập, góp phần nâng cao chất lượng đào tạo.
Mặc dù đã có nhiều c ố gắng d ể trình bày, nhưng không tránh khỏi các thiếu sót, rất mong nhận được ý kiến đóng góp cua hạn đọc.
Hà nội, ngày 15 tháng 10 năm 2008
Tác giả
Trang 4MỞ ĐẨU
I KINH TẾ LƯỢNG LÀ GÌ?
Cho đến nay chưa có một câu trả lời được mọi người cùng chấp nhận cho câu lỏi này.Thuật ngữ tiếng Anh "Econometrics" được ghép từ hai gốc từ "Econo" có nghĩa là "Kinh tế" và Metrics có nghĩa là "Đo lường" Thuật ngữ này do giáo sư kinh tế học người Na-Uy là A.K.Ragnar Frisch- giải thưởng Nobel vể kinh tế học (1969) cùng với J.Tinbergen, sử dụng lần đầư tiên vào khoảng năm 1930
Kinh tế lượng có nghĩa là đo lường kinh tế Mặc dù đo lường kinh tế là một nội dung quan trọng của kinh tế lượng nhưng phạm vi của kinh tế lượng rộng hơn nhiều.Điều đó được thể hiện thông qua một số định nghĩa sau đây:
- Kinh tế lượng bao gồm việc áp dụng thống kê toán cho các số liệu kinh tế để củng cố vé mặt thực nghiệm cho các mô hình do các nhà kinh tế toán đề xuất và
để tìm ra lời giải bằng số.(1)
- Kinh tế lượng có thể được định nghĩa như là sự Ịihân tích vể tượng các vấn đẻ kinh tế hiộn thời dựa trên viộc vận dụng đồng thời lý thuyết và thực tế được thực hiên bằng các phương pháp suy đoán thích hợp.(2)
- Kinh tế lượng có thể được xem như là một khoa học xã hội trong đó các công
cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích cẩc vấn đổ kinh tế.(3)
- Kinh tế lượng quan tâm đến việc xác định về thực nghiệm các luật kinh tế.(4)Thuật ngữ ,,Econometrics,M' được dịch sang tiếng Việt là "Kinh tế lượng học" hoặc "Đo lường kinh tế", ngắn gọn hơn là "Kinh trắc" 0 5 những định nghĩa, quan niệm khác nhau về kinh tế lượng bắt nguồn từ thực tế: các nhà kinh tế lượng trước hết và phần lớn họ là các nhà kinh tế có khả năng sử dụng lý thuyết kinh tế để cải tiến việc phân tích thực nghiộm về các vấn đề mà họ đặt ra Họ đồng thời là các nhà kinh tế toán- mô hình hoá lý thuyết kinh tế theo cách làm cho lý thuyết kinh
tế phù hợp với việc kiểm định giả thiết thống kê Họ cũng là những nhà kế toán - tìm kiếm, thu thập các số liệu kinh tế, gắn các biến kinh tế Ịý thuyết với các biến quan sát được Họ cũng là các nhà thống kê thực hành- sử dụng kỹ thuật tính toán
để ước lượng các quan hộ kinh tế hoặc dự báo các hiện tượng kinh tế
Commỉttee fo r Econometrỉca", Econome trica,\oỉ 22, no 2, Aprỉỉ 1954,iọp 141'146.
(4) H.Theil, Principles o f Econometrỉcs, John Wỉley & Sons, Inc.
5
Trang 5Trẽn các lĩnh vực khác nhau, người ta có các quan niệm khác nhau về kinh tế lượng Tuy vậy, theo các quan điểm trên thì kinh tế lượng là sự kết hợp các lý thuyết kinh tế, kinh tế toán, thống kê kinh tế, thống kê toán, nhưng nó vẫn là một môn độc lập vì những lý do sau đây:
- Các lý thuyết kinh tế thường nêu ra các giả thuyết hay các giả thiết Phần lớn các giả thuyết này nói vể chất
Ví dụ: kinh tế học vi mô khẳng định rằng trong các điều kiện khác không thay
đổi nếu giảm giá về một loại hàng hoá nào đó thì sẽ làm tăng lượng cầu vể loại
hàng hoá này và ngược lại Dù rằng lý thuyết kinh tố có khẳng định quan hệ nghịch biến giữa giá cả và lượng cầu nhưng lý thuyết này không đưa ra một số đo bằng số về quan hệ giữa chúng, không nói cho ta biết lượng cầu sẽ tăng hoặc giảm bao nhiêu nếu ta giảm hoặc tăng một đơn vị giá cả Các nhà kinh tế lượng sẽ cho chúng ta ước lượng bằng số về các con số này
- Nội dung chính của kinh tế toán là trình bày lý thuyết kinh tế dưới dạng toán học (các phương trình và bất phương trình), nếu thiếu các mô hình toán học thì không thể đo hoặc kiểm tra bằng thực nghiệm lý thuyết kinh tế Kinh tế lượng chủ yếu quan tâm đến kiểm định về mặt thực nghiệm các lý thuyết kinh tế Kinh tế lượng thường sử dụng các phương trình toán học do các nhà kinh tế toán đề xuất và đặt các phương trình dưới dạng phù hợp để kiểm định bằng thực nghiêm
- Thống kê kinh tế chù yếu liên quan đến việc thu thập, xử lý và trình bày các
số liệu Những số liệu này là những số liệu thồ đối với Kinh tế lượng Thống kê kinh tế không đi xa hơn, không liên quan đến việc sử dụng số liệu để kiểm tra các giả thuyết kinh tế
- Các số liệu kinh tế là các gố liệu không phải do các cuộc thí nghiệm đem lại, chụng nằm ngoài sự kiểm soát của tất cả mọi người Các số liệu về tiêu dùng, tiết kiệm, giá cả, do các cơ quan Nhà nước hoặc tư nhân thu thập đều là các số liệu phi thực nghiêm Các số liộu này chứa sai số của phép đo Kinh tế lượng phải sử dụng các công cụ, phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê
II PHƯƠNG PHÁP LUẬN CỦA KINH TÊ LƯỢNG
Phân tích kinh tế lượng được thực hiên theo các bước sau đây:
1 Nêu ra các giả thuyết hay giả thiết vé các mối quan hệ giữa các biến kinh
tế Chẳng hạn kinh tế vĩ mô khẳng định rằng mức tiêu dùng của các hộ gia đình phụ thuộc theo quan hệ cùng chiểu với thu nhập khả dụng của họ
2 Thiết lập các mô hình toán học để mô tả mối quan hệ giữa các biến số này Chẳng hạn:
Y = p, + p 2 X + utrong đó, Y :Chi tiêu cho tiêu dùng của một hộ gia đình,
X :Thu nhập khả dụng của hộ gia đình,PịiHộ số chặn, p 2: Hệ số góc, u: Yếu tố ngẫu nhiên
Trang 6Sự tổn tại của yếu tố ngẫu nhiên bắt nguồn từ mối quan hệ giữa các biến kinh
tế nói chung là không chính xác
3 Thu thập số liệu: Để ước lượng các tham số của mô hình, cần phải thu thập
số liệu Kinh tế lượng đòi hỏi kích thước mẫu khá lớn
4 Ước lượng các tham số của mô hình nhằm nhận được số đo về mức ảnh hưởng của các biến với các số liộtì hiên có Các ước lượng này là các kiểm định thực nghiệm cho lý thuyết kinh tế
5 Phân tích kết quả: Dựa trôn lý thuyết kinh tế để phân tích và đánh giá kết quả nhận được Xét xem các kết quả nhận được có phù hợp với lý thuyết kinh tế không, kiểm đinh các giả thiết thống kê về các ước lượng nhận được Trong mô hình:
Y= [3, + p2X + u,
nếu ước lượng của p2 là số dương
và nhỏ hơn 1 thì ước lượng này là
hợp lý về mặt kinh tế Trong trường
hợp ngược lại ( < 0 hoặc > 1) thì
không phù hợp về mặt kinh tế Khi
đó cần phải tìm ra một mô hình
đúng
Ngoài phân tích vể mặt kinh tế
còn phải phân tích vể kỹ thuật —
các yêu cầu về mặt toán học
6 Dự báo ; Nếu như mô hình phù
hợp với lý thuyết kinh tế thì có thể sử
dụng mô hình để dự báo Dự báo giá
trị trung bình hoặc dự báo giá trị cá
biệt
7 Ra quyết định: Để bảo bảo tính
hiên thực của dự báo cần có các
chính sách, các giải pháp tương ứng
Các bước trên đây có nhiệm vụ khác nhau trong quá trình phân tích một vấn đề kinh
tế và chúng được thực hiộn theo một trình tự nhất định Tìm ra bản chất một vấn đề kinh tế là một việc không đơn giản Vì vậy, quá trình trên đây phải được thực hiện nhiều lần như là các phép lặp cho đến khi chúng ta thu được một mô hình đúng Có thể minh họa quá trình phân tích kinh tế lượng một vấn đề kinh tế bằng sơ đồ trên
7
Trang 7Những điéu nói trên đây cho thấy rõ nội dung nghiên cứu, đối tượng và rnục đích, cũng như công cụ và cách tiếp cận trong nghiên cứu của bộ môn khoa học này Chính vì vậy, từ khi ra đời đến nay kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo lường sắc bén để đo các quan hệ kinh tế Ngày nay, phạm vi sử dụng của kinh tế lượng đã vượt quá phạm vi kinh tế, đã lan sang các lĩnh vực khác như xã hội học, vũ trụ học Trong 30 năm gần đây, kinh tế lượng là một bộ phận không thể thiếu được trong chương trình đào tạo các cán bộ kinh tế của hẩu hết các nước trên thế giới Số các đầu sách viết vé kinh tế lượng, bao gồm các sách giáo khoa ờ bậc đại học và sau đại học, các sách chuyên khảo, cũng như các tài liêu thực hành, các chuyên san.-về lý thuyết và ứng dụng kinh tế lượng, đã trở nên hết sức phong phú Sự đòi hỏi phải phân tích định lượng các hiên tượng kinh tế, kiểm định sự phù hợp và độ tin cậy của các giả thuyết trong quá trình hoạch định chính sách vĩ mô cũng như ra các quyết định tác nghiệp, việc dư báo và dự đoán có độ tin cậy cao , tất cả đã làm cho kinh tế lượng học có một vai trò ngày càng quan trọng và bản thân nó cũng không ngừng được phát triển
và hoàn thiộn Sự phát triển của máy tính điộn tử đã làm ra tăng sức mạnh của kinh tế lượng Điều đó, giúp các nhà kinh tế kiểm chứng được các lý thuyết kinh
tế có thích hợp hay không, dản tới những quyết định đúng đắn trong hoạt động kinh doanh tác nghiệp và hoạch định các chính sách và chiến lược kinh tế xã hội Cùng với việc giảng dạy kinh tế vi mô và kinh tế vĩ mô, thì kinh tế lượng là một môn không thể thiếu được Nếu như kinh tế vĩ mô mô tả sự vận động của toàn bổ nền kinh tế, kinh tế vi mô mô tả hành vi của người sản xuất và người tiêu đùng, thì kinh tế lượng trang bị cho nhà kinh tế một phương pháp lượng hoá và phân tích
sự vận động và các hành vi trên Ba môn này sẽ trang bị những kiến thức cơ sở để học sinh và các nhà kinh tế đi vào các chuyên ngành hẹp
Trang 8Thuật ngữ "Hồi quy" đã được Francis Galton sử dụng vào năm 1886 Trong một bài báo nổi tiếng của mình, ông đã cho rằng có một xu hướng về chiều cao của những đứa trẻ do cha mẹ cao không bình thường hoặc thấp không bình thường sinh
ra Người ta gọi xu hướng này là luật Galton Trong bài báo của mình Galton dùng cụm từ "regression to mediocrity" - quy về trung bình Từ đó vấn đề hồi quy được nhiều người quan tâm và hoàn thiện, các ứng dụng của phân tích hồi quy đã có nội dung rộng hơn nhiều
1.1 PHÂN TÍCH HỒI QUY
Phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc hay biến được giải thích) với một hay nhiều biến khác (được gọi là (các) biến độc lập hay giải thích) nhằm ước lượng và/ hoặc dự báo giá trị trung bình của biến phụ thuộc với các giá trị đã biết của (các) biến độc lập
Ta xem xét các thí dụ sau đây:
T hí dụ 1.1
a Luật Galton Karl Pearson nghiên cứu sự phụ thuộc chiều cao của các cháu trai vào chiều cao của bố những đứa trẻ này Ông đã xây dựng được đò thị chỉ ra phân bô' chiêu cao của các cháu ừai ứng với chiều cao của người cha Qua mô hình này có thể thấy:
Thứ nhất, với chiều cao đã biết của người cha thì chiều cao của các cháu trai sẽ
là một khoảng, dao động quanh giá trị trung bình;
Thứ hai, chiều cao của cha tăng thì chiều cao của các cháu trai cũng tăng Mô hình này giải thích được điều mà Galton đặt ra và còn được dùng trong dự báo
9
Trang 9Hình 1.1.
Tiếp tục nghiên cứu vấn đề trên, Karl Pearson đã phát hiện ra rằng: chiều cao trung bình của các cháu trai của nhóm bố cao nhỏ hơn chiều cao của bô' và chiều cao trung bình của các cháu trai của nhóm bô' thấp lớn hon chiều cao của bố Điều
này được thể hiện: hệ số góc của đường thẳng trên hình 1.1 nhỏ hơn 1
Trong thí dụ này, chỉềụ cao của các cháu trai là biến phụ thuộc, chiều cao của người bô' là biến độc lập
b Một người nghiên cứu sự phụ thuộc của lượng cầu về một loạt hàng hóa vào giá bản thân hàng hóa, thu nhập của người tiêu dùng và giá của những hàng hóa khác cạnh tranh với hàng hóa này
Trong trường hợp này, lượng cầu là biến phụ thuộc, giá của bản thân hàng hóa, của các hàng hóa cạnh tranh, và thu nhập cùa người tiêu dùng là các biến độc lạp
c Một nhà kinh tế lao động nghiên cứu tỳ lệ thay đổi của tiền lương trong
quan hệ với tỷ lệ thất nghiệp đã đưa ra đồ thị ở hình 1.2 Đường cong trên hình 1.2
được gọi là đường cong Phillips, trong đó: tỷ lệ thay đổi của tiền lương là biến phụ thuộc, tỷ lê thất nghiệp - biến độc lập Mô hình cho phép dự đoán được sự thay đổi trung bình của tỳ lệ tiền lương với một tỷ lệ thất nghiệp nhất định
d Trong điều kiện các yếu tố khác không thay đổi, tỷ lệ lạm phát càng cao thì
tỷ lệ thu nhập cùa nhân dân được giữ dưới dạng tiền mặt càng ít
Có thể minh họa điều đó bằng đồ thị ở hình 1.3
Trang 10Hình 1.2 Hình 1.3
Ta có thể đưa ra được rất nhiêu ví dụ về sự phụ thuộc của một biến vào một hoặc nhiều biến khác Kỹ thuật phân tích hồi quy giúp ta nghiên cứu mối quan hệ như vậy giữa các biến
Các ký hiệu: Y- biến phụ thuộc [hay biến được giải thích]
Xi - biến độc lập [hay biến giải thích] thứ iTrong đó, biến phụ thuộc Y là đại lượng ngẫu nhiên, có quy luật phân bô' xác suất, các biến độc lập Xj không phải là biến ngẫu nhiôn, giá trị của chúng đã được cho trước
Phân tích hồi quy giải quyết các vấn đề sau đây:
1 Uờc lượng giá trị trung bình của biến phụ thuộc với giá trị đã cho của biến độc lập
2 Kiổm đinh giả thiết vê bản chất của sự phụ thuộc
3 Dự đoán giá trị ưung bình của biến phụ thuộc khi biết giá trị của các biến độc lập
4 Kết hợp các vấn đề trên
Trong phân tích hồi quy chúng ta phân biột các quan hộ sau đây:
1 Quan hệ thống kê và quan hệ hàm số
Vấn dề mấu chốt trong phân tích hồi quy là sự phụ thuộc thống kê của biếnphụ thuộc vào một hay nhiều biến giải thích Biến phụ thuộc là đại lượng ngẫunhiên, có phân bố xác suất Các biến giải thích thì giá trị của chúng đã biết Biến phụ thuộc là ngẫu nhiên vì có vô vàn nhân tô' tác động đến nó mà trong mô hình ta
11
Trang 11không dề cập đến được, ứng với mỗi giá trị đã biết của biến độc lập có thể có iửiiêu giá trị khác nhau của biến phụ thuộc Trong quan hệ hàm số các biến không phải là ngẫu nhiên, ứng với mỗi giá trị cùa biến độc lập có một giá trị của biến phụ thuộc, phân tích hồi quy không xét đến các quan hệ hàm số.
T hí dụ 1.2
Sự phụ thuộc của nãng suất một loại lúa trên một hecta vào nhiệt độ, lượng mưa, độ chiếu sáng, phân bón là quan* hộ thống kê Các biến: nhiêt độ, lượng mưa, độ chiếu sáng, phân bón là các biến độc lập Năng suất tính trên 1 hecta là biến phụ thuộc, là đại lượng ngẫu nhiên khổng thể dự báo một cách chính xác năng suất của giống lúa này trên một hecta vì:
- Có sai sô' trong phép đo các biến này,
- Còn rất nhiều nhân tô' khác cũng ảnh hưởng đến năng suất mà ta không th” liệt kê ra và nếu có cũng không thể tách được ảnh hường của riông từng nhân tố đến năng suất dù rằng chúng ta có đưa thêm bao nhiêu biến giải thích khác
Trong vật lý khi xét một động tử chuyển động đều, người ta có công thức:
s= v.t
trong đó, s là độ dài quầng đường đi được;
V là vận tốc trong một đơn vị thời gian;
t là thời gian
Đây là quan hệ hàm số, ứng với mỗi giá trị của vận tốc và thời gian ta chỉ có một giá trị duy nhất của độ dài quãng đường, phân tích hồi quy không xét các quan
hộ này
2 Hàm hồi quy và quan hệ nhán quả
Phân tích hồi quy nghiên cứu quan hệ giữa một biến phụ thuộc với một hoặc nhiều biến độc lập khác Điều này không đòi hỏi giữa biến độc lập và cá biến phụ thuộc có mối quan hệ nhân quả Nếu như quan hệ nhân quả tồn tại thì nó phải được xác lập dựa trên các lý thuyết kinh tế khác Thí dụ, luật cầu nói rằng trong điồu kiên các biến (điều kiện) khác không thay đỏi thì nhu cầu về một loạt hàng hóa tỷ lệ nghịch với giá của chính hàng hóa này hay trong thí dụ 1.2 chúng ta có thể dự đoán sản lượng dựa vào lượng mưa và các biến khác, nhưng không thổ chấp nhận được việc dự báo lượng mưa bằng việc thay đổi sản lượng
3 Hồi quy và tương quan
, Hồi quy và tương quan khác nhau vồ: mục đích' và kỹ thuật Phân tích tương quan trước hết là đo mức độ kết hợp tuyến tính giữa hai biến Ví dụ: Mức độ quan
hộ giữa nghiện thuốc lá và ung thư phổi, giữa kết quả thi môn thống kê và môn toán Nhưng phân tích hồi quy lại ước lượng hoặc dự báo một biến trôn cơ sờ giá trị
đã cho cùa các biến khác Về kỹ thuật trong phân tích hồi quy các biến không có tính chất đối xứng Biến phụ thuộc là đại lượng ngẫu nhiên Các biến giải thích giá
Trang 12trị của chúng đã được xác định Trong phân tích tương quan, không có sự phân biệt giữa các biến, chúng có tính chất đối xứng:
r (X,Y) = r (Y,X)
1.2 BẢN CHẤT VÀ NGUỒN s ố LIỆU CHO PHÂN TÍCH H ồ i QUY
lìiành công của bất kỳ một sự phân tích kinh tế nào đều phụ thuộc việc vào sử dụng các số liêu thích hợp và phụ thuộc vào phương pháp xừ lý các số liệu đó Do vậy ở đây sẽ trình bày đôi nét về bản chất, nguồn gốc và những hạn ch ế của số liộu
mà chúng ta sẽ gặp phải ưong phân tích kinh tế nói chung và phân tích hồi quy nói riêng
1 Các loại số liệu
Có ba loại số liệu: Các số liệu theo thời gian (chuỗi thời gian), các số liệu chéo
và các sổ liộu hỗn hợp của hai loại ưên
Các số liêu theo thời gian là các số liêu được thu thập trong một thời kỳ nhất định, ví dụ như các số liệu về GNP, số người thất nghiệp, lượng cung về tiền Có
số liệu được thu thập hàng tuần như lượng cung về tiền, có sô' liệu thu thập hàng tháng, quý, năm Các số liệu này có thể đo được bằng những con số như giá cả, thu thập, nhưng cũng có những số liệu không đo được bằng con số, chúng là những chỉ tiêu chất lượng như: nam hoặc nữ, có gia đình hay chưa có gia đình, có việc làm hay chưa có viộc làm, màu xanh hay màu trắng Người ta gọi các biến loại này là biến giả (dummy) Chúng cũng quan trọng như những biến số lượng khác
Các số liệu chéo là các số liệu vồ một hoặc nhiều biến được thu thập tại một thời điểm ở nhiều địa phương, đơn vị khác nhau: ví dụ như các số liệu về điều tra dân số vào 0 giờ ngày 1/1/1992; các số liệu điều ữ a về vốn cơ bản của các xí
Các số liệu hỗn hợp theo thời gian và không gian: các số liệu về giá vàng hàng ngày ở thành phố Hà Nội, Hò Chí Minh, Hải Phòng, Nam Định
Các số liệu có thổ do các cơ quan nhà nước, các tổ chức quốc tế, các công ty tư nhân hay các cá nhân thu thập Chúng có thể là các số liệu thực nghiệm hoặc không phải thực nghiệm Các số liệu thực nghiệm thường được thu thập trong khoa học tự nhiên, một điều ưa viên muốn thu thập các số liệu ảnh hưởng của một số nhân tố đến đối tượng nghiên cứu, anh ta đã giữ nguyên các yếu tố khác Thí dụ, một kỹ sư nông nghiệp nghiên cứu khả năng chịu bệnh của một giống lúa mới Anh ta tiến hành thí nghiệm bằng cách trồng hai giống lúa mới và cũ trên hai khu ruộng có độ màu mỡ như nhau, thực hiện chế độ chăm sóc hai khu ruộng như nhau và theo dõi
sự phát triển của sâu bệnh trên hai khu ruộng này bằng cách gây cùng một loại bệnh trên hai khu ruộng Các số liệu thu được sẽ là các số liệu thực nghiêm
13
Trang 13Trong khoa học xã hội các số liệu nói chung là các số liệu không phải do thực nghiêm mà có Các số liệu về GNP, số người thất nghiệp, giá cổ phiếu khỏng nằm dưới sự kiểm soát của kỹ thuật viên Điều này thường gây ra những vấn đề đặc biệt trong viộc tìm ra những nguyên nhân chính xác ảnh hường đến một tình huống riêng biệt Thí dụ: có phải lượng cung về tiền ảnh hưởng đến GDP hay còn có nguyên nhân khác ?
Chất lượng của các số liệu thu được thường không tót Điều đó do các nguyên nhân sau đây:
- Hầu hết các số liộu trong khoa học xã hội đều là các số liệu phi thực nghiệm
Do vậy, có thể có sai số quan sát hoặc bỏ sót quan sát hoặc cả hai
- Ngay với các số liêu được thu thập bằng thực nghiệm cũng có sai số của phép đo
- Trong các cuộc điều tra bằng câu hỏi, vấn đề không nhận được câu trả lời hoặc có ưả lời nhưng không trả lời hết các câu hỏi
- Các mẫu được thu thập ưong các cuộc điều tra rất khác nhau về kích cỡ cho nên rất khó khăn trong việc so sánh các kết quả giữa các đợt điều tra
- Các sô' liệu kinh tế thường có sẵn ở mức tổng hợp cao, không cho phép đi sâu vào các đcm vị nhỏ
- Ngoài ra còn có những số liệu thuộc bí mật quốc gia mà không phải ai cũng
có thể sử dụng được
Do vậy kết quả nghiên cứu sẽ phụ thuộc vào chất lượng của các số liệu được
sử dụng và phụ thuộc vào mô hình được lựa chọn (vấn dề này sẽ được trình bày ở các chưcmg sau)
1.3 MÔ HÌNH HỒI QUY T ổN G THỂ
Phần ưẽn chúng ta nói phân tích hồi quy đặc biệt quan tâm đến ước lượng hoặc ;dự báo giá trị trung bình của biến phụ thuộc trên cơ sở biết các giá trị của biến độc lập Ta xét các thí dụ giả định sau đây:
T h í dụ 1.3
Y : Chi tiêu của một gia đình trong một tuần tính bằng $
X : Thu nhập sau khi đã trừ thuế của một gia đình tính bằng $
Giả sử ràng ở một địa phương chỉ có cả thảy 60 gia đình, 60 gia đình này được chia thành 10 nhóm, chênh lệch về thu nhập của các nhóm gia đình từ nhóm này sang nhóm tiếp theo đều bằng nhau Ta có bảng số liệu sau đây:
Trang 14B ảng 1.1 T hu nhập và chi tiêu trong một tuần của tổng thê
X, đó chính là phân bô' có điều kiộn của Y với giá trị X đã cho
Vì bảng 1.1 là tổng thể nên ta dễ dàng tìm P(Y/X) Chẳng hạn, P(Y=85/X=100)-l/6 Chúng ta có bảng xác suất có điều kiện sau đây:
Trong đó: E(Y/X i) = X Y , P(Y= Yj /X=Xj)
7 J
Chẳng han: E(Y/100) = X Y ị P(Y= Y ^ I O O )
7 J
= 65* 1/6+70* 1/6+74* 1/6+80* 1/6+85* 1/6+88* 1/6 = 77Biểu diẽn các điểm của bảng 1.1 và các trung bình E(Y/Xị): i= l,2, 10 lên hộ tọa độ, nối các điểm có tọa độ (Xj.E(Y/X j), ta được đồ thị sau đây:
15
Trang 15Chi tiêu
1 tuần200
có hơn một biến độc lập gọi là hàm hồi quy bội
Hàm hồi quy tổng thể cho chúng ta biết giá trị trung bình của biến Y sẽ thay đổi như thế nào theo X
Hàm f(X i) có dạng như thế nào - tuyến tính hay phi tuyến - chúng ta chưa biết được bởi lẽ trong thực tế chúng ta chưa có sẵn tổng thể để kiểm tra Xác định dạng hàm hồi quy là vấn đề thực nghiệm (chúng ta sẽ đề cập đến vấn đề này các chương sau )
Giả sử rằng PRF E(Y/Xj) là hàm tuyến tính:
trong đó Pi, p2 là các tham số chưa biết nhưng cố định, và đuợc gọi là các hộ số
Trang 16Trong phân tích hồi quy chúng ta phải ước lượng giá trị trung bình của biến Y, tức là ước lượng hàm hồi quy chẳng hạn dạng (1.2) Ở phương trình (1.2), giá trị của các Xj ta đã biết, do vậy việc ước lượng (1.2) trỏ thành việc ước lượng các tham
số chưa biết Pi và p2, trên cơ sờ những quan sát của Y và X Phần này sẽ được trình bày ờ chương II
Thuật ngữ "tuyến tính" ở đây được hiểu theo hai nghĩa: tuyến tính đối với tham số và tuyến tính đối với các biến Thí dụ E(Y/Xi) = P) + p2X j2 là hàm tuyến tính đối với tham sô' nhưng không tuyến tính (phi tuyến) đối với biến; E(Y/Xi) =
Pi + t/ P2 Xi là hàm tuyến tính đối với biến nhưng phi tuyến đối với tham số Hàm hồi quy luyến tính'luôn luôn được hiểu là hồi quy tuyến tính đối với các tham số,
nó có thể hoặc không phải là tuyến tính đối với biến
1.4 SAI SỐ NGẪU NHIÊN VÀ BẢN CHAT CỦA NÓ
Giả sử chúng ta đã có hàm hồi quy tổng thể E(Y/Xj); vì E(Y/Xi) là giá trị trụng bình của biến Y với giá tri Xi đã biết, cho nên các giá trị cá biệt Yi không phải bao giờ cũng trùng với E(Y/Xj), mà chúng xoay quanh E(Y/Xj)
Ký hiệu Ư, là chênh lệch giữa giá trị cá biệt Yi và E(Y/Xj):
ư, = Yi - E(Y/Xj)
ụ là biến ngẫu nhiên, người ta gọi Ư, là yếu tố ngẫu nhiên (hoặc nhiễu) và (1.3) được gọi PRF ngẫu nhiên
Nếu như E(Y/Xj) là tuyến tính đối với Xj thì Yj = /?, + P ĩ X i + Ư,
Từ (1.3)
E(Yi/Xi) = E(E(Y/Xi) + E(WXÌ)
-> Eíu/Xi) = 0
Như vậy, nếu đường hồi quy của tổng thể đi qua các trung bình có điều kiện cùa Y thì E(Ư/Xị) = 0, trong trường hợp này (1.2) và (1.3) là như nhau Nhưng (1.3) chỉ ra rằng ngoài các biến giải thích đã có trong mô hình còn có các yếu tố khác ảnh hường đến biến phụ thuộc Y Nhưng trung bình ảnh hưởng của các yếu tố này
17
Trang 17đến biến phụ thuộc bằng 0 và do vậy không cần phải đưa các yếu tố này vào mô hình.
Nhưng cũng có thể nêu vấn đề: Các yếu tồ' này là những yếu tô' nào và có ihể đưa vào mô hình được không? Câu trả lời là: Chúng ta có thể xây dựng được mô hình hồi quy bội, nhung dù chúng ta có đua vào bao nhiêu biến đi chãng nữa thì yếu tô' ư, vẫn tồn tại vì một sô' lý do sau đây:
- Chứng ta có thể biết một cách chính xác biến giải thích X và biến phụ thuộc
Y, nhung chúng ta không biết hoặc biết không rõ về các biến khác ảnh hưởng đến
Y Vì vậy, Ư, được sừ dụng như yếu tố đại diện cho tất cả các biến không có trong
mô hình
- Ngay cả khi biết các biến bị loại khỏi mô hình là các biến nào, khi đó chúng ta có thể xây dựng mô hình hồi quy bội, nhưng có thể không có các số liệu cho các biến này
- Ngoài các biến giải thích đã có trong mô hình còn có một số biến khác nhưng ảnh hưởng của chúng đến Y rất nhỏ Trong trường hợp này, chúng ta cũng sử dụng yếu tô' ngẫu nhiên Ui đại diện cho chúng Trong thí dụ đã trình bày ở phần trên: số con trong gia đình, giới tính, tôn giáo , cũng ảnh hưởng đến chi tiêu trong gia đình, Ư, đại diện cho chúng
- Vê mặt kỹ thuật và kinh tế, chúng ta muốn có một mô hình đơn giản nhất có thể được Nếu như chúng ta có thể giải thích được hành vi của biến Y bàng một số nhỏ nhất các biến giải thích và nếu như ta không biết tường minh những biến khác
là những biến nào có thể bị loại ra khỏi mô hình thì ta dùng yếu tô' n để thay cho tất cả các biến này
Trên đây là một vài lý do về sự.tồn tại của Ư, u, giữ vai trò đặc biột trong phân tích hồi quy, chúng phải thỏa mãn những điều kiộn nhất định thì viộc phân tích Irên
mô hình hồi quy mới có ý nghĩa Sẽ là sai lầm nghiêm trọng nếu như sử (lụng một công cụ mà không biết những điều kiện để sử dụng nó có được thỏa mãn hay không Trong phạm vi của cuốn sách này chúng tôi đặc biệt quan tâm đến những điều kiện để vận dụng mô hình Tuy nhiên, trong thực tiễn những điồu kiện này không phải bao giờ cũng được thỏa mãn và bạn đọc có thể tìm thấy cách phát hiện
và cách khắc phục nếu như có một sô' giả thiết của mô hình khỡng được thỏa mãn Những vấn đề này sẽ được trình bày dần dần trong các chương sau
1.5 HÀM HỒI QUY MẪU
ở phần phụ lục, chương II có trình bày sơ lược về tổng thể và mẫu vì sao phải nghiên cứu mẫu Vấn đề ở đây cũng tương tự như vậy Chúng ta không có tổng thể, hoặc có nhưng khồng thể nghiên cứu được toàn bộ tổng thể Đ iều này có nghĩa là chúng ta không thể xây dựng được hàm hồi quy tổng thể (PR F) Chúng ta chỉ có mẫu ngẫu nhiên được lấy từ tổng thể Qiúng ta muốn ước lượng PRF từ những thông tin thu được trên mẫu ngẫu nhiên của các giá trị Y đối với các giá trị của X đã
Trang 18biết Một điều chác chắn ràng chúng ta không thể ước iượng một cách chính xác PRF dựa trên mẫu ngẫu nhiên.
Hàm hồi quy được xây dựng trôn cơ sở một mẫu Iigảu nhiên được gọi là hàm hồi quy mẫu (SRF) hoặc hồi quy mẫu
Bảng 1.3 và 1.4 cho 2 mẫu ngẫu nhiên từ tổng thể trong ihí dụ 1.2
Trang 19trong đó: Ỳj là ước lượng cùa E(Y/Xi)
và P2 là ước lượng của Pi và p2
Mặt khác theo (1.3): Yi = E(Y/Xi) + Ui
Do đó: Yi= j3| + p2 Xj + ei
trong đó, e, được gọi là phần dư hay chính là ước lượng của Ư, Sự tồn tại của e;
được giải thích như sự tồn tại của ự
Trên mẫu, với X = Xị ta có Y = Yj
Yi = E(Y/Xj) + ụ
Hình 1.6 Đường hòi quy tổng th ể và đường hòi quy mẫu.
Vấn dề đặt ra là ta có thể đưa ra một phương pháp và một sô' điều kiện mà nhờ nó SRF là ước lượng tuyến tính, không chêch có phương sai nhỏ nhất cùa PRF hay nói khác đi P| và P2 gần nhất với giá trị thực Pi và ị32 có thổ được dù rằng chúng ta không bao giờ biết giấ trị thực của pi và P2 Vấn đề này được trình bày ở chương II
Trang 202.1 PHUƠNG PHÁP BÌNH PHUƠNG NHỎ NHẤT
Phương pháp bình phương nhỏ nhất do nhà toán học Đức Carl Friedrich Gauss đưa ra sử dụng phương pháp này kèm theo một vài giả thiết, các ước lượng thu được có tính chất đặc biệt, nhờ đó mà phương pháp này là phương pháp mạnh nhất
và được nhiều người thích sử dụng
1 Nội dung phương pháp bình phương nhỏ nhất
ej = Yj - Ỷj =
càng nhỏ càng tốt
21
Trang 21Ta xem đồ thị sau đây:
Do X j, Y i: i - l ,n đã biết, nên X e i là hàm của p , , P2:
Trang 22' Hộ phương trình (2.1) gọi là hệ phương trình chuẩn Giải hệ phương trình trên
p , , P2 là các ước lượng của pi và p2 được tính bằng phương pháp bình phươngnhỏ nhất - được gọi là các ước lượng bình phương nhỏ nhất
2 Các tính chất của các ước lượng bình phương nhỏ nhất
1 P |, (3 2 được xác định một cách duy nhất ứng với n cặp quan sát (Xj,Yi)
2 (3,, P2 là các uớc lượng điểm của Pi, p2 và là các đại lượng ngẫu nhiên,với các mẫu khác nhau chúng có giá trị khác nhau
Ỷ '■ = (3, + Í32Xj - SRF có các tính chất sau đây:
1 SRF đi qua trung bình mẫu ( X , Y ), nghĩa là :
Ỹ = p, + p2 X
23
Trang 232 Giá trị trung bình của Yj bằng giá trị trung bình của các quan sát:
Bảng sau đây cho số liệu về lãi suất (Y) và tỷ lệ lạm phát(X) trong năm 1988
ờ 9 nước Giả sừ rằng sự phụ thuộc E(Y/X) có dạng tuyến tính đối với cả biến số và tham số Hãy ước lượng hàm hồi quy và tính các đặc trưng của nó
Quá trình tính toán được thể hiện trong bảng 2.1
2.2 CÁC GIẢ THIẾT c ơ BẢN CỦA PHUƠNG PHÁP BÌNH PHUƠNG NHỎ NHAT
Trong phân tích hồi quy, mục đích của chúng ta là ước lượng, dự báo về tổng thể, tức là ước lượng E(Y I X i) hay trong mô hình hồi quy tuyến tính đơn là ước lượng E(Y1 X i) = Pi + p2Xi P| và P2 tìm được bằng phương pháp bình phương nhỏ nhất là các ước lượng điểm của Pi và p2- Chúng ta không biết được chất lượng của các ước lượng này như thế nào Chất lượng cùa các ước lượng phụ thuộc vào:
- Dạng hàm của mô hình được lựa chọn
- Phụ thuộc vào các Xị và ụ
- Phụ thuộc vào kích thước mẫu
Vê dạng hàm của mô hình chúng ta sẽ đề cập đến ở chương IX ở đây chúng
ta sẽ nói về các giả thiết đối với Xi và Ui Với các giả thiết này thì các ước lượng tìm được bằng phương pháp bình phương nhỏ nhất là các ước lượng tuyến tính, không chệch, có phương sai nhỏ nhất
Giả thiết 1: Biến (các biến) giải thích là phi ngẫu nhiên, tức là các giá trị của
chúng là các sô' đã được xác định
Giả thiết này không có gì mới, vì phân tích hồi quy được đề cập là phân tích hồi quy có điều kiện, phụ thuộc vào các giá trị X đã cho
Trang 24< jk>
Trang 25Giả thiết 2: Kỳ vọng của yếu tố ngẫu nhiên u bằng không, tức là
E (ư, I X;) = 0Giả thiết này có nghĩa là các yếu tố không có trong mô hình, ư, đại diện cho chúng, không có ảnh hưởng hệ thống đến giá trị trung bình của Y
Về mặt hình học giả thiết này được mô tả bằng đồ thị (hình 2.2)
ĐỒ thị chỉ ra rằng với mỗi giá trị cùa X, các giá trị có thể có của Y xoay quanh giá trị trung bình Phân bô' của phần lớn hơn hay nhỏ hơn giá trị trung bình chính là các Ư„ theo giả thiết này trung bình của các chênh lệch này bằng 0
Chú ý: Giả thiết E(ư, I Xi) = 0 kéo theo E(Ỵ I Xi) = (3, + p2
Hình 2.2
Trang 26Giả thiết 3 Phương sai bằng nhau (phương sai thuần nhất) của các Ui
(Homosccdasticity of Ư ,)
Var (UI Xi) = Var(ưj I Xj) = ơ2 Vi * jGiả thiết 3 có nghĩa là phân bố có điều kiện của Y với giá trị đã cho của X có phương sai bằng nhau, các giá trị cá biệt của Y xoay quanh giá trị trung bình với phương sai như nhau
Giả thiết 3 kéo theo Var(Yị I Xi) = ơ 2
v ể mặt hình học có thể mô tả giả thiết này như hình 2.3
Hình 2.4: Var (U I Xi) * Var (Uj I Xj) = ơ j: j
(Phương sai không thuần nhất)
Giả thiết 4 Không có sự tương quan giữa các ụ :
Cov(Ư, , Uj) = 0 V i * j
Hình 2.5
a Kliông tự tưcmg quan; b Tự tương quan dương;
c Tự tương quan âm
Trang 27Giả thiết này có nghĩa là ư, là ngẫu nhiên Về mật hình học có nghĩa là nếu như có một giá trị u nào đó lớn hơn (nhỏ hơn) giá trị trung bình thì không có nghĩa giá trị khác cũng lớn hơn (nhò hơn) giá trị trung bình.
Giả thiết 5 Ụ và Xi không tương quan với nhau:
Trên đây đã đưa một số giả thiết cơ bản Bạn đọc có thể đặt vấn đề: vì sao phải có các giả thiết này? Chúng được thực hiện như thế nào? Cái gì sẽ xảy ra nếu các giả thiết này không được thỏa mãn? Bằng cách nào biết được mô hình hồi quy thỏa mãn tất cả các giả thiết này Vấn đề mà bạn đưa ra thật lý thú nhưng không thể giải đáp ngay trong chương này được Chúng sẽ được giải đáp dần dần trong các chương sau
2.3 ĐỘ CHÍNH XÁC CỦA CÁC UỠC LUỢNG b ì n h PHUƠNG n h ỏ n h ấ tTheo phương pháp bình phương nhỏ nhất, các ước lượng (3,, p., được xác định theo công thức:
Các ước lượng này là hàm của mẫu, là đại lượng ngẫu nhiên, với các mẫu khác nhau ta có các ước lượng khác nhau Vì phương sai hay độ lệch chuẩn đặc trưng cho độ phân tán của đại lượng ngẫu nhiên, nên ta dùng chúng làm thước đo cho chất lượng của ước lượng
Với các giả thiết của phương pháp bình phương nhỏ nhất, phương sai và độ lệch chuẩn của các ước lượng được cho bởi các công thức sau:
Trang 28z
Xi = Xi - X
Trong các công thức trôn a chưa biết, a được ước lượng bằng ước lượng
khồng chệch cùa nó là ơ2 = —— ; ồ = ỵ i=l ỵ ^ n 2) là sai số tiêu chuẩn củađường hổi quy (Standard eư or of regression) Nó chính là độ lệch tiêu chuẩn các giá trị Yquanh đường hồi quy mẫu
Các tính chất của các ước lượng bình phương nhỏ nhất được thể hiện qua định
lý sau đây:
Định lý Gauss - Markov: Với các giả thiết 1-5 của phương pháp bình phương bé nhất, các ước lượng bìrửx phương nhỏ nhất là các ước lượng tuyến tính, không chệch và
có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch.
Với các kết quả ở bảng 2.1, ta tính được:
ỉ 2 X 1973,8489i=l
Trang 29ESS (Explained Sum of Squares) là tổng bình phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc Y nhận được từ hàm hồi quy mẫu với giá trịtrung bình của chúng (Ỹ = Y ) Phần này đo độ chính xác của hàm hồi quy.
Trang 30Từ định nghĩa r2 chúng ta thấy r2 đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của
Y với giá tri trung bình của chúng được giải thích bằng mô hình (hay biến độc lập), r2
được sử dụng để đo độ thích hợp của hàm hồi quy Dễ dàng thấy được 0 < r2 < 1 Nếu lấy càn bậc hai của r ta được r r chính là hê số tương quan mẫu, tuy nhiên dấu của r tuỳ thuộc vào quan hệ cùng chiều hay ngược chiều giữa Y và X
31
Trang 31Các tính chất của hệ sô tương quan r
1 r có thể âm hoặc dương, dấu của r phụ thuộc vào dấu của tử số, đó chính là dấu của Cov(XỴ), hay là dấu của hộ số góc
5 Nếu X,Y độc lập với nhau thì r(X,"Y) = 0; Điều ngược lại không đúng
6 r đo sự phụ thuộc tuyến tính, nhưng không có ý nghĩa trong việc định rõ tính chất các quan hệ phí tuyến
7 r đo độ phụ thuộc tuyến tính giữa X và Y, vậy không đòi hỏi X Y có mối quan hệ nhân quả
Phần trên chúng ta đã trình bày các ước lượng điểm của P! và p2 thu được bằng phương pháp bình phương nhỏ nhất Với các giả thiết cơ bản:
E (U ) = 0
Var (Ụ ) = ơ2
Cov (Ụ ,U j) = 0 ( V i ^ j)thì p , , P2 là các ước lượng tuyến tính không chệch có phương sai nhỏ nhất của Pi
và P2 Mục đích của phân tích hồi quy không phải chỉ là suy đoán v'ê pi và P2 hay PRF mà còn phải kiểm tra bản chất của sự phụ thuộc, còn phải thực hiộn các dự đoán khác Do vậy cần phải biết phân bố xác suất của p | và P 2 Các phân bố này phụ thuộc vào phân bố của các ụ
Bây giờ chúng ta đua thêm giả thiết
Trang 32Giả thiết 6 Ui có phân bố N(0, ơ 2)
Với các giả thiết trôn, các ước lượng bình phương nhỏ nhất p ị , P2 và ở 2 có
các tính chất sau đây:
1 Chúng là các ước lượng không chộch
2 Có phương sai cực tiểu
3 Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ với giá trị thực của phânbố
Trang 33Do đó, có thể tìm khoảng tin cậy, kiểm định giả thiết cho các hệ sô' hồi quy và ơ2.
1 Khoảng tin cậy của Pi
_ Ễ l ~ Ễ l TY n.\
t — /s ~ T(n - 2)
se (P ,)Với hệ số tin cậy 1 - a ta tìm được ta/2 (n -2) thỏa mãn
Pi-P.
p (-ta/2 (n -2) ^ * ị <; tafl (n -2)) = 1 - a
s e (p ,)Khoảng tin cậy (1 - a ) của Ị3i là:
2 Kiểm định giả thiết đối VÓI Pi
Có thể <lưa ra giả thiết nào đó về Pi, chẳng hạn pi = p* Nếu giả thiết này đúng thì:
se (P ,)
Ta có bảng sau đây:
Bảng 2.2. Kiểm định giả thiết vê p!
Loại giả thiết Giả thiết Ho Giả thiết đối H| Miền bác bỏ
Phía phải
- p i * p ; p i > p ; t > ta (n -2)Phía trái
Trang 34Pí - P2
P( - ta/2 (n -2) < la/2 (n -2)) = 1 - a
s e (p 2)P( p2 - w (n -2) se ( p 2) £ p2 á p2 + ta/2 (n -2) se( ậ 2)) = 1 - a
4 Kiểm định giả thiết đối với p2
Có thể đưa ra giả thiết về giá trị thực cùa P2, chẳng hạn P2 = P2 •
Nếu giả thiết này đúng thì
P2 ~ P2
t = ~ T (n -2)
se(p2)
Bảng 2.3. Kiểm định giả thiết về p2
Loại giả thiết Giả thiết Ho Giả thiết đối H| Miền bác bỏ
Hai phía p2= p ; P2 * p 2 11 1 > ta/2 (n -2)Phía phải P2 ^ p 2 p2> p ; t > ta (n -2)
Phía trái
• P2 ^ P2 p2< p ; t < - ta (n -2)Nếu như đưa ra giả thiết p2 = P2 = 0 thì điều này có nghĩa là đưa ra giả thiết biến độc lập X không ảnh hưởng đến biến phụ thuộc Y, khi các tj được tính bằngcông thức:
se(Pi) se(Pj)Với các số ở bảng 2.1, ta có thể tìm khoảng tin cậy của Pi và p2 cũng như kiểm định' các giả thiết về tham số này
Với a = 0,10 => to,050 (n - 2) = to,050 (7) = 1,895 (theo bảng 2);
se (P ,) = 0,6811; se( p2 ) = 0,0388Khoảng tin cậy của pi và p2 với hệ số tin cậy 90% là:
(p , - 1,895 s e ( p ,) ; p, + 1,895 se(P ,))
(2,7418335 - 1,895 0,6811 ; 2,741835 + 1,895 0,6811)
hay (1,451149; 4,0325195)
( ệ >2 - 1,895 se ( P 2 ); ậ2 + 1,895 se ( P2 ))(1,2494067 - 1,895 0,0388 ; 1,2494067 + 1,895 0,0388)(1,17588; 1,3229327)
Có thể kiểm định giả thiết
Ho : Ị32 = p ; = 0
35
Trang 35= 32,2
H , : p2 * 0
Giả thiết Ho về mặt kinh tế tức là chúng ta đưa ra giả thiết biến X không ảnh hường đến Y, trong ví dụ cụ thể này nghĩa là nêu ra giả thiết tỳ lẹ lạm phát không ảnh hưởng đến lãi suất ngân hàng
ừong đó X ot(k) được cho bởi bảng 4, phần phụ lục
6 Kiểm định giả thiết đối với ơ 2
2 ' < XÍ_a(n - 2 ) ơ0
Kiểm định giả thiết cho thí dụ 2.1
Phần trên đã tính được ở2 = 2,9746993
Có th? kiểm ư a giả thiết: Ho : ơ2 = ơ? = 3
H, : ơ2 * 3
Trang 36GC = 0,05 => X^O,025 (n-2) - x20,025 (7) — ỉ 6,0128;
x20,975 (7) = 1,68987( n - 2 ) ô2 7.2,9746993
- 4 — = - = 2,3136
2.7 KIỂM ĐỊNH S ự P H Ù HỢP CỦA HÀM H ồ i QUY, PHÂN TÍCH H ồ i QUY
VÀ PHÂN TÍCH PHUƠNG SAI
Phần này sẽ trình bày việc phân tích hồi quy theo quan điểm của phân tích phương sai, nó cung cấp cho chúng ta một cách khác, hữu ích trong việc giải quyẽt vấn đề phán đoán thống kê.Theo phần 2.5 chúng ta có:
Chúng ta kiểm định giả thiết:
37
Trang 37Bảng 2.5. Bảng phân tích phương sai cho mô hình hồi quy hai biến
Nguồn biến thiên Tổng bình phương Bậc tự do Phương sai
do đó bác bỏ giả thiết p2 = 0 hay bác bỏ giả thiết ĩ = 0
2.8 PHÂN TÍCH HỒI QUY VÀ D ự BÁO
Các phần trên đã trình bày phương pháp xây dựng một hàm hồi quy, các đánh giá và phán xệt về các hệ số củạ hàm hồi quy Tuy nhiên mục đích cùạ chúng ta không chỉ dừng tại đó Có thể sử dụng hàm hồi quy để dự báo Có hai loại dự báo:
- Dự báo trung bình có điều kiộn của Y với một giá trị X = X(,
Trang 38- Dự báo già trị cá biệt của Y với X = Xo
- Dự báo giá trị trung bình
Giả sử X = Xo, ta muốn dự báo E(YlXo) Đường hồi quy mẫu cho ước lượng điểm cùa E(Y1X<)): Ỷ0 = p, + P2 Xo
Ỳ0 là ước lượng không chệch có phương sai nhỏ nhất của E(YlXo) Tuy nhiên
Y0 vẫn khác so với giá trị thực của nó
Ỷ0 có phân bố chuẩn với kỳ vọng Pi + p2 Xo , nên
Do đó khoảng tin cậy 1- a của E( YI Xo):
P( p, + p 2 Xo - 1«/2(11-2) se ( Ỹ0 ) <; p, + p2 Xo
- P i + p2 ^ 0 + 1 ot/2(n-2) se ( Ỵ0 ) ) = 1-a Ỳc- t a/2(n-2) s e ( Ỳ 0 ) < E(Y/*o) < Ỳ0 + t a/J(n-2) se ( Ỹ0 ) )
Thí dụ : Hãy dự báo mức lãi suất trung bình nếu tỷ lê lạm phát Xo = 5%,
39
Trang 39x i ) ■o»t Ị + ( j ^ ] w [ U <ĩ 7 9f o ĩ i
2> ĩi=l
= 0,3366 suy ra se ( Ỳ0 ) = 0,58
7,889767 < E ( YIXo) < 10,087967.
Dự báo giá trị các biệt:
Nếu chúng ta muốn dự báo giá trị riêng biệt Y = Yó với X = Xo , khi dó ước lượng củằ Yo là, Ỷ0 = Pj + P2 Xo
i-lKhoảng tin cậy của Yo được xác định bửi:
P(Ỷ0- 1 aữ (n-2) se (Yo) £ Y0 ^ Ỵo + t aJ1(_n-2) se (Y„)) = 1- a
Thí dụ: Hãy dự báo mức lãi suất nếu tỷ lệ lạm phát Xo = 5%, a = 0,1.
Kệ't quả phân tích hồi quy có thể trình bày vắn tắt dưới dạng sau đây:
Y - P , + p2 x ;(se( p I ) ) ( se( P2 )) Bậc tự do n - 2
Trang 402.10 THÍ DỤ
] Thí dụ 2.2: Cho số liệu sau đây vể năng suất (tạ / ha) của một loại cây trổng và mức phân bón(tạ / ha) cho loại cây này tính trên một ha trong 10 năm từ 1988-1997 H ãy’ước lượng mô hình hổi quy của năng suất phụ thuộc mức phân bón và trả lời các câu hỏi sau đây:
a) Hãy giải thích ý nghĩa kinh tế của các hệ số nhận được
b) H ãy tín h độ lệch tiêu chuẩn của các p
c) Với m ức ý n g h ĩa 5% hãy cho biết mức phân bón có ảnh hưởng đến năng suất loại cây này không?
d) Hãy tìm khoảng tin cậy 95% cho các hệ số hồi quy
e) Hãy tính r2 và giải thích ý nghĩa của kết quả nhận được
f) Với m ức phân b ó n là 20 tạ / ha, hãy dự báo giá trị trung bình và giátrị cá biột cù a nàng suất với hệ số tin cậy 95%
i) Hãy đọc kết quả và giải thích các kết quả do MFIT3 đưa ra
Năm Phân bón(X) Năng suất(Y) Năm Phân bón(X) Năng suất(Y)
hộ giữa “N ăng suất- Y ” và
lượng “ Phân bón-X ) tính trên