Phương sai hai chiều Phân tích hồi qui Mô hình hồi qui tổng thể, hồi qui mẫu Tham khảo trước tài liệu 4 tiết Ước lượng mô hình Khoảng tin cậy và kiểm định giả thuyết Kiểm định sự p
Trang 1Ths Dương Phú Điền
LƯU HÀNH NỘI BỘ
Long Xuyên, tháng 05 – 2013
Trang 2Chương 0 HƯỚNG DẪN HỌC TẬP MÔN KINH TẾ LƯỢNG
1 Hình thức tính điểm
A/ Hệ CQ
Điểm giữa kỳ
A=(Bài KT giữa kỳ + Báo cáo Nhóm)/2
(Trong quá trình học có điểm cộng cho sinh viên phát biểu xây dựng bài và tham gia giải bài tập)
Điểm thi kết thúc học phần
B=Bài thi kết thúc học phần
Điểm cuối khóa
C = (A+B)/2 B/ Hệ VLVH
Điểm giữa kỳ
A=(Bài KT+(Bài KT giữa kỳ)*2)/Tổng hệ số
(Trong quá trình học có điểm cộng cho sinh viên phát biểu xây dựng bài và tham gia giải bài tập)
+ Bài giảng Kinh tế lượng (của thầy)
+ Tài liệu Kinh tế lượng của trường ĐHAG (thầy Khiêm, cô Hương)
3 Tài liệu tham khảo
+ Bài giảng Kinh tế lượng (Nguyễn Quang Dong – Trường ĐH KTQD HN)
+ Giáo trình Kinh tế lượng và Bài tập dùng kèm (Hoàng Ngọc Nhậm – Trường
ĐHKT TP HCM)
+ Kinh tế lượng: Hướng dẫn trả lời Lý thuyết và Giải các bài tập (Nguyễn Cao Văn
– Bùi Dương Hải)
+ Các tài liệu khác về Kinh tế lượng
Trang 3 0918 405 651 hoặc dpdien@gmail.com hoặc dpdien@agu.edu.vn
7 Phân phối chương trình
Kiểm định giả thuyết Xác định cỡ mẫu
Tham khảo trước tài liệu
(4 tiết) Phương sai một chiều
Phương sai hai chiều Phân tích hồi qui
Mô hình hồi qui tổng thể, hồi qui mẫu
Tham khảo trước tài liệu
(4 tiết) Ước lượng mô hình
Khoảng tin cậy và kiểm định giả thuyết
Kiểm định sự phù hợp của hàm hồi qui
Tham khảo trước tài liệu
ở nhà
Trang 4Mô hình hồi qui tuyến tính
đa biến (Các thống kê HQ)
Tham khảo trước tài liệu
ở nhà
Chương 6
Hồi qui bội
(4 tiết) Mô hình hồi qui tuyến tính
đa biến (Kiểm định) Hồi qui với biến giả
Tham khảo trước tài liệu
ở nhà
Chương 7
Vi phạm giả thuyết
hồi qui
(4 tiết) Hiện tượng đa cộng tuyến
Hiện tượng tự tương quan
Hiện tượng phương sai không đồng đều
Tham khảo trước tài liệu
Thực hành (5 tiết) Phân tích số liệu với Excel
Thực hành (5 tiết) Phân tích số liệu với SPSS
Bài tập, Thảo luận (5 tiết) Hướng dẫn bài tập
Thảo luận theo chủ đề của nhóm
Photo tài liệu môn học
2 6-10 Chương 2 Suy luận thống kê (tt) Tham khảo trước tài
liệu ở nhà
3 11-13 Chương 3 Phân tích phương sai Tham khảo trước tài
Trang 54
14-15 Chương 4 Hồi quy đơn
4 16-20 Chương 4 Hồi quy đơn (tt) Tham khảo trước tài
a) Thời gian làm bài: 90 phút
b) Sinh viên được xem tài liệu
c) Cấu trúc đề:
A/ Hệ CQ
* Dạng 1:
+ Câu 1: (Hồi quy đơn) (4 điểm)
+ Câu 2: (Hồi quy bội + Hồi quy với biến giả + Mở rộng mô hình hồi quy) (4 điểm) + Câu 3: (Suy luận thống kê hoặc Phân tích phương sai) (2 điểm)
* Dạng 2:
+ Câu 1: (Hồi quy đơn) (4 điểm)
+ Câu 2: (Hồi quy bội + Hồi quy với biến giả + Mở rộng mô hình hồi quy + Một số vấn đề liên quan đến mô hình hồi quy) (6 điểm)
B/ Hệ VLVH
* Dạng 1:
+ Câu 1: (Hồi quy đơn) (4 điểm)
+ Câu 2: (Hồi quy bội + Hồi quy với biến giả) (4 điểm)
+ Câu 3: (Suy luận thống kê hoặc Phân tích phương sai) (2 điểm)
* Dạng 2:
+ Câu 1: (Hồi quy đơn) (4 điểm)
+ Câu 2: (Hồi quy bội + Hồi quy với biến giả + Mở rộng mô hình hồi quy ) (6 điểm)
Trang 6CHƯƠNG 1 GIỚI THIỆU
1.1 Kinh tế lượng là gì?
Thuật ngữ tiếng Anh “Econometrics” có nghĩa là đo lường kinh tế1 Thật ra phạm vi của kinh tế lượng rộng hơn đo lường kinh tế Chúng ta sẽ thấy điều đó qua một định nghĩa về kinh tế lượng như sau:
“Không giống như thống kê kinh tế có nội dung chính là số liệu thống kê, kinh tế lượng là một môn độc lập với sự kết hợp của lý thuyết kinh tế, công cụ toán học và phương pháp luận thống kê Nói rộng hơn, kinh tế lượng liên quan đến: (1) Ước lượng các quan hệ kinh tế, (2) Kiểm chứng lý thuyết kinh tế bằng dữ liệu thực tế và kiểm định giả thiết của kinh tế học về hành vi, và (3) Dự báo hành vi của biến số kinh tế.”2
Sau đây là một số ví dụ về ứng dụng kinh tế lượng
Ước lượng quan hệ kinh tế
(1) Đo lường mức độ tác động của việc hạ lãi suất lên tăng trưởng kinh tế
(2) Ước lượng nhu cầu của một mặt hàng cụ thể, ví dụ nhu cầu xe hơi tại thị trường Việt Nam
(3) Phân tích tác động của quảng cáo và khuyến mãi lên doanh số của một công ty
Kiểm định giả thiết
(1) Kiểm định giả thiết về tác động của chương trình khuyến nông làm tăng năng suất lúa
(2) Kiểm chứng nhận định độ co dãn theo giá của cầu về cá basa dạng fillet ở thị trường nội địa
(3) Có sự phân biệt đối xử về mức lương giữa nam và nữ hay không?
Dự báo
(1) Doanh nghiệp dự báo doanh thu, chi phí sản xuất, lợi nhuận, nhu cầu tồn kho… (2) Chính phủ dự báo mức thâm hụt ngân sách, thâm hụt thương mại, lạm phát… (3) Dự báo chỉ số VN Index hoặc giá một loại cổ phiếu cụ thể như REE
1.2 Phương pháp luận của kinh tế lượng
Theo phương pháp luận truyền thống, còn gọi là phương pháp luận cổ điển, một nghiên cứu sử dụng kinh tế lượng bao gồm các bước như sau3:
(1) Phát biểu lý thuyết hoặc giả thiết
(2) Xác định đặc trưng của mô hình toán kinh tế cho lý thuyết hoặc giả thiết
(3) Xác định đặc trưng của mô hình kinh tế lượng cho lý thuyết hoặc giả thiết
(4) Thu thập dữ liệu
(5) Ước lượng tham số của mô hình kinh tế lượng
(6) Kiểm định giả thiết
(7) Đánh giá kết quả nhận được
(8) Dự báo và sử dụng mô hình để quyết định chính sách
1 A.Koutsoyiannis, Theory of Econometrics-Second Edition, ELBS with Macmillan-1996, trang 3
2 Ramu Ramanathan, Introductory Econometrics with Applications, Harcourt College Publishers-2002, trang 2
Trang 76
Hình 1.1 Phương pháp luận của kinh tế lượng
Ví dụ 1: Các bước tiến hành nghiên cứu một vấn đề kinh tế sử dụng kinh tế lượng với đề tài
nghiên cứu xu hướng tiêu dùng biên của nền kinh tế Việt Nam
(1) Phát biểu lý thuyết hoặc giả thiết
(2) Xây dựng mô hình toán cho lý thuyết hoặc giả thiết
Dạng hàm đơn giản nhất thể hiện ý tưởng của Keynes là dạng hàm tuyến tính
TD GNP, trong đó : 0 < < 1 2 (1.1) Biểu diển dưới dạng đồ thị của dạng hàm này như sau:
4
John Maynard Keynes, 1936, theo D.N.Gujarati, Basic Economics, 3rd , 1995, trang 3
Lý thuyết hoặc giả thiết
Lập mô hình kinh tế lượng
Thu thập số liệu
Ước lượng thông số
Kiểm định giả thiết
Đánh giá kết quả nhận được Xây dựng lại mô hình
Dự báo Quyết định chính sách
Lập mô hình toán kinh tế
Trang 81 : Tung độ gốc
2: Độ dốc
TD : Biến phụ thuộc hay biến được giải thích
GNP: Biến độc lập hay biến giải thích
Hình 1 2 Hàm tiêu dùng theo thu nhập
(3) Xây dựng mô hình kinh tế lượng
Mô hình toán với dạng hàm (1.1) thể hiện mối quan hệ tất định (deterministic relationship) giữa tiêu dùng và thu nhập trong khi quan hệ của các biến số kinh tế thường mang tính không chính xác Để biểu diễn mối quan hệ không chính xác giữa tiêu dùng và thu nhập chúng ta đưa vào thành phần sai số:
Hệ số khử lạm phát
Trang 98
Bảng 1.1 Số liệu về tổng tiêu dùng và GNP của Việt Nam Nguồn : World Development Indicator CD-ROM 2000, WorldBank
TD: Tổng tiêu dùng của nền kinh tế Việt Nam, đồng hiện hành
GNP: Thu nhập quốc nội của Việt Nam, đồng hiện hành
Do trong thời kỳ khảo sát có lạm phát rất cao nên chúng ta cần chuyển dạng số liệu về tiêu dùng và thu nhập thực với năm gốc là 1989
TD, đồng-giá cố định 1989
Tổng thu nhập GNP, đồng-giá cố định 1989
Bảng 1.2 Tiêu dùng và thu nhập của Việt Nam, giá cố định 1989
(5) Ước lượng mô hình (Ước lượng các hệ số của mô hình)
Sử dụng phương pháp tổng bình phương tối thiểu thông thường (Ordinary Least Squares)5chúng ta thu được kết quả hồi quy như sau:
TD = 6.375.007.667 + 0,680 GNP
t [4,77] [19,23]
R2 = 0,97
Ước lượng cho hệ số 1 là 6.375.007.667 ˆ1
Ước lượng cho hệ số 2 là 0,68 ˆ2
Xu hướng tiêu dùng biên của nền kinh tế Việt Nam là MPC = 0,68
(6) Kiểm định giả thiết thống kê
Trị số xu hướng tiêu dùng biên được tính toán là MPC = 0,68 đúng theo phát biểu của Keynes Tuy nhiên chúng ta cần xác định MPC tính toán như trên có lớn hơn 0 và nhỏ hơn 1 với
ý nghĩa thống kê hay không Phép kiểm định này cũng được trình bày trong chương 2
(7) Diễn giải kết quả
Dựa theo ý nghĩa kinh tế của MPC chúng ta diễn giải kết quả hồi quy như sau:
Tiêu dùng tăng 0,68 ngàn tỷ đồng nếu GNP tăng 1 ngàn tỷ đồng
(8) Sử dụng kết quả hồi quy
Dựa vào kết quả hồi quy chúng ta có thể dự báo hoặc phân tích tác động của chính sách Ví
dụ nếu dự báo được GNP của Việt Nam năm 2004 thì chúng ta có thể dự báo tiêu dùng của Việt
5
Sẽ được giới thiệu trong chương 2
Trang 10Nam trong năm 2004 Ngoài ra khi biết MPC chúng ta có thể ước lượng số nhân của nền kinh tế theo lý thuyết kinh tế vĩ mô như sau:
M = 1/(1-MPC) = 1/(1-0,68) = 3,125
Vậy kết quả hồi quy này hữu ích cho phân tích chính sách đầu tư, chính sách kích cầu…
1.3 Những câu hỏi đặt ra cho một nhà kinh tế lượng
1 Mô hình có ý nghĩa kinh tế không?
2 Dữ liệu có đáng tin cậy không?
3 Phương pháp ước lượng có phù hợp không?
4 Kết quả thu được so với kết quả từ mô hình khác hay phương pháp khác như thế nào?
1.4 Dữ liệu cho nghiên cứu kinh tế lượng
Có ba dạng dữ liệu kinh tế cơ bản: dữ liệu chéo, dữ liệu chuỗi thời gian và dữ liệu bảng
Dữ liệu chéo bao gồm quan sát cho nhiều đơn vị kinh tế ở một thời điểm cho trước Các đơn
vị kinh tế bao gồm các các nhân, các hộ gia đình, các công ty, các tỉnh thành, các quốc gia…
Dữ liệu chuỗi thời gian bao gồm các quan sát trên một đơn vị kinh tế cho trước tại nhiều
thời điểm Ví dụ ta quan sát doanh thu, chi phí quảng cáo, mức lương nhân viên, tốc độ đổi mới công nghệ… ở một công ty trong khoảng thời gian 1990 đến 2002
Dữ liệu bảng là sự kết hợp giữa dữ liệu chéo và dữ liệu chuỗi thời gian Ví dụ với cùng bộ
biến số về công ty như ở ví dụ trên, chúng ta thu thập số liệu của nhiều công ty trong cùng một khoảng thời gian
Biến rời rạc hay liên tục
Biến rời rạc là một biến có tập hợp các kết quả có thể đếm được.Ví dụ biến Quy mô hộ gia
đình ở ví dụ mục 1.2 là một biến rời rạc
Biến liên tục là biến nhận kết quả một số vô hạn các kết quả Ví dụ lượng lượng mưa trong
một năm ở một địa điểm
Dữ liệu có thể thu thập từ một thí nghiệm có kiểm soát, nói cách khác chúng ta có thể thay đổi một biến số trong điều kiện các biến số khác giữ không đổi Đây chính là cách bố trí thí nghiệm trong nông học, y khoa và một số ngành khoa học tự nhiên
Đối với kinh tế học nói riêng và khoa học xã hội nói chung, chúng ta rất khó bố trí thí nghiệm
có kiểm soát, và sự thực dường như tất cả mọi thứ đều thay đổi nên chúng ta chỉ có thể quan sát hay điều tra để thu thập dữ liệu
1.5 Vai trò của máy vi tính và phần mềm chuyên dụng
Vì kinh tế lượng liên quan đến việc xử lý một khối lượng số liệu rất lớn nên chúng ta cần dến
sự trợ giúp của máy vi tính và một chương trình hỗ trợ tính toán kinh tế lượng Hiện nay có rất nhiều phần mềm chuyên dùng cho kinh tế lượng hoặc hỗ trợ xử lý kinh tế lượng
Excel
Nói chung các phần mềm bảng tính (spreadsheet) đều có một số chức năng tính toán kinh tế lượng Phần mềm bảng tính thông dụng nhất hiện nay là Excel nằm trong bộ Office của hãng Microsoft Do tính thông dụng của Excel nên mặc dù có một số hạn chế trong việc ứng dụng tính toán kinh tế lượng, giáo trình này có sử dụng Excel trong tính toán ở ví dụ minh hoạ và hướng dẫn giải bài tập
Phần mềm chuyên dùng cho kinh tế lượng
Hướng đến việc ứng dụng các mô hình kinh tế lượng và các kiểm định giả thiết một cách nhanh chóng và hiệu quả chúng ta phải quen thuộc với ít nhất một phần mềm chuyên dùng cho kinh tế lượng Hiện nay có rất nhiều phần mềm kinh tế lượng như:
Trang 1110
Phần mềm Công ty phát triển
AREMOS/PC Wharton Econometric Forcasting Associate
BASSTALBASS Institute Inc
BMDP/PCBMDP Statistics Software Inc
DATA-FITOxford Electronic Publishing
ECONOMIST WORKSTATIONData Resources, MC Graw-Hill
ESPEconomic Software Package
ETNew York University
EVIEWS Quantitative Micro Software
GAUSS Aptech System Inc
LIMDEP New York University
MATLAB MathWorks Inc
PC-TSPTSP International
P-STATP-Stat Inc
SAS/STATVAR Econometrics
SCA SYSTEMSAS Institute Inc
SHAZAMUniversity of British Columbia
SORITECThe Soritec Group Inc
SPSS SPSS Inc
STATPROPenton Sofware Inc
Trong số này có hai phần mềm được sử dụng tương đối phổ biến ở các trường đại học và viện nghiên cứu ở Việt Nam là SPSS và EVIEWS SPSS rất phù hợp cho nghiên cứu thống kê và cũng tương đối thuận tiện cho tính toán kinh tế lượng, trong khi EVIEWS được thiết kế chuyên cho phân tích kinh tế lượng
Trang 12Chương 2 Suy luận thống kê 2.1 Ước lượng khoảng tin cậy cho tham số của tổng thể
2.1.1 Ước lượng khoảng tin cậy cho trung bình (kỳ vọng) của một tổng thể
2.1.1.1 Ước lượng khoảng hai phía
ƯỚC LƯỢNG KHOẢNG HAI PHÍA CHO TRUNG BÌNH (Mức ý nghĩa )
30
Trường
hợp
Các bước
2
phân phối
1 Nhận
định
tham số
cần ước
lượng
2 Tính
giá trị tới
z
2
z
2
2
n
t
3 Tính
độ chính
z n
2
s z n
2
z n
2
t n
4 Xác
định
khoảng
ước lượng
Áp dụng bất đẳng
thức Chebyshev, ta
được
X
x K
với
X n
X
s n
1
K thỏa
2
1 1
X
K
2
z thỏa
2
1 1
tra từ Bảng giá trị hàm Laplace
1
2
n
t
2
1 1
n
P T t
Ví dụ 2.1.1.1.1 Một công ty bánh kẹo đóng gói kẹo trong những bao 20 gr Số kẹo trong
một bao có biến động và kẹo được bán theo trọng lượng Công ty muốn ước lượng trọng lượng
kẹo trong mỗi bao Nhân viên kiểm tra chọn ngẫu nhiên 120 gói kẹo để cân số kẹo trong mỗi
bao Họ nhận thấy rằng trọng lượng kẹo trung bình trong một bao là 18,720 gr với độ lệch
chuẩn mẫu là 0,874 gr Ước lượng điểm của trọng lượng kẹo trung bình trong một bao là bao
nhiêu? Tìm khoảng tin cậy 99% của trọng lượng kẹo trung bình trong một bao
Giải
………
………
………
………
………
Trang 1312
………
………
………
………
………
………
………
………
………
………
………
Ví dụ 2.1.1.1.2 Để nghiên cứu sản lượng sữa hàng ngày (SLSHN) của một đàn bò, người ta điều tra ngẫu nhiên trên 100 con bò của nông trường và có kết quả sau: SLSHN (kg) 9 10 12 14 15
Số con bò 10 24 42 16 8
Ước lượng sản lượng sữa trung bình mỗi ngày của một con bò bằng khoảng tin cậy 97% ĐS: 11, 392;12,168 kg Giải ………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
2.1.1.2 Ước lượng khoảng một phía
ƯỚC LƯỢNG KHOẢNG BÊN TRÁI CHO TRUNG BÌNH (Mức ý nghĩa )
30
Trường
hợp
Các
bước
2
đã biết chưa biết 2 đã biết 2 chưa biết 2 Không biết qui
luật phân phối
1 Nhận
Áp dụng bất đẳng
thức Chebyshev
Trang 14thỏa P T t n 1 tra từ Bảng phân phối Student 1
ƯỚC LƯỢNG KHOẢNG BÊN PHẢI CHO TRUNG BÌNH (Mức ý nghĩa )
luật phân phối
Trang 1514
t n 1
thỏa P T t n 1 1 tra từ Bảng phân phối Student
* Chú ý:
Khi có ước lượng khoảng bên trái cho trung bình với độ tin cậy là
;x , ta nói giá trị tối đa của trung bình với độ tin cậy là x
Khi có ước lượng khoảng bên phải cho trung bình với độ tin cậy là
x , ta nói giá trị tối thiểu của trung bình với độ tin cậy là x ;
Ví dụ 2.1.1.2 (1)
Để nghiên cứu sản lượng sữa hàng ngày (SLSHN) của một đàn bò, người ta điều tra ngẫu nhiên trên 100 con bò của nông trường và có kết quả sau:
SLSHN (kg) 9 11 12 13 15
Số con bò 10 24 42 16 8
Với độ tin cậy 98%, có thể nói sản lượng sữa trung bình hàng ngày của một con bò ít nhất và nhiều nhất bằng bao nhiêu? Giải ………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
Trang 16………
………
………
………
………
………
………
………
2.1.2 Ước lượng khoảng tin cậy cho tỉ lệ một tổng thể 2.1.2.1 Ước lượng khoảng tin cậy hai phía Các bước ƯỚC LƯỢNG KHOẢNG HAI PHÍA CHO TỈ LỆ p (Mức ý nghĩa ) 1 Nhận định tham số cần ước lượng p 2 Tính giá trị tới hạn 2 z 3 Tính độ chính xác 2 1 p p z n 4 Xác định khoảng ước lượng p ; p 2 z thỏa 2 1 1 2 2 z tra từ bảng giá trị hàm Laplace Ví dụ 2.1.2.1 Để nghiên cứu sản lượng sữa hàng ngày (SLSHN) của một đàn bò, người ta điều tra ngẫu nhiên trên 100 con bò của nông trường và có kết quả sau: SLSHN (kg) 9 10 12 14 15
Số con bò 10 24 42 16 8
Tìm khoảng tin cậy 94% cho tỉ lệ bò cho SLSHN không nhiều hơn 12kg Giải ………
………
………
………
………
………
………
………
………
………
Trang 1716
………
………
………
………
………
………
2.1.2.2 Ước lượng khoảng tin cậy một phía
Các bước
ƯỚC LƯỢNG KHOẢNG BÊN TRÁI CHO TỈ LỆ p
(Mức ý nghĩa )
1 Nhận định tham số
z
n
4 Xác định khoảng ước
z thỏa z 1 tra từ Bảng giá trị hàm Laplace
Các bước
ƯỚC LƯỢNG KHOẢNG BÊN PHẢI CHO TỈ LỆ p
(Mức ý nghĩa )
1 Nhận định tham số
z
n
4 Xác định khoảng ước
z thỏa z 1 tra từ Bảng giá trị hàm Laplace
* Chú ý:
Khi có ước lượng khoảng bên trái cho tỉ lệ p với độ tin cậy là ; p , ta nói
giá trị tối đa của tỉ lệ p với độ tin cậy là p
Khi có ước lượng khoảng bên phải cho tỉ lệ p với độ tin cậy là p , ta nói ;
giá trị tối thiểu của tỉ lệ p với độ tin cậy là p
Ví dụ 2.1.2.2 (2)
Trang 18Một công ty sản xuất bột giặt muốn thăm dò mức độ tiêu thụ sản phẩm này trong thành phố H Công ty tiến hành điều tra 500 hộ gia đình và có kết quả sau:
Nhu cầu (kg/tháng) < 1 [1; 1,5) [1,5; 2) [2; 2,5) [2,5; 3) [3; 3,5) ≥ 3,5
Những hộ có nhu cầu trên 2 kg trong một tháng được gọi là những hộ có nhu cầu cao Với độ tin cậy 96%, có thể nói tỉ lệ tối đa và tỉ lệ tối thiểu của những hộ có nhu cầu cao ở thành phố H bằng bao nhiêu?
Giải
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
2.1.3 Một số bài toán có liên quan đến ước lượng khoảng tin cậy hai phía cho trung bình (kỳ vọng) và tỉ lệ của một tổng thể
Yếu tố đã biết Yếu tố cần tìm Ước lượng khoảng
cho trung bình
Ước lượng khoảng cho tỉ lệ
- Cỡ mẫu n
- Độ tin cậy
1
Độ chính xác
2
z n
hoặc
2
s z n
2
1
z
n
- Cỡ mẫu n
- Độ chính xác
Độ tin cậy 1
2
2 z 1
2 z2 1
- Độ tin cậy
1
- Độ chính xác
2 '
n z
hoặc 2
2
n z
2 2 2
1
n z
Ví dụ 2.1.3.1 (3)
Trang 1918
Nghiên cứu về độ bền X (kg/mm2) của một loại thép, người ta tiến hành quan sát
một số tấm thép trên mẫu và có kết quả cho trong bảng sau:
Độ bền (kg/mm2) Độ bền đại diện (kg/mm2) Số tấm thép
(95, 115]
(115,135]
(135,155]
(155,175]
(175,195]
(195,215]
> 215
105
125
145
165
185
205
225
15
19
23
31
29
21
6 (a) Tìm khoảng tin cậy 97% cho độ bền trung bình của loại thép trên
(b) Sẽ đạt độ tin cậy bao nhiêu nếu muốn ước lượng độ bền trung bình của loại thép trên bằng khoảng tin cậy có độ dài bằng 6?
(c) Thép có độ bền trên 195kg/mm2 được gọi là thép loại A Tìm khoảng tin cậy
98% cho độ bền trung bình của thép loại A Giả sử độ bền X (kg/mm2) của loại
thép đó có phân phối chuẩn
Độ bền (kg/mm2) Độ bền đại diện (kg/mm2) Số tấm thép
(195,215]
> 215
205
225
21
6
Giải
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
Ví dụ 2.1.3.2 (4) Giả sử bạn muốn ước lượng tỉ lệ xe gắn máy hiệu Air Blade trong tổng số xe gắn máy đang lưu hành ở Tp.Long Xuyên trong giờ cao điểm bằng cách đứng ở góc cầu Nguyễn Trung Trực và đếm số xe hiệu Air Blade Bạn nghĩ rằng tỉ lệ này không quá 0,40 và muốn sai số của khoảng tin cậy không lớn hơn 0,03 Bạn cần phải chọn một mẫu ít nhất cỡ bao nhiêu xe? Dùng mức tin cậy 90%
Giải
Trang 20………
………
………
………
………
………
………
………
………
………
………
Ví dụ 2.1.3.3 (5) Để nghiên cứu sản lượng sữa hàng ngày (SLSHN) của một đàn bò, người ta điều tra ngẫu nhiên trên 100 con bò của nông trường và có kết quả sau: SLSHN (kg) 9 11 12 13 15
Số con bò 10 24 42 16 8
Muốn sai số khi ước lượng sản lượng sữa trung bình mỗi ngày không vượt quá 0,5kg và sai số khi ước lượng tỉ lệ bò cho SLSHN không nhiều hơn 12kg không vượt quá 12%, với cùng độ tin cậy 98%, thì cần điều tra ít nhất bao nhiêu con bò? Giải ………
………
………
……… ………
………
………
……… ………
………
………
……… ………
2.1.4 Ước lượng khoảng tin cậy cho phương sai một tổng thể
2.1.4.1 Ước lượng khoảng hai phía
Giả sử tổng thể X có phân phối chuẩn N(;2), trong đó 2 chưa biết và chúng ta
muốn tìm khoảng ước lượng cho với độ tin cậy 2 (0 < < 1) cho trước Ta 1
có các công thức ước lượng khoảng cho như sau: 2
Trang 21 từ bảng phân phối Chi bình phương với (n – 1) bậc tự do
Ví dụ 2.1.4.1 Để khảo sát tính chính xác của một cái cân, người ta đặt quả cân
100g lên cân và đọc kết quả do cân chỉ Lặp lại nhiều lần, người ta thu được các kết quả
sau:
xi(g): 102 101 97 102 99 101 102 99 98
Tính chính xác của cân thể hiện qua phương sai Hãy tìm khoảng tin cậy 95% cho
phương sai của cân, biết trọng lượng cân có phân phối chuẩn
Giải
Theo giả thuyết, ta có = 100
Ta có khoảng ước lượng của phương sai với độ tin cậy =1– = 95% 0, 05
Trang 222 0,025(9) 19, 023
và 20,975(9) 2, 700
Vậy khoảng tin cậy 95% cho phương sai của cân là:
29 ; 29 1,524;10,741 19,023 2,700
Ví dụ 2.1.4.2 Cho biết khối lượng trẻ sơ sinh có phân phối chuẩn Một mẫu cỡ 20
cho giá trị trung bình mẫu bằng 2982 (g) và giá trị phương sai mẫu bằng 209108 (g2)
Tìm khoảng tin cậy 90% cho độ lệch chuẩn tổng thể
Vậy khoảng tin cậy 90% cho là: (363,046;626,666) (g)
Ví dụ 2.1.4.3 Mức tiêu hao nguyên liệu cho một đơn vị sản phẩm là một biến ngẫu nhiên X tuân theo quy luật chuẩn Quan sát 28 sản phẩm được chọn ngẫu nhiên, người ta thu được kết quả cho trong bảng sau:
x (gam) 19 19,5 20 20,5
Hãy xây dựng khoảng tin cậy 90% cho phương sai tổng thể trong hai trường hợp:
(a) biết E(X) = 20g; ĐS: 0,175;0, 428
(b) chưa biết E(X) ĐS: 0,143;0, 356
Trang 232.1.4.2 Ước lượng khoảng một phía
Giả sử tổng thể X có phân phối chuẩn N(;2), trong đó 2 chưa biết và chúng ta
muốn tìm khoảng ước lượng cho với độ tin cậy 2 (0 < < 1) cho trước Ta 1
có các công thức ước lượng khoảng một phía cho như sau: 2
Ước lượng khoảng bên trái cho phương sai 2
2
1 2
từ bảng phân phối Chi bình phương với n – 1 bậc tự do
Ước lượng khoảng bên phải cho phương sai 2
Trang 24Tra 2( ) n từ bảng phân phối Chi bình phương với n bậc tự do
Tra 2( n 1) từ bảng phân phối Chi bình phương với n – 1 bậc tự do
* Chú ý:
Khi có ước lượng khoảng bên trái cho phương sai với độ tin cậy là 2 0; , ta ˆ2
nói giá trị tối đa của phương sai với độ tin cậy là 2 ˆ2
Khi có ước lượng khoảng bên phải cho phương sai với độ tin cậy là 2 , ˆ ;2
ta nói giá trị tối thiểu của phương sai với độ tin cậy là 2 ˆ2
Ví dụ 2.1.4.2.
2.1.5.1 Trường hợp hai mẫu phối hợp từng cặp
Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n cặp quan sát từ những phân phối với trung bình µx và µy Ðặt d và sd là trung bình và độ lệch chuẩn của n sự khác biệt di= xi – yi Nếu phân phối của những khác biệt này là phân phối chuẩn thì khoảng tin cậy 100 (1 - α) % cho
Trang 25 tra từ Bảng phân phối Student với n 1 bậc tự do
trước cải tiến và sau cải tiến trong một nhà máy được cho trong bảng dưới đây:
Kiện hàng Trước cải tiến Sau cải tiến Chênh lệch
Với độ tin cậy 99%, hãy ước lượng sự chênh lệch trọng lượng trung bình tổng thể của
mỗi kiện hàng được sản xuất bởi phân xưởng nói trên trước cải tiến và sau cải tiến
d d
n
d nd s
Trang 26trọng lượng trung bình mỗi kiện hàng được sản xuất từ phân xưởng nói trên trước cải tiến
và sau cải tiến
2.1.5.2 Trường hợp hai mẫu độc lập
a) Hai mẫu độc lập cỡ lớn có phương sai tổng thể khác nhau đã biết hoặc có phương sai tổng thể bằng nhau nhưng chưa biết
Giả sử có hai mẫu ngẫu nhiên độc lập có nx và ny quan sát (nx 30 và ny 30) từ những tổng thể khác nhau có phân phối chuẩn, có trung bình x và y và phương sai 2xvà y2 (đã
trung bình mẫu là x và ythì khoảng tin cậy 100 (1 - α) % cho (x - y) được tính bởi công thức:
tra từ Bảng giá trị hàm Laplace
những người nghỉ việc không có lý do là 2,15 giờ trong tháng và độ lệch chuẩn là 2,09 giờ/tháng Một mẫu ngẫu nhiên độc lập khác gồm 206 người không hút thuốc lá, lượng giờ trung bình của những người nghỉ việc là 1,69 giờ/tháng, độ lệch chuẩn của mẫu là 1,91 giờ/tháng Tìm khoảng tin cậy 99% cho sự khác biệt của hai trung bình tổng thể
x 2,15; nx = 96; sx = 2,09 (Mẫu quan sát người hút thuốc lá)
y 1,96; ny = 206; sy = 1,91 (Mẫu quan sát người không hút thuốc)
b) Hai mẫu độc lập cỡ nhỏ có phương sai tổng thể bằng nhau nhưng chưa biết
Khoảng tin cậy 100(1-α)% cho (x - y) được tính:
Trang 27có hệ thống hoạch định chính thức có tốc độ tăng thu nhập trung bình hàng năm là 2,098% và độ lêch chuẩn là 10,834 Giả sử rằng hai phân phối tổng thể có cùng phương sai, tìm khoảng tin cậy 90% cho sự khác biệt giữa hai trung bình
2.1.6 Ước lượng khoảng tin cậy cho sự khác biệt giữa hai tỷ lệ tổng thể (trường hợp
n lớn)
Ðặt px là tỉ lệ của mẫu có nx quan sát từ một tổng thể với tỉ lệ px
và py là tỉ lệ của mẫu có ny quan sát từ một tổng thể với tỉ lệ py
Ta có khoảng tin cậy 100(1 - α)% của sự khác biệt giữa px và py:
một chương trình kế toán nên có một phần mềm ứng dụng riêng biệt và đó cũng là đòi hỏi của tất cả kế toán viên Một mẫu ngẫu nhiên độc lập gồm 127 giáo viên kế toán, 21 người đồng ý với điều này Tìm khoảng tin cậy 95% cho sự khác biệt giữa hai tỉ lệ của tổng thể những người sẽ đồng ý với luận điểm trên
Trang 28
48
98 21
2.2 Kiểm định giả thuyết về tham số của tổng thể
2.2.1 Kiểm định giả thuyết cho trung bình (kỳ vọng) của tổng thể
2.2.1.1 Kiểm định giả thuyết hai phía cho trung bình (kỳ vọng) của một tổng thể
Bảng 2.2.1.1
KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH HAI PHÍA
H H
H H
H H
H H
n
t t
Trang 29KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH PHÍA PHẢI
Trang 30H H
H H
H H
A, kết quả là nhịp mạch trung bình 74 lần/phút và độ lệch chuẩn bằng 9 lần/phút Hãy kiểm định xem đặc điểm nghề A có làm cho nhịp mạch của thanh niên tăng quá mức bình thường không, biết rằng nhịp mạch bình thường của thanh niên là 72 lần/phút (kết luận với mức = 0,01)
Trang 31KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH PHÍA TRÁI
H H
H H
H H
H H
ngẫu nhiên tuân theo luật phân phối chuẩn N(500; (8,5)2) Sau một thời gian sản xuất, ban lãnh đạo nhà máy nghi ngờ rằng khối lượng của loại sản phẩm này có xu hướng giảm, nên tiến hành cân thử 25 sản phẩm và thu được kết quả sau:
Trang 32Giả thuyết H0 : p p0 với đối thuyết H1: p p0 (Mức ý nghĩa )
Trang 33(b) Hãy cho kết luận về việc cải tiến máy có làm thay đổi tỉ lệ sản phẩm loại A ở mức ý nghĩa = 0,04
Giả thuyết H0 : p p0 với đối thuyết H1 : p p0 (Mức ý nghĩa
Trang 35800 sản phẩm để kiểm tra thì thấy có 24 phế phẩm
(a) Với mức ý nghĩa = 5%, hãy kiểm định xem đợt cải tiến kỹ thuật có thực sự làm giảm tỉ lệ phế phẩm không?
(b) Sau đợt cải tiến kỹ thuật, nếu nhà máy báo cáo tỉ lệ phế phẩm là 2% thì có chấp nhận được không ở mức ý nghĩa = 3%?
Trang 36
2.2.4 Kiểm định giả thuyết cho sự khác biệt giữa trung bình (kỳ vọng) của hai tổng thể
2.2.4.1 Trường hợp hai mẫu phối hợp từng cặp (matched pairs)
Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n cặp quan sát từ những phân phối của hai tổng thể có trung bình lần lượt là và Đặt và là trung bình và độ lệch chuẩn cho
sự khác nhau của n cặp Nếu tổng thể của sự khác nhau này có phân phối chuẩn, là
Trang 3736
một giá trị cụ thể nào đó, để kiểm định và kiểm định ở mức ý nghĩa ta có ba trường hợp kiểm định tổng quát như sau:
1 Giả thuyết và đối thuyết
(1): 1 đuôi phải (2): 1 đuôi trái (3): 2 đuôi
quảng cáo của các sản phẩm khi xem tivi trong 24 giờ Công ty đưa ra 2 loại nhãn hiệu quảng cáo cho 10 sản phẩm khác nhau Tài liệu thu nhập sau đây là lượng người sau khi phỏng vấn nhớ hai lọai nhãn hiệu khi xem Tivi:
Trang 38Ta có: 210 21
10
i
d d
d nd s
về sự gợi nhớ nhãn hiệu sản phẩm bị bác bỏ ở mức ý nghĩa 10% nhưng được chấp nhận ở mức ý nghĩa 5% mặc dù số liệu trong bảng trên cho thấy rằng trung bình nhãn hiệu loại 1 cao hơn
Ví dụ 2.2.4.2 (13) Một công ty muốn đánh giá về hiệu quả của một đợt quảng cáo đối với số sản phẩm bản ra của công ty 10 cửa hàng bán sản phẩm của công ty được chọn ngẫu nhiên để theo dõi số lượng sản phẩm bán ra trong một tuần trước đợt quảng cáo (TĐQC) và một tuần sau đợt quảng cáo (SĐQC)
2.2.4.2 Trường hợp hai mẫu độc lập
Xét hai mẫu (X1, X2, , Xn1), đặc tính X có phân phối chuẩn, với kỳ vọng X, độ
lệch chuẩn X và mẫu (Y1, Y2, , Yn2), đặc tính Y có phân phối chuẩn, với kỳ vọng
Trang 3938
Y, độ lệch chuẩn Y Giả sử hai mẫu trên độc lập nhau Chúng ta muốn kiểm định
xem giữa X và Y, thể hiện qua x và y , giống nhau hay khác nhau?
2.2.4.2.1 Kiểm định giả thuyết hai phía về so sánh hai trung bình của hai mẫu độc lập
X2, Y2 đã biết ( thực hiện giống
0 2
n n
t t
0 2
0 2
Trang 40
Miền bác bỏ
O
1 2 2
a) Tính khoảng tin cậy 98% của ước lượng khác biệt của phí bảo hiểm trung bình của 2 nhĩm
b) Kiểm định giả thuyết sự khác nhau của hai phí trung bình ở mức ý nghĩa 2%
CỦA HAI MẪU ĐỘC LẬP