Khoảng tin cậy lỉxác định thường tốn kém; trong khi đó , và s là giá trị trung bình và độ lệch chuẩn của một mẫu lấy từ tập hợp mẹ tính được tương đối dễ dàng.. Khi sự sử dụng phân phối
Trang 3M Ụ C L Ụ C
IM mở đầu
1.1 Giới thiệu 10
ỉ'.2 ước lượng và sự lấy mẫu 10
1.3 Phân phối giá trị trung bình của mẫu 12
1.4 Khoảng tin cậy của giá trị ưung bình trong ưường hợp phân bố chuẩn 14
1.5 Kích thước mẫu để ước tính giá trị trung bình của tập hợp mẹ 16
1.6 Phân phối Student và khoảng tin cậy của giá trị trung bình 17
1.7 Bất đẳng thức Bienaymé-Tchebycheí Khoảng tin cậy của giá trị trung bình 18
1.8 Khoảng tin cậy của độ sai biệt 2 giá trị trung bình dựa vào phân phối chuẩn 19
1.9 Khoảng tin cậy của độ sai biệt 2 giá trị trung bình dựa vào phân phối Student 21
1.10 Khoảng tin cậy của một tỷ lệ dựa vào phân phối chuẩn 22
1.11 Xác định kích thước mẫu cần thiết để ước lượng tỷ lệ 23
1.12 Khoảng tin cậy cho sự sai biệt giữa 2 tỷ lệ 24
BÀI TẬP 25
Chương 2 :K iể m đ ịn h g iả th iế t 2.1 Giới thiệu 47
2.2 Các bước kiểm định một giả thiết 47
2.3 Kiểm định giả thiết về giá trị trung bình của một phân phối chuẩn 48
2.4 Kiểm định giả thiết về giá ưị trung binh của một phân phối Student 51
2.5 Kiểm định giả thiết về sự sai biệt của 2 giá trị trung bình dựa vào phân phối chuẩn 52
2.6 Kiểm định giả thiết về sự sai biệt của 2 giá trị trung bình dựa vào phân phối Student 55
Trang 42.7 Kiểm định giả thiết cho tần số dựa vào phân phối chuẩn 5" 2.8 Kiểm định giả thiết về sự sai biệt của hai tần sô" nhờ vào
phân phối chuẩn 58
2.9 Kiểm định giả thiết liên quan đến phân phôi X2 60
2.9.1 Kiểm định sự phù hợp 60
2.9.2 Kiểm định giả thiết sự độc lập giữa hai biến số 63
2.10 Kiểm định giả thiết cho tỷ l ệ 65
2 10 1 Kiểm định cho tỷ lệ 65
2.10.2 Kiểm định về sự khác nhau của hai tỷ l ệ 6Ó 2.10.3 Kiểm định sự bằng nhau của hai tỷ lệ 66
BÀI TẬP 69
Chương 3 : M ô h ìn h h ồ i q u y tu yế n tín h đ ơ n 3.1 Giới thiệu 90
3.2 Giới thiệu mô hình 90
3.2.1 Ví dụ giới thiệu 90
3.2.2 Vai trồ của số hạng ngẫu nhiên 91
3 3Ảnh hưởng của hệ số ngẫu nhiên 93
3.3 Ước lượng các thông số của mô hình 94
3.3.1 MÔ hình và các giả thiết 94
3 2Công thức xác định các hệ số ước lượng 95
3.3.3 Các dạng khác nhau của mô hình: sai sô" và sô" dư 98
3 4Các tính chất của hệ số hồi quy âo, ầ | 99
3.4 Hệ quả của các giả thiết: thiết lập các kiểm định 101
3.4.1 Giẳ thiết sai số tuân theo phân phôi chuẩn 101
3 2Hệ quâ của giả thiết 101
3.5 Phương trình và bảng tính phân tích phương sai 106
3.5.1 Phương trình phần tích phương sai 106
3.5.2 Bảng phân tích phương sai 107
3.6 Vấn đề dự báo trong một mô hình hồi quy đơn 111
BÀI TẬP 114
Chương 4: M ô h ìn h h ồ i q u y tu yế n tín h b ộ i 4.1 Giới thiệu * 118
4.2 Mô hình dưới dạng ma trận 118
Trang 54.3 Sự ước lượng và các tính chất của sự ưổlc lượng 119
4.3.1 Ưđc lượng các hệ sô trong phương trình hồi quy 119
4.3.2 Các giả thiết và tính chất của ước lượng 120
4.3.3 Các tính chât của các ước lượng 121
4.4 Phương trình phân tích phương sai và clhất lượng của sự ăn khớp 122
4.5 Các kiểm định thống kê trong mô hình kinh tế lượng 127
4.5.1 Vai trò của các giả thiết 127
4.5.2 Thiết lập các kiểm định 127
4.6 Phân tích phương sai 131
4.6.1 Bảng phân tích và kiểm định tổng quát cho hồi quy 131
4.6.2 Các kiểm định khác 132
4.7 Biến chỉ báo 136
4.8 Biến định tính trong mô hình kinh tế lượng 141
4.8.1 Giới thiệu vấn đề 141
4.8.2 Chuẩn bị số liệu cho biến định tíaih 141
4.8.3 Vấn đề điều kiện ràng buộc ưong trường hợp biến định tính 142
4.9 Dự báo của mô hình tuyến tính tổng qjuát — Dự báo có điều kiện 144
4.10 Vấn đề phụ thuộc tuyến tính và sự lựa chọn các biến giải thích 145
4.10.1 Giới thiệu 145
4.10.2 Tương quan riêng phần 145
4.10.3 Tổng quát hóa khái niệm tương quan riêng phần 146
4.10.4 Phụ thuộc tuyến tính giữa các bnến giải thích: hệ quả và phương phấp nhận biết 150
4.10.5 Sự lựa chọn các biến giải thích 155
4.11 Vấn đề tự tương quan của chuỗi sai số 158
4.11.1 Đặt vấn đề 158
4.11.2Toán tở ước lượng của phương pháp bình phương tối thiểu tổng quát hóa • 159
4.11.3Nguyên do và cách nhận biết vấn đề tự tương quan • giữa các sai số ! 160
4.11.4Các quy trình ựớc lượng trong tirường hợp có tính tự
Trang 64.12 Hiện tượng “hétérocédasticité” 168
4.12.1Giới thiệu vấn đề 168
4Hiệu chỉnh 169
BÀI't ậ p 173
Chương 5 : M ô hình p h i tu yến v à m ô h ìn h c ó h ệ p h ư ơ n g trình đ ồ n g th ờ i 5.1 Giới thiệu 186
5.2 Mô hình LnY = aX + b 187
5.3 MÔ hình Y= aLnX + b 191
5.4 Mô hình LnY = aLnX + b 192
5.5 Mô hình có dạng đa thức 195
5.6 Mô hình khuyếch tán 197
5.6.1 Các dạng mô hình chu kỳ phát triển của sản phẩm 198
5.6.2 Mô hình Logistique (đường cong Verhulst hay đường cong Pearl) 198
5.6.3 Mô hình Gompertz 199
5.6.4 Phương pháp ước lượng 200
5.7 Mô hình tuyến tính tự hồi quy 206
5 7.1 Công thức tổng quát 206
5.7.2 Kiểm tra trình tự tương quan và các phương pháp ước lượng ! 207
5.7.3 Ước lượng trong trường hợp có hiện tượng tự tương quan giữa các sai sô" 208
5.7.4 Dự báo trong một mô hình tự tương quan 210
5.8 Mô hình với các biến ư ễ 214
5.8.1 Công thức tổng quát 214
5.8.2 Độ trễ trung bình 215
5 3Xác định mức độ trễ h 215
5.9 Mô hình động 216
5.9.1 Mô hình tương thích từng phần 216
5.9.2 Mô hình dự đoán thích nghi 218
5.10 Mô hình với các phương trình đồng thời 219
5.10.1 Phương trình câu trúc và phương trình thu gọn 219
5.10.1.1 Ví dụ giới thiệu 220'
5 10 1Mô hình tổng quát 221
Trang 75.10.1.3 Trường hợp đặc biệt: mô h'inh đệ q u i 222
5.10.2 Vân đồ đồng nhât trong hệ phương trình 223
5.10.2.1 Ràng buộc cho các hệ s ố 223
5.10.2.2 Các điều kiện đồng nhất 223
5.10.3 Các phương pháp ước lượng 224
5.10.3.1 Phương pháp bình phương tối thiểu gián tiêp 225
5.10.3.2 Mô hình bình phương tối thiểu hai lần 225
BÀI TẬP 232
C h ư ơ n g 6: P h â n tíc h c h u ồ i th ờ i g ia n 6.1 Giới thiệu 239
6.2 Các phương pháp làm trơn 239
6.2.1 Phương pháp làm trơn với trung bình động 240
6.2.2 Phương pháp làm trơn với 1 đa thức 243
6.2.3 Phương pháp làm trơn với hàm m ũ 244
6.2.4 Phương pháp làm trơn với hàm mũ có hiệu chỉnh 248
6.3 Phương pháp phân rã 249
6.3.1 Phân tích xu tlìế 249
6.3.2 Đánh giá sự biến đổi theo mùa 251
6.3.3 Dự báo dựa trên xu thế và thành phần theo mùa 252
6.3.4 Phân tích sự biến đổi theo chu kỳ và sự biến đổi ngẫu nhiên 253
6.3.5 Ví dụ áp dụng 253
6.4 Phương pháp Box-Jenkins 255
6.4.1 Tính ổn định của 1 chuỗi 255
6.4.2 Hàm số tự tương quan và tự tương quan riêng phần 256
6.4.3 Kiểm định “nhiễu trắng" 258
6.4.3.1 Phân tích hàm tự tương quan 258
6.4.3.2 Tham số thông kê của Box-Pierce và Ljung-Box 259
6.4.4 Mô hình AR (p) (Auto Régressif) 261
6.4.5 Mô hình MA (q) (Moving Average) 263
6.4.6 Mô hình ARMA (p,q) 265
6.4.7 Mô hình ARMA mở rộng : ARIMA, SARIMA 266
6.4.8 Phương pháp Box-Jenkins 268
BÀI TẬP .279
PHỤ LỤC 285
Trang 8Khoảng tin cậy 9
Chương 1
KHOẢNG TIN C Ậ Y
Trang 910 Kinh tê lượng ứng dụng
Giới thiệu
Trong khuôn khổ nghiên cứu các biến ngẫu nhiên liên tục tuân theo một phân phối thống kê nào đó, một số bài toán, ta thường khảo sát giá trị các biến dao động trong một khoảng cho trước Nói một cách khác, biến liên tục ngẫu nhiên X sẽ dao động trong một khoảng giá trị cho trước tương ứng với một xác suâ't định trước nào đó Để so sánh giá trị của một biến ngẫu nhiên với một giá trị cho trước, người ta sẽ đưa ra khái niệm một khoảng giá trị
và sẽ so sánh giá trị cần khảo sát với khoảng giá trị này
v ề quan điểm thống kê, người ta không bao giờ đặt vấn đề biến X nghiên cứu sẽ bằng vđi một giá trị « chính xác » đã định với một xác suất cho trước trong trường hợp này Ví dụ tuổi trung bình của các mẫu lấy ra từ tập hợp sinh viên trường Đại học Kỹ thuật
Tp Hồ chí Minh tuân theo phân phôi chuẩn Tiến hành chọn một mẫu ngẫu nhiên của sinh viên, và từ đó ta chỉ có thể tính giá trị tuổi trung bình của mẫu này sẽ nằm trong một khoảng tính được với một xác suất tương ứng Ta không đặt vấn đề khảo sát giá trị này bằng với một giá trị cho trước Một ví dụ khác ta xét tỷ lệ trẻ sơ sinh là nam (nữ) tại Tp Hồ chí Minh Ta có thể xem tỷ lệ này sẽ tuân theo phân phối chuẩn Tiến hành khảo sát trên một mẫu điển hình và tính được tỷ lệ nam trên tổng số v ề nguyên tắc ta chỉ có thể tiến hành khảo sát tỷ lệ này dao động trong một khoảng cho trước nào
đó vđi xác suất tương ứng Ta không thể khảo sát giá trị này bằng với một giá trị định trước nào đó Đó là lý do tại sao khi nghiên cứu đến sự thay đổi của các biến ngẫu nhiên liên tục người ta nói đến vấn đề khoảng tin cậy
1.2 Ước lượng và sự lấy mổu
Trong thực tế nghiên cứu các thông số thống kê của một tập hợp mẹ bất kỳ, người ta thường tính toán trên mẫu được chọn từ tập hợp mẹ một cách cồ lý luận được gọi là thống kê mẫu Ví dụ p và CT biểu thị giá trị trung bình và độ lệch chuẩn của tập hợp mẹ (thông thường là các đại lượng không biết vl kích thước mẫu lđn, tiến hành
Trang 10Khoảng tin cậy lỉxác định thường tốn kém); trong khi đó , và s là giá trị trung bình
và độ lệch chuẩn của một mẫu lấy từ tập hợp mẹ (tính được tương đối dễ dàng) Một cách tổng quát ta có: // * và ơ * s Tuy vậy,
các nghiên cứu lý thuyết sẽ dược tiến hành nhằm cho phép nghiên
cứu giá trị của ụ , ơ từ kết quả có được 5 cho từ mẫu
Các nhà thống kê học đưa ra các tiêu chuẩn để chọn lựa các đại lượng đánh giá dùng để nghiên cứu các thông số của tập hựp
mẹ Tiêu chuẩn đầu tiên đặt ra là đại lượng đánh giá này không bị lệch Theo định nghĩa một đại lượng đánh giá được xem là không bị lệch khi kỳ vọng toán của nó bằng đúng với giá trị của nó mà chúng ta đang tìm cách ước lượng
Thứ hai là tiêu chuẩn hội tụ Một đại lượng đánh giá được xem là hội tụ khi giá trị của đại lượng đánh giá này tiến về giá trị tương ứng của tập hợp mẹ trong trường hợp kích thước mẫu xét n tiến về kích thước tập hợp mẹ đang xét N Một đại lượng đánh giá chỉ được xem là hoàn toàn đúng khi nó thỏa mãn cả 2 tính chất: không lệch và hội tụ
Trong bảng sau giới thiệu cho chúng ta một vài đại lượng đánh giá hay gặp:
Thông sô" (tập hỢp mẹ) Đại lượng đắnh giá
Trang 1112 Kỉnh tế lượng ứng dụng
1.3 Phân phối giá trị trung bình của mẫu
Xét tập hợp các mẫu có kích thước n lấy ra từ tập hợp mẹ
Từ các mẫu, chúng ta có thể tính đưực các thông số thống kê như
giá trị trung bình, độ lệch chuẩn Các thông số sẽ thay đổi từ mẫu
này sang mẫu khác Ví dụ, các'giá trị trung bình tính từ các mẫu
nghiên cứu sẽ tạo nên một phân phối được gọi là phân phối giá trị
trung bình của mẫu Gọi X là giá trị trung bình của mẫu và nó tạo thành một phân phối, <Xjlà độ lệch chuẩn của phân phối Nếu tập
hợp mẹ là vô hạn và sự lấy mẫu sẽ được hoàn trả lại cho tập hợp
mẹ sau mỗi lần lấy Chúng ta có:
ưđc lượng sự phân phối của giá trị trung bình tính từ các mẫu có
kích thước n = 36 nhờ vào giá trị trung bình và độ lệch chuẩn của
tập hỢp mẹ như sau:
E( X ) = p = 50
Trong trường hợp kích thước tập hợp mẹ là hữu hạn và sự
lấy mẫu từ tập hợp này là không hoàn lại, giá trị của <Tj, trong
trường hợp này, phải thêm vào giá trị hiệu chỉnh để kể đến sự thay
đổi kích thước của tập hợp mẹ Trong thực tế ứng dụng, nếu n <
5%N (với N là kích thước tập hợp mẹ) sự hiệu chỉnh này có thể bỏ
qua Trong trường hợp ngược lại, nến n > 5%N, giá trị ơ~x có kể đến
hiệu chỉnh được tính như sau:
Trang 12Khoảng tin cậy 13
ơ ỉ' 7 ^ v ã^ t
Nhận xét: ơ ị = ơ k h i n = ì
Trong trường hợp nếu độ lệch chuẩn ơ của tập hợp mẹ
không biết, chúng ta có thể ước lượng độ lệch chuẩn của mẫu Để
phân biệt, chúng ta sẽ ký hiệu 5j cho trường hợp này :
5
Tương tự như trên, nếu tập hợp mẹ là hữu hạn và sự lấy mẫu
là không hoàn lại, ta phải thêm vào giá trị hiệu chỉnh:
í I n - n
Ví dụ 1: Một kiểm định viên chọn một mẫu ngẫu nhiên có
kích thước n=16 trong tập hợp mẹ có kích thước N = 100 Kết quả
tính toán độ lệch chuẩn cho thấy s = 57 Xác định độ lệch chuẩn
của phân phối các giá trị trung bình
S ĩ ~ ^ÌN -iVÏ6 V 100-1 - u , u
Ghi chú: Chúng ta phải kể đến giá trị hiệu chỉnh khi tính Sị n
>5%N Trong thực tế tính toán,người tù thừa nhận khi kích thước mẫu thỏa mãn điều kiện n >30, thì sự phân của giá trung bình theo gần
như phân phối chuẩn.
Ví dụ 2: Một kiểm định viên lấy một mẫu có kích thước n =
36 từ một tập hợp mẹ có kích thước N = 100 Giả sử độ lệch chuẩn
của tập hỢp mẹ chưa biết và độ lệch chuẩn của mẫu là s = 43 Nêu
giá trị trung binh của tập hợp mẹ là p = 260 Xác định xác suât để
giá trị trung bình của mẫu xét nhỏ hơn hoặc bằng 250 Giả sử giá trị
trung binh tuân theo phân phối chuẩn
Trang 13Trong mục này chúng ta giả thiết phân phối của giá trị trung
bình từ các mẫu tuân theo phân phối chuẩn
Đỉnh nghĩa:
Khoảng tin cậy của giá trị trung bình là một khoảng được
ước lượng từ giá trị trung bình của tập hợp mẹ, được thiết lập đối
xứng quanh giá trị trung bình của mẫu sao cho khoảng tin cậy này
chứa giá trị trung bình của tập hợp mẹ với một xác suất định trước
Ta cố thể giới thiệu định nghĩa trên nhờ vào sơ đồ sau đây:
Khoảng tin cậy
với e được gọi là biên độ
Hình 1.1
Các khoảng tin cậy của giá trị trung bình thừa nhận giá trị X
Trang 14Khoảng tin cậy 15
ở trung điểm Khi sự sử dụng phân phối chuẩn là hợp lý, khoảng tin cậy của’ giá trị trung bình được xác định bởi:
Ví dụ: Một cuộc thăm dò được thực hiện trong vòng một
tuần lễ về lương tháng nhận được của các công nhân trong một xí nghiệp có sô' công nhân viên làm việc được xem là lđn (tập hợp mẹ) Có n = 30 công nhân được chọn phỏng vân một cách ngẫu nhiên và người ta nhận thây là lương trung bình của họ là
X = 180ƯSD Độ lệch chuẩn của phân phối lương của 30 công nhân này là s = 14USD Chúng ta sẽ ước tính lương trung bình của tất cả công nhân của xí nghiệp nhờ vào khoảng tin cậy Giả sử chúng ta mong muôn có một hệ số tin cậy là 95% để khoảng tin cậy chứa giá trị lương trung bình của công nhân xí nghiệp
Trang 15Để đạt được độ tin cậy đặt ra, giám đốc nhân sự phải điều tra trên mẫu có kích thưổc tối thiểu là:
Trang 16Khoang tin cậy 17
1.6 Phân phối student và khoảng tin cộy của giá trị trung
Chúng ta đã biết khi kích thước mẫu xét n > 30, phân phối
chuẩn có thể được sử dụng để ước lượng giá trị trung bình của tập
hợp mẹ Nếu n < 30 ta phải đảm bảo trước tiên là tập hợp mẹ phải
thỏa mãn phân phối chuẩn và độ lệch chuẩn ơ đã biết nếu muốn áp
dụng phân phôi chuẩn trong tính toán Trong mục này, chúng ta sẽ
giải quyết trường hợp kích thước mẫu n là nhỏ và ơ là không biết
và tập hỢp mẹ là phân phối chuẩn
Như ta đã thấy, các giá trị trung bình của mẫu phải được
trung tâm hóa và chuẩn hóa: ( x - ụNếu ơ là không biết, giá
trị s } sẽ thay thê cho ơ ở mẫu số Điều này làm cho phân phối của
biến chuẩn hóa này không còn hình dạng của phân phối chuẩn
Trong trường hợp như vậy các giá trị Sj trong thực tế, sẽ
phân phối theo luật Student Mỗi phân phối này sẽ phụ thuộc vào
một thông số ta gọi là bậc tự do (dl) có giá trị bằng (n-1) với n là
kích thước của mẫu ngẫu nhiên
Tóm lại, phân phối Student thích hợp để xác định khoảng tin
cậy của giá trị trung bình cho bất kỳ kích thước mẫu đang xét trong
trường hợp ơ không biết Lưu ý rằng ngay trường hợp này tập hợp
mẹ phải có phân phối chuẩn, v ề lý thuyết, dạng đường cong biểu
thị phân phối Student sẽ tiệm cận về dạng phân phối chuẩn khi kích
thưđc mẫu n tăng
Ví dụ: Tuổi thọ trung bình của một mẫu gồm n = 10 bóng
dèn điện là X = 4000 giờ Độ lệch chuẩn của mẫu là s =200 giờ
Giả thiết phân bố tuổi thọ bóng đèn gần như là phân phối chuẩn
Chúng ta muốn ưđc tính tuổi thọ trung bình của toàn bộ bóng đèn
với một khoảng tin cậy là 95%
Với khoảng tin cậy là 95%, từ bảng tra phân bố Student (vì n
< 30) với độ tự do dl = n-1 = 9, ta có:
bình
tr n p m
Trang 1718 Kinh tế lượng ứng dụng
tdi = 2,262 và = —Ị= = —p= = 63.3
v ũ Vĩo
Do đó, khoảng tin cậy sẽ là:
3c +tut 5j = [3857giờ ; 4143giờ]
Kết luận:Vđi một độ tin cậy là 95% chúng ta có thể bảo đảm
giá trị trung bình của tuổi thọ các bóng đèn nằm trong khoảng
[3857giờ; 4143giờ]
1.7 Bất đẳng thức Bienaymé-Tchebychet: Khoảng tin cậy
của giá trị trung bình
Khi kích thước mẫu xét có n < 30 và chúng ta không thể giả
định phân phối của tập hợp mẹ là chuẩn, trong trường hợp này
chúng ta không thể thành lập khoảng tin cậy, ngay cả khi châp
nhận phân phối Stuđent
Định lý Bienaymé - Tchebycheí
Định lý được thể hiện bởi bất đẳng thức sau:
Chú ý trong bất đẳng thức Bienaymé-Tchebychef giá trị
hiện hữu Do đó, chúng ta phải biết ơ hoặc ưđc lượng bởi .Vj.
Bất đẳng thức Bienaymé-Tchebychef không được áp dụng rộng rãi
trong việc xác định khoảng tin cậy của giá trị trung bình, tuy vậy
đây là phương pháp duy nhất sẽ được sử dụng khi phân phối của
tập hợp mẹ không phù hợp với phân phối chuẩn và trường hợp kích
thước mẫu xét là nhỏ (n<30)
Để áp dụng bất đẳng thức Bienaymé-Tchebychef nhằm
thiết lập khoảng tin cậy của giá trị trung bình, ta đặt (1-1/k2) bằng
độ tin cậy mong muốn Tìm giá trị k và thiết lập khoảng tin cậy từ
các công thức thích hợp sau:
với k > 1
Trang 18Khoảng tin cậy 19
- nếu ơ biết ta xác định khoảng tin cậy từ ±
- nếu ơ không biết ta xác định khoảng tin cậy từ
Ví dụ: Trong một tuần thăm dò, 10 công nhân được chọn ngẫu
nhiên trong một xí nghiệp lớn (tập hợp mẹ có kích thước lớn) và người ta tính được lương trung binh từ mẫu 10 người này là = 180USD và độ lệch chuẩn là s = 14USD Xác định khoảng tin cậy tương ứng với độ tin cậy 95% chứa giá trị lương trung bình của toàn thể công nhân Xí nghiệp Giả thiết trong trường hợp này ta không thể chấp nhận phân phối lương công nhân là phân phối chuẩn
Trang 19trong trường hợp nếu chúng ta biết độ lệch chuẩn của hai tập hợp
mẹ, độ lệch chuẩn của phân bố biểu thị sự sai biệt hai giá trị trung bình xác định như sau:
và nẹu chúng ta không biết độ lệch chuẩn ở tập hợp mẹ, sự ưđc lượng giá trị độ lệch chuẩn của phân bố hiệu hai giá trị trung bình
Như vậy chúng ta sẽ tiến hành tính toán độ lệch chuẩn cho từng tập hợp mẹ riêng lẻ và hiệu chỉnh nó khi cần thiết (khi tập hợp
mẹ hữu hạn) như đã trình bày ở trước
Ví dụ: Lương hàng tuần trung bình của công nhân Xí nghiệp
A tính từ một mẫu khảo sát ni=30 cho biết 3ẽị = 180 nghìn đồng Độlệch chuẩn là S| = 14 nghìn đồng Đối với Xí nghiệp B nghiên cứu
cho một mẫu khảo sát ĨÌ 2 = 40 cho biết x 2 = 170 nghìn đồng và độ
lệch chuẩn S2 = 10 nghìn đồng Xác lập khoảng tin cậy với độ tin cậy 99% cho sự sai biệt hai giá trị lương trung bình
Trang 20Khoảng tin cậy 21
Với độ tin cậy là 99%, chúng ta có thể kết luận là lương
trung bình hàng tuần của công nhân Xí nghiệp A cao hơn ở Xí
nghiệp B và sự khác biệt đó nằm trong khoảng [2,23 nghìn đồng ; 17,77 nghìn đồng]
1.9 Khoảng tin cộy cho độ sai biệt hai gỉá trị trung bình dựa vào phân phối student
Giống như phần trước, phân phối Student sẽ được sử dụng thay cho phân phối chuẩn khi kích thươc mẫu của ta bé (n<30) và
độ lệch chuẩn ơ là không biết, mặc dù phân phối của tập hợp mẹ là
phân phối chuẩn Trong trường hợp này, bậc tự do sẽ là (ni +Ũ 2 -2) với ni , n2 lần lượt là kích thước của mẫu 1 và mẫu 2 Khoảng tin cậy sẽ được xác định bởi:
te - * 2 ) ± 'c //V ĩ2Bậc tự do:
ni + n2 -2 = 16Với độ tin cậy là 90% và bậc tự do là 16, từ bảng tra của phân phối Student, ta có:
Trang 2122 Kinh tê lượng ứng dụng
0 ,= / ,, =1.746và:
Do đó:
5 j _ j X ì - X 2 \ x \ x ĩ = 7 Ị s ĩ + s ĩ =108,65
Từ đó khoảng tin cậy sẽ là:
(4000 - 4600) ± 1,746*108,65 = [ - 789,7 giờ; - 410,3giờ )
Kết luận:Với độ tin cậy là 90%, chúng ta có thể nói tuổi thọ
trung bình của bóng đèn hiệu B lớn hơn bóng đèn hiệu A và sự sai
biệt đó nằm trong khoảng [410,3giờ ;789,7giờ]
1.10 Khoảng tin cộy của một tỷ lệ dựa vào phân phối
Ta biết rằng phân phối nhị thức có tỷ lệ p, sẽ được tính xấp
xỉ và sẽ thay thế bởi phân phối chuẩn khi n > 30 và np > 5 (xem lại
lý thuyết về các luật phân phối) Gọi p là tỷ lệ mẫu quan sát được,
ta có thể ước tính độ lệch chuẩn liên quan đến sự phân phối của các
tỷ lệ như sau:
Trong trường hợp n > 5%N, với N là kích thước tập hợp mẹ,
và ta phải hiệu chỉnh giá trị của s^nhưsau:
chuấn
Trang 22Khoảng tin cậy 23
Và khoảng tin cậy cho tỷ lệ đưực xác điịnh như sau:
p ±
Ví dụ: Một nhân viên thương mại muốn nghiên cứu thị
trường dao cạo râu Chọn ngẫu nhiên 100 người dàn ông trong một thành phố lđn và nhận thây là 40% người được phỏng vấn sử dụng dao cạo râu hiệu A Xác định khoảng tin cậy cho tỷ lệ đàn ông sử dụng dao cạo râu hiệu A với độ tin cậy là 95%
Ta có:
Độ lệch chuẩn của các phân phối tỷ lệ là:
Vđi độ tin cậy là 95%, từ bảng phân phối chuẩn ta có
z = 1,96
Kết luận: Với độ tin cậy là 95%, ta có thể ước lượng là tỷ lệ đàn
ông sử dụng dao cạo râu hiệu A trong thànhi phố biến động trong khoảng [0,3;0,5J
1.11 Xác định kích thước mẫu cần thiết để ước lượng tỷ
Do đó khoảng tin cậy sẽ là:
lệ
Gọi 71 là ước lượng sơ bộ của tỷ lệ đang xét, tai có:
Trang 23Trong trường hợp không thể đưa ra được ưđc lượng giá trị n,
ta có thể giả thiết là ( = 0,5 Với giả thiết này sẽ đưa đến việc xác định n lđn nhất so với bất kỳ giá trị nào của 71 (thiên về an toàn) Ta
có trong trường hợp này:
1.12 Khoảng tin cộy cho $ự sai biệt giữa hai tỷ lệ
Cũng dựa trên lý luận tương tự cho tỷ lệ, ở đây chúng ta cũng nhờ vào phân phôi chuẩn Khoảng tin cậy cho sự sai biệt của hai tỷ lệ tương ứng trong hai tập hợp mẹ là:
Trang 24Khoáng tin cậy 25
BÀI TẬP
Bài 1 Chuyên viên kiểm tra chất lượng đèn hình của hãng
Sony biết rằng tuổi thọ trung bình của nó là P = 9000 giờ và độ lệch
chuẩn ơ = 5000 giờ Xác định giá trị trung bình và độ lệch chuẩn
của phân phối giá trị trung bình từ các mẫu lấy có kích thước n =
100.
Giải:
e { xj = M = 9000 giờ
ơ 5000Vĩõõ = 50 giờ
Bài 2 Một chuyên viên phân tích tài chính chọn ngẫu nhiên
10% trong tổng số 300 hóa đơn bán hàng của công ty Giá trị trung
bình tính từ mẫu là X = 148,5ƯSD và độ lệch chuẩn là s = 35,7USD ước lượng độ lệch chuẩn của giá trị trung bình của phân
phối mẫu có kích thước như trên
Giải:
Do n > 5%N, độ lệch chuẩn của giá trị trung bình phải được hiệu
chỉnh:
Í Ặ E i u “ ¿5 lm _ -3 0 USDs’ ■ -f> V N - 1 M V 300 - I '
Bài 3 Giả sử giá trị trung bình của tập hợp mẹ gồm 300 hóa
đơn trong bài tập trên là |i= 138USD Xác định xác suất để lấy ra
một mẫu có giá trị trung bình ít nhât là 148.5USD
Giải:
Giả thiết xem đây là một phân phối chuẩn Ta có:
P ( X > 148,5) = P(^—^ > 148>^ 138) = P (Z > 1,69)
Trang 2526 Kinh tếlưựng dụng
Từ bảng tra của phân phối chuẩn ta có:
P( X > 148,5) = P(Z > 1,69) = 0,0455
Bài 4 Giả sử độ lệch chuẩn của tuổi thọ bóng đèn Điện Quang là cr
= 500 giờ Giả thiết tuổi thọ của bóng đèn tuân theo phân phối
chuẩn và ta không biết giá trị trung bình của nó Trong một mẫu
chọn ngẫu nhiên có kích thước n=15, người ta tính được tuổi thọ
trung bình của nó là x=8900 giờ Xác định (a) khoảng tin cậy với
độ tin cậy là 95% và (b) với độ tin cậy là 90% của tuổi thọ trung
bình của bóng đèn do Điện Quang sản xuất
Kết luận:Từ kết quả tính từ mẫu trên, ta có thể nói với độ tin cậy
95%>, giá trị tuổi thọ trung bình của bóng đèn Điện Quang sẽ nằm
trong khoảng [ 8647giờ ; 9153giờ ]
(b) Tương tự cách tính cho độ tin cậy 90%:
8900 ± 1,65.129,2 = [ 8687giờ ; 9113giờ]
Nhận xét:Cùng xuất phát từ một mẫu khảo sát, xác suất đê giá
trung bình của tuổi thọ rơi vào khoảng cậy bé ( trường hợp b) sẽ
nhỏ hơn là rơi vào khoảng tin cậy lớn (trường hợp
Trang 26Khoảng tin cậy 27
Bài 5 Lấy lại ví dụ trên và giả thiết là phân phối tập hợp mẹ là
không theo phân phối chuẩn Giả sử là trong một mẫu có kích thước
n = 35, người ta quan sát được tuổi thọ trung bình X 8900 giờ Xác
định khoảng tin cậy với độ tin cậy là 95% cho phép ước lượng giá
trị trung bình của tập hợp rnẹ
Giải:
Ở đây ta vẫn áp dụng phân phối chuẩn bởi vl chúng ta có
thể nhờ vào định lý giới hạn trung tâm khi n > 30, khi đó phân phối
giá trị trung bình tính từ các mẫu lấy ra tử tập hợp mẹ, có thể xem
là phân phối chuẩn mặc dù tập hợp mẹ là không thỏa
Ta có:
x±Zơ- x = 8900 + 1 9 6 = [ 8734giờ ; 9066giờ ]
V35 Bài 6 Lây lại bài tập trên nhưng với giả thiết mới là tập hợp mẹ
tuân theo phân phối chuẩn và ta không biết độ lệch chuẩn của nó
Từ một mẫu có kích thước n = 35 ta tính được giờ và độ lệch chuẩn
s = 500 giờ Xác định khoảng tin cậy với độ tin cậy là 90% cho giá
Bài 7 Một chuyên viên nghiên cứu thương mại khảo sát 100 khách
hàng trong số 400 khách hàng vào mua ở cửa hàng Tính toán trên
100 khách hàng này cho thây chi tiêu trung bình để mua hàng là
X =1000 USD và độ lệch chuẩn là s = 1500 USD Xác định (a)
khoảng tin cậy với độ tin cậy 95% giá trị trung bình đã sử dụng của
400 khách hàng và (b) tổng giá trị sử dụng bởi 400 khách hàng này
Giải:
Có thể xem phân phối của tập hợp mẹ là phân phối chuẩn,
do kích thước mẫu lấy ra là lớn (n> 5%N), phải hiệu chỉnh giá trị độ
lệch chuẩn
Trang 27Bài 8 Dự định md một cửa hàng bán đồ lưu niệm tại một phi
trường, chuyên viên phân tích tài chính của Công ty z muốn ước
lượng giá trị tiền trung bình của du khách đã sử dụng cho mục đích
này Quan sát sô" liệu từ một cửa hàng tương tự, ông ta ước tính
được độ lệch chuẩn của giá trị tiêu tiền trung bình là ơ = 0,8 Xác
định kích thưđc cần phải có của mẫu khảo sát để cho sự lệch quanh
giá trị tiêu tiền trung bình thực không quá e = 0,25 với độ tin cậy là
Bài 9 Khảo sát tuổi thọ trung bình của đèn hình TV Sony được thực
hiện trên một mẫu có kích thước n =15 cho thây X = 8900 giờ và
độ lệch chuẩn của nó là s = 500 giờ Xác định khoảng tin cậy dể
ưđc lượng giá trị trung bình của tập hợp mẹ với độ tin cậy là (a)
Ở đây do a của tập hợp mẹ là không biết và mẫu có kích
thước bé (n < 30), ta phải sử dụng phân phối Student thay vì phân
phối chuẩn
Trang 28Khoảng tin cậy 29(a) với độ tin cậy là 95%, từ bảng tra của bảng phân phối Student với độ tự do dl = n-1 = 14, ta có tdi = 2,145
lỉài 10 Một chuyên viên nghiên cứu thương mại phỏng vấn
ni = 200 trong số N| = 900 khách hàng đến mua một cách ngẫu
nhiên Từ mẫu phỏng vấn này ông ta tính được tiền bình quân mua
hàng của khách là X, =19.6 USD và độ lệch chuẩn S| = 8,4 USD.Trong một cuộc phỏng vân khác trên n2 = 100 khách hàng trên tổng
số Na = 400, ông ta tính được x2 =24.57USD và S2 =6,6 USD Xác định (a), trường hợp khoảng tin cậy của giá trị trung bình với độ tin cậy là 95% và (b) khoảng tin cậy cho sự sai biệt hai giá trị trung bình cho 2 mẫu phỏng vấn với độ tin cậy là 90%
Trang 29Bài 11 Một điều tra trên 50 hộ gia đình lây ngẫu nhiên ở thành phố
A cho thây thu nhập bình quân tháng là X, =13800 FF Độ lệch chuẩn của mẫu là S| =2200 FF ở thành phố B, cũng với mẫu gồm
50 hộ gia đình cho thấy x2 =14600 FF và độ lệch chuẩn s = 2800
FF Xác định khoảng tin cậy cho sự sai biệt của thu nhập trung bình của dân ở hai thành phố với độ tin cậy là 95%
Trang 30Khoảng tin cậy 31Khoảng tin cậy cho sai biệt giá trị trung Minh là:
(x, - x 2)±Zs.Xi_h =(13800-146(0*0) ±1,96(503,66)
= [-1787,1 7:187,17]
Kết luận:Với độ tin cậy là 95%, chúng ta có thể nói là thu nhập
hình quân của dân ở thành phố B cao h<ơ>n dân ở thành phố A một giá trị là 1787,17 Trong khi đó thu nhãp bình quân của dân ở thành phố A vượt hdn thành phô B một giá trị Là 187,17 Tóm lại, với độ tin cậy 95%, ta có thể kết luận có khả năng không có sự sai biệt về thu nhập bình quân của dân ỏ 2 thành phô A và B
Bài 12 Khối lượng trung bình của nho chứa trong mỗi hộp đến từ
nông trường A được ước tính từ một mẫu lấy ngẫu nhiên gồm 12 hộp (ni = 12) Ta thấy X, =159.67gram và S| = 1,5 gram Tương tự
từ nông trường B vđi một mẫu n2 = 15 hộp, ta thấy x 2 = 161.4 gram
và $2 = 0,9 gram Chúng ta giả thiết là khối lượng nho trong mỗi hộp là tuân theo phân phối chuẩn Xác định khoảng tin cậy cho sự sai biệt hai giá trị trung bình của nho từ hai nông trường A và B với
Giải:
Vì 111, n2 < 30 ta sử dụng phân phối Student cho sự sai biệt
của giá trị trung bình Khoảng tin cậy sẽ được xác định bởi:
(^1 ~ ĩ)
-Bậc tự do:
dl = n I + 112 - 2 = 25Với độ tin cậy là 90% và bậc tự do 25, từ bảng tra phân phối Student ta có tell = 1,708 Ngoài ra:
Trang 31Kết luận:Với độ tin cậy là 90%, ta eó thể nói khôi lượng trung
bình của nho trong hộp đến từ nông trường B vượt quá giá trị của
nông trường A và sự sai biệt này nằm trong khoảng [0,89 ; 2,57]
Bài 13 Một khảo sát được tiến hành trên tài liệu lưu trữ của 230
học sinh ở một trường chuyên nghiệp, trong số toàn bộ học sinh tiếp
tục theo học cấp 3 ngành hành chính Người ta nhận thấy có 54
trường hợp đã có bằng cấp 2 ngành hành chính Xác định khoảng
tin cậy cho tỷ lệ tất cả các học sinh cấp 3 ngành hành chính đã cổ
được bằng cấp 2 với độ tin cậy là 90%
Lưu ý:Ờ đây ta giả sử là số lượng toàn bộ s ố lượng học sinh theo học ngành hành chánh là lớn, do đó không cần phải hiệu chỉnh độ
lệch chuẩn S - trên mẫu nghiên cứu.
Giải:
Ta có:
54
p = — = 0,235 230
Độ lệch chuẩn của phân phôi là:
p i1 - p)
n
Khoảng tin cậy sẽ là:
p ± Z s p = 0,235 ± 1,65(0,028)= [o,19;0,2 8 ]
Trang 32Khoảng tin cậy 33
Bài 14 Một thăm dò ý kiến của các nhià doanh nghiệp tư nhân về một dự luật về thuế doanh thu được Tổng Cục Thống kê tiến hành
ở thành phố Hồ Chí Minh và ỏ Hà Nội (được đánh giá là 2 thành
phố chính tập trung các nhà doanh nghiệp tư nhân quan trọng) Tại
mỗi thành phố, 100 nhà doanh nghiệp được chọn ngẫu nhiên để
phỏng vấn Tại thành phố Hồ Chí Minh, 70% nhà doanh nghiệp tán thành dự luật, trong khi đó là 50% tán thành ở thành phố Hà Nội Xác định khoảng tin cậy cho sự sai biệt 2 tỉ lệ về sự chấp thuận dự luật này với độ tin cậy là 95%
Giải:
Tại thành phố Hồ Chí Minh:
4 _ M i £ị) „ « 2 ^ = 0 , 0 0 2 1
P\ n, 100Tại thành phố Hà Nội:
Kết luận:Vđi độ tin cậy là 95%, ta có thể nói sự sai biệt về hai tỷ
lệ đồng ý cho dự luật của cả hai thành phố là nằm trong khoảng [ 0,07 ; 0,33]
Bài 15 Một Xí nghiệp sản xuất nước uống có chứa đường, muốn kiểm tra định kỳ lượng đường có trong sản phẩm, để từ đó có quyêt định tiến hành hay không bảo trì thiết bị đo và cung cấp đường của 'dây chuyền nếu cần thiết Sản phẩm được đựng vào những chai 1,5
litre Tiêu chuẩn chấp nhận là tỷ lệ đường trong chai không vượt
Trang 3334 Kỉnh tế lượng ứng dụng
quá 45g/l vđi tỷ lệ là 5% trong tổng số mẫu khảo sát Chọn 60 chai
một cách ngẫu nhiên trong lô hàng và người ta nhận thấy có 5 chai
vượt quá 45g/l và 2 chai có hàm lượng dưới 35g/l Anh (Chì) hãy
xác định với khoảng tin cậy 99% để tỷ lệ số chai không đạt yêu cầu
nằm trong khoảng đó
Giải:
Ta biết là F (tần số của mẫu là một thông số dùng để ước lượng) là
không lệch và hội tụ của một tỷ lệ p trong tập hợp mẹ Từ đó ta có
thể dùng F để ước lượng các đại lượng chưa biết p, F
a - Ưđc lượng khoảng tin cậy cho p
Ta có:
a = 99% = P ( p - e < F < p + e) với e là biên độ của khoảng tin cậy
Ngoài ra ta biết F tuân theo luật phân phối chuẩn LG (p,
(trong trường hợp mẫu lđn)
Để đánh giá p, ta có thể sử dụng giá trị gần đúng cho từ mẫu khảo
Kết luận: Chúng ta có 99% khả năng là tỷ lệ của các chai có hàm
lượng đừng vượt quá 45g/l sẽ nằm trong khoảng [ 0 ; 0,175 ].
Trang 34Khoảng tin cậy 35
Với lý luận hoàn toàn tương tự, ta sẽ có được e ’ = 0,0595, từ đó
khoảng tin cậy cho r là:
[ 0,033 - 0,059 ; 0,033 + 0,059 ] = [ 0 ; 0,092 ]
Kết luận: Chúng ta có 99% khả năng là tỷ lệ của các chai có hàm
lượng đường dưới 35g/l sẽ nằm trong khoảng [ 0 ; 0,092 ]
thành phẩm Khối lượng mỗi bao dự kiến là 20 kg, và ta chấp nhận
là trọng lượng thực của mỗi bao (x) là một biến tuân theo phần phối chuẩn.Hãy xác định khoảng tin cậy xung quanh giá trị E (x) để khôi lượng quan sát cho một mẫu gồm 10 bao lấy ngẫu nhiên, nằm trong khoảng đó vđi độ tin cậy là 95% trong các trường hợp sau:
(a) ơ2 phương sai của khối lượng gạo đưa từ thiết bị vào giả sử đã biết là 10 và (b) trong trường hợp ta không biết ơ2 và phải ước lượng nó từ mẫu khảo sát là:
Trang 35Chúng ta sẽ có 95% khả năng là trọng lượng trung bình của 10 bao gạọ.nói trên nằm trong khoảng [18,04 kg ; 21,96 kg ].
b - Trong trường hỢp ơ không biết
Ở đây phương sai được ưđc tính từ mẫu là 5 2 = 10, do đó T sẽ tuân theo phân phối Student vđi độ tự do dl = 10 - 1 = 9 Và ta có:
Từ bảng tra phân phối Student ta có:
định khoảng tin cậy, với độ tin cậy là 90%, để cho tỷ lệ từ một mẫu khảo sát là 900 người là nằm trong khoảng đó
Hướng dẫn:
Ta có:
90% = p ( E(X) -e < F < E(X) + e )
Trang 36Từ bảng tra phân phối chuẩn ta có:
Chúng ta có 90% khả năng là tỷ lệ người ủng hộ giám đốc công ty nằm trong khoảng
lỉài 18 Một xe tải chở 50 người Khối lượng của một người lây ngẫu nhiên trong sô khách hàng là 70 kg và độ lệch chuẩn là 10 kg Tính xác suất một cách gần đúng, để cho khối lượng tổng cộng của
họ vượt quá 3600kg
Hướng dẫn:
Gọi X là khối lượng của khách hàng, đây là một biến ngẫu nhiên biến thiên chung quanh giá trị trung bình = 70 kg
Do n = 50, kích thước mẫu tươiĩg đối lớn (> 30) và ơ = 10 đã biết,
do đó ta có thể xem như X tuân theo phân phối chuẩn LG ( X ,
~ L ) Ta tính xác suất để khối lượng tổng cộng cỏa họ vượt quá
<7Khoảng tin cậy trong trường hợp này sẽ là:
Trang 37ngẫu nhiên tuân theo luật phân phối chuẩn có' độ lệch chuẩn là 0,3
mg/1 Vđi một mẫu khảo sát, ta tiến hành đo 10 lần Tính xác suất
để sai số trên giá trị trung bình của 10 lần đo nhỏ hơn 0,1 mg/l
Cùng câu hỏi cho trường hợp 50 lần đo (giả thiết rằng sai số các lần
đọ liên tiếp là độc lập với nhau)
P ( -1,054 < T < 1,054 )
Trang 38a, Khảo sát một mẫu gồm n trẻ sinh ra trong thành phố này và ta
gọi pn là tỷ lệ sinh con trai tương ứng
Xác định khoảng tin cậy cho Pn [a, hj với độ tin cậy là 99% xung
quanh tỷ lệ trung bình p trong các trường hợp ni =100, t \2 =400, n.3
=2500, n4=10000
b - Xác định kích thước mẫu tối thiểu pllẳi lây để phương sai của
khoảng tin cậy như định nghĩa trên, lớn hơn hoặc bằng 0,5%
Trang 39Bài 21 Xét một thiết bị chế tạo các loại đồng tiền ưòn bằng kim
loại Đường kinh d của các đồng tiền là một biến tuân theo phân bố chuẩn vđi độ lệch chuẩn là 1,5 mm Người ta chọn ngẫu nhiên một mẫu gồm 9 đồng tiền Đo kích thước đường kinh (mm) của chúng cho ta kết quả sau: 60,4 - 60,8 - 59,0 - 61,6 - 62,6 - 58,3 - 59,2 - 60,2
a Xác định khoảng tin cậy chứa giá trị đường kính trung bình m, vđi độ tin cậy là 95%
b Cũng như câu hỏi trên, nhưng trong trường hợp này giả thiết ta không biết độ lệch chuẩn
-a.Ta có:
0,95 = P ( m - e < X < m + e ) = P ( - e < X - m < e )
Trang 40Khoảng tin cậy