Chap 8-2 Mục tiêu chương Sau khi hoàn thành chương này, bạn sẽ có thể: Phân biệt giữa ước lượng điểm và ước lượng khoảng tin cậy Xây dựng và giải thích ước lượng khoảng tin cậy cho
Trang 1Chap 8-1Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc.
Ước lượng khoảng tin cậy
Chương 8
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-2
Mục tiêu chương
Sau khi hoàn thành chương này, bạn sẽ có thể:
Phân biệt giữa ước lượng điểm và ước lượng
khoảng tin cậy
Xây dựng và giải thích ước lượng khoảng tin cậy
cho một trung bình tổng thể sử dụng cả phân
phối Z và t
Xây dựng và giải thích ước lượng khoảng tin cậy
cho một tỷ lệ tổng thể riêng lẻ
Khoảng tin cậy
Nội dung của chương này
Khoảng tin cậy cho một Trung bình tổng
thể, μ
Khi phương sai tổng thể σ 2 đã biết
Khi phương sai tổng thể σ 2 chưa biết
Khoảng tin cậy cho một Tỷ lệ tổng thể,
(mẫu lớn)
pˆ
Trang 2Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-4
Ước lượng điểm và khoảng
Thông thường một tham số tổng thể mà ta
quan tâm thì chưa biết
Một thống kê mẫu thích hợp được sử dụng để ước
tính tham số tổng thể.
Một ước lượng (estimator) của một tham số
tổng thể là
Một biến ngẫu nhiên phụ thuộc vào thông tin mẫu
Giá trị của nó cung cấp giá trị xấp xỉ cho tham số
chưa biết đó
Một giá trị cụ thể của biến ngẫu nhiên đó được
gọi là một giá trị ước lượng (estimate)
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-5
Ước lượng điểm và khoảng
Một giá trị ước lượng điểm là một con số
Độ rộng của khoảng tin cậy
Chúng ta có thể ước lượng
một tham số tổng thể …
Ước lượng điểm
bằng một thống kê mẫu (một ước lượng điểm)
Trung bình
x μ
pˆ
Trang 3Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-7
Không chệch (Unbiasedness)
Một ước lượng điểm được gọi là một ước
lượng không chệch của tham số nếu giá trị
kỳ vọng, hay trung bình, của phân phối mẫu
Ví dụ:
Trung bình mẫu là một ước lượng không chệch của μ
Phương sai mẫu là một ước lượng không chệch của σ2
Tỷ lệ mẫu là một ước lượng không chệch của P
θˆ
θˆ
θ ) θ E( ˆ
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-8
chệch:
1
θˆ θ
Một giá trị cụ thể của ước lượng thì không chính xác
bằng với tham số tổng thể Nó có thể ước lượng cao hơn (overestimate) hay thấp hơn (underestimate).
Khi lặp lại quy trình lấy mẫu nhiều lần, sau đó, giá trị
trung bình (kỳ vọng) của các ước lượng bằng với tham số tổng thể.
Nó có “khả năng ước lượng tham số tổng thể chính
xác về mặt trung bình”.
Trang 4Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-10
Chệch (Bias)
Độ chệch của được xác định bằng chênh
lệch giữa trung bình của nó với
Độ chệch của một ước lượng không chệch
bằng 0
θˆ
θˆ
θ ) θ E(
) θ Bias( ˆ ˆ
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-11
Tính vững/hội tụ (Consistency)
Gọi là một ước lượng của
lệch giữa giá trị kỳ vọng của và giảm dần
khi cỡ mẫu càng tăng
Ta mong muốc tính vững khi không thể thu
được ước lượng không chệch
θˆ
θˆ
θˆ
Ước lượng hiệu quả nhất
Giả sử có một số ước lượng không chệch của
Ước lượng hiệu quả nhất hay ước lượng không chệch có
phương sai nhỏ nhất của là ước lượng không chệch có
giá trị của phương sai nhỏ nhất
Gọi và là hai ước lượng không chệch của , dựa
trên cùng số quan sát mẫu Thế thì,
được gọi là hiệu quả hơn nếu
Hiệu quả tương đối của theo là tỳ số giữa phương
sai của chúng:
) θ Var(
) θ Var( ˆ 1 ˆ2
) θ Var(
) θ Var(
Efficiency Relative
12ˆ
Trang 5Ước lượng không chệch: Ví dụ
Gọi x 1 , x 2 , …, x n , là một mẫu ngẫu nhiên từ một
tổng thể lớn có phân phối là N(, 2 ) Trung
bình hay trung vị mẫu nên là công cụ ước
lượng tốt hơn của trung bình tổng thể?
Chúng ta biết rằng,X là ước lượng không chệch của
với phương sai:
Trung vị mẫu cũng là một ước lượng không chệch
của và phương sai là
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-13
var X n
Một số thuộc tính cho các ước lượng
điểm tiêu biểu
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-14
Khoảng tin cậy
Bao nhiêu sự không chắc chắn có liên quan
đến ước lượng điểm của một tham số tổng
thể?
Ước lượng khoảng cung cấp nhiều thông tin
về một đặc điểm tổng thể hơn là ước lượng
điểm
Ước lượng khoảng thời gian như vậy được
gọi là khoảng tin cậy
Trang 6Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-16
Ước lượng khoảng tin cậy
Một khoảng tin cậy cung cấp một khoảng
các giá trị :
Đưa vào xem xét sự thay đổi trong thống kê
mẫu từ mẫu này sang mẫu khác
Dựa trên quan sát từ 1 mẫu
Cung cấp thông tin về sự gần gũi với các
tham số tổng thể chưa biết
Được phát biểu dưới dạng mức độ tin cậy
Không bao giờ tin cậy đến 100%
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-17
Khoảng tin cậy và Độ tin cậy
Nếu P(a < < b) = 1 - thế thì khoảng từ a
đến b được gọi là một khoảng tin cậy 100(1
-)% của
Lượng (1 - ) được gọi là độ tin cậy của
khoảng tin cậy ( nằm giữa 0 và 1)
Trong các mẫu lặp lại của tổng thể, giá trị thực của
tham số sẽ được chứa trong 100(1 - )% các khoảng được tính theo cách này
Khoảng tin cậy được tính theo cách này được viết là
a < < b với độ tin cậy 100(1 - )%.
Quy trình ước lượng
Trang 7Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-19
Độ tin cậy, (1-)
Giả sử độ tin cậy = 95%
Được viết là (1 - ) = 0,95
Giải thích bằng tần số tương đối:
Từ các mẫu lặp lại, 95% của tất cả các khoảng
tin cậy có thể được xây dựng sẽ chứa tham số thực chưa biết
Một khoảng cụ thể sẽ chứa hoặc sẽ không
Giá trị của hệ số độ tin cậy phụ thuộc vào
mức độ tin cậy mong muốn; hay
ME: biên sai số là hệ số sai số (margin of error)
Ước lượng điểm (Hệ số tin cậy)(Sai số chuẩn)
σ 2 chưa biết
Khoảng Tin cậy
Tỷ lệ Tổng thể
σ 2 đã biết
Trang 8Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-22
Khoảng tin cậy cho μ (σ 2 đã biết)
Giả định
Phương sai tổng thể σ 2 đã biết, trung bình chưa biết
Tổng thể theo phân phối chuẩn
Nếu tổng thể không chuẩn, dùng quy luật mẫu lớn
Ước lượng một khoảng tin cậy 100(1 - )% of
của trung bình tổng thể:
Ta biết:
/
x Z n
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-23
Khoảng tin cậy cho μ (σ 2 đã biết)
Ước lượng khoảng tin cậy:
(trong đó z/2là giá trị của phân phối chuẩn có xác suất /2 ở mỗi
đuôi)
n
σ z x μ n
σ z
1 1
Biên sai số (Margin of Error)
Khoảng tin cậy,
Cũng có thể được viết
Độ rộng của khoảng tin cậy , w, bằng 2 lần biên sai số
n
σ z x μ n
σ z
ME α/2
Trang 9Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-25
Thu nhỏ ME
Biên sai số có thể được thu nhỏ nếu:
Độ lệch chuẩn tổng thể có thể được giảm (σ↓)
Cỡ mẫu tăng (n↑)
Độ tin cậy giảm, (1 – ) ↓
n
σ z
Tìm z 0,025 = 1,96 từ bảng phân phối chuẩn tắc
Những độ tin cậy phổ biến
Những độ tin cậy thường được sử dụng là
90%, 95% và 99%
Confidence Level
Confidence Coefficient, Z /2value
1,28 1,645 1,96 2,33 2,58 3,08
0,80 0,90 0,95 0,98 0,99 0,998
Trang 10Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-28
chuẩn lớn có điện trở trung bình là 2,20
ohms Chúng ta biết từ thử nghiệm trước
đây rằng độ lệch chuẩn dân số là 0,35
ohms
Xác định khoảng tin cậy 95% cho điện trở
trung bình thực của tổng thể các mạch.
2.4068 μ 1.9932
.2068 2.20
) 11 (.35/
1.96 2.20 n
σ z x
Trang 11Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-31
hay không nằm trong, 95% các khoảng
được xây dựng theo cách này sẽ chứa giá
trị trung bình thực
Ví dụ
Thời gian mua sắm của khách hàng tại một
trung tâm mua sắm thường theo phân phối
chuẩn với = 20 phút Một mẫu ngẫu nhiên
gồm 64 người mua hàng có thời gian trung bình
là 75 phút Thiết lập khoảng tin cậy 95% cho
Khoảng Tin cậy
Tỷ lệ tổng thể
σ 2 chưa biết
σ 2 đã biết
Trang 12Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-34
Phân phối t của Student
Xem xét một mẫu ngẫu nhiên có n quan sát
Có trung bình x và độ lệch chuẩn s
Từ một tổng thể chuẩn có trung bình μ
Thay thế độ lệch chuẩn tổng thể bằng ước lượng
của nó s từ biến Z, vậy thì biến
theo phân phối t của Student có bậc tự do (n - 1)
n s/
μ x
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-35
Nếu độ lệch chuẩn dân số chưa biết,
chúng ta có thể thay thế bằng độ lệch
chuẩn mẫu, s
Điều này làm tăng thêm độ không chắc
chắn, vì s thay đổi từ mẫu này sang mẫu
khác
Nên chúng ta dùng phân phối t thay vì
phân phối chuẩn
Khoảng tin cậy cho μ (σ 2 chưa biết)
Giả định
Độ lệch chuẩn dân số là chưa biết
Tổng thể theo phân phối chuẩn
Nếu tổng thể không chuẩn, sử dụng quy luật mẫu lớn
Dùng phân phối t của Student
Ước lượng khoảng tin cậy:
trong đó tn-1,α/2là giá trị tới hạn (critical value) của phân phối t có
S t
x n - 1, α/2 n - 1, α/2
(continued)
α/2 ) t P(t
Trang 13Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-37
Phân phối t của Student
t là một họ của các phân phối
Giá trị t phụ thuộc vào bậc tự do (d.f.)
Số lượng quan sát tự do thay đổi sau khi tính trung bình mẫu
d.f = n - 1
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-38
Phân phối t của Student
t
0
t (df = 5)
t (df = 13) phân phối t có hình chuông
và đối xứng, nhưng có đuôi
đuôi dẹp hơn so với phân
phối chuẩn
Chuẩn tắc (t có df = ∞)
Lưu ý: t Z khi n tăng
Phân phối t của Student
The t distribution is more dispersed since the
uncertainty caused by replacing the known
population standard deviation with its sample
estimator.
As the d.f is large, the t distribution approaches
the standard normal distribution
For large sample, the sample standard deviation is a
very precise estimator of the population standard deviation
Trang 14Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-40
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-41
Giá trị phân phối t
một mẫu ngẫu nhiên có n = 25 có x = 50 và
s = 8 Xây dựng khoảng tin cậy 95% cho μ
d.f = n – 1 = 24, nên
Khoảng tin cậy là
2.0639 t
t n 1, α/2 24,.025
53.302 μ
46.698
25
8 (2.0639) 50
μ 25
8 (2.0639) 50
n
S t x μ n
S t
Trang 15Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-43
Khoảng tin cậy
Population Mean
σ Unknown
Confidence Intervals
Population Proportion
σ Known
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-44
Khoảng tin cậy cho tỷ lệ
tổng thể, p
Tỷ lệ sinh viên tiếp tục chương trình thạc sĩ
sau khi hoàn thành bằng cử nhân là bao
Sử dụng phân phối nhị thức, đặt biểu thị tỷ
lệ thành công trong n thử nghiệm độc lập với
xác suất thành công P.
Một ước lượng khoảng cho tỷ lệ tổng thể (P)
có thể được tính bằng cách bổ sung thêm
mức độ không chắc chắn cho sự không chắc
chắn của tỷ lệ mẫu ( ) pˆ
ˆp
Trang 16Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-46
Khoảng tin cậy cho tỷ lệ tổng
thể, p
Hãy nhớ rằng đối với mẫu lớn, phân phối
biến ngẫu nhiên :
xấp xỉ phân phối chuẩn tắc, theo đó:
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-47
Khoảng tin cậy cho tỷ lệ tổng
thể, p
Hãy nhớ rằng phân phối tỷ lệ mẫu xấp xỉ
chuẩn nếu cỡ mẫu lớn, với độ lệch chuẩn
Chúng ta sẽ ước lượng tỷ lệ này bằng số liệu
mẫu:
(continued)
n ) p (1
p ˆ ˆ
n
P) P(1
Điểm cuối khoảng tin cậy
Cận trên và dưới của khoảng tin cậy đối với tỷ lệ
tổng thể được tính theo công thức
pˆ
Trang 17Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-49
Ví dụ
Một mẫu ngẫu nhiên 100 người cho
thấy 25 người thuận tay trái.
Xây dựng khoảng tin cậy 95% cho tỷ
lệ thực sự của người thuận tay trái.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-50
Ví dụ
Giải : khoảng tin cậy cần tìm
(continued)
0.3349 P
0.1651
100
.25(.75) 1.96
100
25 P 100
.25(.75) 1.96
100
25
n ) p (1 p z p P n ) p (1 p z
Trang 18Ví dụ
Một người quản lý muốn ước lượng tỷ lệ nhân
viên ủng hộ kế hoạch thưởng mới Từ một mẫu
ngẫu nhiên gồm 344 nhân viên, 261 người ủng
hộ Tìm khoảng tin cậy 90% của tỷ lệ thực.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-52
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-53
PHStat Interval Options
options
Using PHStat (for μ, σ unknown)
A random sample of n = 25 has X = 50 and
S = 8 Form a 95% confidence interval for μ
Trang 19Xác định cỡ mẫu: Tổng thể lớn
Cỡ mẫu càng lớn, khoảng tin cậy càng hẹp.
Giảm mức độ không chắc chắn về tham số được
ước lượng.
Đôi khi, chiều rộng của CI được cố định trước,
cỡ mẫu sẽ được chọn đủ lớn để đảm bảo chiều
rộng đó.
Làm như thế nào?
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-55
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 9-56
Xác định cỡ mẫu
Đối với trung bình
Có thể tìm thấy cỡ mẫu yêu cầu để đạt đến biên
sai số mong muốn (ME) với mức độ tin cậy
Trang 20Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 9-58
Đối với trung bình
Xác định
cỡ mẫu
n
σ z
n
σ z
Margin of Error (sampling error)
Xác định cỡ mẫu
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 9-59
For the Mean
Determining Sample Size
n
σ z
ME α/2
(continued)
2
2 2 α/2
ME
σ z
Now solve for n to get
Trang 21Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 9-61
Ví dụ về cỡ mẫu cần thiết
Nếu = 45, cỡ mẫu nào là cần thiết để
ước tính giá trị trung bình trong khoảng ± 5
với độ tin cậy 90%?
(luôn làm tròn lên)
219.19 5
(45) (1.645) ME
σ z
Vì vậy, cỡ mẫu yêu cầu là n = 220
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 9-62
n
) p (1 p z
n
) p (1 p z
n
Thay thế 0,25 cho
Và giải tìm n
(continued)
Xác định cỡ mẫu
n ) p (1 p z
p ˆ ˆ
Trang 22Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 9-64
Tỷ lệ mẫu và tổng thể, và P, thông thường
chưa biết (vì chưa có mẫu nào được lấy)
P(1 – P) = 0,25 tạo ra biên sai số lớn nhất có
thể (do đó đảm bảo rằng cỡ mẫu kết quả sẽ
đáp ứng mức độ tin cậy mong muốn)
Để xác định cỡ mẫu yêu cầu cho tỷ lệ, bạn
6) (0.25)(1.9 ME
z 0.25
2 2
2
Trang 23Xác định cỡ mẫu: ví dụ
Chiều dài của thanh kim loại được sản xuất bởi
một nhà máy theo phân phối chuẩn với = 1,8
mm Giả sử rằng người quản lý sản xuất yêu
cầu CI 99% kéo dài không quá 0,5 mm ở mỗi
bên của giá trị trung bình của mẫu Cỡ mẫu lớn
thế nào là cần thiết?
Giải: cỡ mẫu cần thiết:
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-67
0.01/2
2.576 1.8 86 0.5
z n ME
Xác định cỡ mẫu
Việc lựa chọn cỡ mẫu đảm bảo rằng CI trải
rộng trong khoảng cách ME ở mỗi bên của giá
trị trung bình của mẫu.
n nên là một số nguyên bằng cách làm tròn n được
tính từ công thức.
Các quy trình tương tự có thể được áp dụng để
xác định kích thước mẫu cho các phân phối
khác.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 8-68
Tóm tắt chương
Giới thiệu khái niệm về khoảng tin cậy
Thảo luận Ước lượng điểm
Phát triển ước lượng khoảng tin cậy
Tạo ước lượng khoảng tin cậy cho giá trị
trung bình (σ 2 đã biết)
Giới thiệu phân phối t của Student
Xác định các ước lượng khoảng tin cậy cho
giá trị trung bình (σ 2 chưa biết)
Tạo ước lượng khoảng tin cậy cho tỷ lệ
Xác định cỡ mẫu cần thiết