Chương 6ƯỚC LƯỢNG Nội dung cơ bản của phương pháp điều tra chọn mẫu là dựa vào sự hiểu biết các tham số Ө’ của tổng thể mẫu điều tra để suy luận thành tham số Ө µ, P, σ2 của tổng thể ch
Trang 1Chương 6
ƯỚC LƯỢNG
Nội dung cơ bản của phương pháp điều tra chọn mẫu là dựa vào sự hiểu biết các tham số Ө’ của tổng thể mẫu điều tra để suy luận thành tham số
Ө (µ, P, σ2) của tổng thể chung chưa biết Việc làm này được gọi là ước lượng.
2
( , , ) X p s
Trang 2Ước lượng không chệch
• Ө’ là ước lượng không chệch của Ө
nếu kỳ vọng toán học của Ө’ bằng Ө,
nghĩa là:
E (Ө’ ) = Ө
Trang 3Ước lượng vững
• Ө’ là ước lượng vững của Ө nếu Ө’ có
xu hướng ngày càng gần với Ө khi
kích thước mẫu tăng lên
Về mặt toán học thì Ө’ hội tụ về Ө nếu với mọi ε > 0 bé tuỳ ý ta luôn có :
ε =) 0 lim (| ' /
Trang 4Ước lượng hiệu quả
• Ө’1 và Ө’2 là 2 ước lượng không chệch của Ө dựa trên số lượng của mẫu quan sát giống nhau:
Ө’1 gọi là hiệu quả hơn Ө’2 nếu:
Var (Ө’1 ) ≤ Var (Ө’2 )
Trang 5Thống kê toán đã chứng minh
• Vì số trung bình mẫu là ước lượng không chệch, vững, hiệu quả của trung bình tổng thể chung µ, do đó nếu chưa biết µ có thể dùng
X
X
p�
p�
Trang 66.1 Ước lượng điểm
Mẫu Tổng thể
Trung bình = µ
Tỷ lệ = P
Phương sai S2 = σ2
X
p�
Trang 76.2 ƯỚC LƯỢNG KHOẢNG
• Trong ước lượng điểm, giá trị ước lượng
các đặc trưng của tổng thể chung phụ thuộc vào một giá trị cụ thể của biến ngẫu nhiên, ví dụ như trung bình, tỷ lệ, phương sai mẫu.
• Ứng với mỗi mẫu khác nhau ta sẽ nhận
được các giá trị khác nhau Do đó chúng không thể hiện tính chính xác của ước lượng.
• Do đó ta cần thực hiện ước lượng
khoảng, nghĩa là dựa vào số liệu của mẫu, với độ tin cậy cho trước, xác định khoảng
Trang 8• Tổng quát, gọi Ө là tham số chưa biết của tổng thể Căn cứ vào mẫu gồm n đơn vị, tìm những biến ngẩu nhiên Ө1và Ө2 sao cho: P(Ө1 ≤ Ө ≤
Nói chung, Độ tin cậy và độ chính xác có xu
hướng đối lập nhau, tức là khoảng ước lượng càng dài (độ chính xác thấp) càng có cơ hội
trúng cao (độ tin cậy cao)
Trang 96.2.1 Ước lượng trung bình tổng thể
1 n≥30 Giả sử có 1 mẫu ngẩu nhiên bao gồm
n quan sát được chọn từ 1 tổng thể có phân phối chuẩn có phương sai σ2 đã biết Với độ tin cậy (1 – α )100% cho trước, trung bình tổng thể µ được xác định bởi:
Trang 11• Từ công thức trên ta thấy :
Với độ tin cậy và kích thước mẫu cố định, độ lệch chuẩn càng lớn thì khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp.
Với độ tin cậy và độ lệch chuẩn cố định , kích thước mẫu n càng lớn thì khoảng ước lượng càng hẹp, tức là độ chính xác của ước lượng càng cao.
Với độ lệch chuẩn và kích thước mẫu n
cố định , độ tin cậy càng cao thì khoảng ước lượng càng rộng, tức độ chính xác của ước lượng càng thấp.
Trang 12Cũng trường hợp n ≥30 , nhưng σ2 chưa biết, khi đó ta thay σ2 bằng S2 (Phương
sai mẫu hiệu chỉnh)
Trang 132 n < 30, tổng thể chung có phân phối
Trang 14* n < 30, tổng thể chung có phân phối
chuẩn, σ2 chưa biết khi đó
Trong đó :
• Có phân phối Student với (n-1) bậc tự do Cho
trước (1- α) và biết n ta tìm được t , α/2 theo
Trang 15• Ví dụ 1: Thực hiện cân thử 100 hộp sửa đặc có đường có trọng lượng trung bình
là 398 gr; σ2 = 400 gr Hãy ước lượng
trọng lượng trung bình của cả lô sửa với
độ tin cậy 95%.
• Phân tích: Đây là trường hợp ước lượng trung bình tổng thể,đã biết σ2; n=100>30 ; với độ tin cậy 95% => α =5%
Trang 16• Ví dụ 2: Để xác định trọng lượng trung bình của các bao bột mì đựoc đóng bao bằng máy tự động, người ta chọn ngẫu nhiên 15 bao và tính được:
39, 8
Trang 17• α = 0,05 => α/2 =0,025.Tra bảng Student với (15-1) bậc tự do ta tìm được: t=2,145.
Trang 18• Ví dụ: Tuổi thọ SP của nhà máy SX bóng đèn giả
sử có phân phối chuẩn Nhân viên kiểm tra chất
lượng của nhà máy chọn ngẫu nhiên 100 SP trong
1 đợt SX, kiểm tra tuổi thọ của SP cho trong bảng
Trang 196.2.2 Ước lượng tỷ lệ tổng thể
• Trong thực tế, nhiều khi ta quan tâm đến
tỷ lệ các đơn vị mang một tính chất nào đó trong tổng thể chung
• Ví dụ: Tỷ lệ khách hàng sử dụng một loại sản phẩm nào đó, tỷ lệ sản phẩm hỏng, tỷ
lệ học sinh bỏ học v.v Tức là có nhu cầu ước lượng tỷ lệ P của tổng thể.
Trang 20• Giả sử có mẫu ngẩu nhiên n quan sát
và là tỷ lệ các quan sát có tính chất
A nào đó Với mẫu lớn ( n ≥ 40), độ tin cậy của khoảng ước lượng ( 1- α ) ta tìm Zα/2.
Trang 21• Ví dụ: Giả sử khi điều tra chọn mẫu
100 đồ hộp, ta phát hiện 20 sản phẩm không đúng quy cách Hãy ước lượng
tỷ lệ đồ hộp không đúng quy cách với
Trang 2202/06/18 22
6.2.3 ƯỚC LƯỢNG PHƯƠNG
SAI CỦA TỔNG THỂ:
Giả sử tổng thể chung có
phân phối chuẩn với
chưa biết Căn cứ vào dữ liệu của mẫu gồm n đơn vị
ta đưa ra 2 giá trị ( số ) và sao cho:
2 2
2 2
2 1 n
2 2
2
,
s ) 1 n
Trang 23VÍ DỤ:
Một công ty muốn tìm hiểu sự biến thiên về tuổi thọ của một loại SP Chọn
ngẫu nhiên 15 SP để thu dữ liệu và tính được phương sai mẫu HC là 15,274 Cần ước lượng phương sai về tuổi thọ
SP với độ tin cậy 95% ( Tuổi thọ của loại SP này có
Trang 24Công ty bột giặt O Tiến hành một khảo sát mẫu tại
Thành phố B như sau: Khảo sát ngẫu nhiên 500 hộ gia
đình và xác định được có 150 hộ gia đình sử dụng bột
giặt O Lượng bột giặt O sử dụng
( kg/ hộ/ tháng )ở các hộ này thể hiện qua dữ liệu:
Lương BG 0,2–0,5 0,5–0,8 0,8–1,1 1,1–1,4 1,4–1,7 ≥1,7
Số hộ 3 12 33 54 37 11
1/ Ước lượng tỷ lệ hộ sử dụng BG O tại TP này với độ tin cậy 95%.
2/ Ước lượng lượng bột giặt O sử dụng trung bình 1 hộ/
tháng với độ tin cậy 99%.
3/ Thành phố có 850000 hộ gia đình, hãy ước lượng tổng
lượng bột giặt O sử dụng 1 tháng ở TP này với độ tin cậy 95%.
Trang 254/ những hộ sử dụng BG O mà sử dụng < 0,8
kg/hộ/tháng là những hộ sử dụng ít Một nhân viên
nghiên cứu thị trường khẳng định có 15% số hộ sử
dụng BG O của TP này sử dụng ít Với mức ý nghĩa
10%, hãy cho kết luân và xác định giá trị P ( P- Value).
5/ Cũng nhân viên trên cho biết những hộ sử dụng BG
O sử dụng trung bình 1,3 kg/ hộ/ tháng Với mức ý nghĩa 5%, hãy cho kết luận và xác định giá trị p ( p- value )
Trang 266.2.4 ƯỚC LƯỢNG SỰ KHÁC BIỆT GIỮA 2 SỐ TRUNG BÌNH CỦA HAI
TỔNG THỂ:
6.2.4.1.TRƯỜNG HỢP MẪU PHỐI HỢP
TỪNG CẶP:
Giả sử ta có mẫu gồm n cặp quan
sát lấy ngẫu nhiên từ 2 tổng thể
X và Y
(x 1 , y 1 ); (x 2 , y 2 ) (x n , y n )
Gọi Là trung bình của 2 tổng
thể.
: Là trung bình của n khác biệt (xi – yi).
S d : Là độ lệch chuẩn của n khác biệt (xi
d
;
x y
Trang 27Gỉa sử sự khác biệt giữa
X và Y trong t.thể có phân
phối chuẩn.
Với độ tin cậy 1 - , chênh
lệch giữa 2 số TB
được xác định Bằng công thức
d n
s t
d - n - 1 , / 2 d x - y n - 1 , / 2 d
2 i
1 n
Trang 28Công ty Điện lực thực hiện một biện pháp nhằm mục đích khuyến khích các hộ gia đình sử dụng tiết kiệm điện Ghi nhận tại 10 hộ gia đình được chọn ngẫu nhiên trong một khu vực dân cư về lượng điện tiêu thụ( kw/hộ/tháng ) một tháng trước và một tháng sau khi
Trang 29Yêu cầu:
• 1/ Với độ tin cậy 95% hãy ước lượng lượng điện tiết kiệm trung bình tháng/ hộ trong khu dân cư này ( Biện pháp áp dụng có đem lại hiệu quả
mong muốn không ? ).
• 2/ Một nhân viện phòng kinh doanh của công ty cho biết biện pháp mà công ty áp dụng đem lại kết quả lượng điện tiết kiệm trung bình 1 tháng/
hộ là 10 kw Với mức ý nghĩa 10%, hãy cho kết luận
Trang 306.2.4.2 ƯỚC LƯỢNG SỰ KHÁC BIỆT GIỮA 2 SỐ TRUNG BÌNH CỦA HAI
TỔNG THỂ TRONG TRƯỜNG HỢP
MẪU ĐỘC LẬP:
GỌI nx, ny LÀ CÁC MẪU ĐƯỢC CHỌN NGẪU NHIÊN ĐỘC
LẬP TỪ HAI TỔNG THỂ CÓ
PHÂN PHỐI CHUẨN X VÀ Y CÓ TRUNG BÌNH LÀ , PHƯƠNG SAI
x
y
x
Trang 31-CÔNG THỨC:
KHOẢNG ƯỚC LƯỢNG
y
2 y x
2 x 2
/
y
x y
2 y x
2 x 2
/
n n
z )
y x
(
n n
z )
y x
Trang 32TRONG TRƯỜNG HỢP CỠ MẪU LỚN
nx, ny 30 TA CÓ THỂ DÙNG CÁC PHƯƠNG SAI MẪU HIỆU CHỈNH THAY CHO PHƯƠNG SAI TỔNG THỂ
VÍ DỤ: MỘT TRẠI CHĂN NUÔI TIẾN HÀNH
NGHIÊN CỨU HIỆU QUẢ CỦA HAI LOẠI THỨC ĂN MỚI A VÀ B SAU MỘT THỜI GIAN NUÔI
THỬ NGHIỆM NGƯỜI TA CHỌN 50 CON GÀ
NUÔI BẰNG THỨC ĂN A VÀ THẤY TRỌNG
LƯỢNG TRUNG BÌNH MỘT CON LÀ 1,9 Kg; ĐỘ
LỆCH CHUẨN LÀ 1,25 Kg VÀ CHỌN 40 CON
GÀ NUÔI BẰNG THỨC ĂN B, TRUNG BÌNH
MỘT CON LÀ 1,2 Kg; ĐỘ LỆCH CHUẨN LÀ
1,02 Kg HÃY ƯỚC LƯỢNG SỰ KHÁC BIỆT VỀ
TRỌNG LƯỢNG TRUNG BÌNH CỦA 1 CON GÀ ĐỐI VỚI 2 LOẠI THỨC ĂN A VÀ B VỚI ĐỘ TIN
2 y
Trang 33Tại một công ty lớn, để tìm hiểu có sự khác biệt về lương giữa nam và nữ nhân viên làm công việc tương ứng không Người ta tiến hành lấy mẫu và thu dữ liệu về lương tháng trong năm.
Chọn ngẫu nhiên 36 nam trong số nhân viên nam Lương tháng của họ thể hiện:
14,2 7,4 11,7 9,2 11,1 11,7 10,9 10,5 13,113,5 7,6 9,6 10,3 12,5 12,3 9,8 11,8 12,310,7 14,2 15,0 14,7 10,8 12,3 10,5 14,5 13,610,6 14,3 12,9 11,5 12,6 10,9 8,8 12,1 13,4
Chọn ngẫu nhiên 32 nữ trong số nhân viên nữ
Lương tháng của họ thể hiện:
11.2 8,2 7,6 14,3 11,5 7,9 12,1 7,7
13,6 8,1 12,6 10,5 10,7 11,4 14,0 9,2
Trang 34Yêu cầu:
1/ Với độ tin cậy 95%, hãy ước lượng sự khác biết về lương trung bình giữa nam và nữ
nhân viên của công ty.
2/ Một cán bộ nhân sự của công ty khẳng định
ở công ty không có sự khác biết lương giữa nam và nữ nhân viên Với mức ý nghĩa 4%, hãy cho kết luận.
Trang 356.2.5 ƯỚC LƯỢNG SỰ KHÁC BIỆT
GIỮA HAI TỶ LỆ TỔNG THỂ:
TA CÓ nx, ny LÀ HAI MẪU ĐƯỢC
CHỌN NGẪU NHIÊN ĐỘC LẬP TỪ HAI TỔNG THỂ X VÀ Y GỌI Px , Py VÀ LẦN LƯỢT LÀ TỶ LỆ CÁC
ĐƠN VỊ CÓ TÍNH CHẤT NÀO ĐÓ
MÀ TA QUAN TÂM TRONG TỔNG
THỂ VÀ TRONG MẪU VỚI MẪU
LỚN nx , ny 40, SỰ KHÁC BIỆT
GIỮA TỶ LỆ HAI TỔNG THỂ X VÀ
Trang 36ĐƯỢC XÁC ĐỊNH BẰNG CÔNG
THỨC
KHOẢNG ƯỚC LƯỢNG
y
y y
x
x
x 2
/ y
x
y x
y
y y
x
x
x 2
/ y
x
n
) pˆ 1
(
pˆ n
) pˆ 1
(
pˆ z
) pˆ pˆ
(
p p
n
) pˆ 1
(
pˆ n
) pˆ 1
(
pˆ z
) pˆ pˆ
Trang 37VÍ DỤ:
MỘT CÔNG TY ĐANG XEM XÉT VIỆC ỨNG DỤNG MỘT PHƯƠNG PHÁP SẢN XUẤT
MỚI NHẰM GIẢM TỶ LỆ PHẾ PHẨM
Ở PHƯƠNG PHÁP SẢN XUẤT MỚI
NGƯỜI TA CHỌN NGẪU NHIÊN RA 500
SẢN PHẨM THÌ THẤY CÓ 10 PHẾ
PHẨM Ở PHƯƠNG PHÁP SẢN XUẤT CŨ NGƯỜI TA CHỌN NGẪU NHIÊN 400 SẢN PHẨM THÌ THẤY CÓ 7 PHẾ PHẨM.
VỚI ĐỘ TIN CẬY 95% HÃY ƯỚC LƯỢNG SỰ KHÁC BIỆT VỀ TỶ LỆ PHẾ PHẨM
Ở HAI PHƯƠNG PHÁP SẢN XUẤT.
Trang 38Để tìm hiểu sự khác biết về tỷ lệ người sử dụng loại kem đánh răng P giữa người ở thành phố và người ở nông thôn, người ta tiến hành lấy mẫu như sau:
Phỏng vấn ngẫu nhiên 750 người sống tại thành phố S
và được biết có 156 ngưới sử dụng kem P hàng ngày
Phỏng vấn ngẫu nhiên 680 người sống tại các huyên
của tỉnh T và được biết có 187 người sử dụng kem P hàng ngày
Yêu cầu
1/ Với độ tin cậy 95%, hãy ước lượng sự khác biệt tỷ lệ sử dụng kem đánh răng P giữa nông thôn và thành phố
2/ Một nhân viên nghiên cứu thị trường khẳng định tỷ lệ
người sử dụng kem P ở thành phố và ở nông thôn
không có sự khác biệt Với mức ý nghĩa 1%, hạy cho kết luận
Trang 396.2.6 ƯỚC LƯỢNG MỘT BÊN:
Công thức ước lượng ở trên là ước lượng đối xứng ( 2 bên ):
P(1 2 ) = 1 -
Khi cần tìm giới hạn tin cậy
thì ta tiến hành ước lượng một bên
Trang 40P( 1 ) = 1 - HOẶC P( 2 ) =
1 -
Chẳng hạn công thức ước
lượng bên phải:
P(
( Lưu ý: Trong ước lượng một
X
Trang 41VÍ DỤ:
Một công ty muốn ước lượng mức nhiên liêu tiêu hao tối thiểu để máy hoạt động bình thường.
Yêu cầu độ tin cậy của ước
lượng là 95% Một mẫu ngẫu
nhiên gồm 40 ngày hoạt động
của máy được chọn Từ DL thu
thập tính được trung bình 1 ngày
tiêu thụ 250 lít nhiên liệu, độ
lệch chuẩn S = 125 Lít.
Trang 42Xóa DL trên máy: Shift – 9 – 3 - =
Mở TK 1 biến: Shift – mode – replay ( dưới )