Ước lượng trung bình của tổng thể chung • Trường hợp đã biết phương sai • Trường hợp chưa biết phương sai • Các nhân tố ảnh hưởng tới độ lớn của khoảng tin cậy trong ước lượng 3.. Một số
Trang 1ƯỚC LƯỢNG
VÀ KIỂM ĐỊNH THỐNG KÊ KINH DOANH
2
I
ƯỚC
LƯỢNG
II
KIỂM ĐỊNH
NỘI DUNG
Đọc giáo trình:
Chương 5,6 (ước lượng Chương 7,8 (kiểm định)
Bài tập:
Bài 1,2,3,4,5 trang248 Bài 1,2 trang293
Bài 1,2,3,4,5,11,12,13,
14,15 trang 317
Bài 1,2,3,4,14,15,16
trang343.
3
I ƯỚC LƯỢNG
1 Một số khái niệm thường dùng trong ước lượng
2 Ước lượng trung bình của tổng thể chung
• Trường hợp đã biết phương sai
• Trường hợp chưa biết phương sai
• Các nhân tố ảnh hưởng tới độ lớn của khoảng tin cậy
trong ước lượng
3 Ước lượng tỷ lệ của tổng thể chung
4 Xác định cỡ mẫu
Trang 21 Một số khái niệm thường dùng
trong ước lượng
• Quá trình ước lượng
• Ước lượng khoảng tin cậy
• Giới hạn tin cậy cho trung bình của tổng
thể chung
• Khoảng tin cậy
• Mức độ tin cậy
• Ước lượng các tham số của tổng thể chung
5
1.1 Quá trình ước lượng
Trung bình, ,
chưa biết
Tổng thể chung Mẫu ngẫu nhiên
Tôi tin chắc 95%
rằng trung bình của tổng thể chung nằm trong khoảng
40 & 60
TB
= 50
Lấy mẫu
X
Chỉ tiêu Tổng thể chung Tổng thể mẫu
Quy mô
Tham số
Số bình quân
Tỷ lệ theo một
tiêu thức
Phương sai
N
xi
n
x
x i
)
xi 2
Trang 3Cách chọn
Chọn hoàn lại (chọn lặp, chọn nhiều lần):
Quy mô tổng thể không đổi
số mẫu có thể có:
)!
(
!
n N n
N C
k n N
n n
A
• Chọn không hoàn lại (chọn không lặp, chọn
một lần): Quy mô tổng thể giảm
số mẫu có thể có:
8
xác suất nhất định
Xác suất đó không bao giờ đạt 100%
1.2 Ước lượng khoảng tin cậy
9
Khoảng tin cậy
Thống kê mẫu
Giới hạn tin cậy
(Giới hạn dưới)
Giới hạn tin cậy (Giới hạn trên)
Xác suất để tham số của tổng thể chung rơi vào
trong khoảng tin cậy
Các yếu tố trong ước lượng KTC
Trang 4Tham số =
Thống kê ± Sai số
© 1984-1994 T/Maker Co.
1.3 Giới hạn tin cậy cho trung bình
của tổng thể chung
X
Sai số
= Sai số = X
X
11
90%
95%
1.4 Khoảng tin cậy
1.645x 1.645x
1.96x 1.96x
99%
X
n
X
_
• Là xác suất để tham số của tổng thể chung
rơi vào trong khoảng tin cậy
• Biểu hiện: (1 - ) % = độ tin cậy
e.g 90%, 95%, 99%
là xác suất để tham số của tổng thể chung
không rơi vào trong khoảng tin cậy
1.5 Độ tin cậy
Trang 5Ước lượng tham số
của tổng thể chung…
từ thống kê của tổng thể mẫu Trung bình
1.6 Ước lượng các tham số
của tổng thể chung
2
Khác biệt -
1 2 x - x
X
_
_ _
14
2 Ước lượng trung bình
của tổng thể chung
Trung bình
Chưa biết
Ước lượng
Tỷ lệ
Đã biết
15
• Giả thiết(điều kiện)
Đã biết độ lệch chuẩn của tổng thể chung
Nếu bất bình thường, sử dụng mẫu lớn
• Ước lượng khoảng tin cậy:
2.1 Trường hợp đã biết phương sai
x
Trongđó: là phạm vị sai số chọn mẫu và được tính bằng: x
x
x z
/2
Trang 62.1 Trường hợp đã biết phương sai
(Đã biết )
Trường hợp 1: Chọn một lần (Chọn không lặp)
Trường hợp 2: Chọn nhiều lần (Chọn có lặp lại)
) 1 (
2
N n n
x
n
x
2
17
• Giả thiết(điều kiện)
Chưa biết độ lệch chuẩn của tổng thể chung
• Nếu mẫu n ≥ 30, sử dụng phân phối z
• Nếu mẫu nhỏ, sử dụng phân bố t Student’s
• Ước lượng khoảng tin cậy:
2.2 Trường hợp chưa biết phương sai
Hay khoảng tin cậy là:
x n
/2(1)
x n x
t
x/2(1) /2(1)
2.2 Trường hợp chưa biết phương sai
(chưa biết )
Trường hợp 1: Chọn một lần (Chọn không lặp)
Trường hợp 2: Chọn nhiều lần (Chọn có lặp lại)
) 1 (
2
N n n s
x
n s
x
2
Trang 7Z t
0
t (df = 5)
Phân bố chuẩn
t (df = 13)
Hình chuông
Đối xứng
Phân bố t Student’s
20
Bài tập
Một doanh nghiệp dệt có 1000 công nhân, người ta chọn ngẫu nhiên (theo cách chọn
không lặp) 100 công nhân để điều tra về năng suất lao động và có kết quả sau:
• Tính NSLĐ bình quân chung của công nhân toàn doanh nghiệp với độ tin cậy
bằng 95,44% Từ đó xác định sản lượng vải của doanh nghiệp?
• Giả sử doanh nghiệp tiến hành một cuộc điều tra chọn mẫu mới để suy rộng về
NSLĐ bình quân Với độ tin cậy bằng 95% và phạm vi sai số chọn mẫu không
quá 2m hãy tính số công nhân cần chọn để điều tra theo cả 2 cách chọn.
• Tính tỷ lệ chung về số công nhân có NSLĐ từ 60m trở lên với độ tin cậy bằng
90% Có khoảng bao nhiêu công nhân của doanh nghiệp đạt mức năng suất này.
• Giả sử doanh nghiệp tiến hành 1 cuộc điều tra mới để suy rộng tỷ lệ công nhân
đạt mức NSLĐ từ 60m trở lên, với độ tin cậy bằng 99% và phạm vi sai số chọn
mẫu không vượt quá 5% hãy tính số công nhân cần điều tra theo cả 2 cách chọn.
NSLĐ (m) Số công nhân
21
• Độ biến thiên của dữ liệu: đo bằng
• Cỡ mẫu
• Mức độ tin cậy
(1 - )
Khoảng tin cậy kéo dài từ
2.3 Những nhân tố ảnh hưởng tới
độ lớn của khoảng tin cậy
© 1984-1994 T/Maker Co.
đến
x
z
x xz.x
n
x
Trang 8• Giả thiết:
Chỉ có hai biểu hiện định tính
Tổng thể chung phân bố theo quy luật nhị thức
Điều kiện cỡ mẫu: n·p 5 & n·(1 - p) 5
• Ước lượng khoảng tin cậy:
3 Ước lượng tỷ lệ của tổng thể chung
f
f p f
f
Trongđó: là phạm vi sai số chọn mẫu và được tính bằng: f
f
/2.
23
Ước lượng tỷ lệ
Trường hợp 1: Chọn một lần (Chọn không lặp)
Trường hợp 2: Chọn nhiều lần (Chọn có lặp lại)
) 1 ( 1 (
N n n f f
f
n f f
f
) 1 (
4 Xác định cỡ mẫu
Quá lớn:
• Đòi hỏi rất
nhiều
nguồn lực
Quá nhỏ:
• Sẽ không thể thực hiện được mục tiêu đặt ra
Cỡ mẫu
Trang 9• Yêu cầu:
+ Sai số nhỏ nhất
+ Chi phí thấp nhất
• Cơ sở xác định: sai số nhỏ nhất
4 Xác định cỡ mẫu
26
Cách xác định
Bình quân
Tỷ lệ
2
2 2 2 /
x
z n
2 / 2
2 2 2 / .
.
z N
z N n
x
2
2 2 / ( 1 )
f
p p z n
) 1 (
) 1 (
2 / 2
2 2 /
p p z N
p p z N n
27
+ Lấy phương sai (2)lớn nhất trong các lần điều tra
trước hoặc tỷ lệ (p) gần 0,5 nhất
+ Lấy phương sai hoặc tỷ lệ của các cuộc điều tra
khác có tínhchất tương tự
+ Điều tra thí điểm để xác định phương sai
+ Ước lượng phương sai dựa vào khoảng biến thiên
6 6
min max x x
sai tổng thể chung
Trang 10+ Hệ số tin cậy (z)/Trình độ tin cậy
+ Phương sai (độ đồng đều) của tổng thể chung (2)
+ Phạm vi sai số chọn mẫu ()
+ Phương pháp tổ chức chọn mẫu
Các nhân tố ảnh hưởng tới
Lưu ý: Số lượng đơn vị mẫu điều tra không bao giờ
lẻ (khi xác định kích thước mẫu luôn làm tròn lên)
29
I
ƯỚC LƯỢNG
II
KIỂM ĐỊNH NỘI DUNG
II KIỂM ĐỊNH
1 Một số vấn đề chung
2 Kiểm định trung bình
• Kiểm định giá trị trung bình của 1 tổng thể chung
• So sánh hai giá trị trung bình của hai tổng thể chung
3 Kiểm định tỷ lệ
• Kiểm định tỷ lệ của 1 tổng thể chung
• So sánh hai tỷ lệ của hai tổng thể chung
Trang 114 Các bước tiến hành kiểm định
Giả thiết thống kê và Kiểm định
1
Sai lầm và mức ý nghĩa trong kiểm định
2
Tiêu chuẩn kiểm định
3
1 Một số vấn đề chung về kiểm định
32
Giả thiết là một giả định về một
tham số của tổng thể chung.
Tham số là trung bình hoặc
tỷ lệ của tổng thể chung
Tham số phải được xác định
trước khi phân tích.
Tôi cho rằng điểm trung bình của cả lớp là 8.5!
© 1984-1994 T/Maker Co.
1 Một số vấn đề chung về kiểm định
1.1 Giả thiết thống kê
33
Đưa ra giả định (bằng số) để kiểm định
VD: Số lượng TV trung bình của các gia đình Mỹ ít nhất là 3
(H 0 : 3)
Bắt đầu với giả định giả thiết “không” luôn luôn ĐÚNG
(Tương tự như khái niệm vô tội cho đến khi có bằng chứng chứng minh là có tội)
Giả thiết“không”, H0
Luôn luôn có dấu ‘ = ‘ Giả thiết “không” có thể hoặc không thể bác bỏ.
Các loại giả thiết thống kê
Trang 12Là sự đối lập với giả thiết “không”
VD: Số lượng TV trung bình trong các hộ gia
đình ở Mỹ nhỏ hơn 3 (H 1 : < 3)
Không bao giờ có dấu ‘=‘
Giả thiết đối có thể hoặc không thể chấp nhận
Giả thiết“đối”, H1
Các loại giả thiết thống kê
35
- Đặt giả thiết “không” (H0: 3)
- Đặt giả thiết đối (H1 : < 3)
• Các giả thiết loại trừ lẫn nhau và bao hàm tất cả
cảc trường hợp
• Đôi khi điền giả thiết đối trước sẽ dễ dàng hơn
- Thu thập thông tin mẫu để rút ra kết luận về
giả thiết cần kiểm định.
Quá trình kiểm định giả thiết
• Là xácsuất bác bỏ Ho khi nó đúng
Gọi là miền bác bỏ của phân bố mẫu
• Lựa chọn giá trị alpha
• Các giá trị điển hình: 0.01, 0.05, 0.10
Trang 13H 0 : = 3
H 1 : < 3
0
0
0
H0 : = 3
H1 : > 3
H0 : 3
H1 : 3
/2
Giá trị tới hạn Miền bác bỏ
38
Loại I
♣ Bác bỏ giả thiết “không” khi nó đúng
♣ Gây ra hậu quả nghiêm trọng
♣ Xác suất sai của loại I là a
Gọi là mức ý nghĩa
Loại II
♣ Không bác bỏ giả thiết “không” khi nó sai
♣ Xác suất xảy ra sai sót loại II là b (Beta)
b Những sai lầm trong ra quyết định
39
b
Giảm sác xuất sai loại này sẽ làm tăng sác xuất tăng loại kia
& b có mối liên hệ ngược chiều
Trang 14• Trong tập hợp các kiểm định thống kê có cùng mức ý
nghĩa (tức là có xác suất mắc sai lầm loại 1như nhau),
kiểm định nào có xác suất mắc sai lầm loại 2 nhỏ nhất sẽ
được xem là “tốt nhất”
• Một số quy luật phân phối thông dụng chọn làm tiêu
chuẩn kiểm định tùy thuộc vào giả thiết cần KĐ như: quy
luật phân phối chuẩn, phân phối T-Student, phân phối 2,
phânphối Fisher
Tiêu chuẩn kiểm định là quy luật phân phối xác suất
nào đó được dùng để kiểm định
41
1 Phát biểu giả thiết H0 và giả thiết đối H1.
2 Định rõ mức ý nghĩa (xác suất mắc sai lầm loại 1)
3 Chọn tiêu chuẩn kiểm định.
4 Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát.
5 Kết luận bác bỏ hay chấp nhận H0 tuỳ theo giá trị của tiêu
chuẩn kiểm định rơi vào miền bác bỏ hay chấp nhận
Cụ thể :
- Nếu giá trị của tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả
thiết H0 , thừa nhận H1.
- Nếu giá trị của tiêu chuẩn kiểm định thuộc miền chấp nhận: Trong trường
hợp này không nên hiểu rằng H0 hoàn toàn đúng mà chỉ nên hiểu rằng
qua mẫu cụ thể này chưa đủ cơ sở để bác bỏ H0, cần nghiên cứu
thêm.
II KIỂM ĐỊNH
1 Một số vấn đề chung
2 Kiểm định và so sánh giá trị trung bình
• Kiểm định giá trị trung bình của 1 tổng thể chung
• So sánh hai giá trị trung bình của hai tổng thể chung
3 Kiểm định và so sánh tỷ lệ
• Kiểm định tỷ lệ của 1 tổng thể chung
• So sánh hai tỷ lệ của hai tổng thể chung
Trang 152 Kiểm định và so sánh số trung bình
-Kiểm định giá trị trung bình của 1 tổng thể chung
- So sánh 2 giátrị trung bình của 2 tổng thể chung
44
a) Phương sai của tổng thể chung 2 đã biết.
Tiêu chuẩn kiểm định được chọn là :
Tuỳ thuộc vào dạng của giả thiết đối H1
mà miền bác bỏ được xây dựng theo các trường hợp sau:
2.1 Kiểm định giá trị trung bình
của tổng thể chung
σ
μ n x
Z 0
Kiểm định phía phải:
H0: = 0
H1: > 0
Nếu Z > Z , bác bỏ giả
thiết H 0 , nhận H1
Kiểm định phía trái:
H0: = 0
H1: < 0
Nếu Z <- Z , bác bỏ giả thiết H 0 , nhận H1
Kiểm định 2 phía :
H0: = 0
H1: 0
Nếu Z > Z /2 ,bác bỏ giả thiết H 0 , nhận H1
45
H0: =0
H 1 : < 0
H0: =0
H 1 : > 0
Z
0
Bác bỏ H0
Z
0
Bác bỏ H0
Miền bác bỏ
Trang 16Một hộp ngũ cốc trung bình có
chứa hơn 368 grams? Lấy
ngẫu nhiên một mẫu gồm 25
Công tyđịnh rõ độ lệch tiêu
chuẩn là 15 grams Kiểm định
tại mức ý nghĩa a = 0.05
368 gm.
Ví dụ
H0: =368
H 1 : > 368
x
47
= 0.05
n = 25
• Giá trị tới hạn: 1.645
Tiêu chuẩn kiểm định:
Quyết định:
Kết luận:
Chưa đủ cơ sở bác bỏ với Ho
Chưa đủ bằng chứng chứng tỏ 1 hộp ngũ cốc trung bình chứa hơn
368 grams với mức ý nghĩa 5%
Z
0 1.645
.05 Bác bỏ
Tính toán ra kết luận
H0: =368
H1: > 368
σ
μ n x
b) Phương sai của tổng thể chung 2 chưa biết (mẫu lớn).
Tiêu chuẩn kiểm định được chọn là :
(s là độ lệch tiêu chuẩn mẫu )
Tuỳ thuộc vào dạng của giả thiết đối H1
mà miền bác bỏ được xây dựng tương tự như trên:
Kiểm định phía phải:
H0: = 0
H1: > 0
Kiểm định phía trái:
H0: = 0
H1: < 0
Kiểm định 2 phía :
H0: = 0
H1: 0
s n μ x
Z 0
2.1 Kiểm định giá trị trung bình
của tổng thể chung
Trang 17c) Phương sai của tổng thể chung 2 chưa biết (mẫu nhỏ).
Tiêu chuẩn kiểm định được chọn là :
(s là độ lệch tiêu chuẩn mẫu)
Tuỳ thuộc vào dạng của giả thiết đối H1
mà miền bác bỏ được xây dựng tương tự như trên:
Kiểm định phía phải:
H0: = 0
H1: > 0
Nếu t > t ,(n-1) , bác bỏ giả
thiết H 0 , nhận H 1
Kiểm định phía trái:
H0: = 0
H1: < 0
Nếu t <- t ,(n-1) , bác bỏ giả thiết H 0 , nhận H 1
Kiểm định 2 phía:
H0: = 0
H1: 0
Nếu > t/2,(n-1),bác bỏ giả thiết H 0 , nhận H1
s n μ x
2.1 Kiểm định giá trị trung bình
của tổng thể chung
t
50
a) Phương sai của 2 tổng thể chung 1 , 2 đã biết.
Tiêu chuẩn kiểm định được chọn là :
Tuỳ thuộc vào dạng của giả thiết đối H1
mà miền bác bỏ được xây dựng theo các trường hợp sau:
2.2 So sánh hai giá trị trung bình
của hai tổng thể chung (2 mẫu độc lập)
Kiểm định phía phải:
H0: 1 = 2
H1: 1 > 2
Nếu Z > Z , bác bỏ giả
thiết H 0 , nhận H1
Kiểm định phía trái:
H0: 1 = 2
H1: 1 < 2
Nếu Z <- Z , bác bỏ giả thiết H 0 , nhận H1
Kiểm định 2 phía:
H0: 1 = 2
H1: 1 2
Nếu Z > Z /2 ,bác bỏ giả thiết H 0 , nhận H1
2 2
1 2 2 1
n n
x x Z σ σ
51
b) Phương sai của 2 tổng thể chung 1 , 2 chưa biết.
*) Nếu phương sai không bằng nhau
Tiêu chuẩn kiểm định được chọn là :
Nếu giả thuyết Ho đúng, t phân phối theo quy luật Student với
bậc tự do là v, trong đó:
2.2 So sánh hai giá trị trung bình
của hai tổng thể chung (2 mẫu độc lập)
2 2 1 2 2 1
n
s n s x x t
2
2 2 2 2
1 2 1
2
2 2 1 2
n s 1 n 1 n s 1 n 1 n s n s v
Trang 18b) Phương sai của 2 tổng thể chung 1 , 2 chưa biết.
Nếu phương sai không bằng nhau
Tuỳ thuộc vào dạng của giả thiết đối H 1
mà miền bác bỏ được xây dựng theo các trường hợp sau:
2.2 So sánh hai giá trị trung bình
của hai tổng thể chung (2 mẫu độc lập)
Kiểm định phía phải:
H0: 1 = 2
H1: 1 > 2
Nếu t > t ,v , bác bỏ giả
thiết H 0 , nhận H1
Kiểm định phía trái:
H0: 1 = 2
H1: 1 < 2
Nếu t <- t ,v , bác bỏ giả thiết H 0 , nhận H1
Kiểm định phía phải:
H0: 1 = 2
H1: 1 2
Nếu > t/2,v, bác bỏ giả thiết H 0 , nhận H1 t
53
b) Phương sai của 2 tổng thể chung 1 , 2 chưa biết.
Nếu phương sai của 2 tổng thể chung bằng nhau
Tiêu chuẩn kiểm định được chọn là :
Trong đó:
Nếu giả thuyết Ho đúng, t phân phối theo quy luật Student với
(n 1 + n 2 – 2) bậc tự do.
Tuỳ thuộc vào dạng của giả thiết đối H1 mà miền bác bỏ được
xây dựng theo các trường hợp như ở trên
2.2 So sánh hai giá trị trung bình
của hai tổng thể chung (2 mẫu độc lập)
2 1
2 1
2 2 1
2
2
1
n
1 n
1 s
x x n
s
n
s
x
x
t
2 n n
s ) 1 n ( s 1 n s
2 1
2 2 2 1 2
• Bạn là nhân viên phân tích tài chính cho Charles
Schwab Liệu có sự khác nhau trong phân chia lợi tức
giữa cổ phiếu niêm yết tại NYSE và NASDAQ? Bạn thu
thập được dữ liệu dưới đây:
• Cho rằng phương sai bằng nhau, liệu thực
sự có sự khác nhau trong lợi tức trung bình
Ví dụ:
Trang 19II KIỂM ĐỊNH
1 Một số vấn đề chung
2 Kiểm định và so sánh giá trị trung bình
• Kiểm định giá trị trung bình của 1 tổng thể chung
• So sánh hai giá trị trung bình của hai tổng thể chung
3 Kiểm định và so sánh tỷ lệ
• Kiểm định tỷ lệ của 1 tổng thể chung
• So sánh hai tỷ lệ của hai tổng thể chung
56
- Kiểm định tỷ lệ của một tổng thể chung
- So sánh 2 tỷ lệ của hai tổng thể chung
3 Kiểm định và so sánh tỷ lệ
57
• P làtỷ lệ theo tiêu thức định tính nào đó của tổng thể
chung
• Tiêuthức định tính có hai biểu hiện và phân bố theo
quyluật nhị thức
Bao gồm cả biểu hiện có và không có theo tiêu thức
nghiên cứu
• Tỷ lệ của tổng thể mẫu: f
Tiêu chuẩn kiểm định:
3.1 Kiểm định tỷ lệ của một tổng thể chung
n ) p 1 ( p p f Z
0 0 0