-Giả thiết: Cho cỡ mẫu n.. Biết rằng theo tiêu chuẩn của dây chuyền công nghệ đó, độ lệch tiêu chuẩn của lượng sơn là 0,08 thùng. Điều tra một mẫu 50 thùng được lượng sơn trung bình là 0[r]
Trang 1LOG O
Chương 4:
LÝ THUYẾT MẪU
&
ƯỚC LƯỢNG THAM SỐ
Giảng viên: Phan Trung Hiếu
2
I Tổng thể và mẫu:
Tổng thể
- Là tập hợp tất cả các phần tử cần khảo sát
một tính chất A nào
đó
- Gọi N: số phần tử
của tổng thể
Mẫu
- Là tập hợp gồm các phần tử được chọn từ tổng thể
- Gọi n: số phần tử
của mẫu (cỡ mẫu)
3
Ví dụ 1: Tính chiều cao trung bình của người
Việt Nam ở độ tuổi 18
Đo chiều cao của tất cả người Việt Nam ở
độ tuổi 18! Tốn thời gian, tiền bạc, công sức.
Không xác định được chính xác tổng thể.
Ví dụ 3: Tính tỉ lệ hộp sữa kém chất lượng trong
kho gồm 1 triệu hộp
Kiểm tra từng hộp! Phá vỡ tổng thể.
Ví dụ 2: Tính tỉ lệ người nhiễm HIV bằng con
đường tiêm chích ma tuý trong số những người
nhiễm HIV ở Việt Nam
Xác định tất cả những người nhiễm HIV!
4
Tổng thể (N)
Mẫu
(n)
Nghiên cứu
Kết quả
Hoàn lại
Không hoàn lại
II Các đặc trưng của tổng thể:
Tỉ lệ (xác suất) phần tử có tính chất A:
Trung bình của tổng thể:E(X)
Phương sai của tổng thể:2Var(X)
, :
m
N
III Các đặc trưng của mẫu:
3.1 Bảng số liệu:
Gọi là những kết quả quan sát.x x1, 2, ,x k
Dạng liệt kê: x1,x2,…, x k trong đó mỗi x i có thể lặp lại.
Dạng bảng tần số:
(Bảng pp thực nghiệm)
Dạng khoảng:
x i x1 x2 x k Tần số (n i ) n1 n2 n k
x a -b … a -b … a -b
Sắp xếp lại số liệu
2
a b
x i i i
Trang 23.2 Các đặc trưng mẫu: Cho bảng tần số
x i x1 x2 x k Tần số (n i ) n1 n2 n k
n1+n2+…+ n k = n
Trung bình mẫu ( ):x
1
1 k
i i i
n
8
Phương sai mẫu (s 2 ):
2
1
1
k
i i i
n
Độ lệch mẫu (s): 2
s s
Tỉ lệ mẫu ( f ): m
f n
m: số phần tử có tính chất A nào đó.
trong đó:
1
1 k
i i i
n
9
fx-570 ES
Xóa bộ nhớ: SHIFT→ 9 → 2 → =
Vào chế độ thống kê (STAT):
MODE→3: STAT→1:1-VAR
Nhập số liệu: dùng nút tròn và nút =
Khai báo cột tần số:
SHIFT→MODE→▼→4: STAT→1: ON
Nhập xong nhấn AC
10
Đọc kết quả:
Đại lượng cần tìm Thao tác
n SHIFT→ 1 → 5:Var→1: n→ =
SHIFT→ 1 → 5:Var→ → =
s SHIFT→ 1 → 5:Var→
→ =
:x n 1
4
fx-570 ES PLUS
Xóa bộ nhớ: SHIFT→ 9 → 2 → =
Vào chế độ thống kê (STAT):
MODE→3: STAT→1:1-VAR
Nhập số liệu: dùng nút tròn và nút =
Khai báo cột tần số:
SHIFT→MODE→▼→4: STAT→1: ON
Nhập xong nhấn AC
12
Đọc kết quả:
Đại lượng cần tìm Thao tác
n SHIFT→ 1 → 4:Var→1: n→ =
SHIFT→ 1 → 4:Var→ → =
s SHIFT→ 1 → 4:Var→ → =
:sx
4
Trang 3fx-580 VNX
Xóa bộ nhớ: SHIFT→ 9 → 2 → =
Vào chế độ thống kê (STAT):
MENU→6: STAT→1:1-VAR
Nhập số liệu: dùng nút tròn và nút =
Khai báo cột tần số:
SHIFT→MENU→▼→3: STAT→1: ON
Nhập xong nhấn AC
14
Đọc kết quả:
Đại lượng cần tìm Thao tác
n Nhấn ▼ Nhìn màn hình thấy n
Nhìn màn hình thấy
s Nhấn ▼ Nhìn màn hình thấy sx
x
OPTN→2:1-VAR
x
IV Lý thuyết ước lượng:
15
Tổng thể
(N)
Mẫu
(n)
2
p
x
2
s
f
Ước lượng (dự đoán)
V Ước lượng điểm:
16
-Kết quả được cho bởi một con số cụ thể
Ví dụ: Ta lấy mẫu và ước lượng chiều cao
trung bình của người Việt Nam Nếu kết luận chiều cao trung bình của người Việt Nam là 170cm thì 170cm là một ước lượng điểm
-Khi đó:
VI Ước lượng khoảng:
-Kết quả cần ước lượng được cho bởi một
khoảng (a,b).
Ví dụ: Ta lấy mẫu và ước lượng chiều cao
trung bình của người Việt Nam Nếu kết luận
chiều cao trung bình của người Việt Nam
trong khoảng (158cm,172cm) thì
(158cm,172cm) là một ước lượng khoảng.
Giả sử là tham số cần ước lượng
2
( , , ) p
(
)
( , ) γ
P a b
(a,b): Khoảng tin cậy (khoảng ước lượng) với
độ tin cậy γ.
1 γ, :
Mức ý nghĩa.
Trang 4VII Ước lượng trung bình của tổng thể:
19
:
trung bình của tổng thể
-Giả thiết: Cho cỡ mẫu n Biết
Cho độ tin cậy
,
x s
γ
-Mục tiêu: Cần tìm (sai số ước lượng, độ
chính xác) sao cho
(x ; x )
-Phương pháp: Tùy vào n và
: Khoảng tin cậy đối xứng.
( ; x )
: Khoảng tin cậy tối đa.
(x ; )
: Khoảng tin cậy tối thiểu.
20
KHOẢNG TIN CẬY ĐỐI XỨNG
(2 PHÍA)
(Xem Phương pháp dạng sơ đồ trang 18)
21
KHOẢNG TIN CẬY TỐI ĐA,
TỐI THIỂU (1 PHÍA)
(Xem Phương pháp dạng sơ đồ trang 18)
22
Ví dụ 1: Mẫu điều tra về chỉ tiêu X của một loại sản
phẩm được kết quả cho trong bảng:
x i (%) 2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5
n i (số sp) 7 12 20 25 18 12 5 1
a) Hãy ước lượng khoảng cho trung bình chỉ tiêu X với độ
tin cậy 95%.
b) Hãy ước lượng khoảng cho trung bình tối đa của chỉ
tiêu X với độ tin cậy 95%.
c) Hãy ước lượng trung bình tối thiểu của chỉ tiêu X với
độ tin cậy 95%.
d) Những sản phẩm có chỉ tiêu X không quá 10% là sản
phẩm loại 2 Hãy ước lượng khoảng cho trung bình chỉ
tiêu X các sản phẩm loại 2 với độ tin cậy 95%, biết rằng chỉ tiêu X các sản phẩm loại 2 có phân phối chuẩn.
23
Giải a) n
chưa biết và
γ
( )
2
100.
0, 95.
0,95
0, 475
Gọi(%) là trung bình chỉ tiêu X
30.
n
24
s C n
(15, 7185 ; 18,8815) (%)
8, 0691
100
( x ; x )
b)
1, 65.
γ 0, 95 1 0, 95 0, 05.
0, 45
s C n
1, 65 8, 0691 1,3314.
100
Trang 5
Vậy trung bình tối đa của chỉ tiêu Xvới độ tin
cậy 95% là 18,6314%
( ; x ) ( ; 18, 6314).
c) ( x ; ) (15,9686 ; ).
Vậy trung bình tối thiểu của chỉ tiêu Xvới độ
tin cậy 95% là 15,9686%
d) Bảng phân phối thực nghiệm các sản phẩm
loại 2:
x i (%) 2,5 7,5
n i (số sp) 7 12
26
Gọi (%) là trung bình chỉ tiêu X các sản phẩm loại 2
n
chưa biết và
7 12 19
5, 6579 2, 4779.
0, 95 1 0, 95 0, 05.
1,2
C t n
2
19 1,
t
18; 0,025 2,101.
t
s C n
2,101 2, 4779 1,1944.
19
30.
n
VII Ước lượng trung bình của tổng thể:
27
x ; x (4, 4635 ; 6,8523) (%).
Ví dụ 2: Chủ một kho cung cấp sơn muốn ước
lượng lượng sơn chứa trong một thùng được sản
xuất từ một dây chuyền công nghệ quốc gia Biết
rằng theo tiêu chuẩn của dây chuyền công nghệ đó,
độ lệch tiêu chuẩn của lượng sơn là 0,08 thùng.
Điều tra một mẫu 50 thùng được lượng sơn trung
bình là 0,97 thùng Với độ tin cậy 99%, hãy ước
lượng khoảng cho lượng sơn trung bình chứa trong
một thùng.
28
Giải
Gọi (thùng) là
γ
(thùng)
VIII Ước lượng tỉ lệ của tổng thể:
:
p tỉ lệ của tổng thể
-Giả thiết: Cho cỡ mẫu n.
Biết tỉ lệ mẫu , m: số phần tử có tính chất A nào đó
Cho độ tin cậy γ
-Mục tiêu: Cần tìm (sai số ước lượng, độ chính xác) sao cho
p f f
m f n
: Khoảng tin cậy đối xứng.
p f : Khoảng tin cậy tối đa.
p f : Khoảng tin cậy tối thiểu.
Trang 6-Sai số ước lượng khoảng tin cậy đối xứng:
(Xem Phương pháp dạng sơ đồ trang 22)
32
-Sai số ước lượng khoảng tin cậy tối đa, tối thiểu:
(Xem Phương pháp dạng sơ đồ trang 22)
33
Ví dụ 1: Kiểm tra 100 sản phẩm trong một lô hàng lớn
gồm 50000 sản phẩm thấy có 20 phế phẩm Hãy ước
lượng khoảng cho tỉ lệ phế phẩm với độ tin cậy 99%?
Số phế phẩm của lô hàng đó nằm trong khoảng nào?
Giải
Gọi p : tỉ lệ phế phẩm của lô hàng.
f : tỉ lệ phế phẩm trong 100 sản phẩm
được kiểm tra
γ
f
20 0, 2.
100 0,99.
2, 58
γ 0, 99
0, 495
2 2
34
p
Số phế phẩm của lô hàng đó nằm trong khoảng:
0, 0968 50000; 0,3032 50000 4840; 15160
(sản phẩm)
2, 58
100
f f C
n
f ; f (0, 0968 ; 0,3032)
Ví dụ 2: Cân ngẫu nhiên 45 con heo 3 tháng
tuổi trong một trại chăn nuôi, ta được kết quả
i 35 37 39 41 43 45 47
n i 2 6 10 11 8 5 3
Heo có khối lượng trên 38kg là heo đạt tiêu
chuẩn Giả sử khối lượng tuân theo quy luật
phân phối chuẩn
a) Hãy tìm khoảng ước lượng cho tỉ lệ heo đạt
tiêu chuẩn trong trại trên với độ tin cậy 90%
b) Hãy ước lượng tối đa cho tỉ lệ heo đạt tiêu
Gọi p :
f :
γ
γ 0, 9
0, 45 1, 64.
f
a)
tỉ lệ heo đạt tiêu chuẩn
tỉ lệ heo đạt tiêu chuẩn trong 45 con heo được cân
Giải
Trang 7
p
với độ tin cậy 90%
38
b) γ
p
Vậy, tỉ lệ tối đa cho heo đạt tiêu chuẩn trong trại trên với độ tin cậy 90% là
IX Ước lượng phương sai của tổng thể:
39
Sinh viên tự nghiên cứu.
X Các bài toán liên quan đến ước lượng trung bình:
40
Xem trang 19
XI Các bài toán liên quan đến ước lượng tỉ lệ:
Xem trang 23
Ví dụ 1: Một khách hàng nhận được lô hàng từ
một nhà máy sản xuất bút bi rẻ tiền Để ước lượng tỉ lệ bút hỏng, khách hàng lấy ngẫu nhiên 300 bút từ lô hàng kiểm tra và thấy có 30 bút hỏng
a) Nếu sử dụng mẫu điều tra, để ước lượng tỉ
lệ bút bi hỏng đạt độ chính xác là 2,5% thì đảm bảo độ tin cậy là bao nhiêu?
b) Nếu muốn ước lượng tỉ lệ bút bi hỏng đạt
độ tin cậy 96% và độ chính xác 3% thì cần
Trang 8Giải a)
200
n
(1 )
n C
γ 2 ( ) C
300
30 0,1
300
0, 025
300
0, 025 1, 44
0,1.(1 0,1)
2 (1, 44) 2 0, 4251
0,8502 85, 02%
Gọi f : tỉ lệ bút hỏng trong 300 bút được kiểm
tra
44
b)
γ 0,95
2
)
2
Gọi n là số bút bi cần kiểm tra
Vậy cần kiểm tra thêm
300 125
mn (bút)
γ 0, 96
0, 48
2 2 2, 06
424, 36 1
n
.(1 ) (2, 06) 0,1.(1 0,1)
424, 36 (0, 03)
C f f n
45
Ví dụ 2: Đo đường kính của 100 chi tiết do
một máy sản xuất được số liệu
x i(cm) 9,75 9,80 9,85 9,90
n i (số sản phẩm) 5 37 42 16
a) Nếu sử dụng mẫu này và muốn ước lượng
đường kính trung bình với độ chính xác 0,006
cm thì đảm bảo độ tin cậy bao nhiêu?
b) Nếu muốn ước lượng đường kính trung bình
với độ chính xác là 0,003 cm và độ tin cậy là
95% thì cần kiểm tra thêm bao nhiêu chi tiết?
46
Giải a) n 100 30 s 0, 04.
γ
C
b) 0, 003 γ 0 9 , 5.
γ 0,95
2
)
2
Vậy cần kiểm tra thêm:
Gọi n là số chi tiết cần kiểm tra
n
O
Chương 5:
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Giảng viên: Phan Trung Hiếu
Việc kiểm tra lại thông tin mà ta nhận được xem có đáng tin cậy không chính là bài toán kiểm định
Trang 9I Các khái niệm:
Giả thuyết thống kê: là các giả thuyết nói về
-Các tham số của tổng thể;
-Quy luật phân phối xác suất hoặc tính độc lập
của các biến ngẫu nhiên
Kiểm định giả thuyết thống kê: là công việc
tìm ra kết luận để bác bỏ hay chấp nhận một
giả thuyết thống kê từ các thông tin thu được
trên mẫu điều tra
Ký hiệu: H: giả thuyết không.
: giả thuyết đối (đối thuyết) của H.
H
50
-Dựa vào mẫu lấy ra để đưa ra kết luận:
"chấp nhận H (bác bỏ )
hay chấp nhận (bác bỏ H)"
H H
Ví dụ 1: Một tổ chức cho rằng chiều cao trung
bình hiện nay của thanh niên Việt Nam là
1,65m Hãy lập giả thuyết để kiểm chứng kết
quả này?
51
Giải
Gọi : chiều cao trung bình của thanh niên
hiện nay (theo thực tế).
Giả thuyết
: 1, 65
: 1, 65
H H
lấy một mẫu
để điều tra
kiểm định chấp nhận
H bác bỏ
52
Ví dụ 2: Một ý kiến cho rằng tỉ lệ sinh viên thi
đạt môn XSTK là thấp hơn 50% Hãy lập giả thuyết để kiểm chứng điều này?
Giải
Gọi p: tỉ lệ sinh viên thi đạt môn XSTK (theo
thực tế).
Giả thuyết
: 0,5
H p
H p : 0, 5
Tiêu chuẩn kiểm định giả thuyết: là một thống kê
T=T(X1, X2,…,X n) có thể phụ thuộc vào tham số đã
biết trong giả thuyết H Thống kê T được chọn sao
cho thỏa điều kiện:Khi H đúng thì luật phân phối
xác suất của T hoàn toàn được xác định.
tìm được tập hợp thỏa
0
W P{TW H đúng} :
W Miền bác bỏ giả thuyết H.
:
W Miền chấp nhận giả thuyết H.
Tiến hành quan trắc dựa trên mẫu ngẫu nhiên
(X1, X2,…, X n ) ta thu được mẫu cụ thể (x1, x2,…,
x n), ta tính được giá trị
t=T(x1, x2,…, x n)
Từ đó:
■ Nếu thì ta bác bỏ H.
■ Nếu thì ta chấp nhận H (chưa đủ cơ sở
để bác bỏ H).
t W
t W
Trang 10II Các loại sai lầm trong kiểm định:
: mức ý nghĩa
Thực tế Kết luận
Sai lầm nào nghiêm trọng hơn?
Cách làm giảm khả năng mắc sai lầm?
56
Ví dụ: Tôi đi khám bệnh Ebola, có 2 giả thiết
H: Tôi thực sự bị bệnh Ebola.
H: Tôi thực sự không bệnh Ebola.
Kết luận của bác sĩ:
Có bệnh Không bệnh Sai lầm loại I: Bác sĩ cho tôi về trong khi tôi
thực sự có bệnh
Sai lầm loại II: Bác sĩ cách ly tôi trong khi tôi
thực sự không có bệnh
Nghiêm trọng
cách ly (tạm giam)
cho về
57
-Ta không thể làm giảm P(sai lầm I) và P(sai
lầm II) xuống cùng một lúc được vì khi P(sai
lầm I) giảm thì P(sai lầm II) sẽtăng và ngược
lại
-Ta sẽ ấn định trước P(Sai lầm I) = , và
trong điều kiện đó P(Sai lầm II) được hạn
chế ở mức thấp nhất
III Kiểm định tham số:
58
Giả sử là tham số cần kiểm định theo thực tế
2
( , , p )
là giá trị đã biết theo 1 ý kiến nào đó
0
2
( ,p , )
Kiểm định
2 phía
Kiểm định
1 phía
Kiểm định phía trái
Kiểm định phía phải
0
0
: :
H H
0
0
: :
H H
0
0
: :
H H
Các bước kiểm định tổng quát:
-Bước 1: Đặt cặp giả thuyết thống kê
-Bước 2: Kiểm định giả thuyết thống kê
-Bước 3: Kết luận (chấp nhận hay bác bỏ H).
IV So sánh trung bình với một số:
: trung bình của tổng thể (thực tế, chua biết)
0
: cho trước.
Cho trước mức ý nghĩa
Nhắc lại: 1