NHÓM 4Ước lượng các tham số của ĐLNN và kiểm định giả thiết thống kê... Ước lượng điểm: • Giả sử cần ước lượng tham số.. Thông thường người taxây dưng * bằng các phương pháp hàm ước lượn
Trang 1NHÓM 4
Ước lượng các tham số của ĐLNN và
kiểm định giả thiết thống kê
Trang 2Lý thuyết toán
5.1 Ước lượng điểm:
• Giả sử cần ước lượng tham số Từ đám đông lấy mẫuW= (X1, X2, …, Xn) từ mẫu này ta xây dựng 1 thống kê *=f(X1, X2, …, Xn) thích hợp Để có ước lượng điểm, ta chỉviệc điều tra 1 mẫu cụ thể w= (x1, x2, …, xn) với kích
thước người lao động đủ lớn, rồi lấy *= f(x1, x2, …, xn)
• Có nhiều cách chọn thống kê * Thông thường người taxây dưng * bằng các phương pháp hàm ước lượng, tức làchon * là các đặc trưng mẫu tương ứng Chẳng hạn lấytrung bình mẫu để ước lượng trung bình đám đông µ=
E(X), lấy phương sai mẫu điều chỉnh S’2 để ước lượngphương sai của đám đông S’2=Var(X), lấy tần suất mẫu f
để ước lượng tỉ lệ của đám đông p Sau đây là các tiêuchuẩn phản ánh bản chất tốt của ước lượng
Trang 3Lý thuyết toán
5.1.1 Ước lượng không chệch.
Thống kê * được gọi là ước lượng không chệch của nếu E(*)= Nếu
E(*) thì * được gọi là ước lượng chệnh của .
5.1.2 Ước lượng vững
Thống kê * được gọi là ước lượng vững của nếu với mọi >0, nhỏ tùy ý ta luôn có:
1)
*(
n
5.1.3 Ước lượng hiệu quả
Thống kê * được gọi là ước lượng hiệu quả của tham số của ĐLNN gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng mẫu đó.
Trang 4Lý thuyết toán
5.2 Khái niệm về ước lượng bằng khoảng tin cậy.
Để ước lượng tam số của ĐLNN X trước hết từ đám đông ta lấy ra mẫu ngẫu
nhiên W= (X 1 , X 2 , …, X n ).
Tiếp đến ta xây dựng thống kê G= f(X 1 , X 2 , …, X n,), sao cho quy luật phân phối
xác suất của G hoàn toàn xác định Với xác suất = 1- cho trước ta xác định cặp giá trị 1 , 2 thỏa mãn các điều kiện 1 0, 2 0 và 1 +2 = Vì quy
luật phân phối xác suất của G đã biết, ta tìm được phân vị g 1-1 và g2 sao cho: P(G> g 1-1 ) = 1- 1 và P(G> g2 ) = 2
Khi đó P(g1-1 <G< g2 ) = 1- 1 - 2 = 1- =
Cuối cùng bằng biến đổi tương đương, ta có:
P(1 * << 2 *) = 1- =
= 1- : độ tin cậy
(1, 2 ) : khoảng tin cậy
I= (2 *- 1 *) : độ dài của khoảng tin cậy
Người ta thường chọn 1 =2 =
2
Nếu chọn 1 =0 và 2 = hoặc chọn 2 =0
Trang 5Lý thuyết toán
Trang 6Lý thuyết toán
Trang 7Lý thuyết toán
Trang 8Lý thuyết toán
Trang 9Lý thuyết toán
Trang 10Lý thuyết toán
Trang 11Lý thuyết toán
Trang 12Lý thuyết toán
Trang 13Lý thuyết toán
5.4 Ước lượng tỷ lệ ( Ước lượng tham số p trong phân phối A(p))
Xét một đám đông kích thước N phần tử mang dấu hiệu A Kí hiệu tỉ lệphần tử mang dấu hiệu A trên đám đông là p =
N
M
Để ước lượng p từ đámđông ta lấy ra mẫu kích thước n Kí hiệu nA là số phần tử mang dấu hiệu A
có trong n phần tử lấy ra.Khi đó f =
f
Trang 14là sai số ước lượng Nếu p chua biết, n khá lớn để tính ta lấy p f , khi đó:
Khoảng tin cậy đối xứng của p là (f – ; f + ).
Độ tin cậy của ước lượng là γ = 1 – α.
Trang 15p f
Trang 17Lý thuyết toán
5.5 ước lượng phương sai của đại lượng ngẫu nhiên
phân phối chuẩn
Giả sử ta cần nghiên cứu một dấu hiệu X có phân phối chuẩn với Var(X)
=2
chưa biết Để ước lượng 2
, từ đám đông ta lấy ra mẫu W = ( X1,
X2,….Xn) Từ mẫu này ta tìm được S'2.Theo 4.4 ta có :
2 '
2 (n 1 )S
~ 2 (n 1 )
Trang 182 1
n
) = 1 – α = γ
Thay biểu thức của 2
vào công thức trên và biến đổi, ta có:
2 1
2 ' 2
) 1 ( 2
2
2 '
) 1 ( )
1 (
n n
S
n
1 – α = γ
Ở đây γ = 1 – α là độ tin cậy.
Khoảng tin cậy của 2
2 1
2 ' )
1 ( 2
2
2 '
S
n
Trang 19Lý thuyết toán
b Khoảng tin cậy phải của 2
( lấy α 1 = 0, α 2 = α dùng để ước lượng giá
trị tối thiểu của 2
Thay biểu thức của 2
từ (5.9) vào công thức trên và biến đổi , ta có:
P (( 21() 1) 2)
2 '
2 '
Trang 20Lý thuyết toán
c Khoảng tin cậy trái của 2
( lấy α1 = α , α2 = 0 dùng để ước lượng giá trị tối đa của 2
Thay biểu thức của 2
từ (5.9) vào công thức trên và biến đổi , ta có:
1
2 ' 2
1
2 '
Trang 21Lý thuyết toán
Trang 22Lý thuyết toán
Trang 23Lý thuyết toán
Trang 25Lý thuyết toán
6.2: Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN.
Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một
đám đông Ký hiệu E(X) , Var(X) 2, trong đó chưa biết Từmột cơ sở nào đó người ta tìm được 0, nhưng nghi ngờ về điềunày Với mức ý nghĩa cho trước, ta cần kiểm định giả thuyết
0
X n
1
X
X n
Trang 26X U
Trang 270 0
0 0
0 0
Ta có P-giá trị = P(U u tn).
Trang 28Lý thuyết toán
2 Kết luận sau khi tìm được P-giá trị
a Cách thứ nhất :
Nếu P-giá trị ≤ 0,05 : Chưa có cơ sở để bác bỏ H0
Nếu 0,01 ≤ P-giá trị < 0,05 : Có cơ sở để bác bỏ H0
Nếu P-giá trị < 0,01 : Có cơ sở chắc chắn để bác bỏ H0
b Cách thứ hai : Quy định trước mức ý nghĩa Tính P-giá trị rồi
so sánh với :
Nếu P-giá trị < thì bác bỏ H0
Nếu P-giá trị ≥ chưa có cơ sở để bác bỏ H0
Chú ý : Các công thức tìm P-giá trị trên còn được dùng cho các bài
toán kiểm định giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn
kiểm định U.
Trang 29Lý thuyết toán
6.2.2 : ĐLNN X trên đám đông có phân phối chuẩn
với 2 chưa biết.
XDTCKĐ :
n S
Trang 300 0
P-giá trị = 2P(T t tn ) , trong đó 1
~T n
T ,
n s
0 0
0 0
P-giá trị = P(T t tn)
Chú ý : Công thức tìm P-giá trị trên còn dùng cho các bài toán kiểm
định khác có dùng tiêu chuẩn kiểm định T.
Sau khi tìm được P-giá trị, việc kết luận được tiến hành như
mục 6.2.1.
Chú ý : Khi ĐLNN có phân phối chuẩn, mặc dù 2 chưa biết, nhưng
Trang 31Lý thuyết toán
6.2.3 : Chưa biết quy luật phân phối xác suất của
0
Khi đó, nếu giả thuyết H0 đúng thì U sẽ xấp xỉ phân phối chuẩn
N(0,1) Phần còn lại tiến hành như mục 6.2.1 Ta cũng cần nhớ
rằng : nếu 2 chưa biết, nhưng n 30 ta có thể lấy 2 s.
Trang 32Bài tập thực tế
Yêu cầu : Điều tra chiều cao của nam ở độ tuổi
trưởng thành của VN
1 Ước lượng chiều cao của nam
2 So sánh với kết quả đưa ra trong nghiên cứu
của Tổng cục TDTT năm 1994 là chiều cao
TB của nam là 163cm
Trang 34Bài tập thực tế
Từ đó ta tính được:
68 ,
169 50
8484 1
x
Trang 35Bài tập thực tế
Trang 36Bài tập thực tế
2 Gọi X là chiều cao của sinh viên nam trường ĐHTM
đông
n N
X N
0 0
:
63 , 1 :
Chọn TKTCKĐ:
n
X U
63 1 69