CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 5.1.3 Ước lượng hiệu quả efficient estimator Ước lượng không chệch có phương sai nhỏ nhất so với mọi ước lượng không chệch khá
Trang 15.1 PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM
5.1.1 Khái niệm ước lượng điểm
Phương pháp ước lượng điểm chủ trương dùng một giá trị để
thay cho giá trị của tham sốchưa biết của tổng thể Thông
thường giá trị được chọn này là giá trị cụ thể của một thống
kê nào đó của mẫu ngẫu nhiên
Với mẫu ngẫu nhiênW=(X1,X2, … ,Xn), thống kê ước lượng
cho tham sốcó dạng
T X X 1, 2, , Xn
Khi đó với mẫu cụ thểw=(x1,x2, … ,xn), giá trị cụ thể của
thống kê qs= T (x1,x2, … ,xn), ước lượng cho tham số
5.1.2 Ước lượng không chệch (unbiased estimator)
chệch của nếu với mọi giá trị của tham số
T X X 1, 2, , Xn
E X X , , , Xn
Ví dụ 5.1: Dựa vào các công thức (4.8), (4.13), (4.17) của lý thuyết mẫu
ta có các kết quả sau:
Trung bình mẫu X là ước lượng không chệch của kỳ vọng của biến ngẫu nhiên gốc của tổng thể
Phương sai mẫu S2 và S*2 là ước lượng không chệch cho phương sai 2 của biến ngẫu nhiên gốc của tổng thể
Tần suất mẫu f là ước lượng không chệch của tần suất p của tổng thể
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.1.3 Ước lượng hiệu quả (efficient estimator)
Ước lượng không chệch có phương sai nhỏ nhất so với mọi ước
lượng không chệch khác được xây dựng trên cùng một mẫu ngẫu
nhiên gọi là ước lượng hiệu quả (hay ước lượng phương sai bé
nhất)
phương sai của các ước lượng không chệch, đó là một dấu hiệu để
xét xem ước lượng không chệch có phải là ước lượng hiệu quả hay
không
Điều kiện (5.1) của ước lượng không chệch có nghĩa rằng trung bình các
giá trị của bằng giá trị Tuy nhiên từng giá trị của có thể sai lệch
rất lớn so với Vì vậy ta tìm ước lượng không chệch sao cho độ sai
lệch trung bình là bé nhất
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Dấu hiệu nghiên cứu là biến ngẫu nhiênXcó hàm mật độ xác suất (hay hàm khối lượng xác suất)f(x,)và là ước lượng không chệch bất kỳ của thì
2
1 D
ln ( , )
n
Bất đẳng thức Cramer-Rao
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Dựa vào bất đẳng thức Cramer-Rao ta có thể chứng minh được
rằng trung bình mẫu là ước lượng hiệu quả của kỳ vọngcủa dấu
hiệu nghiên cứu X của tổng thể có phân bố chuẩnN(;2)
Ta có D X 2
n
Mặt khác hàm mật độ củaXcó dạng
2 2
( ) 2 1 ( , )
2
x
( ) ln ( , )
ln ( , ) ln 2
2
2
ln ( , )
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.1.4 Ước lượng vững (consistent estimator)
của tham số của biến ngẫu nhiên gốcXnếu hội tụ theo xác suất đếnkhin
T X X 1, 2, , Xn
Ta có các kết quả sau
Trung bình mẫu là ước lượng không chệch, hiệu quả và vững của kỳ vọngcủa biến ngẫu nhiên gốc của tổng thể
Tần suất mẫuflà ước lượng không chệch, hiệu quả và vững của tần suấtpcủa tổng thể
Phương sai mẫuS2vàS*2(trường hợpđã biết) là ước lượng không chệch và vững của phương sai của biến ngẫu nhiên gốc của tổng thể
Trang 25.2 PHƯƠNG PHÁP ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY
Phương pháp ước lượng điểm nói trên có nhược điểm là khi kích
thước mẫu bé thì ước lượng điểm có thể sai lệch rất nhiều so với giá
trị của tham số cần ước lượng
Phương pháp ước lượng điểm cũng không thể đánh giá được khả
năng mắc sai lầm khi ước lượng là bao nhiêu
Khoảng[a; b]có hai đầu mút là hai thống kê
1, 2, , n , 1, 2, , n
phụ thuộc mẫu ngẫu nhiênW =(X1,X2,…,X n) gọi là khoảng tin cậy
của tham số với độ tin cậy nếu
1, 2, , n 1, 2, , n
P a X X X b X X X
Do đó khi kích thước mẫu bé người ta thường dùng phương pháp
ước lượng khoảng tin cậy
5.2.1 Khái niệm khoảng tin cậy
Trong thực tế thường yêu cầu độ tin cậy khá lớn, khi đó theo nguyên lý xác suất lớn biến cố
{ a(X1,X2,…,Xn) b(X1,X2,…,Xn) }
hầu như chắc chắn sẽ xảy ra trong một phép thử Tiến hành một phép thử với mẫu ngẫu nhiênW=(X1,X2,…,Xn)
ta thu được một mẫu cụ thể w=(x1,x2,…,xn),tính được giá trị
cụ thểa=a(x1,x2,…,xn),b=b(x1,x2,…,xn) Lúc đó có thể kết luận là: Qua mẫu cụ thể với độ tin cậytham
sốcủa biến ngẫu nhiên gốcXsẽ nằm trong khoảng[a;b], tức làa b
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.2.2 Khoảng tin cậy của kỳ vọng biến ngẫu nhiên phân bố chuẩn
5.2.2.1 Trường hợp phương sai2đã biết
Khoảng tin cậy của tham số với độ tin cậy có dạng
/ 2
U là giá trị tới hạn mức 2 của phân bố chuẩn tắc N (0;1)
/ 2
U
n
được gọi là độ chính xác của ước lượng
Với độ tin cậykhông đổi, với độ chính
xác 0cho trước, kích thước mẫu cần
thiết là số tự nhiênnnhỏ nhất thỏa mãn
2 2 /2 2
U
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
/ 2
U O
/ 2
/ 2
/ 2
U
Hình 5.1: Khoảng tin cậy của kỳ vọng phân bố chuẩn
1
(X ) n
1
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Trọng lượng của một loại sản phẩm là một biến ngẫu nhiên phân
bố chuẩn với độ lệch tiêu chuẩn 1 gram Cần thử 25 sản phẩm loại
này ta thu được kết quả
Trọng lượng (gram) 18 19 20 21
Với độ tin cậy 0,95 2 0,025 U2 1 96 ,
19,64.
x
Độ chính xác của ước lượng / 2 1
1,96 0,392 25
U n
Khoảng tin cậy với độ tin cậy 95% của tham sốlà
19, 248 20,032 Nếu muốn độ chính xác của ước lượng không vượt quá 0,3 thì
/ 2
0
1 1,96 42,68 0,3
U
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.2.2.2 Trường hợp phương sai2chưa biết, n 30
Khoảng tin cậy của tham sốvới độ tin cậy
/2 S ; /2 S
Để xác định chiều cao trung bình của các cây bạch đàn trong khu rừng rộng trồng bạch đàn, ta tiến hành đo ngẫu nhiên 35 cây
Khoảng r i x i u i = x i 8,25 r i u i r i u i2
Trang 30,1857 8, 25 0,1857 8,06
35
2
U
Với độ tin cậy 95%, U2 1,96
Độ chính xác của ước lượng / 2 0, 64
35
s U n
Khoảng tin cậy cho chiều cao trung bình của các cây bạch đàn
7,85 8, 27
5.2.2.3 Trường hợp phương sai2chưa biết, n < 30
Khoảng tin cậy của tham số với độ tin cậy
/ 2( 1) S ; / 2( 1) S
trong đó t/ 2( n 1) là giá trị tới hạn mức 2 của phân bố Student 1
n bậc tự do
/ 2( 1) S
n
được gọi là độ chính xác của ước lượng
2 / 2 0 ( 1)
Với độ tin cậykhông đổi, với độ chính xác
0cho trước, kích thước mẫu cần thiết là số
tự nhiên n nhỏ nhất thỏa mãn
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Năng suất của một loại giống mới là một biến ngẫu nhiên có quy
luật phân bố chuẩn N(;2) Gieo thử giống này trên 16 mảnh vườn
thí nghiệm thu được như sau (đơn vị kg/ha):
172, 173, 173,174, 174, 175, 176, 166, 166, 167, 165, 173, 171, 170, 171, 170
Với độ tin cậy = 95%
Từ các số liệu trên ta tính được: x 171; s 3, 4254
/ 2 0,025
Vậy khoảng tin cậy với độ tin cậy = 95% cho năng suất
trung bình của loại hạt giống này 169,115 172,885
Độ chính xác /2( 1) 2,1313, 4254 1,885
16
s
t n
n
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.2.3 Khoảng tin cậy cho tần suất của tổng thể
Ta cần nghiên cứu một dấu hiệu định tínhAnào đó của tổng thể Nếu cá thể có dấu hiệuAta cho nhận giá trị 1, trường hợp ngược lại
ta cho nhận giá trị 0
Lúc đó dấu hiệu nghiên cứu có thể xem là biến ngẫu nhiên X có phân
bố Bernoulli với tham sốp
Kỳ vọng EX = p và phương sai DX = p(1 p)
Lấy mẫu ngẫu nhiên W=(X1,X2,…,X n)
Tần suất mẫu X1 Xn
f n
(1 )
U
xấp xỉ với phân bố chuẩn tắc N (0;1) khi n đủ lớn
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Khoảng tin cậy cho tần suất pcủa tổng thể với độ tin cậy
;
Với điều kiện nđủ lớn 10
(1 ) 10
nf
Độ chính xác của khoảng tin cậy / 2 f (1 f )
U
n
Với độ tin cậykhông đổi, với độ chính
xác0cho trước, kích thước mẫu cần
thiết là số tự nhiênnnhỏ nhất thỏa mãn
2 / 2 0 (1 ) U
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Trong đợt vận động bầu cử tổng thống ở một nước nọ, người
ta phỏng vấn ngẫu nhiên 1600 cử tri, được biết có 960 người
trong số đó sẽ bỏ phiếu cho ứng cử viên A
Với độ tin cậy= 95% hãy ước lượng ứng cử viên Asẽ chiếm được tối thiếu bao nhiêu % số phiếu bầu
Độ chính xác của ước lượng 0,6 0, 4
1600
Từ mẫu cụ thể trên ta có 960
0,6 1600
Thỏa mãn điều kiện nđủ lớn 960 10
(1 ) 640 10
nf
n f
Khoảng tin cậy 95% 0,576 p 0, 624
Vậy tối thiểu có 57,6% cử tri sẽ bỏ phiếu cho ứng cử viên A
Trang 45.3 KHÁI NIỆM CHUNG VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Trong mục này ta sẽ sử dụng phương pháp kiểm định giả thiết
thống kê để kiểm định các tham số đặc trưng của tổng thể
5.3.1 Giả thiết thống kê
Giả thiết đưa ra kiểm nghiệm được ký hiệu làH0, gọi là “ giả
thiết không ” (Null hypothesis)
Giả thiết cạnh tranh, mang tính chất đối chứng vớiH0gọi là
đối thiết(Alternative hypothesis), ký hiệuH1 Đối thiếtH1sẽ
được chấp nhận khiH0bị bác bỏ và ngược lại
Vì các dấu hiệu nghiên cứu có thể xem là các biến ngẫu nhiên
gốc của tổng thể do đó ta xét các giả thiết thống kê là giả thiết
về biến ngẫu nhiên gốc của tổng thể, bao gồm: dạng phân bố
xác suất, các tham số đặc trưng của biến ngẫu nhiên gốc hoặc
giả thiết về sự độc lập của các biến ngẫu nhiên gốc
5.3.2 Tiêu chuẩn kiểm định giả thiết thống kê Qui tắc kiểm định dựa trên hai nguyên lý sau
Nguyên lý xác suất nhỏ: "Nếu một biến cố có xác rất nhỏ thì trong một phép thử biến cố đó được coi như không xảy ra"
Phương pháp phản chứng: "Để bác bỏAta giả sửAđúng; nếu từ giả thiếtAđúng dẫn đến một điều vô lý thì ta bác bỏA"
Dựa vào hai nguyên lý này ta đưa ra phương pháp chung để kiểm định một giả thiết thống kê như sau:
Để kiểm định H0trước hết giả sử H0đúng từ đó ta tìm được biến cố
Amà xác suất xuất hiện biến cốAlà rất bé và ta có thể xemAkhông thể xảy ra trong một phép thử Lúc đó nếu từ một mẫu cụ thể quan sát được mà biến cốAxảy ra thì điều này trái với nguyên lý xác suất nhỏ Vậy H0sai và bác bỏ nó
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
T T(X1, X2, … , Xn, ) Tiêu chuẩn kiểm định là thống kê
trong đó là tham số liên quan đến giả thiết cần kiểm định
Từ biến ngẫu nhiên gốcXcủa tổng thể lập mẫu ngẫu nhiên
kích thướcn
W (X1, X2, … , Xn)
NếuH0đúng( 0)thì thống kê Tcó quy luật phân bố xác
suất xác định Từ đó lập biến cố W có xác suất bé
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.3.3 Miền bác bỏ giả thiết
Sau khi đã chọn tiêu chuẩn kiểm địnhT, vớibé cho trước (thường
được lấy bằng 0,05 hoặc 0,01) và với giả thiết H0đúng ta có thể tìm được miềnWsao choTnhận giá trị trong miềnWvới xác suất bằng
W gọi là miền bác bỏ giả thiếtH0với mức ý nghĩa
P{T W|H0} =
5.3.4 Giá trị quan sát của tiêu chuẩn kiểm định Thay giá trị thu được mẫu cụ thểw=(x1,x2, … ,xn)vào thống kê tiêu chuẩn kiểm định ta được giá trị quan sát của tiêu chuẩn kiểm định
( , , , , )
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.3.5 Quy tắc kiểm định giả thiết thống kê
So sánh giá trị quan sát của tiêu chuẩn kiểm định với miền bácbỏ
Wvà kết luận theo quy tắc sau
1.Nếu giá trị quan sátTqs rơi vào miền bác bỏW, theo nguyên
tắc kiểm định thì H0sai, do đó ta bác bỏ H0thừa nhận H1
2 Nếu giá trị quan sátTqs không rơi vào miền bác bỏWthì
điều này chưa khẳng định rằngH0 đúng mà chỉ có nghĩa là qua
mẫu cụ thể này chưa khẳng định được làH0 sai Do đó ta chỉ có
thể nói rằng qua mẫu cụ thể này chưa có cơ sở để bác bỏH0(trên
thực tế là thừa nhậnH0)
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.3.6 Sai lầm loại một và sai lầm loại hai Với quy tắc kiểm định như trên có thể mắc hai loại sai lầm sau
1 Sai lầm loại I:Đó là sai lầm mắc phải khi bác bỏ giả thiếtH0 trong khiH0đúng.Ta thấy xác suất mắc sai lầm loại I đúng bằng mức ý nghĩa Thật vậy, xác suất ta bác bỏ H0 bằng xác suất biến cố {TW},do đó khiH0 đúng thì xác suất này bằngP{TW| H0} Sai lầm loại I sinh ra do kích thước mẫu quá nhỏ, do phương pháp lấy mẫu v.v…
2 Sai lầm loại II:Đó là sai lầm mắc phải khi thừa nhận giả thiếtH0 trong khiH0 sai, điều này xảy ra khi giá trị quan sátT qs không thuộc
miền bác bỏWtrong khiH1đúng.Vậy xác suất sai lầm loại II làxác định như sau:P{TW | H1}
Xác suất của biến cố đối của sai lầm loại II: P{TW |H1}1 gọi
làlực lượng của kiểm định
Trang 5Sai lầm Quyết định đúng
Xác suất 1
Không bác bỏ H0
Quyết định đúng Xác suất 1
Sai lầm Bác bỏ H0
H0sai
H0đúng
Thực tế
Quyết định
Ta muốn tìm một qui tắc kiểm định mà cả hai loại sai lầm trên là
cực tiểu Nhưng không tồn tại kiểm định lý tưởng như vậy, vì nói
chung khi giảm sai lầm loại I thì sai lầm loại II tăng và ngược lại
Sai lầm loại II Xác suất
Quyết định đúng Xác suất 1
Không bác bỏ H0
Quyết định đúng Xác suất 1
Sai lầm loại I Xác suất Bác bỏ H0
H0sai
H0đúng
Thực tế
Quyết định
Trong bài toán kiểm định thì giả thiết H0là giả thiết quan trọng,
do đó sai lầm về nó càng nhỏ càng tốt Vì vậy các nhà thống kê đưa ra phương pháp sau
Sau khi ta chọn sai lầm loại I nhỏ ởmức ý nghĩa, với mẫu kích thướcnxác định, ta chọn ra miền bác bỏW sao cho xác
suất sai lầm loại II là nhỏ nhất hay lực lượng kiểm định là lớn nhất
Nghĩa là cần tìm miền bác bỏW thỏa mãn điều kiện
P T W và P T WH1 1 max Định lý Neymann - Pearson chỉ ra rằng nhiều bài toán quan trọng trong thực tiễn có thể tìm được miền bác bỏW thỏa
mãn điều kiện trên
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.3.7 Thủ tục kiểm định giả thiết thống kê
Một thủ tục kiểm định giả thiết thống kê bao gồm các bước sau
1 Phát biểu giả thiết H0và đối thiết H1
2 Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n
3 Chọn tiêu chuẩn kiểm địnhTvà xác định quy luật phân bố
xác suất củaTvới điều kiện giả thiết H0đúng
4 Với mức ý nghĩa, xác định miền bác bỏW tốt nhất tùy
thuộc vào đối thiết H1
5 Từ mẫu cụ thể tính giá trị quan sát của tiêu chuẩn kiểm địnhTqs
6 So sánh giá trị quan sát của tiêu chuẩn kiểm địnhTqsvới miền
bác bỏW và kết luận
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.4 KIỂM ĐỊNH THAM SỐ
Giả sử biến ngẫu nhiên gốcXtrong tổng thể có phân bố chuẩn N( ;2), cần kiểm định kỳ vọng
Nếu có cơ sở để giả thiết rằng kỳ vọngbằng giá trị0ta đưa
ra giả thiết thống kê
H0: 0 Tiêu chuẩn kiểm định và miền bác bỏ phụ thuộc các trường hợp sau
5.4.1 Kiểm định giả thiết về kỳ vọng của biến ngẫu nhiên
có phân bố chuẩn
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.4.1.1 Trường hợp đã biết phương sai
Giả sử phương sai2của biến ngẫu nhiên gốcXtrong tổng
thể có phân bố chuẩnN( ;2)đã biết
Từ tổng thể rút ra một mẫu ngẫu nhiên kích thước n:
W=(X1, X2, … , Xn) Tiêu chuẩn kiểm định ( X ) n
Nếu giả thiết H0đúng thì thống kê ( X 0) n
có phân bố chuẩn tắc N(0;1)
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Bài toán 1: H0: 0; H1: 0 bài toán kiểm định hai phía
;
/ 2
U O
/ 2
/ 2
/ 2
U
Hình 5.1: Miền bác bỏ của kỳ vọng phân bố chuẩn, bài toán 1
0 /2
P W P U
Trang 6Bài toán 2: H0: 0; H1: 0 bài toán kiểm định một phía
;
U O
Hình 5.2: Miền bác bỏ của kỳ vọng phân bố chuẩn, bài toán 2
0
Bài toán 3: H0: 0; H1: 0 bài toán kiểm định một phía
;
O
U
Hình 5.3: Miền bác bỏ của kỳ vọng phân bố chuẩn, bài toán 3
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊCHƯƠNG VII: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.4.1.2 Trường hợp chưa biết phương sai, kích thước mẫun 30
Bài toán 1: H0: 0; H1: 0 bài toán kiểm định hai phía
;
S
Bài toán 2: H0: 0; H1: 0 bài toán kiểm định một phía
;
S
Bài toán 3: H0: 0; H1: 0 bài toán kiểm định một phía
;
S
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Ví dụ 5.15: Một công ti có một hệ thống máy tính có thể xử lí 1200 hóa đơn trong một giờ Công ti mới nhập một hệ thống máy tính mới
Hệ thống này khi chạy kiểm tra trong 40 giờ cho thấy số hóa đơn được xử lí trung bình trong 1 giờ là 1260 với độ lệch chuẩn 215 Với mức ý nghĩa 5% hãy nhận định xem hệ thống mới có tốt hơn hệ thống cũ hay không?
Giải: Gọilà số hóa đơn trung bình mà hệ thống máy tính mới xử lí được trong 1 giờ
Ta kiểm định: Giả thiếtH0: 1200; Đối thiếtH1: 1200 Tiêu chuẩn kiểm định T (X 1200) n
S
Miền bác bỏ W T (X 1200) n;T 1,64
S
Giá trị quan sát (1260 1200) 40 1,76
215
qs
Giá trị quan sát của tiêu chuẩn kiểm định rơi vào miền bác bỏ, vậy ta có thể kết luận
hệ thống máy tính mới tốt hơn hệ thống cũ
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.4.1.3 Trường hợp chưa biết phương sai, kích thước mẫun 30
Giả sử giả thiết H0: 0đúng
Khi đó thống kê
0
T S
có phân bố Studentn 1 bậc tự do
Ta xây dựng các miền bác bỏ dựa vào đối thiết H1
Ký hiệut(n 1), t/2(n 1) lần lượt là giá trị tới hạn mức,
mức/2 của phân bố Student n 1 bậc tự do
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Bài toán 1: H0: 0; H1: 0 bài toán kiểm định hai phía
S
Bài toán 2: H0: 0; H1: 0 bài toán kiểm định một phía
S
Bài toán 3: H0: 0; H1: 0 bài toán kiểm định một phía
S
Trang 7Ví dụ 5.16: Một công ty sản xuất hạt giống tuyên bố rằng một loại
giống mới của họ có năng suất trung bình là 21,5 tạ/ha Gieo thử hạt
giống mới này tại 16 vườn thí nghiệm và thu được kết quả:
19,2; 18,7; 22,4; 20,3; 16,8; 25,1; 17,0; 15,8; 21,0; 18,6;
23,7; 24,1; 23,4; 19,8; 21,7; 18,9
Với mức ý nghĩa 5%, dựa vào kết quả này hãy xác nhận xem quảng
cáo của công ty có đúng không Biết rằng năng suất giống cây trồng là
một biến ngẫu nhiên có phân bố chuẩn
Giải:
Gọi là năng suất trung bình của loại giống mới
Ta kiểm định: Giả thiết H0: 21,5; Đối thiết H1: 21,5
Tiêu chuẩn kiểm định ( X 21,5) n
T
S
Giá trị tới hạn mức 0,025 của phân bố Student 15 bậc tự do là 2,131
S
Giá trị quan sát của tiêu chuẩn kiểm định
(20, 406 21,5) 16
3,038
qs
Vì |Tqs| 1,44 2,131 nên chưa có cơ sở để bác bỏ H0
Có nghĩa là với số liệu này thì có thể chấp nhận lời quảng cáo của công ty
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.4.2 KIỂM ĐỊNH THAM SỐ CỦA BiẾN NGẪU NHIÊN CÓ PHÂN
BỐ BERNOULLI
Giả sử ta để ý đến một đặc trưngAnào đó mà mỗi cá thể của tổng
thể có thể có tính chất này hoặc không
Gọiplà tần suất có đặc trưngAcủa tổng thể (pcũng là xác suất cá
thể có đặc trưngAcủa tổng thể), dấu hiệu nghiên cứu này là một
biến ngẫu nhiênXcó phân bố Bernoulli với kỳ vọng bằng p
Nếu pchưa biết, song có cơ sở để giả thiết rằng giá trị này bằngp0
Ta kiểm định giả thiết
H0: pp0
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Từ tổng thể rút ra một mẫu ngẫu nhiên kích thướcn
Gọif là tần suất mẫu Tiêu chuẩn kiểm định ( )
(1 )
T
Nếu giả thiếtH0 đúng, vớinđủ lớn thỏa mãn 0
0
5
np
Thống kêTxấp xỉ phân bố chuẩn tắcN(0;1)
Do đó với mức ý nghĩa và tùy thuộc đối thiếtH1 ta có thể xây dựng các miền bác bỏ tương ứng
0
(0;1)
T
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Bài toán 1: H0: p p0; H1: p p0 bài toán kiểm định hai phía
;
Bài toán 2: H0: p p0; H1: p p0 bài toán kiểm định một phía
;
Bài toán 3: H0: p p0; H1: p p0 bài toán kiểm định một phía
;
CHƯƠNG 5: ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Ví dụ 5.17: Một đảng chính trị trong một cuộc bầu cử tổng thống ở nước nọ tuyên bố rằng có 45% cử tri sẽ bỏ phiếu cho ứng cử viênA
của đảng họ
Chọn ngẫu nhiên 2000 cử tri để thăm dò ý kiến và cho thấy có 862
cử tri tuyên bố sẽ bỏ phiếu choA
Với mức ý nghĩa 5%, hãy kiểm định xem dự đoán của đảng trên có đúng không
Giải:
Ta kiểm định: Giả thiết H0: p 0,45; Đối thiếtH1: p 0,45 Gọiplà tỉ lệ cử tri sẽ bỏ phiếu cho ứng cử viênA
Điều kiệnnđủ lớn 0
0
2000 0,45 900 5 (1 ) 2000 0,55 1100 5
np
Trang 8Tần suất mẫu 862
0, 431 2000
Giá trị quan sát của tiêu chuẩn kiểm định
Tiêu chuẩn kiểm định ( 0,45) 2000
0,45 0,55
f
T
Miền bác bỏ W T 1,96
/ 2
(0, 431 0,45) 2000
1,708 0,45 0,55
qs
Ta thấy |T qs| 1,96
Vậy chưa có cơ sở để bác bỏH0