Trong lĩnh vực Công Nghệ Thông Tin nói riêng, yêu cầu quan trọng nhất của người học đó chính là thực hành. Có thực hành thì người học mới có thể tự mình lĩnh hội và hiểu biết sâu sắc với lý thuyết. Với ngành mạng máy tính, nhu cầu thực hành được đặt lên hàng đầu. Tuy nhiên, trong điều kiện còn thiếu thốn về trang bị như hiện nay, người học đặc biệt là sinh viên ít có điều kiện thực hành. Đặc biệt là với các thiết bị đắt tiền như Router, Switch chuyên dụng
Trang 1Giới thiệu về thống kê
DEPOCEN
Chương 6
Cơ bản về kiểm định giả thuyết:
kiểm định một mẫu
Trang 2Chủ đề
•Các phương pháp kiểm định giả thuyết
•Z -test trung bình (biết)
• p-Value trong kiểm định giả thuyết
•Liên hệ với ước lượng khoảng tin cậy
•Kiểm định một phía
• t -test cho trung bình
•Z -test cho tỉ lệ
Trang 3Một giả thuyết là một điều
giả sử về tham số tổng thể.
Một tham số là một
trung bình hoặc tỉ lệ tổng thể
Tham số phải được định
nghĩa trước khi phân tích.
I assume the money VND income of this class
is VND 3.5 million
© 1984-1994 T/Maker Co.
Giả thuyết là gì?
Trang 4 Là câu giả sử trong phép kiểm định
e.g trung bình số TV bán được trong 1h ít nhất là 3 (H 0 : 3)
Bắt đầu với giả sử rằng giả thuyết “trống”
là đúng TRUE
•Giả thuyết “trống” có thể chấp nhận hoặc bác bỏ
Trang 5 Là ngược lại với giả thuyết “trống” e.g
trung bình số TV bán được trong 1h nhỏ hơn 3 (H1 : < 3 )
Đối thuyết có thể chấp nhận hoặc không
Đối thuyết, H1
Trang 8tổng thể
Tuy nhiên, ta loại bỏ giả thuyết vì = 50.
20
H0
Lí do loại bỏ H0
Trang 9 Xác định giá trị của thống kê mẫu mà khả năng giả thuyết “trống” không xảy ra là đúng, còn
được gọi là miền bác bỏ phân phối mẫu (bác bỏ giả thuyết)
Trang 10Miền bác bỏ
Trang 11 Sai lầm loại I:
Loại bỏ giả thuyết trống khi nó đúng
Đưa đến một hậu quả nghiêm trọng
Xác suất của sai lầm loại I là
Gọi là mức ý nghĩa
Sai lầm loại II:
Không bác bỏ khi giả thuyết trống sai
Xác suất của sai lầm loại II là (Beta)
Các sai lầm khi lựa chọn
Trang 12Power (1 - )
Các khả năng
Trang 13
Reduce probability of one error
and the other one goes up.
& có quan hệ
ngược nhau
Trang 14 Giá trị thực của tham số tổng thể
Tăng khi sự sai khác giữa tham số giả thuyết trống và giá trị thực giảm
Tăng khi n giảm
Các tác nhân ảnh hưởng sai lầm loại II:
Trang 15 Chuyển từ thống kê mẫu(e.g., ) sang biến
ngẫu nhiên chuẩn tắc Z
So sánh với giá trị giới hạn của Z
Nếu thống kê Z nằm trong miền giới hạn, bác bỏ H0 ;
ngược lại không bác bỏ H0
Thống kê Z-Test (biết)
Trang 16• Là giá trị nhỏ nhất mà H 0 có thể bị bác bỏ, gọi là mức ý
nghĩa quan sát:
P-giá trị = P(D | H 1 đúng), với D: là 1 miền
Không trực tiếp cho ta kết luận về giả
thuyết mà chỉ gián tiếp cho ta kết luận về việc chấp nhận và bác bỏ đối thuyết
Được sử dụng khi đưa ra quyết định:
Nếu p-giá trị không bác bỏ H0
Nếu p-giá trị <, bác bỏ H0
Trang 171. Xác định H0 H0 : 3
2. Xác định H1 H1 :
3 Chọn = 05
4. Chọn cỡ mẫu n n = 100
5 Chọn kiểm định Z Test (or p Value)
Kiểm định giả thuyết: các bước
trung bình số TV bán được trong
1h ít nhất là 3 (H0 : 3 )
Trang 186 Xác định giá trị giới hạn Z = -1.645
7 thu thập số liệu 100 values
8 tính toán thống kê kiểm định Computed Test Stat.= -2
9 đưa ra kết luận thống kê bác bỏ giả thuyết
10 Thể hiện kết luận thống kê trung bình số TV bán được
trong 1h nhỏ hơn 3
Kiểm định giả thuyết: các bước
(continued)
Trang 19 Giả sử:
Tổng thể có phân phối chuẩn
Nếu không chuẩn, ta dùng cỡ mẫu lớn
Giả thuyết trống chỉ có dấu or
Thống kê kiểm định Z:
Kiểm định Z 1-phía đối
với trung bình (biết)
Trang 21Có trung bình bao nhiêu hộp
ngũ cốc chứa nhiều hơn 368
grams? Một mẫu ngẫu nhiên
Trang 22Z .04 06 1.6 .5495 5505 .5515 1.7 5591 5599 5608 1.8 5671 5678 5686
Trang 23Z
Trang 24p –giá trị = P(Z 1.50) = 0.0668
p Value Solution
Trang 271 25
Z
Trang 28Liên hệ với khoảng tin cậy
or 366.62 378.38
nếu khoảng tin cậy chứa trung bình của giả thuyết ( 368 ), ta không thể bác bỏ giả thuyết
trống, nếu ngược lại thì ta bác bỏ.
_
Trang 29Giả sử:
Tổng thể có phân phối chuẩn
Nếu không chuẩn, ta chỉ sử dụng được khi biết phân phối hơi nghiêng & cỡ mẫu lớn
Kiểm định tham số:
Thống kê t:
n S
X
Trang 30Ví dụ: kiểm định 1-phía với t-Test
Có bao nhiêu hộp ngũ cốc chứa
nhiều hơn 368 grams? Biết một
mẫu ngẫu nhiên gồm 36 hộp có
Trang 31X
Trang 32 Liên quan đến các biến định tính
Là % của biến định tính trong tổng thể
Nếu xuất hiện 2 biến định tính, ta có phân phối 2 chiều.
Mẫu tỉ lệ(p s):
Tỉ lệ
size sample
successes of
number n
X
Trang 33Ví dụ: dùng kiểm định Z cho tỉ lệ
•Bài toán: một công ty marketing nhận
được 4% phản hồi từ dịch vụ Mail
•Cách tiếp cận: để kiểm tra, họ tiến hành
khảo sát 500 người với 25 phản hồi
•Yêu cầu: kiểm định với = 05