• Hiểu được các giả thuyết và sai lầm trong kiểm định thống kê • Hiểu được nguyên lý của kiểm định thống kê • Thực hiện và phiên giải được kiểm định cho giá trị trung bình... – Giả thu
Trang 1Kiểm định giả thuyết Kiểm định giá trị trung bình
Lớp CN YTCC K10
Trang 2Mục tiêu
• Hiểu được khái niệm của kiểm định thống kê.
• Hiểu được các giả thuyết và sai lầm trong
kiểm định thống kê
• Hiểu được nguyên lý của kiểm định thống kê
• Thực hiện và phiên giải được kiểm định cho
giá trị trung bình
Trang 3Thống kê suy luận
• Ước lượng
• Kiểm định
Trang 4Ước lượng
Trang 6Ví dụ
• Môn Thống kê:
– Điểm TB của nam lớp là 7.5 điểm (n=30),
– Điểm TB của nữ là 7.9 điểm (n=26)
– Vậy nữ lớp CN K10 học giỏi Thống kê hơn nam?
Sự khác biệt có ý nghĩa thống kê không?
Trang 7Ví dụ
• Chương trình can thiệp nâng cao sức
khỏe PC sốt xuất huyết
– Nhóm can thiệp: 76% có KT đúng
– Nhóm không can thiệp: 62% có KT đúng
– Can thiệp là hiệu quả?
Sự khác biệt có ý nghĩa thống kê không?
Trang 8Để trả lời
• Phải kiểm chứng!!!
• Kiểm định
Trang 9• Tỷ lệ SDD ở ĐT và toàn quốc là không khác biệt?
• Tỷ lệ SDD ở ĐT và toàn quốc là khác biệt?
Phải kiểm định sự khác biệt này!
Trang 10Ví dụ
• Môn Thống kê:
– Điểm TB của nam lớp là 7.5 điểm (n=30),
– Điểm TB của nữ là 7.9 điểm (n=26)
– Giả thuyết:
• Trung bình hai nhóm là không khác nhau?
• Trung bình hai nhóm là khác nhau?
Phải kiểm định sự khác biệt này!
Trang 11Ví dụ
• Chương trình can thiệp nâng cao sức
khỏe PC sốt xuất huyết
Trang 12Tại sao chúng ta cần sử dụng các kiểm
Trang 13Kiểm định giả thuyết
• Giả thuyết: giả định về tham số quần
thể
• Kiểm định cái gì có giả thuyết
– Giả thuyết không:
Trang 14Ví dụ
• Điểm TB môn Thống kê:
– Điểm TB của nam lớp là 7.5 điểm (n=30),
– Điểm TB của nữ là 7.9 điểm (n=26)
• Giả thuyết không:
– μ (nam) = μ (nữ)
Hoặc
– Điểm TB môn TK của nam và nữ là không khác nhau
Trang 15Nếu không chấp nhận Ho…?
• Kết luận như thế nào?
• Phải có một giả thuyết thay thế: Ha
– μ (nam) ≠ μ (nữ)
Hoặc
– Điểm TB môn TK của nam và nữ là khác nhau
Trang 16Như vậy…
• Kiểm định:
– Giả thuyết không: Ho “kết quả tìm được của NC là do ngẫu nhiên, không phải là thật sự trong quần thể”
– Giả thuyết thay thế: Ha “kết quả tìm được của NC là thật sự, không do ngẫu
nhiên” – đây cũng là giả thuyết mà nhà NC mong muốn
• Chúng ta không trực tiếp chứng minh
được Ha mà là tìm bằng chứng để bác
bỏ Ho
Trang 17Câu hỏi
• Có mấy trường hợp xảy ra khi kết
luận? Đó là các trường hợp nào?
Trang 18Khi bác bỏ Ho…
• Thực tế: đúng là điểm TB môn TK của
nam và nữ là không khác nhau
Trang 19Các loại sai lầm của kiểm định
Trang 20Khi không thể bác bỏ Ho…
• Thực tế: điểm TB môn TK của nam và
Trang 21Các loại sai lầm của kiểm định
Trang 22Nguyên lý của kiểm định
• Trong logic học
– Nếu hoá chất này là glucose thì nó phải có vị ngọt
Đánh giá:
– Nếu hoá chất đó không ngọt, thì nó không phải là glucose
– Nếu hoá chất này không phải là glucose thì nó không có vị ngọt
Trang 23Nguyên lý của kiểm định (tt)
Trang 24Nguyên lý của kiểm định (tt)
Trang 25Giá trị ngưỡng? Ví dụ
• Điểm trung bình của trẻ trường A là 7, độ
lệch chuẩn là 2 Trẻ lớp chuyên có điểm trung bình như thế nào?
– Chọn ngẫu nhiên 16 trẻ và tính được điểm TB là 8,1.
Trang 26Hãy nhớ lại
• Cả trường: Điểm TB là 7
– 95% học sinh có điểm trung bình trong khoảng ± 1,96σ
• Nếu điểm TB của 18 trẻ (8,1) nằm
trong khoảng này thì
– Bình thường, nhóm hs này cũng giống cả trường
• Nếu điểm TB của 18 trẻ (8,1) nằm
ngoài khoảng này thì
– Đặc biệt hơn, nhóm hs này có điểm trung bình không giống cả trường
Trang 27Hai phía
Miền bác bỏ Miền bác bỏ
1,96
Trang 28KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH
Trang 29Vấn đề của KĐ giá trị TB
• Biến số đang quan tâm có phân phối
gì?
– Nếu là phân phối chuẩn kiểm định Z
– Nếu là phân phối student kiểm định t
• Biết phân phối tra được giá trị
ngưỡng
Trang 31Phân phối chuẩn?
• Cỡ mẫu lớn (n>30)
Hoặc
• Biết độ lệch chuẩn của quần thể σ
Trang 33Kiểm định gì?
• Cỡ mẫu?
• Có biết độ lệch chuẩn của quần thể
(σ) không?
Trang 35Các bước kiểm định (tt)
• Ta tính được:
• Lấy giá trị tuyệt đối: z = 4,16
Trang 36Các bước kiểm định (tt)
• Bước 4: So sánh giá trị tính toán với
giá trị ngưỡng (tùy theo mức ý nghĩa – 0.01 hay 0.05)
– Lấy mức ý nghĩa α = 0.05 giá trị ngưỡng: 1,96
– Ztính toán > Z ngưỡng/tra bảng bác bỏ Ho
• Bước 5: Kết luận
– Vậy chiều cao trung bình trẻ nữ 15 tháng tuổi ở HN khác với chiều cao theo tiêu chuẩn VN
Trang 37Hai phía
Miền bác bỏ Miền bác bỏ
1,96
Trang 38Ví dụ 2
• Cholesterol TB của nam là 4,7 mmol/l
Nam giới béo phì có Cholesterol TB
như thế nào?
• Lấy ngẫu nhiên 50 người đo
Cholesterol, trung bình là 5,4 mmol/l
• Cholesterol TB của người béo phì có
khác quần thể chung không?
chọn kiểm định gì?
Trang 39Ví dụ 3
• Trung bình IQ của trẻ em <5 tuổi là
100
• Có 25 trẻ được thử nghiệm chương
trình dinh dưỡng đặt biệt, sau 1 năm, kết quả là:
– Trung bình IQ: = 110
– Độ lệch chuẩn: s = 20
• Chế độ dinh dưỡng này có làm thay
đổi IQ của trẻ không?
x
Trang 41Các bước kiểm định (tt)
Ta tính được:
t = (110 - 100)/4 = 2,5
• Bước 4: So sánh giá trị tính toán với
giá trị ngưỡng (tùy theo mức ý nghĩa – 0.01 hay 0.05)
– Lấy mức ý nghĩa α = 0.05 giá trị ngưỡng
Tra bảng t với bậc tự do df = n-1 = 25 – 1 = 24
t ngưỡng = 2,0639
– t tính toán > t ngưỡng/tra bảng bác bỏ Ho
Trang 42Các bước kiểm định (tt)
• Bước 5: Kết luận
– Vậy điểm trung bình IQ trong nhóm trẻ có chương trình dinh dưỡng đặc biệt khác với điểm trung bình IQ chung của quần thể
Trang 43• Kiểm định t (chú ý tra bảng t với bậc tự do)
Trang 44Kiểm định giả thuyết 2 trung bình
So sánh hai quần thể
• Hầu hết các nghiên cứu so sánh hai hoặc nhiều bộ số liệu để suy luận về sự khác biệt của hai hoặc nhiều quần thể.
• Bài này trả lời câu hỏi nghiên cứu về sự
Trang 45Có hai cách để thu được hai bộ số liệu
nhằm so sánh:
1 Hai bộ số liệu từ hai quần thể độc lập (ví
dụ: phụ nữ và nam giới, hoặc sinh viên lớp A và lớp B)
2 Hai bộ số liệu từ hai quần thể liên quan
(không độc lập) (ví dụ: bệnh nhân Đái
tháo đường “trước điều trị” và “sau điều
Kiểm định t /z hai mẫu
So sánh hai quần thể
Trang 46So sánh hai trung bình quần thể
Để so sánh sự khác biệt trung bình giữa hai
quần thể độc lập ( ví dụ: giữa hoại loại điều trị).
Trang 48Kiểm định t hai mẫu
Sử dụng khi:
Cỡ mẫu nhỏ: n<30 VÀ
Không biết độ lệch chuẩn của quần thể (σ)
Với hai trường hợp giả định khác nhau
Trang 49Đặt giả thuyết
H 0 : không có sự khác biệt giữa hai
trung bình quần thể Ho: µ 1 = µ 2
H 1 : Có sự khác biệt giữa hai trung
bình quần thể
Kiểm định t hai mẫu
Trang 50Đặt giả thuyết
Ho: µ1 - µ2 = 0
H1: µ1 - µ2 ≠ 0
Để kiểm định giả thuyết Ho
tính giá trị thống kê kiểm định t
so sánh với giá trị t ngưỡng
Kiểm định t hai mẫu
Trang 51Kiểm định t:
2 phương sai quần thể bằng nhau
(σ1=σ2)
Trang 52Ví dụ 3
Trọng lượng trung bình
sơ sinh của
2 nhóm
có khác không?
Trang 53Đặt giả thuyết
H 0 : không có sự khác biệt TB trọng
lượng SS ở 2 nhóm Ho: µ 1 = µ 2
H 1 : Có sự khác biệt TB trọng lượng
SS ở 2 nhóm
Các bước
Trang 54Tính toán kiểm định
• Trong đó:
• Ta có:
Ko hút thuốc Có hút thuốc
Trang 55Tính được
Trang 57Khoảng tin cậy cho sự khác biệt
giữa hai trung bình
• Công thức chung:
• KTC 95% trong kiểm định t hai mẫu:
Trang 58Khoảng tin cậy
• CI = 0,3904 ± (2,05x0,1612)
• CI = 0,06 đến 0,72
• Kết luận?
Trang 59Bài tập 1
Một nhà tâm lý học muốn tìm hiểu sự khác biệt về kỹ
năng nói giữa trẻ em trai và gái 8 tuổi Hai mẫu độc lập
10 em trai và 10 em gái được chọn Mỗi trẻ được kiểm tra khả năng nói bằng một thử nghiệm tiêu chuẩn Số liệu thu được như sau:
Bé gái Bé trai
n1 = 10 = 37
SS1 = 150
1
x
n2 = 10 = 31
Trang 601 Mô tả bộ số liệu
2 Nêu giả định
• Hai quần thể phân bố chuẩn
• Phương sai hai quần thể như nhau
• Hai mẫu ngẫu nhiên độc lập nhau
• Các quan sát độc lập
n1 = 10 = 37
SS1 = 150
1
X
n2 = 10 = 31
Trang 613 Đặt giả thuyết
– H0: µ1 = µ2
– H1: µ1 ≠ µ2
4 Kiểm định thống kê và phân bố xác
suất của kiểm định thống kê
- Vì n<30, không biết σ, dùng kiểm định t hai mẫu
- Không quan tâm đến hướng khác biệt, nên đây là kiểm định hai phía
Thực hiện các bước
Trang 64Kiểm định t:
2 phương sai quần thể khác nhau
(σ1≠σ2)
Trang 66Kiểm định Z
Trang 67Kiểm định Z
• Cỡ mẫu lớn
• Biết độ lệch
chuẩn quần thể
Trang 68• Mức Hb trung bình trong nhóm nhiễm
có thấp hơn nhóm không nhiễm
Trang 70Tra bảng và kết luận
• Z tính toán > 1,96 (Z tra bảng)
• Kết luận: Mức Hb trung bình của trẻ
có nhiễm P.falciparum thấp hơn có ý
nghĩa so với trẻ không nhiễm.
Trang 71Tính khoảng tin cậy
• Khoảng tin cậy:
• Tính ra:
-0,9 ± (1,96 x 0,2216) = -1,33 đến
-0,47
• Kết luận
Trang 72Bài tập 1
• NC trên 641 trẻ sơ sinh
– Cân nặng trung bình 3123.2 gr
– Độ lệch chuẩn 664.6 gr
• Câu hỏi: CNSS trung bình trong
nghiên cứu này có khác CNSS trung
bình của quần thể (là 3000 gr) hay
không? Nếu khác, khác như thế nào?
Trang 73Kết quả
One- Sample St at ist ics
641 3123.2496 664.57546 26.24915 birth weight in gms
N Mean Std Deviation
Std Error Mean
One-Sample Test
4.695 640 000 123.2496 71.7047 174.7945 birth weight in gms
t df Sig (2-tailed)
Mean Difference Lower Upper
95% Confidence Interval of the Difference Test Value = 3000
Trang 74• Câu hỏi: CNSS trung bình trẻ nam và
nữ có khác nhau hay không? Nếu
khác, khác như thế nào?
Trang 752.00 birth weight in gms
Std Error Mean
Independent Samples Test
Equal variances assumed Equal variances not assumed
Std Error
95% Confidence Interval of the Difference t-test for Equality of Means
Trang 77Group St at ist ics
N Mean Std Deviation
Std Error Mean
Independent Samples Test
15.979 000 -5.977 638 000 -442.2728 73.99082 -587.568 -296.978
-4.909 105.000 000 -442.2728 90.09368 -620.912 -263.634
Equal variancesassumedEqual variancesnot assumed
Std ErrorDifference Lower Upper
95% ConfidenceInterval of theDifferencet-test for Equality of Means
Trang 79Kiểm định t ghép cặp
• Tính hiệu số giữa các giá trị quan
sát của hai nhóm và xem đây là một
bộ số liệu
• Tiến hành kiểm định t một mẫu trên
bộ số liệu mới này Đối tượng
nghiên cứu
Trước khi dùng thuốc
Sau khi dùng thuốc
Hiệu số
Trang 81Các bước tính toán trong
Trang 82Ví dụ