Giả thuyết gốc, HoGiả thuyết đối, H 1 là giả thuyết sẽ được kiểm định * Ví dụ: Số con trung bình trong một gia đình người Việt Nam là 3 Luôn bắt đầu với giả định: giả * Ví dụ: Số
Trang 21 Trình bày mục đích và các bước tiến hành của kiểm định giả thuyết
2.Trình bày được khái niệm giả thuyết thống kê và các sai lầm khi tiến hành kiểm định giả thuyết thống kê
3.Trình bày được định nghĩa và tính chất của phân phối Student
t-4 Tính và giải thích được khoảng tin cậy cho giá trị trung bình mẫu, sự khác biệt của hai trung bình mẫu
5 Áp dụng được kiểm định z và t để kiểm định được ý nghĩa của 1 giá trị trung bình, đánh giá được sự khác biệt giữa hai trung bình mẫu
6 Tiến hành được các bước kiểm định số liệu ghép cặp
Trang 3Quần thể Mẫu
cứu
Trang 4Là một quá trình rút ra kết luận về một quần thể dựa trên những thông tin của một mẫu được rút ra từ quần thể đó.
Bản chất của suy luận thống kê là việc ước tính các tham số quần thể (parameters)
Với mỗi tham số, có thể tính toán 2 loại ước lượng: điểm và khoảng
Mục đích: có thể cho biết kết quả nghiên cứu thu được chỉ là do ngẫu nhiên hay không
Trang 5Ví dụ:
Một cuộc điều tra về tình hình mắc bệnh SXH được tiến hành ở huyện A và huyện B Tỷ lệ mắc ở huyện A là 30% và ở huyện B
là 20%,
hơn huyện B?
Kiểm định thống kê -> kiểm định giả thuyết TK, chọn phép thống kê phù hợp
Trang 6 Tìm các kiểm định thống kê thích hợp để tính toán giá trị xác suất thông qua xác suất để đưa ra kết luận phù hợp.
Trang 7là một giả định về tham số quần thể
Được đặt ra bởi người nghiên cứu và được xuất phát từ các câu hỏi nghiên cứu
Trung bình quần thể hoặc tỷ lệ quần thể
Tham số quần thể phải được xác định trước khi phân tích
Trang 8Giả thuyết gốc, Ho
Giả thuyết đối, H 1
là giả thuyết sẽ được kiểm
định
* Ví dụ: Số con trung bình trong một
gia đình người Việt Nam là 3
Luôn bắt đầu với giả định: giả
* Ví dụ: Số con trung bình trong một
gia đình người Việt Nam khác 3
Mâu thuẫn với hiện trạng
Không bao giờ có dấu“=”
Có thể hoặc không thể chấp
nhận
Là giả thuyết mà nhà nghiên cứu tin là đúng và muốn chứng minh.
Trang 9Ví dụ: Nghiên cứu chiều cao của trẻ em sơ sinh tại một thành phố nào đó Giả thuyết:
Chiều cao trung bình của
quần thể trẻ em sơ sinh là
Trang 105 Quyết định về mức ý nghĩa của kiểm định thống kê
6 Tính toán cụ thể và kết luận về kiểm định:
7 Kết luận về kiểm định
Trang 11Bước 1: Mô tả bộ số liệu
phương pháp thống kê mô tả: loại biến, đại lượng thống
kê tóm tắt
để xác định loại kiểm định thích hợp
Bước 2: Đặt giả định
tuỳ theo từng loại kiểm định
VD: Trung bình đường huyết giữa nhóm nghiên cứu dùng thuốc A (1 ) và nhóm chứng (2 nhóm không dùng thuốc A) 2 nhóm NC là mẫu rút ra từ 2 quần thể BN có và không có dùng thuốc A
-> Chúng ta giả định rằng hai quần thể gốc đó đều tuân theo phân
phối chuẩn.
Trang 12Bước 3: Nêu giả thuyết kiểm định: H 0 và H 1
tuỳ theo câu hỏi nghiên cứu
0 là giá trị giả định của trung bình quần thểlà là giá trị giả định của trung bình quần thểgiá là giá trị giả định của trung bình quần thểtrị là giá trị giả định của trung bình quần thểgiả là giá trị giả định của trung bình quần thểđịnh là giá trị giả định của trung bình quần thểcủa là giá trị giả định của trung bình quần thểtrung là giá trị giả định của trung bình quần thểbình là giá trị giả định của trung bình quần thểquần là giá trị giả định của trung bình quần thểthể
Trang 13Bước 4: Phân bố xác suất của giá trị thống kê kiểm định
Mỗi loại kiểm định tương ứng với một loại phân bố xác suất (phân bố mẫu)
Chọn kiểm định thống kê tuỳ thuộc bản chất bộ số liệu
Bước 5: Chọn mức ý nghĩa thích hợp
Thường là 0,05 hoặc 0,01
Cân nhắc hậu quả của sai lầm loại I và II
Trang 14giá trị kiểm định = giá trị thống kê - tham số giả thuyết
sai số chuẩn của giá trị thống kê
Trang 15Sai lầm loại I:
Bác bỏ giả thuyết H0 nhưng thực ra H0 đúng
Xác suất của sai lầm loại I là
Có hậu quả rất nghiêm trọng
=> Còn gọi là sai lầm khi bác bỏ giả thuyết đúng.
Sai lầm loại II:
Chấp nhận giả thuyết H0 nhưng thực ra H0 sai.
Sai lầm loại II thường được ký hiệu là
=>Còn gọi là sai lầm khi chấp nhận giả thuyết sai.
Trang 16 Hai loại sai lầm có thể mắc phải khi tiến hành kiểm định:
Trang 17Xác suất không mắc sai lầm loại I:
(1-)
gọi là mức tin cậy
Xác suất không mắc sai lầm loại II:
(1-)
gọi là lực kiểm định, hay xác suất để bác bỏ H0 khi H0sai
1 - = p [chấp nhận H 1 | H 0 sai] = p [bác bỏ H 0 | H 0 sai]
Trang 18
Trang 19(a) Sai lầm loại I (xảy ra khi giả thuyết H 0 đúng): Trung bình mẫu = Đường cong thể hiện phân bố mẫu của trung bình mẫu Miền gạch dọc (tổng số
bằng 5%) thể hiện xác suất loại bỏ giả thuyết khi nó đúng.
Trang 20(b) Sai lầm loại II (xảy ra khi giả thuyết H 0 sai): Trung bình quần thể là ’ ≠
Đường cong liền nét thể hiện phân bố mẫu thực của trung bình mẫu, trong khi đường cong nét chấm thể hiện phân bố mẫu theo giả thuyết H 0 Miền
gạch dọc là xác suất (b%) khi chúng ta không bác bỏ được giả thuyết H 0 Nói cách khác, vùng gạch dọc này trùng với một phần của miền chấp nhận giả thuyết, vì vậy giả thuyết là sai mà chúng ta vẫn chấp nhận (không bác bỏ được).
Trang 21 Giả sử một mẫu ngẫu nhiên cỡ n, được rút ra từ một quần thể có phân phối chuẩn và có trung bình, biến ngẫu nhiên:
sẽ có phân phối t với n-1 bậc tự do
n s
X t
/
Trang 22Đường cong phân bố t đối xứng qua gốc toạ độ
Tổng diện tích đường cong phân phối t bằng 1
(tương tự phân phối chuẩn tắc)
Đường cong phân bố t trải rộng ra cả hai phía so với
gốc toạ độ và không bao giờ giao điểm với trục hoành
Khi bậc tự do tăng thì hình dạng phân phối t sẽ tiệm
cần gần với phân phối chuẩn
Trang 23®êngcongtvíi1 bËctùdo
®êngcongph©n bèchuÈn
®êngcongtvíi6
bËctùdo
Trang 24Giá trị ước lượng + (hệ số tin cậy) (sai số chuẩn)
Công thức chung:
Cần biết 3 giá trị để xây dựng khoảng tin cậy cho trung bình quần thể :
trung bình mẫu
hệ số tin cậy z/2 (tuỳ thuộc vào mức tin cậy)
sai số chuẩn của trung bình (độ lệch chuẩn quần thể chia căn bậc hai cho cỡ mẫu)
Trang 26X n
s t
X /2,df , /2,df
n s
x t
/
có phân bố t với n-1 bậc tự do
Khi không biết :
Ta dùng s để ước lượng cho , phân phối t ước lượng cho KTC
Trang 27Người ta lấy ra một mẫu ngẫu nhiên gồm 20 trẻ gái 15 tháng tuổi
ở một thị trấn để đo chiều cao Người ta tính được kết quả điều tra như sau:
:Trung bình mẫu = 75,1 và được biết độ lệch chuẩn quần thể
2 96
, 1 1
, 75
; 20
9 ,
2 96
, 1 ( 1 , 75
Vậy chúng ta chắc chắn rằng có 95% rằng chiều cao của trẻ
em gái 15 tháng tuổi tại thị trấn sẽ nằm trong khoảng 73,83 đến 76,37.
Khi biết :
Trang 28 Khi không biết :
Một chương trình phun thuốc diệt côn trùng cho một làng, người ta đã tiến hành khảo sát để ước lượng không gian cần thiết phải phun thuốc
Chọn ngẫu nhiên 30 hộ gia đình và đo khoảng diện tích có thể phun thuốc được (tính theo m 2 ) và thu được các kết quả sau:
Tổng số hộ n = 30 Trung bình 243,6 Độ lệch chuẩn s = 39,4
Trang 29X n
s t
Trang 30 Là việc so sánh xem liệu trung bình của mẫu nghiên cứu có khác biệt với giá trị trung bình quần thể không
Đã biết độ lệch chuẩn quần thể: kiểm định dựa trên phân bố chuẩn z-test
Chưa biết độ lệch chuẩn quần thể: kiểm định dựa trên phân bố t: t-test
Trang 31 Kiểm định dựa trên phân bố chuẩn z-test
Kiểm định dựa trên phân bố t: t-test
n
x e
s
x z
t
Trang 32Khi muốn so sánh trung bình mẫu với một trung bình giả thuyết
Từ số liệu thống kê quốc gia
Từ một nghiên cứu khác
Biết độ lệch chuẩn của quần thể
Không biết độ lệch chuẩn của quần thể
Trang 33Thể tích trung bình hồng cầu (TTHC) xét nghiệm được ở
15 bé trai 5 tuổi mắc bệnh hồng cầu hình liềm đồng hợp
tử (SS) như sau (đơn vị fl):
Trang 34Bước 1: Mô tả bộ số liệu
0 = 84,0 , s = 8,3, n = 15
Bước 2: Đặt giả định
Phân phối mẫu của giá trị trung bình trên xấp xỉ phân phối chuẩn
Trang 35Bước 3: Nêu giả thuyết kiểm định
H0: = 80 (Thể tích hồng cầu trung bình của mẫu bằng với giá trị lý thuyết)
H1: 80 (giá trị trung bình trên khác với trung bình lý
thuyết)
Bước 4: Phân bố xác suất và chọn loại kiểm định
Vì không biết , dùng kiểm định t
15-1 = 14 bậc tự do
Trang 361 15
3 , 8
Trang 37Bước 7: Kết luận về kiểm định
Không có sự khác biệt giữa thể tích trung bình hồng cầu của nhóm trẻ bị bệnh so với giá trị trung bình lý thuyết
Trang 38 Ví dụ:
- Điểm trung bình về mức độ lo âu của trẻ em 10 tuổi là
7, độ lệch chuẩn là 2
- Một nhà nghiên cứu muốn tìm hiểu những trẻ em cùng
độ tuổi, có cha/mẹ nghiện rượu có điểm trung bình lo
âu khác với 7 không.
Nhà nghiên cứu chọn ngẫu nhiên một nhóm 16 trẻ 10 tuổi có cha/mẹ nghiện rượu và tính được điểm lo âu trung bình là 8,1
Trang 39Bước 1: Mô tả bộ số liệu
0 = 7, = 2, = 8.1, n = 16
Bước 2: Đặt giả định
Quần thể lấy mẫu có phân bố chuẩn, hoặc cỡ mẫu lớn
Mẫu ngẫu nhiên
Các quan sát độc lập
x
Trang 40 Bước 3: Nêu giả thuyết kiểm định
Trang 41Bước 6: Tính toán cụ thể
Z = 2,2 > 1,96 (z tra bảng)
Bác bỏ Ho, chấp nhận H1
2 ,
2 16
2
1 , 8
s
x z
Trang 42Bước 7: Kết luận về kiểm định
Sự khác biệt giữa điểm trung bình lo âu giữa trẻ em 10 tuổi
có cha/mẹ nghiện rượu và trẻ em bình thường cùng độ tuổi
là có ý nghĩa thống kê.
Điểm trung bình lo âu của trẻ em 10 tuổi có cha mẹ nghiện rượu (8,1) cao hơn có ý nghĩa so với trung bình quần thể
(7), z = 2,2, p=0,028.
Trang 43Quần thể những người
nhận điều trị thường quy
Quần thể những người nhận điều trị mới
2
Trang 44Kiểm định z hai mẫu:
Quần thể có phân bố chuẩn và độ lệch chuẩn đã biết,
hoặc
Mẫu lớn
Mẫu nhỏ rút ra từ quẩn thể có phân phối chuẩn và
Không biết độ lệch chuẩn quẩn thể
Trang 45Kiểm định z hai mẫu
Dùng kiểm định z hai mẫu khi:
Biết độ lệch chuẩn:
Cỡ mẫu lớn (n>30):
) /
/
2 1
n s
n s
x
x z
)/
/
2 1
2 1
2 1
n n
x
x z
Trang 46) /
/ (
.
) ' ( )
(
.
2
2 2 1
2 1
2 1
n s
n s
e s
e s z x
x i
Trang 47Trong nghiên cứu về huyết áp tâm thu của các dối tượng từ
30 tuổi trở lên tại xã A Một mẫu ngẫu nhiên gồm 64 nam và
45 nữ được chọn vào nghiên cứu, được kết quả sau:
HATT tb =160 mmHg
s= 16 mmHg
HATT tb = 155 mmHg s= 15 mmHg
Ta có thể kết luận rằng có sự khác biệt về HA tâm thu trung bình của nam và nữ hay không?
Với độ tin cậy 95% hãy tìm khoảng tin cậy sự khác biệt hai trung bình của nam và nữ?
Trang 48Kiểm định t hai mẫu
Dùng kiểm định t hai mẫu khi:
Cỡ mẫu nhỏ (n<30)
Không biết độ lệch chuẩn quần thể
Hai trường hợp giả định khác nhau:
o Độ lệch chuẩn quần thể bằng nhau (1 = 2 )
o Độ lệch chuẩn quần thể khác nhau (1 2 )
Trang 49Kiểm định t hai mẫu
Đặt giả thuyết
Ho: 1 - 2 = 0
H1: 1 - 2 0
Để kiểm định giả thuyết H0
+ Tính giá trị thống kê kiểm định t
Trang 50Kiểm định t hai mẫu, (1 = 2)
Giả định hai độ lệch chuẩn bằng nhau, ước lượng độ lệch
chuẩn chung: bậc tự do: n1 + n2 –2
Sai số chuẩn của sự khác biệt giữa hai trung bình được ước lượng
Giá trị t được tính:
Trang 51Một nhà tâm lý học muốn tìm hiểu sự khác biệt về kỹ năng nói giữa TE trai và gái 8 tuổi Hai mẫu độc lập 10 em trai
và 10 em gái được chọn Mỗi trẻ được kiểm tra khả năng nói bằng một thử nghiệm tiêu chuẩn Số liệu thu được như sau
Trang 52Bước 1: Mô tả bộ số liệu
Hai quần thể lấy mẫu có phân bố chuẩn
Độ lệch chuẩn hai quần thể là như nhau
Hai mẫu ngẫu nhiên độc lập nhau
Các quan sát là độc lập
37
Trang 53 Bước 3: Nêu giả thuyết kiểm định
Ho: 1 - 2 = 0
H1: 1 - 2 0
Bước 4: Phân bố xác suất và chọn loại kiểm định
Phân bố chuẩn
Vì n<30, không biết , dùng kiểm định t hai mẫu,
Vì không quan tâm đến hướng khác biệt nên đây là kiểm định hai phía
Trang 54Bước 6: Tính toán cụ thể
180 2
10 10
210
* ) 1 10
( 150
* ) 1 10
31
37s.e
Trang 55Bước 7: Kết luận
với mức =0,05, /2=0,05 giá trị tra bảng t với bậc 18 (10+10-2) là 2,1
Vì kiểm định được t=1< t ngưỡng là 2,1
Không bác bỏ giả thuyết H0, với mức ý nghĩa 0,05
=> Kỹ năng nói của TE gái (37) thật sự không khác biệt với
kỹ năng nói TE trai (31) ở độ tuổi 8 tuổi.
Trang 56Giá trị ước lượng + (hệ số tin cậy) (sai số chuẩn)
Trang 57Kiểm định t hai mẫu, (1 2)
Các bước kiểm định như trên
Giá trị t hai mẫu với giả định ( 1 2 ):
2
2 2
1
2 1
2 1
n
s n
s
x
x t
2 2 2
2 1
2 1 1
2
2 2 1
2 1
)
(1
1)
(1
1
n
s n
n
s n
n
s n
s k
Trang 58 Khi hai mẫu không độc lập nhau:
Thu thập số liệu trên cùng một nhóm đối tượng nghiên cứu tại hai thời điểm
Trang 59Ví dụ: Để đánh giá kết quả của một thử nghiệm lâm sàng
về tác dụng của một loại thuốc ngủ Người ta đã tiến hành quan sát và ghi chép giấc ngủ của 10 bệnh nhân qua hai đêm, một đêm dùng thuốc ngủ và một đêm dùng thuốc không có hoạt tính (placebo) Từ đó người ta tính
ra số giờ ngủ chênh lệch giữa hai loại thuốc.
=> Dùng kiểm định t ghép cặp
Trang 60Bước 1: Mô tả bộ số liệu
Tính hiệu số hai giá trị quan sát: thời gian ngủ khi dùng thuốc và dùng thuốc không hoạt tính Kiểm định t mẫu trên số liệu này:
Thời gian ngủ (tính theo tiếng)
Bệnh nhân Khi dùng thuốc ngủ Khi dùng Placebo Chênh lệch (d)
Trang 61Bước 2: Đặt giả định kiểm đinh t ghép cặp
- Một mẫu ngẫu nhiên mà quần thể chung của chúng tuân theo phân phối chuẩn
Trang 62 Bước 3: Nêu giả thuyết kiểm định
TH1: Nếu muốn kiểm định 1 - 2 = 0
Trang 63 Bước 4: Phân bố xác suất và chọn loại kiểm định
Kiểm định cả 3 trường hợp trên đều tính t theo công thức
Là trung bình mẫu của sự chênh lệch thời gian ngủ,
là trung bình quần thể giả định của sự chênh lệch đó
, là độ lệch chuẩn của các giá trị chênh lệch trong mẫu
n là cỡ mẫu
Là độ lệch chuẩn của “quần thể” các giá trị chênh lệch
- Khi giả thuyết H0 là đúng, kiểm định thống kê sẽ tuân theo phân
phối t với n-1 bậc tự do.
s d d /
d
s
Trang 64 Bước 5: Chọn mức ý nghĩa =0,05
Dạng kiểm định t 2 phía, với mức =0,05,
/2=0,025 giá trị tra bảng t với bậc n-1 = 10-1 = 9
sẽ là 2,26
bác bỏ giả thuyết H0 nếu như giá trị t tính được bằng hoặc lớn hơn giá trị tra bảng nói trên
Trang 65sd d /
Trang 66Bước 7: Kết luận
Bác bỏ H0
Thuốc ngủ có tác dụng nhất định tới thời gian ngủ của bệnh nhân
Trang 67Ví dụ:
Trong một nghiên cứu điều trị bệnh béo phì, 17 bệnh nhân bị bệnh này được cân trước và sau khi điều trị Chênh lệch cân nặng được tính cho mỗi bệnh nhân
Thay đổi cân nặng:
N=17; =7,26 ; sd = 7,16
Chênh lệch về cân nặng có ý nghĩa thống kê không?
Hay chế độ điều trị có tác dụng không?
d
Trang 68Bước 1: Mô tả bộ số liệu
Thay đổi cân nặng:
N=17; =7,26 ; sd = 7,16
Bước 2: Nêu giả định:
-Các giá trị khác biệt tuân theo phân phối chuẩn -Các quan sát độc lập nhau
Bước 3: Đặt giả thuyết
Ho: d = 0
H1: d 0
d
Trang 69Ví dụ:
Bước 4: Phân bố xác suất và chọn loại kiểm định :
-Vì đo lường trên 1 nhóm đối tượng tại hai thời điểm dùng t ghép cặp
-Không quan tâm đến hướng khác biệt nên đây là kiểm định 2 phía
Bước 5: Chọn mức ý nghĩa =0,05
Bước 6: Tính toán:
df=17-1=16
74 , 1 17
/ 16 , 7
17,
474
,1
026
Trang 71Đại lượng
TK mẫu
Tham
số QT giả thuyết
Sai số chuẩn ước tính Giá trị thống kê kiểm định t
x t
1
1
n n
2
2 2 1
2 1
2 1
n
s n
s
x x
2 1
1 1
n n
s
x x
2 1
n
s n
s
n s
2
Trang 73THE END