PowerPoint Presentation NỘI DUNG I MỘT SỐ KHÁI NIỆM II KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỀ TRUNG BÌNH III KIỂM ĐỊNH GTTK VỀ TỈ LỆ IV KIỂM ĐỊNH GTTK VỀ PHƯƠNG SAI V KIỂM ĐỊNH PHI THAM SỐ VI KIỂM ĐỊNH TÍNH[.]
Trang 1NỘI DUNG:
I MỘT SỐ KHÁI NIỆM
II KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỀ TRUNG BÌNH
III KIỂM ĐỊNH GTTK VỀ TỈ LỆ
IV KIỂM ĐỊNH GTTK VỀ PHƯƠNG SAI
V KIỂM ĐỊNH PHI THAM SỐ
VI KIỂM ĐỊNH TÍNH ĐỘC LẬP
CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT
THỐNG KÊ
Trang 2I MỘT SỐ KHÁI NIỆM
Giả thuyết thống kê
Sai lầm loại I và sai lầm loại II.
P – Value
Các bước của bài toán kiểm định.
Trang 3II KIỂM ĐỊNH GTTK VỀ SO SÁNH
TRUNG BÌNH VỚI MỘT GIÁ TRỊ
Xét biến ngẫu nhiên X ~ N(μ, 2) Kiểm định giả thuyết sau với mức ý nghĩa
Trang 4II KIỂM ĐỊNH GTTK VỀ SO SÁNH TRUNG BÌNH VỚI MỘT GIÁ TRỊ
Điều kiện bác bỏ giả thuyết H0:
Dạng phân phối chuẩn (dạng Z)
Trang 5II KIỂM ĐỊNH GTTK VỀ SO SÁNH
TRUNG BÌNH VỚI MỘT GIÁ TRỊ
Điều kiện bác bỏ giả thuyết H0:
Dạng phân phối student (dạng T)
+ Nếu bất đẳng điều kiện đúng thì bác bỏ H0
+ Nếu bất đẳng điều kiện không đúng thì chưa đủ cơ sở bác
Trang 6II KIỂM ĐỊNH GTTK VỀ SO SÁNH
TRUNG BÌNH VỚI MỘT GIÁ TRỊ
Ví dụ: Kiểm tra hàm lượng alkaline phosphatase ở 50 bệnh nhân bị bệnh loãng xương thu được số liệu sau:
xi 50-54 54-58 58-62 62-66 66-70
ni 14 12 10 6 8
Sau khi cho các bệnh nhân sử dụng một loại thuốc A có tác dụng tăng alkaline phosphatase, người ta ghi nhận được alkaline phosphatase trung bình của bệnh nhân là 68 Với
mức ý nghĩa 5% hãy cho biết thuốc A có tác dụng làm
tăng alkaline phosphatase hay không?
Trang 7II KIỂM ĐỊNH GTTK VỀ SO SÁNH
TRUNG BÌNH VỚI MỘT GIÁ TRỊ
μ: là hàm lượng alkaline phosphatase trung bình của bệnhnhân bị bệnh loãng xương khi chưa dung thuốc A
Giả thuyết:
Giá trị kiểm định:
Theo số liệu mẫu:
0 1
H H
Trang 8II KIỂM ĐỊNH GTTK VỀ SO SÁNH TRUNG BÌNH VỚI MỘT GIÁ TRỊ
Điều kiện bác bỏ giả thuyết H0:
Ta có:
Kết luận: Bác bỏ giả thuyết H0 , Chấp nhận H1
Nghĩa là thuốc A có tác dụng làm tăng alkaline phosphatase
Trang 9II KIỂM ĐỊNH GTTK VỀ SO SÁNH
HAI TRUNG BÌNH
Xét các biến ngẫu nhiên X, Y phân phối chuẩn, có phương sai
bằng nhau Kiểm định giả thuyết sau với mức ý nghĩa
Giả thuyết:
Giá trị kiểm định:
+ TH1: nx ≥ 30; ny ≥ 30:
0 1
2 2
y x
x y Z
s s
Trang 10II KIỂM ĐỊNH GTTK VỀ SO SÁNH HAI TRUNG BÌNH
Giá trị kiểm định: + TH2: nx < 30; ny < 30:
2 2
2 2 2
x y
y x
x y
x y
y x
y x
x y T
s s
n n
df n n
s s
df
s s
n n
Trang 11II KIỂM ĐỊNH GTTK VỀ SO SÁNH HAI TRUNG BÌNH
Giá trị kiểm định:
+TH3: X và Y có dạng so sánh cặp
Điều kiện bác bỏ giả thuyết H0:
Dạng phân phối chuẩn (dạng Z)
Dạng phân phối student (dạng T) với bậc tự do df
Trang 13II KIỂM ĐỊNH GTTK VỀ SO SÁNH HAI TRUNG BÌNH
Giả thuyết:
Giá trị kiểm định:
0 1
: :
H H
y x
x y Z
s s
x y Z
s s
Trang 14II KIỂM ĐỊNH GTTK VỀ SO SÁNH
TRUNG BÌNH VỚI MỘT GIÁ TRỊ
Điều kiện bác bỏ giả thuyết H0:
Ta có:
Kết luận: Bác bỏ giả thuyết H0 , Chấp nhận H1
Nghĩa là protein trung bình của hai nhóm trẻ làkhác nhau
2
Z Z
0,025 2
Trang 15II KIỂM ĐỊNH GTTK VỀ SO SÁNH
HAI TRUNG BÌNH
Ví dụ: Bài tập 6 trang 80
Giả thuyết:
Giá trị kiểm định: với D = X – Y
Theo số liệu mẫu:
0 1
: :
H H
s
Trang 16II KIỂM ĐỊNH GTTK VỀ SO SÁNH TRUNG BÌNH VỚI MỘT GIÁ TRỊ
Điều kiện bác bỏ giả thuyết H0:
Trang 17II KIỂM ĐỊNH GTTK VỀ SO SÁNH NHIỀU TRUNG BÌNH (PHÂN TÍCH PHƯƠNG SAI – ANOVA)
Mục tiêu của phân tích phương sai là so sánh trung bìnhcủa nhiều nhóm (tổng thể) dựa trên các số trung bìnhcủa các mẫu quan sát từ các nhóm này và thông quakiểm định giả thuyết để kết luận về sự bằng nhau củacác số trung bình này
Trang 18II KIỂM ĐỊNH GTTK VỀ SO SÁNH NHIỀU TRUNG BÌNH (PHÂN TÍCH PHƯƠNG SAI – ANOVA)
Giả sử cần so sánh số trung bình của k tổng thểđộc lập Ta lấy k mẫu có số quan sát là n1, n2… nk;tuân theo phân phối chuẩn Trung bình của các tổngthể được ký hiệu là μ1; μ 2 ….μk thì mô hình phân tíchphương sai một yếu tố ảnh hưởng được mô tả dướidạng kiểm định giả thuyết như sau:
Ho: μ1 = μ 2 =….=μ k
H1: Tồn tại ít nhất 1 cặp có μi ≠μ j; i ≠ j
Trang 19II KIỂM ĐỊNH GTTK VỀ SO SÁNH NHIỀU TRUNG BÌNH (PHÂN TÍCH PHƯƠNG SAI – ANOVA)
Để kiểm định ta đưa ra 3 giả thiết sau:
1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
2) Các phương sai tổng thể bằng nhau
3) Ta lấy k mẫu độc lập từ k tổng thể Mỗi mẫu
được quan sát nj lần.
Trang 20Các bước tiến hành:
Bước 1: Tính các trung bình mẫu và trung bình
chung của k mẫu
Ta lập bảng tính toán như sau:
Trang 21Bước 1: Tính các trung bình mẫu và trung bình
chung của k mẫu
Trung bình mẫu x1 x2 xk được tính theo công thức:
k
i i
Trang 22Bước 2: Tính các tổng độ lệch bình phương
1
2 1
2 2
Trang 23Bước 2: Tính các tổng độ lệch bình phương
Tổng các độ lệch bình phương giữa các nhóm(SSB)
2 1
k
i i i
Trang 24Bước 3: Tính các phương sai (phương sai của
nội bộ nhóm và phương sai giữa các nhóm)
Ta ký hiệu k là số nhóm (mẫu); n là tổng số quan sátcủa các nhóm thì các phương sai được tính theo côngthức sau:
SSW MSW
SSB MSB
k
MSW: Là phương sai nội bộ nhóm
SSB: Là phương sai giữa các nhóm
Trang 25Bước 4: Kiểm định giả thuyết
Tính tiêu chuẩn kiểm định F (F thực nghiệm)
MSB F
Trang 26Bảng phân tích phương sai 1 yếu tố khi sử dụng máy tính (phần mềm EXCEL hoặcSPSS) tóm tắt như sau:
Bảng gốc bằng tiếng Anh
Trang 27Bảng phân tích phương sai 1 yếu tố khi sử dụng máy tính (phần mềm EXCEL hoặcSPSS) tóm tắt như sau:
Bảng phân tích phương sai tổng quát dịch ra tiếng việt – ANOVA
Trang 28II KIỂM ĐỊNH GTTK VỀ SO SÁNH NHIỀU TRUNG
BÌNH (PHÂN TÍCH PHƯƠNG SAI – ANOVA)
Trang 29II KIỂM ĐỊNH GTTK VỀ SO SÁNH NHIỀU TRUNG
BÌNH (PHÂN TÍCH PHƯƠNG SAI – ANOVA)
SSB n x x n x x n x x
Trang 30II KIỂM ĐỊNH GTTK VỀ SO SÁNH NHIỀU TRUNG BÌNH (PHÂN TÍCH PHƯƠNG SAI – ANOVA)
Trang 31II KIỂM ĐỊNH GTTK VỀ SO SÁNH NHIỀU TRUNG BÌNH (PHÂN TÍCH PHƯƠNG SAI – ANOVA)
Ví dụ: Ba loại thực phẩm được kiểm tra nhằm xem xétlượng cholesterol (g cholesterol/1000g thực phẩm) trongcác mẫu thực phẩm lấy ngẫu nhiên được thể hiện trong
bảng sau Hãy thực hiện kiểm định ANOVA ở mức ý
nghĩa 5% nhằm xác định xem phải chăng lượng
cholesterol trung bình ở 3 loại là bằng nhau
Loại A: 45,5 45,8 43,7 42,1 44,5 45,1 44,2Loại B: 45,4 44,4 46,1 44,8 42,2 45,3 44,2Loại C: 45,1 44,1 42,5 43,6 42,5 43,3 43,5
Trang 32 Điều kiện bác bỏ giả thuyết H0:
Dạng phân phối chuẩn (dạng Z)
Trang 33 Ví dụ 5.8/71
Điều tra ở tỉnh H 200000 người được chọn ngẫu nhiên thấy
có 67 người bị bệnh lao Theo báo cáo, tỉ lệ bệnh lao ở tỉnh H là 0,05%, với mức ý nghĩa 5% hãy cho biết báo cáo có đáng tin cậy không?
III KIỂM ĐỊNH GTTK VỀ SO SÁNH
TỶ LỆ VỚI MỘT GIÁ TRỊ
Trang 35III KIỂM ĐỊNH GTTK VỀ SO SÁNH
HAI TỶ LỆ
Giả sử px, py là tỷ lệ phần tử có đặc điểm T trong tổng thể thứ
1 và thứ 2 Kiểm định giả thuyết sau với mức ý nghĩa
Giả thuyết:
Giá trị kiểm định: với
Điều kiện bác bỏ giả thuyết H0:
Dạng phân phối chuẩn (dạng Z)
Kết luận:
0 1
: : ( ; )
n n
Trang 36Cho ăn đường có ảnh hưởng đến tỉ lệ đột biến của ruồi giấm không, với mức ý nghĩa 5%?
Trang 37: :
n n
0
80 805; 0, 0994
805
357 0, 0994 0,1295 2756; 0,1295
Trang 38III KIỂM ĐỊNH GTTK VỀ SO SÁNH
HAI TỶ LỆ
Điều kiện bác bỏ giả thuyết H0:
Kết luận: Bác bỏ giả thuyết H0, chấp nhận H1
Tức là khi cho ăn đường có ảnh hưởng đến tỉ lệ đột biến củaruồi giấm
Trang 39Tính giá trị kiểm định bằng công thức:
Trong đó
nij: Tần số thực nghiệm nhóm thứ i,j
n’ij: Tần số lý thuyết nhóm thứ i,j
ri: Tổng theo dòng; cj: Tổng theo cột
Điều kiện bác bỏ giả thuyết Ho
2
'
r c
ij ij 2
ij
r c n
n
Trang 41+ Giả thiết H0: “Tỉ lệ khỏi bệnh khi điều trị bằng bốn loại
thuốc là như nhau”
r c
ij ij 2
Trang 42IV KIỂM ĐỊNH GTTK VỀ SO SÁNH
PHƯƠNG SAI VỚI MỘT GIÁ TRỊ
Xét biến ngẫu nhiên X ~ N(μ, 2) Kiểm định giả thuyết sau với mức ý nghĩa
2
2 0
2 0
Trang 43IV KIỂM ĐỊNH GTTK VỀ SO SÁNH
PHƯƠNG SAI VỚI MỘT GIÁ TRỊ
Điều kiện bác bỏ giả thuyết H0: (Trường hợp μ đã biết)Dạng phân phối chi bình phương (dạng )
n
Trang 44IV KIỂM ĐỊNH GTTK VỀ SO SÁNH
PHƯƠNG SAI VỚI MỘT GIÁ TRỊ
Ví dụ. Biết trọng lượng của một loại sản phẩm là
bnn X ~ N((, 2) (gram) Khảo sát 25 sản phẩm, có
số liệu:
Với mẫu trên, có thể nói rằng phương sai trọng lượng
của sản phẩm nhỏ hơn 5g2 được không, với mức ý nghĩa 5%?
Trang 45IV KIỂM ĐỊNH GTTK VỀ SO SÁNH
HAI PHƯƠNG SAI
Xét các biến ngẫu nhiên X , Y có phân phối chuẩn Kiểm
định giả thuyết sau với mức ý nghĩa
2 2
x y
s F
s
Trang 46IV KIỂM ĐỊNH GTTK VỀ SO SÁNH HAI PHƯƠNG SAI
Điều kiện bác bỏ giả thuyết H0:
Dạng phân phối Fisher (dạng F )
Trang 47IV KIỂM ĐỊNH GTTK VỀ SO SÁNH
HAI PHƯƠNG SAI
Ví dụ 2.11/76: Một mẫu được phân tích bởi 2 phương pháp
Trang 48Kiểm định phi tham số (Nonparametric Tests)
được sử dụng trong những trường hợp dữ liệu
không có phân phối chuẩn, hoặc cho các mẫu nhỏ
có ít đối tượng
Kiểm định phi tham số cũng được dùng cho các
dữ liệu định danh (nominal), dữ liệu thứ bậc (ordinal) hoặc dữ liệu khoảng cách (interval) không có phân phối chuẩn
Nhược điểm của kiểm định phi tham số là khả
năng tìm ra được sự sai biệt kém, không mạnh như các phép kiểm có tham số (T student, phân tích
phương sai…) Sau đây là các kiểm định phi tham
số được dùng
IX KIỂM ĐỊNH PHI THAM SỐ
Trang 49So sánh giữa kiểm định phi tham số và có tham số
KIỂM ĐỊNH KIỂM ĐỊNH PHI THAM SỐ KIỂM ĐỊNH THAM SỐ
Mẫu bắt cặp Kiểm định dấu (Sign
test) hoặc kiểm định dấu và hạng Wilcoxon (Wilcoxon test)
Phép kiểm T với mẫu phối hợp từng cặp (Paired-
Samples t test) Hai mẫu độc
lập
Kiểm định Whitney
Mann-Phép kiểm T với 2 mẫu độc lập
Samples t test) Lớn hơn 2
(Independent-mẫu độc lập
Kiểm định Wallis
Trang 50Kiểm định này sử dụng luôn các thông tin về độ lớn của chênh lệch vì vậy nó mạnh hơn kiểm định dấu
Xếp thứ hạng theo giá trị tuyệt đối (không kể dấu)
từ nhỏ đến lớn (trong trường hợp có nhiều giá trị bằng nhau thì hạng của chúng được tính bình quân)
Tính tổng các hạng đối với chênh lệch (+)và chênh lệch (-)
W = Tổng hạng ứng chênh lệch dương (+)
1 Kiểm định Wilcoxon
n(n 1) W-
4 Z
Trang 51Ví dụ: Điều trị 10 bệnh nhân có ferritin máu cao, với lượng ferritin máu trước và sau điều trị được ghi nhận như sau:
Thứ tự Lượng ferritin máu (ng/ml)
Trước điều trị Sau điều trị
Trang 522 Z
Trang 53Ví dụ: So sánh lượng ferritin máu giữa 2 nhóm bệnh nhân
có và không uống rượu
2 Kiểm định Mann-Whiney
Thứ tự Lượng ferritin máu (ng/ml)
Không uống rượu Có uống rượu
Trang 54Tính giá trị kiểm định bằng công thức:
Trong đó
n:số đối tượng
ni: số đối tượng nhóm thứ i
Ri: tổng hạng của các đối tượng ở nhóm thứ i
Điều kiện bác bỏ giả thuyết Ho
Trang 55Thứ tự Lượng ferritin máu (ng/ml)
không uống rượu có uống rượu Bệnh viêm gan mãn
3 Kiểm định Kruskall- Wallis:
Ví dụ: Sử dụng để kiểm định sự khác biệt về trung bình giữa ba
(hoặc nhiều hơn ba) nhóm không có phương sai tương đương nhau
Ví dụ So sánh lượng ferritin máu giữa 3 nhóm BN: (0): Không uống rượu; (1) Có uống rượu và (2) BN viêm gan mãn.
Trang 56Giả thiết đã xác định
Tính giá trị kiểm định bằng công thức:
Điều kiện bác bỏ giả thuyết Ho
4 Kiểm định Chi - Square:
(Kiểm định giả thuyết về phân phối, so sánh tỉ lệ thực
* 1
Trang 574 Kiểm định Chi - Square:
Ví dụ: Kết quả thí nghiệm di truyền Menden
Trang 584 Kiểm định Chi - Square:
Ví dụ: Quan sát trọng lượng X của 108 người ở độ tuổi từ
30 – 50, có kết quả như sau:
Với mức ý nghĩa 5%, trọng lượng X có phân phối chuẩnkhông?
Trọng lượng < 40 40 - 45 45 - 50 50 - 55 55 - 60 60 - 65 65 - 70 70 - 75 >75
Trang 59Tính giá trị kiểm định bằng công thức:
Trong đó
nij: Tần số thực nghiệm nhóm thứ i,j
n’ ij: Tần số lý thuyết nhóm thứ i,j
ri: Tổng theo dòng; cj: Tổng theo cột
Điều kiện bác bỏ giả thuyết Ho
2
'
r c
ij ij 2
5 Kiểm định Chi – Square :
(Kiểm định sự phụ thuộc, so sánh nhiều tỉ lệ)
(r 1)(c 1),
i j '
ij
r c n
n
Trang 60r c
ij ij 2
Trang 615 Kiểm định Chi – Square (tính độc lập):
Ví dụ: So sánh tác dụng của 6 loại thuốc trị bệnh B bằng cách theo dõi tác dụng của thuốc trên 6 lô chuột, kết quả như sau:
Với mức ý nghĩa 5%, so sánh tỉ lệ có tác dụng của 6 lô chuột dùng thuốc?
Không có
Trang 625 Kiểm định Chi – Square (tính độc lập):
Ví dụ: Một cuộc điều tra xã hội được tiến hành ở các thành phố lớn để tìm hiểu những vấn đề về giới tính Kết quả ghi nhận được như sau:
Với mức ý nghĩa 5%, có thể kết luận rằng trình độ học vấn
và giới tính độc lập với nhau hay không?
Trang 63r c
ij ij 2