1. Trang chủ
  2. » Y Tế - Sức Khỏe

NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ

138 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nguyên Lý Kiểm Định Kiểm Định Thống Kê
Tác giả TS. Nguyễn Thị Minh Trang
Trường học Đại học Y Dược TPHCM
Chuyên ngành Thống kê
Thể loại thesis
Năm xuất bản 2022
Thành phố TPHCM
Định dạng
Số trang 138
Dung lượng 2,84 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

PowerPoint Presentation NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ TS Nguyễn Thị Minh Trang Bộ môn Thống kê – Khoa Y tế Công cộng Đại học Y Dược TPHCM Email drminhtranggmail com 22032022 1 NỘI DUNG 22032022 2 • Khái niệm kiểm định giả thuyết1 • Khái niệm P value2 • Sai lầm và năng lực thống kê3 • Chọn lựa phương pháp thống kê4 • Kiểm định biến định tính5 • Kiểm định biến định lượng6 1 KHÁI NIỆM Giả thuyết Hypothesis Kiểm định giả thuyết Hypothesis testing 22032022 3 ➢ GIẢ THUYẾT (GT) ➢ KIỂM Đ.

Trang 1

NGUYÊN LÝ KIỂM ĐỊNH

KIỂM ĐỊNH THỐNG KÊ

TS Nguyễn Thị Minh Trang

Bộ môn Thống kê – Khoa Y tế Công cộng

Đại học Y Dược TPHCM

Email: drminhtrang@gmail.com

22/03/2022

1

Trang 3

1 KHÁI NIỆM

Giả thuyết: Hypothesis

Kiểm định giả thuyết: Hypothesis testing

22/03/2022

Trang 4

KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU

Giả thuyết nghiên cứu:

Mệnh đề có thể kiểm định được về việc dự đoán mối liên

Trang 5

KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU

có giả thuyết nghiên cứu là

“Những người mất ngủ sẽ có điểm số thi thấp hơnnhững người ngủ đủ giấc”

5

Trang 6

KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU

Trang 7

KHÁI NIỆM GIẢ THUYẾT HO - HA

• Ho (o: null hypothesis):

• Không có sự liên hệ thống kê nào giữa 2 yếu tố đang xem xét.

• Ha (a: alternative):

• Giả thuyết thay thế hay đảo thuyết.

• Có mối liên quan có ý nghĩa thống kê giữa 2 yếu tố đang xem xét.

22/03/2022 7

Trang 8

KHÁI NIỆM GIẢ THUYẾT HO - HA

• Ho: Không có sự khác biệt về điểm số thi giữa 2 nhómngười mất ngủ và ngủ đủ giấc

Trang 9

KHÁI NIỆM GIẢ THUYẾT HO - HA

Trang 10

KHÁI NIỆM KIỂM ĐỊNH GIẢ THUYẾT

“Phương pháp phản chứng”

Nếu BN bị tắc ruột (A) thì BN sẽ không trung tiện (không B)

(không A)

Trang 11

“Phương pháp phản chứng”

▪ Nếu {Ho=>T hiếm xảy ra} thì {T xảy ra=>Ho hiếm xảy ra}

▪ Nếu {Ho=>P(T) nhỏ} thì {T xảy ra=>P(Ho) nhỏ}

22/03/2022 11

KHÁI NIỆM KIỂM ĐỊNH GIẢ THUYẾT

Trang 12

QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT

Trang 13

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia đình có

1 Xây dựng GT Ho:

Tỷ lệ K vú/ nhóm tiền căn gđ = Tỷ lệ K vú/ không tiền căn

QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT

Trang 14

QUI TRÌNH KIỂM ĐỊNH GT

đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát

2 Chọn kiểm định phù hợp:

Kiểm định Chi bình phương để so sánh 2 tỷ lệ

Trang 15

QUI TRÌNH KIỂM ĐỊNH GT

đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát

3 Tính giá trị thống kê của kiểm định đã chọn

22/03/2022 15

Trang 16

QUI TRÌNH KIỂM ĐỊNH GT

đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát

4 Tính xác suất thống kê (giá trị P) từ giá trị thống kê tínhđược

Trang 17

QUI TRÌNH KIỂM ĐỊNH GT

đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát

5 Kết luận

không có tiền căn là như nhau thì xác suất có được sự

Trang 18

QUI TRÌNH KIỂM ĐỊNH GT

5 Kết luận

Giả sử P(K vú /Ho) <0.001: nếu Ho đúng hay tỷ lệ K vú ở

được sự khác biệt như chúng ta quan sát thấy là nhỏ hơn1/1000

Trang 19

2 KHÁI NIỆM P VALUE

22/03/2022

19

Trang 20

KHÁI NIỆM VỀ P-VALUE

• Nghiên cứu về tiền căn gia đình và Ung thư vú

• Giả sử tỷ lệ mắc Ung thư vú ở phụ nữ không có tiền căn

• Câu hỏi: Vậy phụ nữ có tiền căn gia đình bị K vú có tỷ lệ

bị K vú khác so với tỷ lệ trên không?

• Đặt giả thuyết Ho và Ha

𝐻0: 𝑝 = 0.02

𝐻𝐴: 𝑝 ≠ 0.02

Trang 21

• Chọn 𝑁 = 100 phụ nữ có tiền căn gia đình bị K vú

• Quan sát 𝑋 = # phụ nữ trong nhóm này bị K vú

phụ nữ này tương tự như số phụ nữ không có tiền căn

• Cụ thể, chúng ta trông đợi rằng 2 trong số 100 người phụ

• Giả sử chúng ta quan sát thấy 𝑋 = 5 ca K vú (5%)

KHÁI NIỆM VỀ P-VALUE

21

Trang 23

Khái niệm: 𝟎 𝟎𝟓𝟎𝟖 là giá trị P , hay P value (p=0.0508)

Giải thích: Nếu GT Ho đúng (không có mối liên quan giữa tiền

căn gđ và K vú), cơ hội quan sát thấy có từ 5 ca trở lên trong

số 100 phụ nữ có tiền căn gia đình là 1/20

Qui ước chung:

P<0,05: Bác bỏ Ho

KHÁI NIỆM VỀ P-VALUE

23

Trang 24

KHÁI NIỆM VỀ P-VALUE

● Giá trị P (P-value) đo lường khả năng (xác suất) quan

● Giá trị P nhỏ có ý nghĩa là giá trị quan sát được là bất

thường nếu GT Ho đúng

=> Bác bỏ GT Ho

● Giá trị P lớn có ý nghĩa là giá trị quan sát được không

phải là bất thường khi GT Ho đúng

=> Không bác bỏ GT Ho

Trang 26

với 1 xác suất nào đó.

Trang 27

SAI LẦM LOẠI 1: TYPE I ERROR

Trang 28

SAI LẦM LOẠI 1: TYPE I ERROR

▪ Ví dụ:

NC về mối liên quan giữa tiền căn gđ bị K vú và K vú

Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)

Ha: P(K vú/tiền căn)  P(K vú/không tiền căn)

Sai lầm α là xác suất cho rằng tiền căn gia đình có liên quanvới K vú (GT Ha) trong khi thực tế không có mối liên quan

Trang 29

SAI LẦM LOẠI 1: TYPE I ERROR

Tiền căn gđ (-)

22/03/2022 29

Sai lầm loại I (α) là sai lầm cho rằng tiền căn gia đình có

mối liên quan (GT Ho)

*Xem tiền căn gia đình như 1 yếu tố nguy cơ, tương tự

1 “test” tầm soát

Trang 30

SAI LẦM LOẠI 2: TYPE II ERROR

Trang 31

SAI LẦM LOẠI 2: TYPE II ERROR

▪ Ví dụ:

NC về mối liên quan giữa tiền căn gđ bị K vú và K vú

Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)

Sai lầm β là xác suất cho rằng tiền căn gia đình không

liên quan (GT Ha)

22/03/2022 31

Trang 32

SAI LẦM LOẠI 2: TYPE 2 ERROR

Tiền căn gđ (+)

Sai lầm loại II (β) là sai lầm cho rằng tiền căn gia đình

Trang 33

SỨC MẠNH THỐNG KÊ: POWER

Trang 34

SỨC MẠNH THỐNG KÊ: POWER

đến K vú (bác bỏ Ho) khi thực tế có mối liên quan này

Trang 37

4 CHỌN LỰA PHƯƠNG PHÁP THỐNG KÊ PHÂN TÍCH

22/03/2022

37

Trang 38

CHỌN PP THỐNG KÊ PHÂN TÍCH

giải thích/ tiên lượng (biến độc lập):

Trang 39

Danh định Thứ tự Wilcoxon

Rank sum (Mann Whitney)

Kruskal Wallis

Hồi qui Logistic Thứ tự

Định lượng

(phân phối

chuẩn)

T 2 nhóm độc lập ANOVA Tương quan Pearson/

Hồi qui tuyến tính

Định lượng

(phân phối lệch)

Wilcoxon Rank sum (Mann Whitney)

Kruskal Wallis

Tương quan Spearman

22/03/2022 39

Khi các nhóm so sánh độc lập:

Trang 40

T bắt cặp ANOVA lặp/GEE GEE /Mixed Model

Định lượng (phân Wilcoxon Friedman test GEE/ GLMM22/03/2022 40

Khi các nhóm so sánh không độc lập

Trang 41

5 KIỂM ĐỊNH BIẾN KẾT CUỘC ĐỊNH TÍNH

22/03/2022

41

Trang 42

Danh định Thứ tự Wilcoxon

Rank sum (Mann Whitney)

Kruskal Wallis

Hồi qui Logistic Thứ tự

Định lượng

(phân phối

chuẩn)

T 2 nhóm độc lập ANOVA Tương quan Pearson/

Hồi qui tuyến tính

Định lượng

(phân phối lệch)

Wilcoxon Rank sum

Kruskal Wallis

Tương quan Spearman

Khi các nhóm so sánh độc lập:

Trang 43

MỤC ĐÍCH

Kiểm định Chi bình phương được sử dụng để xác

định

43

Trang 44

VÍ DỤ

đường típ 2 ở cộng đồng nghiên cứu hay không?

Trang 45

VÍ DỤ

45

Biến số độc lập

(yếu tố liên quan)

Giá trị biến số Loại biến số

Trang 46

BẢNG PHÂN PHỐI TẦN SUẤT

trù

biến số

Trang 47

BẢNG PHÂN PHỐI TẦN SUẤT

Trang 48

TẦN SỐ KÌ VỌNG (VỌNG TRỊ)

của bảng dự trù khi chưa thu thập dữ liệu thực tế

bảng dự trù để tính giá trị kì vọng của mỗi ô trong

Trang 52

GIẢ ĐỊNH CỦA KIỂM ĐỊNH Χ2

Trang 53

CÁC BƯỚC HÌNH THÀNH KIỂM ĐỊNH THỐNG KÊ

53

Trang 54

CÁC BƯỚC HÌNH THÀNH KIỂM ĐỊNH THỐNG KÊ

đường típ 2

Trang 56

Trang 60

KIỂM ĐỊNH FISHER

exact test dùng thay thế Chi bình phương

Trang 61

6 KIỂM ĐỊNH BIẾN KẾT CUỘC ĐỊNH LƯỢNG

22/03/2022

61

Trang 62

Danh định Thứ tự Wilcoxon

Rank sum (Mann Whitney)

Kruskal Wallis

Hồi qui Logistic Thứ tự

Định lượng

(phân phối

chuẩn)

T 2 nhóm độc lập ANOVA Tương quan Pearson/

Hồi qui tuyến tính

Định lượng

(phân phối lệch)

Wilcoxon Rank sum

Kruskal Wallis

Tương quan Spearman

Trang 63

Friedman test GEE/ GLMM

Trang 64

● Hình chuông và tập trung tại giá trị 0(giống phân phối chuẩn)

● Biến thiên lớn hơn phân phối chuẩn

● Nếu mẫu càng tăng, phân phối t trở nên gần giống hình dạng phân phối chuẩn

Trang 65

CÁC LOẠI KIỂM ĐỊNH T

65

Trang 66

GIẢ ĐỊNH CỦA KIỂM ĐỊNH T

1 Thang đo biến số: biến liên tục

sampling)

Trang 67

KIỂM ĐỊNH T ĐỘC LẬP

(INDEPENDENT T TEST)

67

Trang 68

2 1

N

SD N

SD

SEdiff = +

Sai số chuẩn gộp

Trang 69

KIỂM ĐỊNH T ĐỘC LẬP

Ví dụ:

Giả sử kiểm tra ảnh hưởng của cafeinne trên vận

động bằng cách ghi nhận thời gian giữ con trỏ di

động theo 1 điểm chuyển động

Trang 73

KIỂM ĐỊNH T ĐỘC LẬP

2

2 2 1

2 1

N

SD N

Trang 74

KIỂM ĐỊNH T ĐỘC LẬP

93

1 10

) 2805

4 ( 9

) 1164

4

2

2 2 1

SD

SEdiff

758

2 93

1

322

5 93

1

1 15 778

t

Trang 75

KIỂM ĐỊNH T ĐỘC LẬP

hạn t (bảng) tạingưỡng alpha = 0.05

Trang 77

KIỂM ĐỊNH T BẮT CẶP

(PAIRED T TEST)

77

Trang 78

KIỂM ĐỊNH T BẮT CẶP

Kiểm định t bắt cặp được sử dụng khi so sánh 2 nhóm

dữ liệu có liên quan

Trang 79

KIỂM ĐỊNH T BẮT CẶPCông thức:

diff

X

SE

D t

pairs

D diff

Trang 80

KIỂM ĐỊNH T BẮT CẶP

5 người được chọn vào nghiên cứu

cảm thấy không chịu đựng được Nhà nghiên cứu ghi

nhận thời gian này Ngày hôm sau, các đối tượng đổi

Trang 81

KIỂM ĐỊNH T BẮT CẶP

(time in sec)

Trang 82

KIỂM ĐỊNH T BẮT CẶP

Person

Painfree(time in second)

Trang 84

KIỂM ĐỊNH T BẮT CẶP

55

2 5

70

75

2 55

2

7 55

2

48 55

Trang 85

KIỂM ĐỊNH T BẮT CẶP

hạn t (bảng) vớialpha=0.05

Độ tự do

df =5-1=4

85

Trang 86

KIỂM ĐỊNH T BẮT CẶP

“không”

Trang 87

KIỂM ĐỊNH ANOVA

22/03/2022

87

Trang 88

ANOVA (ANALYSIS OF VARIANCE)

Ý tưởng:

Kiểm định sự khác biệt giữa

đối với những biến số định lượng

quả tính toán tương tự t-test)

Trang 89

PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU

ONE-WAY ANOVA

Các giả định của kiểm định ANOVA

89

Trang 90

GIẢ THUYẾT CỦA ONE-WAY ANOVA

nhóm các

bình Trung

:

a

H

Trang 91

KIỂM ĐỊNH ANOVA

✓ Độ tự do nội bộ nhóm (df within-group)

✓ Độ tự do giữa các nhóm (df between groups)

▪ Kí hiệu: F(df between, df within)

91

Trang 93

CÁC BƯỚC TÍNH TOÁN F

2

) 1

Trang 94

Bước 3: Tổng bình phương toàn bộ SS

Total sum of square _ SS: df = N-1

CÁC BƯỚC TÍNH TOÁN F

Trang 95

Bước 4: Trung bình bình phương nội bộ nhóm

Within_group mean squares_MSw

Between_group mean squares_MSb

k N

Trang 96

Bước 6: Tính giá trị thống kê F

Ha: Trung bình giữa các nhóm khác nhau, MSb > MSw

Độ tự do của F

Trang 97

PHÂN PHỐI CỦA F

Kiểm định dựa trên phân phối F > 1

97

Trang 98

PHÂN PHỐI CỦA F

2 2

2

2 0

m n within

Trang 99

VÍ DỤ

800 mg calcium vs 1500 mg calcium vs placebo

99

Trang 100

Within group variability

Within group variability

Trang 102

KIỂM ĐỊNH F

063

)1

3

)97.06.1()

97.94(

)97.92

(

(

*11

2 2

2 2

−+

−+

) 11 08

10

6 0095

Cỡ mẫu

Hiệu số giữa trung bình từng nhóm và trung bình chung

MSB

MSW

MSB

MSW

Trang 103

BẢNG F

P < 0.05

103

Trang 104

BẢNG F

Trang 107

ANOVA TÓM TẮT

cụ thể những nhóm nào

số phân tích sâu hơn để hiệu chỉnh vấn đề so sánh đa

nhóm (Post Hoc Test)

107

Trang 108

KIỂM ĐỊNH PHI THAM SỐ

Danh định Thứ tự Wilcoxon

Rank sum (Mann Whitney)

Kruskal Wallis

Hồi qui Logistic Thứ tự

Định lượng

(phân phối

chuẩn)

T 2 nhóm độc lập ANOVA Tương quan Pearson/

Hồi qui tuyến tính

Định lượng

(phân phối lệch)

Wilcoxon Rank sum/ Mann

Kruskal Wallis

Tương quan Spearman

Trang 109

KIỂM ĐỊNH PHI THAM SỐ

Friedman test GEE/ GLMM

Trang 110

PHÂN BIỆT THAM SỐ VÀ PHI THAM SỐ

Trang 111

3/22/2022 111

Giả định chung của các phương pháp này

mẫu)

PHÂN BIỆT THAM SỐ VÀ PHI THAM SỐ

Trang 112

PHƯƠNG PHÁP PHI THAM SỐ

(NON-PARAMETRIC METHODS)

Kĩ thuật thống kê

thường của số liệu

Trang 113

PHƯƠNG PHÁP PHI THAM SỐ

(NON-PARAMETRIC METHODS)

❖ Hữu dụng khi:

chữa bằng phép biến đổi thích hợp

❖ Khuyết điểm

3/22/2022 113

Trang 114

KIỂM ĐỊNH PHI THAM SỐ THAY THẾ

KIỂM ĐỊNH THAM SỐ

KIỂM ĐỊNH THAM SỐ PHI THAM SỐ

Signed-rank test

samples T test

Wilcoxon rank sum test

Trang 116

Số giờ ngủ Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)

Trang 117

WILCOXON SIGNED-RANK TEST

1 Loại bỏ mọi hiệu số bằng zero Sắp xếp các hiệu số

3/22/2022 117

Số giờ ngủ Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)

Trang 118

WILCOXON SIGNED-RANK TEST

Trang 119

WILCOXON SIGNED RANK TEST

3 Nếu không có sự khác biệt hiệu quả giữa thuốc ngủ

sự khác biệt thì một tổng sẽ lớn hơn và tổng kia sẽ

nhỏ hơn Kí hiệu tổng nhỏ hơn là T

Trang 121

WILCOXON RANK SUM TEST

Không hút thuốc Hút thuốc lá nặng Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng

Trang 122

WILCOXON RANK SUM TEST

1 Sắp hạng các quan sát trong cả hai nhóm theo thứ tự độ lớn như trong bảng Nếu có các giá trị nào bằng nhau thì lấy trung bình của chúng

Trang 123

WILCOXON RANK SUM TEST

Trang 124

WILCOXON RANK SUM TEST

được sắp đặt hơi khác

Trang 125

N1 = 15; N2 = 14; P=0,05

Khoảng giá trị tương ứng của T 164 - 256

T =163 => P<0,05

3/22/2022 125

Trang 126

PHÉP KIỂM KRUSKAL WALLIS

Kiểm định cho biết có ít nhất 1 cặp so sánh có trung vị

khác nhau

Trang 127

PHÉP KIỂM KRUSKAL WALLIS

≥3)

3/22/2022 127

Trang 128

PHÉP KIỂM KRUSKAL WALLIS

Trang 129

PHÉP KIỂM KRUSKAL WALLIS

Trang 130

PHÉP KIỂM KRUSKAL WALLIS

Trang 131

PHÉP KIỂM KRUSKAL WALLIS

trong bảng

hạn thì bác bỏ giả thuyết Ho

22/03/2022 131

Trang 132

PHÉP KIỂM KRUSKAL WALLIS

Ví dụ: Kiểm định sự khác biệt về mức thu nhập giữa 3

nhóm

Trang 133

PHÉP KIỂM KRUSKAL WALLIS

Trang 134

PHÉP KIỂM KRUSKAL WALLIS

▪ H=6,72

Trang 135

PHÉP KIỂM KRUSKAL WALLIS

22/03/2022 135

P=0,05 và df=2, Chi=5.99

Trang 136

PHÉP KIỂM KRUSKAL WALLIS

Trang 138

TÀI LIỆU THAM KHẢO

▪ Sách:

1 ARMITAGE, P., BERRY, G & MATTHEWS, J N S 2008

Statistical Methods in Medical Research, Chichester:, John

Wiley & Sons, Ltd

2 Ðỗ Văn Dũng Xác suất và sinh thống kê căn bản TP Hồ Chí

Minh, Khoa Y tế công cộng, Trường Ðại học Y Dược, 2001

▪ Web:

https://www.graphpad.com/support/faqid/1790/

Ngày đăng: 05/06/2022, 13:01

HÌNH ẢNH LIÊN QUAN

BẢNG PHÂN PHỐI TẦN SUẤT - NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ
BẢNG PHÂN PHỐI TẦN SUẤT (Trang 47)
Vọng trị: số màu đỏ trong ngoặc đơn trông cá cô của bảng dự trù - NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ
ng trị: số màu đỏ trong ngoặc đơn trông cá cô của bảng dự trù (Trang 51)
● Hình chuông và tập trung tại giá trị 0(giống phân phối chuẩn) ● Biến thiên lớn hơn phân phối chuẩn - NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ
Hình chu ông và tập trung tại giá trị 0(giống phân phối chuẩn) ● Biến thiên lớn hơn phân phối chuẩn (Trang 64)
BẢNG F - NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ
BẢNG F (Trang 104)
BẢNG ANOVA WbMSMSF= - NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ
b MSMSF= (Trang 106)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w