1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Đại cương về mục tiêu, biến số và phân tích số liệu

27 279 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 1,85 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

ỹ Đề xuất và thăm dũ một số giải phỏp can thiệp làm giảm Biến số 1 Biến số 2 Biến số 3 Biến số 4 Tờn đề tài Định nghĩa Biến số% • Đặc tính của người, vật sự việc, hiện tư ợng biến thiê

Trang 1

MT cụ thể:

ỹ  Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A

ỹ  Xỏc định một số yếu tố liờn quan đến tỡnh trạng cao HA

ỹ  Đỏnh giỏ hiệu quả của một số giải phỏp can thiệp làm giảm

tỷ lệ tăng huyết ỏp

Tờn đề tài: Huyết ỏp của người dõn tại

huyện A năm 2005 và một số yếu tố ảnh hưởng

MT chung: Xỏc định tỷ lệ cao HA của người

cao tuổi tại huyện A năm 2005

Cao HA của người cao tuổi tại huyện A năm 2005 và một số yếu

tố ảnh hưởng

•  Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A năm 2005

và một số yếu tố ảnh hưởng ỹ  Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A

ỹ  Xỏc định một số yếu tố liờn quan đến tỡnh trạng cao HA

ỹ  Đề xuất (và thăm dũ) một số giải phỏp can thiệp làm giảm

Biến số 1 Biến số 2 Biến số 3 Biến số 4

Tờn đề tài

Định nghĩa Biến số%

• Đặc tính của người, vật sự việc, hiện tư

ợng biến thiên theo các điều kiện khác nhau

• Do người nghiên cứu lựa chọn phù hợp với từng mục tiêu nghiên cứu

• Triển khai nghiên cứu chính là thu thập

số liệu cho các biến số này

• Đối lập với biến số là các hằng số

Trang 2

Phân loại theo bản chất của biến số

Biến định lượng

Biến định tính

Biến liên tục Biến rời rạc Biến tỷ suất Biến khoảng chia Biến danh mục Biến thứ hạng Biến nhị phân

Bài tập 1: Phân loại các biến số

Định tính

Định lượng

Danh mục

Thứ hạng

Nhị phân

Khoảng chia

Tỷ suất

Liên tục

Rời rạc Tuổi

Hàm lượng đường huyết

Độ cận, viễn của mắt (đi ốp)

Số lượng hồng cầu Nhiệt độ không khí Giới

Dân tộc Trình độ văn hoá

Danh mục

Thứ hạng

Nhị phân

Khoảng chia

Tỷ suất

Liên tục

Rời rạc

Biến phụ thuộc (bệnh)

Yếu tố nhiễu

l Nhiễu là yếu tố làm sai lệch ảnh hưởng của phơi nhiễm với bệnh (thay đổi độ lớn và ý nghĩa thống kê)

l Biến độc lập, phụ thuộc và nhiễu được xác định bởi ngư

ời nghiên cứu và chỉ có ý nghĩa trong nghiên cứu đó

Trang 3

Tiêu chuẩn của 1 yếu tố nhiễu%

v  Phải là 1 yếu tố nguy cơ đối với bệnh

v  Phải có liên quan đối với phơi nhiễm như

ng không lệ thuộc vào phơi nhiễm

v  Không phải là yếu tố trung gian giữa phơi

nhiễm và bệnh

v  Phải thực sự tác động lên mối tương quan

giữa phơi nhiễm và bệnh (khẳng định khi

phân tích số liệu)

v  Có thể đổi chỗ cho yếu tố phơi nhiễm tuỳ

theo mục đích người làm nghiên cứu

Trường hợp nào sau đây là nhiễu?%

Nếu muốn xác định các biến số cần và đủ cho

một nghiên cứu thì cần dựa vào cách nào dưới

đây (chọn cách mà Anh/Chị cho là hợp lý nhất)?

A.  Kinh nghiệm của các nghiên cứu tưõng tự đã

được tác giả khác triển khai,

B.  Cây vấn đề được phát triển từ đề tài nghiên

‒  là mô tả kết quả thu được từ mẫu nghiên cứu

‒  biểu thị độ lớn, sự phân bố của các tham số của mẫu nghiên cứu như , độ lệch chuẩn, các tỷ lệ, bảng, biểu, đồ thị sự phân bố theo các biến số khác nhau như tuổi, giới, địa dư

•  Thống kê suy luận:

‒  là quá trình ngoại suy kết quả nghiên cứu từ mẫu

ra quần thể nghiên cứu

‒  bao gồm 2 phương pháp: ước lượng và kiểm định

Trang 4

Quần thể đích%

Quần thể nghiên cứu%

- Mẫu kinh nghiệm %

- Mẫu thuận tiện !

- Mẫu chỉ tiêu!

- Mẫu có mục đích.%

Chọn mẫu%

Ước lượng%

•  điểm%

•  khoảng%

Kiểm định giả thuyết%

Suy luận thông kê

Giá trị p Lựa chọn!

Nếu một người nghiờn cứu muốn thu thập số liệu

về huyết ỏp tối đa của cỏc đối tượng NC, cỏch thu

thập nào dưới đõy Anh/Chị cho là hợp lý nhất?

A.  Phõn huyết ỏp thành cỏc nhúm (vớ dụ < 90

mmHg; 90-120; 121-140 ) sau đú chọn nhúm

thớch hợp

B.  Ghi đầy đủ trị số huyết ỏp tối đa của từng đối

tượng

C.  Phõn đối tượng thành hai loại cú và khụng cao

huyết ỏp tối đa

D.  Phõn thành cỏc nhúm: huyết ỏp thấp, bỡnh

thường, cao và rất cao

Bài tập

Nếu một người nghiờn cứu muốn thu thập số

liệu về số điếu thuốc lỏ một người hỳt trung

bỡnh/ngày, cỏch thu thập nào dưới đõy Anh/Chị cho là hợp lý nhất?

A.  Phõn thành cỏc nhúm (vớ dụ < 5 điếu; 5-10;

Trang 5

Ví dụ 1: Mô tả đặc điểm của cân nặng khi

đẻ của 500 trẻ mới sinh tại bệnh viện M:%

1 Khi cân nặng tính bằng gram (biến định lượng)!

ố Đo lường độ tập trung của số liệu:

- Giá trị trung bình: với số liệu phân bố chuẩn

- Giá trị trung vị: với bộ số liệu phân bố không chuẩn

ố Đo lường độ phân tán của bộ số liệu:

- Khoảng dao động (Max ‒ Min)

- Độ lệch chuẩn

2 Khi cân nặng tính theo mốc < hoặc ≥ 2500

gram (biến định tính)!

ố Tỷ lệ trẻ có cân nặng < 2500 gr

Ưu điểm của phân tích số liệu dưới dạng

định lượng (ví dụ cân nặng khi đẻ của trẻ)%

Ưu điểm của phân tích số liệu dưới dạng

định lượng (tiếp) (Huyết áp tối đa)%

Trang 6

Các nội dung chính của thống kê mô tả%

II Trình bày số liệu bằng bảng: %

‒  Biểu đồ đa giác%

‒  Biểu đồ chấm (đám mây)%

‒  Bản đồ%

1/ Tổng hợp số liệu với các biến định tính

số học sinh nữ

số giường bệnh -dân số trong khu vực

Trang 7

•  Là 1 dạng đặc biệt của tỷ lệ khi nó được đo lư

ờng trong một khoảng thời gian nhất định

•  Ví dụ:

số biến cố xẩy ra trong 1 khoảng thời gian - x k dân số trung bình trong khoảng thời gian đó

n Hệ số k có thể là 1, 10, 100, 1000

n Ví dụ:%

số người bị sốt rét tại huyện A năm 2000 - x 100 dân số trung bình của huyện A trong năm đó

A.  Trung vị

B.  Khoảng phần trăm

C.  Giỏ trị trung bỡnh

D.  Độ lệch chuẩn

Trang 8

•  Được tính bằng tổng số các giá trị quan sát đư

ợc chia cho số lần quan sát

•  Giá trị trung bình chỉ tính được với các số dạng

X X

X X

n i

i

=

= + + +

‒  Với bộ số liệu: 40, 41, 42, 43, 44, 47, 49 và 72 thì trung

vị là giá trị trung bình cộng của giá trị thứ 4 và thứ 5 = (43+44)/2 = 43,5

v  Trung vị (giá trị trung tâm):

•  Là giá trị quan sát được nhiều lần nhất trong bộ số liệu

•  Trong bộ số liệu dưới đây:141, 141, 143, 144, 145, 146,

155 thì 141 được coi là mốt vì quan sát được nhiều lần

nhất

•  Mốt ít có giá trị trong đo lường độ tập trung của bộ số liệu

khi ở dạng định lượng, nhưng có giá trị với bộ số liệu phân

Đo lường (cm)

Trang 9

•  Giá trị trung bình được sử dụng thường xuyên

hơn và có giá trị khi bộ số liệu là 1 phân bố chuẩn.%

•  Khi bộ số liệu phân bố không chuẩn, trung vị có

ý nghĩa hơn:%

•  Ví dụ: !

‒  Với bộ số liệu này: 40, 41, 42, 43, 44, 47, 72 thì giá

trị trung bình = 47, trong khi giá trị trung vị bằng 43

‒  Nếu ta thay giá trị 72 trong bộ số liệu trên = 51, giá

trị trung vị không đổi, nhưng giá trị trung bình chỉ còn

là 44!

2/ Tổng hợp số liệu với các

biến định lượng (tiếp)

2.2 Đo lường độ phân tán:

v  Khoảng số liệu (range): %

‒  Là hiệu giữa hai giá trị đo lường cao nhất và thấp nhất trong một bộ số liệu

‒  Khoảng số liệu (R) = Xmax ‒ Xmin

•  Ví dụ: nếu cân nặng của 7 phụ nữ là 40, 41, 42, 43, 44,

47 và 72 kg, khoảng quan sát sẽ là 72 - 40 = 32 kg.%

1

) (

1

2 2

n i

v  Phương sai (variance)%

‒ Là tổng bình phương các khoảng cách giữa giá trị quan sát so với giá trị trung bình chia cho số các quan sát trừ đi 1

v  Độ lệch chuẩn (standard deviation)%

2

s

s =

Trang 10

v  Ví dụ minh hoạ:

1

2 -1

0 -2 Khoảng chênh lệch so với giá

5 , 2 4

10 1

) (

1

2 2

n i

X

2 ) (Xi − X

58 , 1 5 ,

2 =

=

⇒ s

v  Hệ số biến thiên (coeficient of variation)%

•  Là tỷ số giữa độ lệch chuẩn và trị tuyệt đối của giá trị trung

bình

•  Hệ số biến thiên được biểu thị bằng tỷ lệ phần trăm (%) và

biểu thị mức độ biến thiên của độ lệch chuẩn so với giá trị

12

60 Cân nặng nam thanh niên

• Độ tập trung, độ phân tán của bộ số liệu định lượng

‒  Trình bày kết quả nghiên cứu:

Trang 11

2 Thống kê suy luận %

2.1 Ước lượng điểm, khoảng%

Phân biệt ước lượng và kiểm định%

•   ước lượng:

‒  ngoại suy từ tham số mẫu ra tham số quần thể:

‒  từ trung bình của mẫu ( ) sang TB quần thể (à)

‒  từ tỷ lệ của mẫu (p) sang tỷ lệ của quần thể (P)

‒  từ OR, RR, r của mẫu ra quần thể

•  Kiểm định giả thuyết:

‒  so sánh 2 hoặc nhiều quần thể NC từ sự khác biệt của 2 hoặc nhiều mẫu rút ra từ các quần thể đó

‒  kiểm định mối tương quan của quần thể dựa theo mối tương quan thu được từ mẫu

X

Ví dụ: Cân nặng khi đẻ của trẻ mới sinh

tại huyện A: tham số mẫu và quần thể%

Trang 12

Ví dụ: Cân nặng khi đẻ của trẻ mới sinh

tại huyện A và huyện B%

n  Nhược điểm của ước lượng điểm:

n  Ví dụ điểm thi của 9 sinh viên

=++++++++

Nếu chọn ngẫu nhiên1 mẫu có 2 SV, ta

Điểm trung bình của 2 sinh viên

Trang 13

Tham số quần thể = tham số mẫu ± Zα/2.SE

SE (Sai số chuẩn) = độ lệch chuẩn của các trung bình mẫu

Ước lượng khoảng còn dùng với nhiều tham số mẫu khác như OR, RR, r

n

s Z

n

p p Z p

Trang 14

Ví dụ 2: So sánh cân nặng khi đẻ của trẻ

mới sinh tại huyện A so với huyện B:%

Trang 15

Víi tÊt c¶

c¸c lo¹i nghiªn cøu%

McNemar’s test (χ2 )%

χ2 hoÆc Fisher test %

Khi so s¸nh%

2 nhãm%

GhÐp cÆp%

Kh«ng % ghÐp cÆp%

Trang 16

2.2 Kiểm định giả thuyết%

Kiểm định mối tương quan giữa 2

biến nhị phân%

Kiểm định mối quan hệ nhân quả

Phân tích Sự"

Tương quan"

Đo lường độ lớn của mối tư

ơng quan %

Biến nhị phân%

Biến định lượng%

Test ý nghĩa

TK của mối tư

ơng quan%

Biến nhị phân%

Với tất cả các loại nghiên cứu%

χ2 hoặc χ 2 của McNemar s%

Phân tích tư

ơng quan và hồi quy%

định lư

ợng

Nhiều biến

định tính và/hoặc

định lượng

Có 2 nhóm

Trên 2 nhóm

1 biến định lư

ợng

Test t Test ANOVA

Factorial design (thừa số)

Hệ số tư

ơng quan r hoặc hồi quy tuyến tính

ANCOVA Phân tích

hồi quy đa biến

1 biến nhị phân

OR, RR,

χ2 hoặc Fisher test

χ2 hoặc Fisher test

Phân tích tầng

Test t Factorial

design (thừa số)

Hồi quy logistics

1 biến định tính

χ2 hoặc Fisher test

χ2 hoặc Fisher test

Phân tích tầng

ANOVA Factorial

design (thừa số)

Trang 17

Một số test thường dùng%

ỉ  Test t student:

ỉ  Test Khi bình phương

ỉ  Test ANOVA

ỉ  Hồi quy và hệ số tương quan

ỉ  Test Khi bình phương của Mc Nemar

ỉ  Test t ghép cặp

ỉ  Một số test phi tham số khác như test

Mann-Whitney U test, Wilcoxon

signed-rank test

) ( 2χ

Chức năng hô hấp của 5 bệnh nhân hen trư

ớc và sau khi dùng thuốc!

( )

( )

.14,3051,0

16,0

051,05

114,0

114,0

)}

1/(

])(

SE

d t

n

s SE s

n d d s

Tra bảng t với độ tự do %

n - 1 = 4, ta có p < 0,04 %

ĐK: Phân bố của d phải chuẩn

Test của Mc Nemar%

Trước điều trị

Tổng Thấp BT

Chức năng hô hấp của bệnh nhân hen trư

ớc và sau khi dùng thuốc!

c b

c b

•  Ví dụ: So sánh tác dụng điều trị đau đầu của Aspirin và

placebo thông qua việc tự cho điểm của bệnh nhân

Aspirin n=8 7,5 8,3 9,1 6,2 5,4 8,3 6,5 8,4 Placebo n=10 3,1 5,6 4,5 6,2 5,1 5,3 5,5 4,1 4,3 4,2

•  Xếp thứ tự các giá trị điểm trên không phân biệt nhóm

Quan sát 3,1 4,1 4,2 4,3 4,5 5,1 5,3 5,4 5,5

Quan sát 5,6 6,2 6,2 6,5 7,5 8,3 8,3 8,4 9,1

Thứ tự 10 11,5 11,5 13 14 15,5 15,5 17 18

Trang 18

Mann-Whitney U test (tiÕp)%

•  TÝnh tæng xÕp h¹ng cña nhãm ®iÒu trÞ (aspirin):

•  T = 8+11,5+13+14+15+16+17+18 = 112,5

•  TÝnh Z theo c«ng thøc:

•  Tra b¶ng Z ta ®­îc p <0,003

] 12 / ) 1 (

[

2 / ) 1 (

2 1 2 1

2 1 1

+ +

+ +

=

n n n n

n n n T Z

24 , 3 ] 12 / ) 1 10 8 ( 10 8 [

2 / ) 1 10 8 ( 8 5 , 112

= +

+

+ +

=

x Z

Wilcoxon signed-rank test%

1 ( [

4 / ) 1 ( + +

+

=

n n

n

n n T Z

4 , 1 ] 24 / ) 1 20 )(

1 10 ( 10 [

4 / ) 1 10 ( 10 41

= +

Trang 19

•  Hàm lượng chất độc trong máu và chất độc trong nước

tiểu trên 1 nhóm đối tượng nghiên cứu!

•  Hàm lượng mỡ trong thức ăn và hàm lượng mỡ trong

máu của người ăn thường ăn thức ăn đó,!

•  Số lượng hồng cầu trong máu và độ cao nơi người đó

sống so với mặt biển !

•  Chiều cao thanh niên giữa vùng thành thị và nông thôn!

•  Chiều cao của bố liên quan đến chiều cao của con !

2 Biểu thị mối tương quan giữa 2 biến

thích hợp bằng biểu đồ chấm:%

•  Vẽ đồ thị

•  Quan sát đồ thị, mô tả mối tương quan:

ỉ  Có tương quan hay không?!

ỉ  Tương quan là tuyến tính hay không?!

ỉ  Tương quan tuyến tính có rõ ràng hay không? !

ỉ  Tương quan là thuận hay nghịch!

ỉ  Có thể viết phương trình hồi quy tuyến tính cho mối

tương quan hay không?!

ỉ  Làm thế nào để cải thiện và xác định đúng mối tư

ơng quan giữa hai biến số này?!

Trang 20

5 6

7

8

9 10

11 12 13

14

15 16 17

25 26

27 28

29

30 31

32 33

34

35

36 37 38 39

40

41 42 43

44 45

46

47

48 49

50 51 52

53

54 55 56

64 65

66 67

68

69 70

•  X giá trị của biến độc lập !

•  Y giá trị của biến phụ thuộc ứng với giá trị X !

•  b hệ số hồi quy biểu thị độ dốc của đường hồi quy:%

n

y x y x x

x

y y x x b

i i

i i i i

2 2

))(

()

(

))(

(

x b y

Trang 21

3.2 Xem xét mối liên quan giữa Y và X

2

) (

) 2 (

) (

) ( )

(

X X n

X X b Y Y

b b

•  Hệ số hồi quy của quần thể được ký hiệu là β %

•  Số chặn của quần thể được ký hiệu là α %

•  Công thức ước lượng khoảng cho hệ số hồi quy

β của quần thể: % %

•  * Chú ý: Hệ số hồi quy β và số chặn α này khác

với α và β trong xác định độ tin cậy%

2

2 2

2

2 /

) (

) 2 (

) (

) (

X X n

X X b

Y Y t

Viết phương trình hồi quy theo

STATA: Lệnh: reg sbp age %

Source | SS df MS Number of obs = 69

•  Huyết áp tối đa = 103,35 + 0,98 tuổi%

•  Biến tuổi đóng góp 64% sự biến đổi của huyết áp tối đa %

* Điều kiện để có thể viết được phương trình hồi quy giữa 2 biến định lượng

•  Biểu đồ chấm thể hiện mối tương quan tuyến tính rõ%

•  Có 1 mối quan hệ nhân quả giữa 2 biến%

•  Biến x được lựa chọn bởi người nghiên cứu (không ngẫu nhiên) trong khi biến y là ngẫu nhiên.%

•  Phân bố các giá trị của cả biến x và y phải chuẩn, %

•  Một giá trị của x thường cho 1 tập hợp các giá trị của y

và chúng phải có các điều kiện sau:%

ỉ Các tập hợp này phải được phân bố chuẩn!

ỉ Chúng có cùng giá trị phương sai!

ỉ Giá trị trung bình của các tập hợp này phải nằm trên 1

đường thẳng (chính là đường hồi quy)!

•  Các giá trị y là độc lập với nhau, tức là không phụ thuộc vào các giá trị khác nhau của x.%

Trang 22

4 Hệ số tương quan (r)

•  Chỉ áp dụng với 2 biến định lượng có quan hệ

nhân quả, tuy nhiên không cần biết biến nào là

phụ thuộc hoặc độc lập!

) )(

(

Y Y X X

Y Y X X r

2

) )(

(

i i

i i

i i i i

y y

n x x n

y x y x n r

4.2 Một số đặc tính của hệ số tư

ơng quan (r):

•  Chỉ biểu thị mối tương quan tuyến tính!

•  r dao động trong khoảng từ -1 đến +1 !

•  r càng gần 1 hoặc - 1 thì mối tương quan giữa 2

biến càng lớn; !

•  r càng gần 0 (zero) thì tương quan càng nhỏ !

•  Khi r = 0, hai biến không có sự tương quan

tuyến tính (nhưng có thể có tương quan dạng khác).!

•  r là hệ số tương quan xác định từ mẫu, trong khi

4.3 Kiểm định giả thuyết cho giá trị r:

•  Giả thuyết ,Ho: ,ρ = 0%

, , , ,Ha: ,ρ ≠ 0%

•  Test thống kê:, %

•  Tra bảng t-student với độ tự do = n - 2 và α tư

ơng ứng %

•  Kết luận: Nếu t tính từ công thức > t tra từ bảng

à tức là p < α; Ho bị loại bỏ và mối tương quan

giữa 2 biến có ý nghĩa thống kê và ngược lại ,%

2

2 )

2 (

) 1 ( )

n r n

r

r r

SE

r t

Trang 23

_cons | 3.000091 1.124747 2.667 0.026 .4557369 - 5.544445

- LÖnh: reg y2 x2

Source | SS df MS Number of obs = 11 Model | 27.5000024 1 27.5000024 Prob > F = 0.0022 -+ - Adj R-squared = 0.6292 - y2 | Coef Std Err t P>|t| [95% Conf Interval]

x2 | 5 .1179638 4.239 0.002 .2331475 - 7668526 _cons | 3.000909 1.125303 2.667 0.026 .4552978 - 5.54652

-

LÖnh reg Y1 X1

Trang 25

Sai số ngẫu nhiên và sai số hệ thống%

Khái niệm về nhiễu và tác động tương hỗ%

Loại nghiên cứu!

Giá trị chung và theo tầng!

1,86 3,00 0,45

4,00 1,00 1,83

Nhiễu và có tác

động tương hỗ giữa các tầng

4,00 1,00 1,83

4,00 1,00 1,83

Không nhiễu và không có tác

1,01 3,00 0,83

4,00 1,00 1,83

9,40 0,33 6,00

4,00 1,00 1,83

Ngày đăng: 09/05/2015, 02:36

HÌNH ẢNH LIÊN QUAN

Bảng lựa chọn test thống kê% - Đại cương về mục tiêu, biến số và phân tích số liệu
Bảng l ựa chọn test thống kê% (Trang 16)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w