ỹ Đề xuất và thăm dũ một số giải phỏp can thiệp làm giảm Biến số 1 Biến số 2 Biến số 3 Biến số 4 Tờn đề tài Định nghĩa Biến số% • Đặc tính của người, vật sự việc, hiện tư ợng biến thiê
Trang 1MT cụ thể:
ỹ Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A
ỹ Xỏc định một số yếu tố liờn quan đến tỡnh trạng cao HA
ỹ Đỏnh giỏ hiệu quả của một số giải phỏp can thiệp làm giảm
tỷ lệ tăng huyết ỏp
Tờn đề tài: Huyết ỏp của người dõn tại
huyện A năm 2005 và một số yếu tố ảnh hưởng
MT chung: Xỏc định tỷ lệ cao HA của người
cao tuổi tại huyện A năm 2005
Cao HA của người cao tuổi tại huyện A năm 2005 và một số yếu
tố ảnh hưởng
• Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A năm 2005
và một số yếu tố ảnh hưởng ỹ Xỏc định tỷ lệ cao HA của người cao tuổi tại huyện A
ỹ Xỏc định một số yếu tố liờn quan đến tỡnh trạng cao HA
ỹ Đề xuất (và thăm dũ) một số giải phỏp can thiệp làm giảm
Biến số 1 Biến số 2 Biến số 3 Biến số 4
Tờn đề tài
Định nghĩa Biến số%
• Đặc tính của người, vật sự việc, hiện tư
ợng biến thiên theo các điều kiện khác nhau
• Do người nghiên cứu lựa chọn phù hợp với từng mục tiêu nghiên cứu
• Triển khai nghiên cứu chính là thu thập
số liệu cho các biến số này
• Đối lập với biến số là các hằng số
Trang 2Phân loại theo bản chất của biến số
Biến định lượng
Biến định tính
Biến liên tục Biến rời rạc Biến tỷ suất Biến khoảng chia Biến danh mục Biến thứ hạng Biến nhị phân
Bài tập 1: Phân loại các biến số
Định tính
Định lượng
Danh mục
Thứ hạng
Nhị phân
Khoảng chia
Tỷ suất
Liên tục
Rời rạc Tuổi
Hàm lượng đường huyết
Độ cận, viễn của mắt (đi ốp)
Số lượng hồng cầu Nhiệt độ không khí Giới
Dân tộc Trình độ văn hoá
Danh mục
Thứ hạng
Nhị phân
Khoảng chia
Tỷ suất
Liên tục
Rời rạc
Biến phụ thuộc (bệnh)
Yếu tố nhiễu
l Nhiễu là yếu tố làm sai lệch ảnh hưởng của phơi nhiễm với bệnh (thay đổi độ lớn và ý nghĩa thống kê)
l Biến độc lập, phụ thuộc và nhiễu được xác định bởi ngư
ời nghiên cứu và chỉ có ý nghĩa trong nghiên cứu đó
Trang 3Tiêu chuẩn của 1 yếu tố nhiễu%
v Phải là 1 yếu tố nguy cơ đối với bệnh
v Phải có liên quan đối với phơi nhiễm như
ng không lệ thuộc vào phơi nhiễm
v Không phải là yếu tố trung gian giữa phơi
nhiễm và bệnh
v Phải thực sự tác động lên mối tương quan
giữa phơi nhiễm và bệnh (khẳng định khi
phân tích số liệu)
v Có thể đổi chỗ cho yếu tố phơi nhiễm tuỳ
theo mục đích người làm nghiên cứu
Trường hợp nào sau đây là nhiễu?%
Nếu muốn xác định các biến số cần và đủ cho
một nghiên cứu thì cần dựa vào cách nào dưới
đây (chọn cách mà Anh/Chị cho là hợp lý nhất)?
A. Kinh nghiệm của các nghiên cứu tưõng tự đã
được tác giả khác triển khai,
B. Cây vấn đề được phát triển từ đề tài nghiên
‒ là mô tả kết quả thu được từ mẫu nghiên cứu
‒ biểu thị độ lớn, sự phân bố của các tham số của mẫu nghiên cứu như , độ lệch chuẩn, các tỷ lệ, bảng, biểu, đồ thị sự phân bố theo các biến số khác nhau như tuổi, giới, địa dư
• Thống kê suy luận:
‒ là quá trình ngoại suy kết quả nghiên cứu từ mẫu
ra quần thể nghiên cứu
‒ bao gồm 2 phương pháp: ước lượng và kiểm định
Trang 4Quần thể đích%
Quần thể nghiên cứu%
- Mẫu kinh nghiệm %
- Mẫu thuận tiện !
- Mẫu chỉ tiêu!
- Mẫu có mục đích.%
Chọn mẫu%
Ước lượng%
• điểm%
• khoảng%
Kiểm định giả thuyết%
Suy luận thông kê
Giá trị p Lựa chọn!
Nếu một người nghiờn cứu muốn thu thập số liệu
về huyết ỏp tối đa của cỏc đối tượng NC, cỏch thu
thập nào dưới đõy Anh/Chị cho là hợp lý nhất?
A. Phõn huyết ỏp thành cỏc nhúm (vớ dụ < 90
mmHg; 90-120; 121-140 ) sau đú chọn nhúm
thớch hợp
B. Ghi đầy đủ trị số huyết ỏp tối đa của từng đối
tượng
C. Phõn đối tượng thành hai loại cú và khụng cao
huyết ỏp tối đa
D. Phõn thành cỏc nhúm: huyết ỏp thấp, bỡnh
thường, cao và rất cao
Bài tập
Nếu một người nghiờn cứu muốn thu thập số
liệu về số điếu thuốc lỏ một người hỳt trung
bỡnh/ngày, cỏch thu thập nào dưới đõy Anh/Chị cho là hợp lý nhất?
A. Phõn thành cỏc nhúm (vớ dụ < 5 điếu; 5-10;
Trang 5Ví dụ 1: Mô tả đặc điểm của cân nặng khi
đẻ của 500 trẻ mới sinh tại bệnh viện M:%
1 Khi cân nặng tính bằng gram (biến định lượng)!
ố Đo lường độ tập trung của số liệu:
- Giá trị trung bình: với số liệu phân bố chuẩn
- Giá trị trung vị: với bộ số liệu phân bố không chuẩn
ố Đo lường độ phân tán của bộ số liệu:
- Khoảng dao động (Max ‒ Min)
- Độ lệch chuẩn
2 Khi cân nặng tính theo mốc < hoặc ≥ 2500
gram (biến định tính)!
ố Tỷ lệ trẻ có cân nặng < 2500 gr
Ưu điểm của phân tích số liệu dưới dạng
định lượng (ví dụ cân nặng khi đẻ của trẻ)%
Ưu điểm của phân tích số liệu dưới dạng
định lượng (tiếp) (Huyết áp tối đa)%
Trang 6Các nội dung chính của thống kê mô tả%
II Trình bày số liệu bằng bảng: %
‒ Biểu đồ đa giác%
‒ Biểu đồ chấm (đám mây)%
‒ Bản đồ%
1/ Tổng hợp số liệu với các biến định tính
số học sinh nữ
số giường bệnh -dân số trong khu vực
Trang 7• Là 1 dạng đặc biệt của tỷ lệ khi nó được đo lư
ờng trong một khoảng thời gian nhất định
• Ví dụ:
số biến cố xẩy ra trong 1 khoảng thời gian - x k dân số trung bình trong khoảng thời gian đó
n Hệ số k có thể là 1, 10, 100, 1000
n Ví dụ:%
số người bị sốt rét tại huyện A năm 2000 - x 100 dân số trung bình của huyện A trong năm đó
A. Trung vị
B. Khoảng phần trăm
C. Giỏ trị trung bỡnh
D. Độ lệch chuẩn
Trang 8• Được tính bằng tổng số các giá trị quan sát đư
ợc chia cho số lần quan sát
• Giá trị trung bình chỉ tính được với các số dạng
X X
X X
n i
i
=
= + + +
‒ Với bộ số liệu: 40, 41, 42, 43, 44, 47, 49 và 72 thì trung
vị là giá trị trung bình cộng của giá trị thứ 4 và thứ 5 = (43+44)/2 = 43,5
v Trung vị (giá trị trung tâm):
• Là giá trị quan sát được nhiều lần nhất trong bộ số liệu
• Trong bộ số liệu dưới đây:141, 141, 143, 144, 145, 146,
155 thì 141 được coi là mốt vì quan sát được nhiều lần
nhất
• Mốt ít có giá trị trong đo lường độ tập trung của bộ số liệu
khi ở dạng định lượng, nhưng có giá trị với bộ số liệu phân
Đo lường (cm)
Trang 9• Giá trị trung bình được sử dụng thường xuyên
hơn và có giá trị khi bộ số liệu là 1 phân bố chuẩn.%
• Khi bộ số liệu phân bố không chuẩn, trung vị có
ý nghĩa hơn:%
• Ví dụ: !
‒ Với bộ số liệu này: 40, 41, 42, 43, 44, 47, 72 thì giá
trị trung bình = 47, trong khi giá trị trung vị bằng 43
‒ Nếu ta thay giá trị 72 trong bộ số liệu trên = 51, giá
trị trung vị không đổi, nhưng giá trị trung bình chỉ còn
là 44!
2/ Tổng hợp số liệu với các
biến định lượng (tiếp)
2.2 Đo lường độ phân tán:
v Khoảng số liệu (range): %
‒ Là hiệu giữa hai giá trị đo lường cao nhất và thấp nhất trong một bộ số liệu
‒ Khoảng số liệu (R) = Xmax ‒ Xmin
• Ví dụ: nếu cân nặng của 7 phụ nữ là 40, 41, 42, 43, 44,
47 và 72 kg, khoảng quan sát sẽ là 72 - 40 = 32 kg.%
1
) (
1
2 2
n i
v Phương sai (variance)%
‒ Là tổng bình phương các khoảng cách giữa giá trị quan sát so với giá trị trung bình chia cho số các quan sát trừ đi 1
v Độ lệch chuẩn (standard deviation)%
2
s
s =
Trang 10v Ví dụ minh hoạ:
1
2 -1
0 -2 Khoảng chênh lệch so với giá
5 , 2 4
10 1
) (
1
2 2
n i
X
2 ) (Xi − X
58 , 1 5 ,
2 =
=
⇒ s
v Hệ số biến thiên (coeficient of variation)%
• Là tỷ số giữa độ lệch chuẩn và trị tuyệt đối của giá trị trung
bình
• Hệ số biến thiên được biểu thị bằng tỷ lệ phần trăm (%) và
biểu thị mức độ biến thiên của độ lệch chuẩn so với giá trị
12
60 Cân nặng nam thanh niên
• Độ tập trung, độ phân tán của bộ số liệu định lượng
‒ Trình bày kết quả nghiên cứu:
Trang 112 Thống kê suy luận %
2.1 Ước lượng điểm, khoảng%
Phân biệt ước lượng và kiểm định%
• ước lượng:
‒ ngoại suy từ tham số mẫu ra tham số quần thể:
‒ từ trung bình của mẫu ( ) sang TB quần thể (à)
‒ từ tỷ lệ của mẫu (p) sang tỷ lệ của quần thể (P)
‒ từ OR, RR, r của mẫu ra quần thể
• Kiểm định giả thuyết:
‒ so sánh 2 hoặc nhiều quần thể NC từ sự khác biệt của 2 hoặc nhiều mẫu rút ra từ các quần thể đó
‒ kiểm định mối tương quan của quần thể dựa theo mối tương quan thu được từ mẫu
X
Ví dụ: Cân nặng khi đẻ của trẻ mới sinh
tại huyện A: tham số mẫu và quần thể%
Trang 12Ví dụ: Cân nặng khi đẻ của trẻ mới sinh
tại huyện A và huyện B%
n Nhược điểm của ước lượng điểm:
n Ví dụ điểm thi của 9 sinh viên
=++++++++
=à
Nếu chọn ngẫu nhiên1 mẫu có 2 SV, ta
Điểm trung bình của 2 sinh viên
Trang 13Tham số quần thể = tham số mẫu ± Zα/2.SE
SE (Sai số chuẩn) = độ lệch chuẩn của các trung bình mẫu
Ước lượng khoảng còn dùng với nhiều tham số mẫu khác như OR, RR, r
n
s Z
n
p p Z p
Trang 14Ví dụ 2: So sánh cân nặng khi đẻ của trẻ
mới sinh tại huyện A so với huyện B:%
Trang 15Víi tÊt c¶
c¸c lo¹i nghiªn cøu%
McNemar’s test (χ2 )%
χ2 hoÆc Fisher test %
Khi so s¸nh%
2 nhãm%
GhÐp cÆp%
Kh«ng % ghÐp cÆp%
Trang 162.2 Kiểm định giả thuyết%
Kiểm định mối tương quan giữa 2
biến nhị phân%
Kiểm định mối quan hệ nhân quả
Phân tích Sự"
Tương quan"
Đo lường độ lớn của mối tư
ơng quan %
Biến nhị phân%
Biến định lượng%
Test ý nghĩa
TK của mối tư
ơng quan%
Biến nhị phân%
Với tất cả các loại nghiên cứu%
χ2 hoặc χ 2 của McNemar s%
Phân tích tư
ơng quan và hồi quy%
định lư
ợng
Nhiều biến
định tính và/hoặc
định lượng
Có 2 nhóm
Trên 2 nhóm
1 biến định lư
ợng
Test t Test ANOVA
Factorial design (thừa số)
Hệ số tư
ơng quan r hoặc hồi quy tuyến tính
ANCOVA Phân tích
hồi quy đa biến
1 biến nhị phân
OR, RR,
χ2 hoặc Fisher test
χ2 hoặc Fisher test
Phân tích tầng
Test t Factorial
design (thừa số)
Hồi quy logistics
1 biến định tính
χ2 hoặc Fisher test
χ2 hoặc Fisher test
Phân tích tầng
ANOVA Factorial
design (thừa số)
Trang 17Một số test thường dùng%
ỉ Test t student:
ỉ Test Khi bình phương
ỉ Test ANOVA
ỉ Hồi quy và hệ số tương quan
ỉ Test Khi bình phương của Mc Nemar
ỉ Test t ghép cặp
ỉ Một số test phi tham số khác như test
Mann-Whitney U test, Wilcoxon
signed-rank test
) ( 2χ
Chức năng hô hấp của 5 bệnh nhân hen trư
ớc và sau khi dùng thuốc!
( )
( )
.14,3051,0
16,0
051,05
114,0
114,0
)}
1/(
])(
SE
d t
n
s SE s
n d d s
Tra bảng t với độ tự do %
n - 1 = 4, ta có p < 0,04 %
ĐK: Phân bố của d phải chuẩn
Test của Mc Nemar%
Trước điều trị
Tổng Thấp BT
Chức năng hô hấp của bệnh nhân hen trư
ớc và sau khi dùng thuốc!
c b
c b
• Ví dụ: So sánh tác dụng điều trị đau đầu của Aspirin và
placebo thông qua việc tự cho điểm của bệnh nhân
Aspirin n=8 7,5 8,3 9,1 6,2 5,4 8,3 6,5 8,4 Placebo n=10 3,1 5,6 4,5 6,2 5,1 5,3 5,5 4,1 4,3 4,2
• Xếp thứ tự các giá trị điểm trên không phân biệt nhóm
Quan sát 3,1 4,1 4,2 4,3 4,5 5,1 5,3 5,4 5,5
Quan sát 5,6 6,2 6,2 6,5 7,5 8,3 8,3 8,4 9,1
Thứ tự 10 11,5 11,5 13 14 15,5 15,5 17 18
Trang 18Mann-Whitney U test (tiÕp)%
• TÝnh tæng xÕp h¹ng cña nhãm ®iÒu trÞ (aspirin):
• T = 8+11,5+13+14+15+16+17+18 = 112,5
• TÝnh Z theo c«ng thøc:
• Tra b¶ng Z ta ®îc p <0,003
] 12 / ) 1 (
[
2 / ) 1 (
2 1 2 1
2 1 1
+ +
+ +
−
=
n n n n
n n n T Z
24 , 3 ] 12 / ) 1 10 8 ( 10 8 [
2 / ) 1 10 8 ( 8 5 , 112
= +
+
+ +
−
=
x Z
Wilcoxon signed-rank test%
1 ( [
4 / ) 1 ( + +
+
−
=
n n
n
n n T Z
4 , 1 ] 24 / ) 1 20 )(
1 10 ( 10 [
4 / ) 1 10 ( 10 41
= +
Trang 19• Hàm lượng chất độc trong máu và chất độc trong nước
tiểu trên 1 nhóm đối tượng nghiên cứu!
• Hàm lượng mỡ trong thức ăn và hàm lượng mỡ trong
máu của người ăn thường ăn thức ăn đó,!
• Số lượng hồng cầu trong máu và độ cao nơi người đó
sống so với mặt biển !
• Chiều cao thanh niên giữa vùng thành thị và nông thôn!
• Chiều cao của bố liên quan đến chiều cao của con !
2 Biểu thị mối tương quan giữa 2 biến
thích hợp bằng biểu đồ chấm:%
• Vẽ đồ thị
• Quan sát đồ thị, mô tả mối tương quan:
ỉ Có tương quan hay không?!
ỉ Tương quan là tuyến tính hay không?!
ỉ Tương quan tuyến tính có rõ ràng hay không? !
ỉ Tương quan là thuận hay nghịch!
ỉ Có thể viết phương trình hồi quy tuyến tính cho mối
tương quan hay không?!
ỉ Làm thế nào để cải thiện và xác định đúng mối tư
ơng quan giữa hai biến số này?!
Trang 205 6
7
8
9 10
11 12 13
14
15 16 17
25 26
27 28
29
30 31
32 33
34
35
36 37 38 39
40
41 42 43
44 45
46
47
48 49
50 51 52
53
54 55 56
64 65
66 67
68
69 70
• X giá trị của biến độc lập !
• Y giá trị của biến phụ thuộc ứng với giá trị X !
• b hệ số hồi quy biểu thị độ dốc của đường hồi quy:%
n
y x y x x
x
y y x x b
i i
i i i i
2 2
))(
()
(
))(
(
x b y
Trang 213.2 Xem xét mối liên quan giữa Y và X
2
) (
) 2 (
) (
) ( )
(
X X n
X X b Y Y
b b
• Hệ số hồi quy của quần thể được ký hiệu là β %
• Số chặn của quần thể được ký hiệu là α %
• Công thức ước lượng khoảng cho hệ số hồi quy
β của quần thể: % %
• * Chú ý: Hệ số hồi quy β và số chặn α này khác
với α và β trong xác định độ tin cậy%
2
2 2
2
2 /
) (
) 2 (
) (
) (
X X n
X X b
Y Y t
Viết phương trình hồi quy theo
STATA: Lệnh: reg sbp age %
Source | SS df MS Number of obs = 69
• Huyết áp tối đa = 103,35 + 0,98 tuổi%
• Biến tuổi đóng góp 64% sự biến đổi của huyết áp tối đa %
* Điều kiện để có thể viết được phương trình hồi quy giữa 2 biến định lượng
• Biểu đồ chấm thể hiện mối tương quan tuyến tính rõ%
• Có 1 mối quan hệ nhân quả giữa 2 biến%
• Biến x được lựa chọn bởi người nghiên cứu (không ngẫu nhiên) trong khi biến y là ngẫu nhiên.%
• Phân bố các giá trị của cả biến x và y phải chuẩn, %
• Một giá trị của x thường cho 1 tập hợp các giá trị của y
và chúng phải có các điều kiện sau:%
ỉ Các tập hợp này phải được phân bố chuẩn!
ỉ Chúng có cùng giá trị phương sai!
ỉ Giá trị trung bình của các tập hợp này phải nằm trên 1
đường thẳng (chính là đường hồi quy)!
• Các giá trị y là độc lập với nhau, tức là không phụ thuộc vào các giá trị khác nhau của x.%
Trang 224 Hệ số tương quan (r)
• Chỉ áp dụng với 2 biến định lượng có quan hệ
nhân quả, tuy nhiên không cần biết biến nào là
phụ thuộc hoặc độc lập!
) )(
(
Y Y X X
Y Y X X r
2
) )(
(
i i
i i
i i i i
y y
n x x n
y x y x n r
4.2 Một số đặc tính của hệ số tư
ơng quan (r):
• Chỉ biểu thị mối tương quan tuyến tính!
• r dao động trong khoảng từ -1 đến +1 !
• r càng gần 1 hoặc - 1 thì mối tương quan giữa 2
biến càng lớn; !
• r càng gần 0 (zero) thì tương quan càng nhỏ !
• Khi r = 0, hai biến không có sự tương quan
tuyến tính (nhưng có thể có tương quan dạng khác).!
• r là hệ số tương quan xác định từ mẫu, trong khi
4.3 Kiểm định giả thuyết cho giá trị r:
• Giả thuyết ,Ho: ,ρ = 0%
, , , ,Ha: ,ρ ≠ 0%
• Test thống kê:, %
• Tra bảng t-student với độ tự do = n - 2 và α tư
ơng ứng %
• Kết luận: Nếu t tính từ công thức > t tra từ bảng
à tức là p < α; Ho bị loại bỏ và mối tương quan
giữa 2 biến có ý nghĩa thống kê và ngược lại ,%
2
2 )
2 (
) 1 ( )
n r n
r
r r
SE
r t
Trang 23_cons | 3.000091 1.124747 2.667 0.026 .4557369 - 5.544445
- LÖnh: reg y2 x2
Source | SS df MS Number of obs = 11 Model | 27.5000024 1 27.5000024 Prob > F = 0.0022 -+ - Adj R-squared = 0.6292 - y2 | Coef Std Err t P>|t| [95% Conf Interval]
x2 | 5 .1179638 4.239 0.002 .2331475 - 7668526 _cons | 3.000909 1.125303 2.667 0.026 .4552978 - 5.54652
-
LÖnh reg Y1 X1
Trang 25Sai số ngẫu nhiên và sai số hệ thống%
Khái niệm về nhiễu và tác động tương hỗ%
Loại nghiên cứu!
Giá trị chung và theo tầng!
1,86 3,00 0,45
4,00 1,00 1,83
Nhiễu và có tác
động tương hỗ giữa các tầng
4,00 1,00 1,83
4,00 1,00 1,83
Không nhiễu và không có tác
1,01 3,00 0,83
4,00 1,00 1,83
9,40 0,33 6,00
4,00 1,00 1,83