Bước 1: Hình thành giả thuyết Bước 2: Đề xuất mức ý nghĩa thống kê Bước 3: chọn test thích hợp cho kiểm định Bước 4: tính kết quả Bước 5: Xác định vùng chấp nhận và vùng suy xét Bước 6: Quyết định Bước 7: Kết luận. Tần số Tần số cộng dồn Tần số tuyệt đối Tỷ suất Tỷ số Tỷ lệ phần trăm Tỷ lệ
Trang 1PHƯƠNG PHÁP PHÂN TÍCH
VÀ TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU
TRƯỜNG ĐẠI HỌC Y HẢI PHÒNG
BỘ MÔN Y TẾ CÔNG CỘNG
Trang 2Trước khi phân tích cần phải:
1 Làm tốt công tác chuẩn bị thu thập số liệu
2 Thu thập đủ, đúng, chính xác các số liệu
cần thu thập
3 Làm sạch và mã hóa số liệu trước khi nhập
số liệu vào máy tính
Trang 3Phõn loại biến số:
Biến định l ợng
Biến liên tục Biến rời rạc Biến tỷ suất Biến khoảng chia
Biến danh mục
Biến thứ hạng Biến định tính
B n ch t c a ản chất của ất của ủa giá tr đo l ị đo lường ường ng
B n ch t c a ản chất của ất của ủa giá tr 0 ị đo lường
Trang 4PHÂN TÍCH SỐ LIỆU VỚI CÁC BIẾN
ĐỊNH TÍNH VÀ ĐỊNH LƯỢNG
Trang 5Tần sốTần số cộng dồnTần số tuyệt đối
Trang 6PHÂN TÍCH SỐ LIỆU VỚI CÁC BIẾN ĐỊNH TÍNH
Trình bày theo tần số và tỷ lệ
Tần số (frequency):
biểu thị số lần xuất hiện của một quan sát nào đó.VD: số người có huyết áp tối đa từ 140-160mm Hg.Tần số cộng dồn (Cumulative frequency): thường sử dụng trong bảng, t/số cộng dồn của một ô nào đó
bằng t/số của ô đó cộng với t/số của các ô trước nó
Trang 7T/số tuyệt đối (absolute frequency) & t/số tương đối (relative frequency)
Ts tuyệt đối là tần số thực của một quan sát, không phụ thuộc vào cỡ mẫu lớn hay bé
Ts tương đối (tần suất) là biểu thị của tần số trong mối tương quan với cỡ mẫu, thường dưới dạng %.VD:
Trong đó:
a là tần số tuyệt đối
n là cỡ mẫu quan sát
Trang 8Tỷ suất (ratio):
phân số giữa 2 giá trị mà mẫu số không bao hàm tử số
tử và mẫu có thể khác đơn vị đo lường
Hệ số k có thể bằng 1, 10, 100, 1000
Tỷ số (proportion):
Phân số mà mẫu số bao hàm tử số
tử và mẫu phải cùng một đơn vị đo lường
Hệ số k có thể bằng 1, 10, 100, 1000
Trang 9Tỷ lệ phần trăm (percentage):
Dạng đặc biệt của tỷ số, hệ số k= 100
Tần số tương đối là một dạng của tỷ lệ %
Tỷ lệ (rate): dạng đặc biệt của tỷ số khi nó được cân nhắc trong một khoảng thời gian nhất định (tỷ lệ mới mắc, tỷ lệ hiện mắc, tỷ lệ sinh thô )
Trang 10TRÌNH BÀY SỐ LIỆU THEO BẢNG
Bảng một chiềuBảng hai chiều
Trang 11Tỷ lệ của một hiện tượng sức khỏe của một quần thể n/cứu có thể được ngoại suy từ một mẫu nghiên cứu nếu mẫu đó được lựa chọn một cách đại diện với cỡ mẫu đủ lớn
Có 2 cách ước lượng cho một tỷ lệ:
Ước lượng điểm: P=pƯớc lượng khoảng:
ƯỚC LƯỢNG MỘT TỶ LỆ TỪ MẪU SANG QUẦN THỂ
Trang 12Bài tập: Một điều tra được tiến hành tại một trường học nhằm đánh giá việc thực hành khám răng miệng của trẻ
em tuổi học đường 300 trẻ được lựa chọn vào nghiên cứu một cách ngẫu nhiên trong số 3000 trẻ của
trường.Trong đó, 123 em trả lời là thường xuyên khám răng miệng tối thiếu 2 lần/năm
Ước lượng tỷ lệ trẻ em đi khám răng trên 2 lần/năm trong trường học đó
Tính toán và giải thích ước lượng khoảng trong trường hợp này với độ tin cậy 95%
Trang 13Mục đích: xác định xem kết quả thu được từ mẫu có phù hợp với đặc trưng của quần thể nghiên cứu không (các cuộc điều tra trước đây/ các chỉ tiêu đặt ra cho quần thể đó/ do quy luật)
Các bước:
Bước 1: Hình thành giả thuyếtBước 2: Đề xuất mức ý nghĩa thống kêBước 3: chọn test thích hợp cho kiểm địnhBước 4: tính kết quả
Bước 5: Xác định vùng chấp nhận và vùng suy xétBước 6: Quyết định
KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT TỶ LỆ
Trang 14Ví dụ: Một cuộc điều tra sau tiêm phòng lao được tiến hành trên 200 trẻ Những trẻ này được chọn ngẫu nhiên
từ quần thể A Kết quả cho thấy 176 trẻ có sẹo lao
Hỏi: tỷ lệ tiêm phòng lao trong quần thể có đạt với chỉ tiêu đặt ra là 80% trẻ được tiêm phòng lao hay không?
Trang 15Bước 1: Hình thành giả thuyết:
H0: P=0,8 Tỷ lệ tiêm phòng lao cho trẻ trong quần thể là 80%
Ha: P0,8 Tỷ lệ tiêm phòng lao cho trẻ trong quần thể không phải là 80%
Bước 2: Đề xuất mức ý nghĩa thống kê: nếu =0,05 khoảng tin cậy là 95%
Bước 3: chọn test thích hợp cho kiểm định: trong
trường hợp này test thích hợp là Z test
Trang 16Diện tích vùng chấp nhận sẽ chiếm 95%.
Trang 17Vùng chấp nhận
/2 =0,025 /2 =0,025
Trang 18Bước 6: Quyết định: vì Z = 2,828, Z nằm ngoài vùng
chấp nhận (trong vùng suy xét) theo sơ đồ Vậy giả
Bước 7: Kết luận: chúng ta có thể kết luận rằng tỷ lệ
tiêm phòng lao từ mẫu thu được là khác với chỉ tiêu đề ra
Lưu ý: Nêu giả thuyết của người nghiên cứu là tỷ lệ
tiêm phòng lao thu được từ mẫu cao hơn so với chỉ tiêu thì giả thuyết Ha phải viết là P>0,8 Khi đó test lựa chọn
là test 1 đuôi Nếu =0,05 ta có Z = 1,645 và vùng suy xét nằm về phía bên phải như hình vẽ sau
Trang 19Vùng chấp nhận
Vùng suy xét 1,645
=0,05
Trang 20ƯỚC LƯỢNG CHO HAI TỶ LỆ
Hai mẫu được chọn ngẫu nhiên từ hai quần thể khác nhau
(Random selected)
(Random selected)
Trang 22Hai mẫu được phân bổ một cách ngẫu nhiên từ một quần thể
Quần thể 1
Mẫu 1
Phân bổ ngẫu nhiên
(Randomization hoặc randomly alocated)
Mẫu 2
Can thiệp 1
Can thiệp 2
Trang 23Câu hỏi đặt ra: sự khác biệt giữa hai mẫu nghiên cứu có thể ngoại suy ra sự khác biệt giữa hai quần thể hay
Trang 24Bước 1: Hình thành giả thuyết.
đuôi)
nhau và bằng P (tỷ lệ của quần thể)
=0,05; 0,01 hoặc 0,1
KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC NHAU
GiỮA HAI TỶ LỆ
Trang 25Theo gt P1-P2=0 nên ta có thể viết ct như sau
Bước 3: Chọn test thích hợp cho kiểm định, trong trường hợp này ta chọn test Z
Trang 26Do P1, P2 và Q1, Q2 (tham số của qt) đều không biết nên trong trường hợp này p chung được sẻ dụng và được
Thay p chung vào ct Z ta có:
Bước 4 :Tính kết quả: tính p chung sau đó thay vào tính Z
Trang 27Bước 5: Xác định vùng chấp nhận và vùng suy xét (tùy theo và test là 1 đuôi hay 2 đuôi.
Bước 6: Quyết định: từ kết quả của Z tính được từ công thức, so với gtrị Z tương ứng với đã chọn, ta có thể loại kết luận Ho bị loại hay chấp nhận
Bước 7: Kết luận
Trang 28Chỉ định dùng test: khi muốn so sánh sự khác nhau giữa hai tỷ lệ nào đó, ta nhìn vào tỷ lệ thực của nó (50%>45%)
Trong nghiên cứu phải thêm câu hỏi: sự khác biệt giữa
các tỷ lệ này có ý nghĩa thống kê hay không test 2
VD:
Có sự khác nhau về TL trẻ SS cân nặng <2500g có ý nghĩa
TK hay không giữa các nhóm ng.nghiệp của mẹ
TL khỏi bệnh của các BN dùng thuốc A là 68%, trong khi
TL này BN dùng thuốc là 56% Hỏi sự khác biệt giữa hai
TL này có ý nghĩa thống kê hay không.
Khoảng cách có thực sự là yếu tố ảnh hưởng đến tỷ lệ phụ
nữ khám thai hay không ( )
SO SÁNH 2 TỶ LỆ BẰNG TEST 2
Trang 29Các bước kiểm định với test Khi bình phương
Trang 30VD: Bảng 1: Cân nặng trẻ sơ sinh dưới 2500 gram trong sự lquan đến tình trạng hút thuốc lá của mẹ
Trang 31Tính toán 2: theo các bước sau:
Tính tần số mong đợi (E) cho mỗi ô của bảng theo công thức
Tính hiệu O-E trong mỗi ô của bảng (O là tsố qsát)
Trang 32-Đối với bảng 2 x 2, ta sẽ có 4 ô, khi đó gtrị 2 sẽ là
(O 1 -E 1 ) 2 (O 2 -E 2 ) 2 (O 3 -E 3 ) 2 (O 4 -E 4 ) 2
2 = + - + +
-E 1 E 2 E 2 E 2
Trang 33Tra bảng tìm giá trị 2:cho phép kết luận về giả thuyết
Xác định được giá trị tin cậy , thường là 0,05; 0,01 hoặc 0,1
Trang 34Điều kiện để áp dụng test Khi bình phương: chỉ áp dụng khi cỡ mẫu đủ lớn và:
Các số liệu trình bày theo bảng 2x2
Cỡ mẫu tối thiểu trình bày trong bảng phải là 40Giá trị mong đợi ở mỗi ô của bảng không nhỏ hơn 5
Với các số liệu trình bày trong bảng 2x2, chỉ cho phép dưới 20% số ô có gtrị mong đợi <5 nhưng không được bằng 0
Trang 35Công thức tính nhanh 2 với bảng 2x2
Trang 36Công thức tính 2 hiệu chỉnh của Yates
Trang 37Trong trường hợp số liệu không đáp ứng đk sử dụng test 2 có thể làm như sau:
Sử dụng test chính xác của Fisher (Fisher’s exact test) để tính
Với các bảng có trên 2 dòng và cột có thể gộp chúng lại với nhau (nếu có thể) để tăng giá trị mong đợi của ô cho phù hợp với đk của test Khi bình
phương
Trang 38Công thức tính test chính xác của Fisher:
Trang 39Thực hành với test Khi bình phương:
Trang 40PHÂN TÍCH SỐ LIỆU VỚI CÁC BIẾN
ĐỊNH LƯỢNG
Trang 41VD: Bảng dưới đây trình bày phân bố huyết áp tối đa của các cá thể trong mẫu nghiên cứu, loại bđồ nào là thích hợp để trình bày sliệu này
Trang 43Khi một biến định lượng của một quần thể nghiên cứu
được đo lường và phân nhóm, nó có thể biểu thị dưới
dạng biểu đồ cột liên tục Nếu số lượng các đối tượng
nghiên cứu tăng lên và khoảng cách các nhóm giảm đi thì biểu đồ sẽ chuyển dần thành đường cong
Sự phân bố của hầu hết các biến liên tục là đường cong, hình dáng đường cong phụ thuộc vào loại số liệu và thuộc một trong 3 loại
Đường cong lệch phải: Thu nhập của dân các nước đang phát triển
Đường cong lệch trái: Phân bố bệnh đái đường, tăng
HA theo tuổiĐường cong đối xứng: Đa số các biến về lượng trong
KHÁI NIỆM VỀ PHÂN BỐ CHUẨN
Trang 45Trong phân bố chuẩn, giá trị trung bình số học (mean), trung vị (median), mốt (mode) là bằng nhau và ở điểm cao nhất của đường cong
Có ý nghĩa trong việc lựa chọn các test thống kê thích hợp
Trang 46Ước lượng điểm: =X
Ước lượng khoảng:
ƯỚC LƯỢNG MỘT GIÁ TRỊ TRUNG BÌNH
TỪ MẪU SANG QUẦN THỂ
Nếu không biết độ lệch chuẩn của qthể có thể sdụng độ lệch chuẩn của mẫu không thể áp dụng pbố chuẩn Z mà phải á/dụng phân bố t
(bậc tự do là n-1)
Trang 47KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT
TRUNG BÌNH QUẦN THỂ
Các bước giống như các bước
kiểm định cho một tỷ lệ quần thể
Sử dụng test Z
Nếu không biết , ta dùng độ
lệch chuẩn của mẫu thay thế và
t được dùng thay thế
Trang 49CHỌN CÁC TEST THỐNG KÊ TRONG
PHÂN TÍCH SỐ LIỆU NGHIÊN CỨU
Trang 50NGUYÊN TẮC CHỌN TEST THỐNG KÊ
Cân nhắc một số các yếu tố sau
Trang 51PHÂN TÍCH SỰ KHÁC NHAU
Với các biến nhị phân:
Tổng hợp số liệu nghiên cứu (mô tả biến số): tỷ lệ (p).Ước lượng từ mẫu ra quần thể nghiên cứu: P
Kiểm định giả thuyết
Cho tỷ lệ 1 nhóm: test Z Cho tỷ lệ 2 nhóm độc lập
Test Z
Test 2 cho bảng 2x2.
Trang 52PHÂN TÍCH SỰ KHÁC NHAU
Với các biến liên tục:
Tổng hợp số liệu nghiên cứu (mô tả biến số): giá trị trung bình: X, độ lệch chuẩn (s)
Kiểm định giả thuyết
So s ánh giá trị trung bình của hai nhóm
Trang 53PHÂN TÍCH SỰ TƯƠNG QUAN GIỮA HAI BIẾN SỐ
Với các biến nhị phân:
Nghiên cứu ngang: tỷ suất chên của tỷ lệ hiện mắc (POR)Nghiên cứu bệnh chứng không ghép cặp: tỷ suất chênh (OR)
Nghiên cứu bệnh chứng có ghép cặp:
Độ lớn của mối liên quan: OR Test ý nghĩa thống kê của mối tương quan: 2 của Mc NemarNghiên cứu thuần tập:
Độ lớn của mối quan hệ nhân quả:nguy cơ tương đối (RR).
Test ý nghĩa thống kê của mối tương quan:
Trang 54Tương quan giữa hai biến liên tục:
Trang 55PHÂN TÍCH SỐ LIỆU VỚI CÁC BIẾN ĐỊNH TÍNH
Trang 57Phân biệt giữa nghiên cứu định tính và định lượng
Nghiên cứu định lượng
Nghiên cứu định tính
Định
hợp của một số biến số
Xác định thăm dò một số biến số giúp ta hiểu sâu về bản chất, nguyên nhân,
các yếu tố ảnh hưởng của vấn đề
Câu
Trang 58Nghiên cứu định lượng
Nghiên cứu định tính
cho NC định lượng, hoặc
sự kết hợp với NC định lượng
Nhược
cỡ mẫu đại diện
Chọn mẫu và cỡ mẫu không quan trọng lắm nếu là NC thăm dò
Trang 59Nghiên cứu định lượng
Nghiên cứu định tính
Phỏng vấn sâu, thảo luận nhóm, vẽ bản đồ, quan sát
Phiếu hỏi, bảng hướng dẫn thảo luận, phiếu ghi chép
Trang 60TRÌNH BÀY CÁC KẾT QUẢ NGHIÊN CỨU
Trang 61MỘT SỐ LƯU Ý CHÍNH KHI PHÂN TÍCH VÀ TRÌNH BÀY SỐ LIỆU TRONG NGHIÊN CỨU ĐỊNH TÍNH
Mô tả quần thể nghiên cứu:
Ai là đối tượng phỏng vấn sâu
Ai là những người tham gia trong các cuộc thảo luận nhóm
Những người này/nhóm người thảo luận này đại diện cho những đối tượng nào, tiến hành phỏng vấn sâu hoặc quan sát trong hoàn cảnh như thế nào
Thái độ của người phỏng vấn, quan sát
Số lượng của các cuộc phỏng vấn và thảo luận nhóm
Trang 62Sắp xếp dữ liệu hợp lý tùy theo dliệu ít hay nhiều
Ít: đánh dấu chủ đề chính bên lề của bản pvấn, qsátNhiều: mã hóa (VD: “LoạiTA” = loại thức ăn mà trẻ được ăn; “SL Ăn” = Số lần trẻ ăn trong ngày )
Trang 63Tóm tắt và trình bày số liệu của NC ĐT:
Liệt kê các số liệu có cùng mã hóa, chủ đề với nhau (phải xđịnh nguồn từ đâu (pvấn nào, trang nào )
dễ dàng xem lại ttin
Nếu có thể thì tóm tắt bằng các bảng biểu (ma trận) hoặc hình vẽ, sơ đồ, biểu đồ nhìn tổng thể được
về số liệu thu thập được
Trang 64Bảng: Ma trận thức ăn sam của trẻ trong số các nhóm bà mẹ ở các
TB: 6 tháng
- Bột
- Bột với đậu đỗ
- Bột với khoai tây và rau
Trang 65Qua đó đưa ra được các kết luận VD:
Các bà mẹ trẻ bắt đầu cho con ăn sam sớm hơn 2,5 tháng so với nhóm bà mẹ cao tuổi
Bà mẹ trẻ cho con ăn thêm nhiều loại thức ăn hơn các bà mẹ nhiều tuổi
Cả hai bà mẹ dường như không có sự khác biệt về
số lần cho trẻ ăn trong một ngày
Trang 66Sơ đồ: là một hình vẽ bao gồm các ô hay các hình tròn biểu thị cho các biến số nối với nhau nhằm chỉ ra mối liên quan giữa các biến số:
Trang 67Sơ đồ: Lý do cho trẻ ăn sam sớm của các bà mẹ
Vụ mùa
ĂN SAM SỚM
Mẹ gầy Sinh đôi
Trẻ bị
ỉa chảy
Chất lượng sữa tồi
Do chồng, mẹ Không
đủ sữa
Trang 68Sơ đồ tiến triển (flow chart): Biểu diễn trình tự hậu quả của một hành động hoặc một quyết định nào đó.
Bảng: bao gồm các cột và dòng tạo nên các hình chữ nhật hoặc vuông trong có chứa các số liệu khác nhau
Tường thuật và mô tả một trường hợp cụ thể: nhằm
minh họa những thái độ hoặc hành vi thường gặp, đặc biệt nào đó của người dân liên quan tới chủ đề cần minh họa
Trang 69VD: mô tả một trường hợp về ý kiến và thái độ của người dân trong sử dụng nguồn nước mưa như sau: Phỏng vấn 1 cặp
vợ chồng đều là nông dân tại xã Kim Thái, Vụ Bản, Nam Định
Tôi rất thích dùng nước mưa cho nấu nước uống và nấu ăn bởi vì nước mưa rất sạch, trong Ở đây hầu hết mọi nhà đều thích dùng nước mưa như vậy Dùng nước mưa như là tập quá từ lâu đời
rồi Hai mươi năm trước đây, chồng tôi xây một bể khoảng một
khối nước, nhưng bể quá bé không đủ dùng, mười năm sau
chúng tôi lại xây thêm một bể khác to hơn Hiện nay gia đình tôi
có hai bể đủ dùng cho ăn uống quanh năm Chúng tôi thường
uống nước mưa trực tiếp không cần phải đun sôi vì nó rất ngọt và mát nữa
Trang 70Rút ra kết luận và kiểm tra các kết luận từ số liệu định tính:
Không phải là quá trình độc lập, luôn đi cùng với quá trình phân tích và trình bày số liệu của NC ĐT
Các kết luận sẽ dần được làm sáng tỏ hoặc bác bỏ trong quá trình phân tích thêm số liệu
Trang 711. Sắp xếp các số liệu có liên quan theo từng mục tiêu
hoặc theo từng câu nghiên cứu
tóm tắt các số liệu có chung một đặc tính hoặc hình thái nào đó
trận để có thể nhìn nhận rõ ràng hơn số liệu, đặc biệt mối quan hệ giữa các biến khác nhau trong nghiên cứu cũng như các kết luận
can thiệp được
như có thể được
Trang 72Cách thức kiểm tra các kết quả tìm được để chứng minh tính giá trị của chúng:
Kiểm tra tính đại diện của số liệu: chọn đối tượng
phải tuân theo một tiêu chuẩn chọn một cách hệ
thống
Kiểm tra sai số hệ thống: sai số do ả/hưởng của các nhà ng/cứu trong những tình huống n.cứu khác nhauKiểm tra chéo ttin, các sự kiện từ nhiều nguồn khác nhau: số liệu, ttin chỉ khẳng định khi đã kiểm tra từ các nguồn khác nhau mà không có sự khác biệt hay mâu thuẫn nhau
Trang 73So sánh và đối chiếu số liệu
x/ định mối liên hệ giữa các b/số và hquả
khi thiết kế n/cứu cần đảm bảo có được các cuộc PV bao gồm các nhóm người có thể cung cấp ttin khác nhau
VD: n/cứu về TĐVH có ảnh hưởng tới sử dụng các
Trang 74Làm thêm các n/cứu bổ sung/ so sánh với các n/cứu khác
để ktra kq tìm được, đặc biệt kq có lq tới các ytố can thiệp.Thu thập những ý kiến phản hồi: có thể có được khi kquả n/cứu phản hồi lại cho các nhà lãnh đạo CĐ hay các cơ quan có lquan chất lượng n/cứu gia tăng
Trang 75MÉu nhá Test chÝnh x¸c cña
Fisher Test dÊu hiÖu (Sign) MÉu lín 2 test hoÆc Z test 2 test cña McNemar
Wilcoxon rank test
signed-Trªn 2 nhãm
way ANOVA
Kruskal-Wallis1-Friedman2-way ANOVA
Trang 76TRÌNH BÀY CÁC KẾT QUẢ NGHIÊN CỨU
Trang 77TRÌNH BÀY CÁC BẢNG, BIỂU ĐỒ, ĐỒ THỊ
Trang 79Bảng hai chiều: khi có hai hoặc trên hai biến số được trình bày trong một bảng Ta có thể biểu thị tổng của các số liệu theo biến ở cả cột và dòng
Bảng giả: Là một loại bảng có đầy đủ tên bảng, các tiêu đề cho cột và dòng nhưng chưa có số liệu Nó
thường được thiết kế trong giai đoạn lập đề cương
nghiên cứu để cho nhà nghiên cứu có sẵn ý tưởng
thiết kế thu thập số liệu