Dấu hiệu nghiên cứuvề chất khả năng xuất hiện Nghiên cứu 1 đối tượng Phân tích thống kê suy luận Phân tích thống kê mô tả Kiểm định giả thuyết Trình bày số liệu bảng, biểu đồ... Trình bà
Trang 1 NCKH là phương tiện khách quan, hệ thống đáng tin cậy để
tạo ra những bằng chứng có giá trị áp dụng vào thực hành lâm sàng
Nâng cao chất lượng và sự an toàn
của các dịch vụ chăm sóc sức khỏe cộng đồng
Trang 2NGHIÊN CỨU KHOA HỌC
2
01 Xác định cỡ mẫu nghiên cứu
02 Chọn mẫu (Phương pháp nào phù hợp?)
03 Xác định biến số → phân loại biến số
04 Thu thập số liệu (đo lường biến số)
05 Phân tích mô tả số liệu
06 Phân tích suy luận → trả lời các câu hỏi NC
Nghiên
cứu
mẫu
Trang 3Dấu hiệu nghiên cứu
về chất (khả năng xuất hiện)
Nghiên cứu 1 đối tượng
Phân tích thống kê suy luận Phân tích thống kê mô tả
Kiểm định giả thuyết Trình bày số liệu
(bảng, biểu đồ)
Trang 4 PHẦN II: THỐNG KÊ
BÀI 1
TỔNG HỢP, PHÂN TÍCH MÔ TẢ VÀ TRÌNH BÀY SỐ LIỆU THỐNG KÊ
(04 tiết LT – 06 tiết TH)
Trang 5A MỤC TIÊU
1 Trình bày được 1 số khái niệm: sự biến thiên,
biến số, số liệu, quần thể và mẫu
2 Trình bày được công thức tính các tham số mẫu của các dạng số liệu định lượng
3 Tính được các tham số mẫu của bộ số liệu
định lượng và nêu được ý nghĩa
4 Tính được các tham số mẫu của bộ số liệu
định tính và nêu được ý nghĩa.
5 Trình bày được các bộ số liệu cụ thể dưới
dạng bảng, biểu đồ thích hợp và phiên giải ý nghĩa.
Trang 7Thống kê là gì ? (Statistic)
Thống kê mô tả (Desciptive statistics)
• Tổng hợp - phân bố số liệu
• Tính toán các tham số thống kê (tham số mẫu)
• Trình bày số liệu theo cấu trúc bảng , biểu đồ
Thống kê suy luận (inferential statistics)
• Ước lượng
• Kiểm định (Test thống kê)
Trang 8 Là sự khác biệt khi đo lường các đặc điểm của các cá thể khác nhau
hoặc cùng 1 cá thể ở các thời điểm khác nhau.
Sự
biến
thiên
Một phương pháp hệ thống được xây dựng để mô tả và phân tích
sự biến thiên của các hoàn cảnh khác nhau là thống kê
Trang 9 Là đặc tính của người, vật, hiện tượng
giá trị thay đổi phụ thuộc vào
từng cá thể khác nhau trong quần thể hoặc giữa các lần quan sát trên cùng 1 cá thể
Biến
số
1 MỘT SỐ KHÁI NIỆM
Đo lường các biến số, người nghiên cứu
có được các số liệu để phân tích, báo cáo
→ lập kế hoạch nghiên cứu
Trang 10Biến danh mục (Nominal)
(liệt kê, kể tên)
Biến thứ hạng (Ordinal)
(Cấp độ khác nhau, trình tự)
Biến nhị phân (Binominal)
(nhận 1 trong 2 giá trị) Biến rời rạc (Discrete)
(giá trị là số nguyên)
Trang 11Phân biệt các biến số (đánh dấu x vào cột tương ứng)
Tên biến lượng Định Liên tục Rời rạc Định tính Danh mục hạng Thứ phân Nhị
Cân nặng (kg)
Tuổi (năm)
Nhóm máu
Suy dinh dưỡng (mức độ)
Huyết áp cao (Có / Không)
Trang 12* Giá trị thay đổi phụ thuộc
vào sự biến đổi của các biến
ảnh hưởng tới nó.
* Là các yếu tố nguy cơ
trong mối quan hệ nhân quả
với hiện tượng sức khoẻ cần
nghiên cứu.
* Mô tả vấn đề nghiên cứu.
* Mô tả, đo lường các yếu tố là
nguyên nhân, ảnh hưởng
đến vấn đề nghiên cứu.
BIẾN PHỤ THUỘC BIẾN ĐỘC LẬP
PHÂN LOẠI BIẾN SỐ
theo mối tương quan giữa các biến số
Trang 13Biến
* Hàm lượng cholesterol máu
1 Nghiên cứu về
cao huyết áp
BIẾN PHỤ THUỘC BIẾN ĐỘC LẬP
Biến
* Hàm lượng cholesterol máu
Biến
Hàm lượng chất béo trong khẩu phần ăn
Trang 14 Đảm bảo thu thập thông tin
không thừa, không thiếu
Xác định phương pháp và công cụ thu thập số liệu thích hợp với từng
loại biến số
Trang 15 Chọn được các test thống kê
thích hợp khi phân tích số liệu
Trang 16 Là các thông tin thu thập được từ các cá thể như: con người, phim chụp X- quang,…
Số liệu ban đầu:
do người nghiên cứu tự thu thập
Số liệu sẵn có:
do người khác thu thập và được người nghiên cứu sử dụng
1 MỘT SỐ KHÁI NIỆM
Trang 17 SỐ LIỆU
Các phương pháp thu thập số liệu
Tốn kém thời gian, chi
Trang 18Các yếu tố đảm bảo chất lượng
số liệu?
SỐ LIỆU
1 Cập nhật thời gian
2 Hoàn chỉnh
•Số lượng biểu mẫu
•Thông tin trong từng biểu mẫu
3 Chính xác
phản ánh đúng hoàn cảnh thực
tế ?
4 Tin cậy Lặp lại thông tin thu thập
Trang 19 Tập hợp các cá thể có chung 1 số đặc điểm nhất định được nghiên cứu
Nhóm các cá thể rút ra từ quần thể nghiên cứu phục vụ trực tiếp cho mục đích nghiên cứu.
Trang 20 Ví dụ
Hãy xác định : Quần thể đích, quần thể
nghiên cứu, mẫu, đơn vị mẫu, khung chọn mẫu, đơn vị quan sát trong nghiên cứu sau:
Trong 1 nghiên cứu điều tra về tình trạng SDD của trẻ ≤ 5 tuổi tại tỉnh Hải Dương năm 2018 Chọn ngẫu nhiên 5 huyện/12 huyện để thực hiện nghiên cứu Mỗi huyện chọn ra 20 hộ gia đình Tất cả trẻ ≤
5 tuổi trong các hộ gia đình được chọn đều được thăm khám
Trang 21• Quần thể đích: { Trẻ ≤ 5 tuổi tại Hải Dương
năm 2018 }
• Quần thể nghiên cứu: { Trẻ ≤ 5 tuổi trong 5 huyện
của tỉnh Hải Dương }
• Mẫu: {Trẻ ≤ 5 tuổi trong 100 hộ gia đình của 5 huyện}
• Đơn vị mẫu: hộ gia đình
→ Khung chọn mẫu = { danh sách 100 hộ gia đình }
• Đơn vị quan sát: trẻ ≤ 5 tuổi/100 hộ gia đình
Trang 22• Tính đại diện cao
Chất lượng thông tin thu thập tốt hơn
Thu thập được số liệu toàn diện hơn
Đôi khi, chọn mẫu là phương pháp duy nhất có thể thực hiện nghiên cứu
• Cỡ mẫu đủ lớn
• Quy trình chọn mẫu là thực tế và khả thi
• Thiết kế mẫu phải kinh tế và hiệu quả
Trang 23 Khái niệm
Mẫu ngẫu nhiên cỡ n là tập hợp n biến ngẫu nhiên độc lập X1, X2,…,Xn được lập thành từ biến ngẫu nhiên gốc X, có cùng quy luật phân phối xác
suất với X Kí hiệu là: W =(X 1 , X 2 ,…,X n )
Giá trị của mẫu ngẫu nhiên
Các tham số mẫu đặc trưng
trung bình, trung vị, mốt; phương sai, độ lệch
MẪU NGẪU NHIÊN
Trang 24khác nhau tăng dần với tần số xuất
hiện tương ứng
2.3 Số liệu
theo nhóm:
* n giá trị chia
thành k khoảng liên tục (độ rộng
= nhau) với
tần số xuất hiện
tương ứng
Trang 25 Đo lường độ phân tán
→ Tìm 1 giá trị trung tâm
Trang 26 Trung bình:
Trung vị:
Bước 1: sắp xếp số liệu (không giảm):
hoặc (không tăng) :
Bước 2: Xác định giá trị chính giữa bộ số liệu đã sắp
xếp
1 2 1
n i
x x
Số liệu không theo nhóm
(Không tính tần số xuất hiện của các giá trị)
Trang 27 Mốt: là giá trị xuất hiện với tần số cao nhất
trong 1 tập hợp các quan sát Kí hiệu là x mod
Ví dụ: Tìm mốt của các bộ số liệu sau
11,2 12,5 11,8 12,3 14,1 15,7 15,9 16,3 16,7 17,0
→ không có mốt
11,2 12,3 11,8 12,5 14,1 15,7 15,9 12,3 16,7 17,0 13,6 16,3 12,3
11,2 12,5 11,8 12,5 14,1 15,7 15,9 12,5 11,8 17,0 13,6 16,0 16,5 11,8
Trang 29mod
x
n = 10 = 2.5→ k = 5 Sắp
xếp
Trang 30 Phiên giải kết quả:
Cân nặng trung bình là 14,88kg: không chính xác
Trang 31 Giả sử cân nặng của 11 trẻ như sau:
10,0 11,7 12,6 15,2 16,3 15,5 15,7 16,3 17,5 18,0 16,8
Trang 32 Vị trí của các số đo lường độ tập trung
Phân bố chuẩn Phân bố nghiêng trái Phân bố nghiêng phải
(đa số quan sát có giá trị lớn) (đa số quan sát có giá trị bé)
x
mod
x x
Trang 33 Ý nghĩa của các số đo lường độ tập trung
trong phân bố số liệu
1 Giá trị trung bình bị ảnh hưởng bởi các giá trị quan sát quá lớn hoặc quá nhỏ → có ý nghĩa nhất trong phân bố chuẩn.
2 Giá trị trung vị luôn chia bộ số liệu đã sắp xếp
Trang 34 n giá trị x1, x2,…, xn có k giá trị khác nhau tăng dần với tần số xuất hiện tương ứng n 1 , n 2 ,…, n k ;
Trung bình:
Trung vị và mốt: xác định tương tự như bộ số liệu
không theo nhóm (khi k nhỏ)
n n
k i
1
Giá trị xi x1 x2 x3 … xkTần số ni n1 n2 n3 … nk
Trang 35 Ví dụ 2: Điện di 53 mẫu máu người bình thường thu được lượng Protein huyết thanh như sau:
Giá trị
TB đúng
Trang 36 Số liệu theo nhóm: n giá trị x1, x2,…, xn chia thành
k khoảng liên tục (độ rộng như nhau) với tần số xuất hiện tương ứng n 1 , n 2 ,…, n k ;
Trung bình: ; x i : chính giữa khoảng
x
) 2
n n
k i
i
1
Trang 37 Mốt
Bước 1: Xác định nhóm mốt
là nhóm có tần số xuất hiện cao nhất
Bước 2: Tìm x mod = x i : giá trị chính giữa nhóm mốt
Ví dụ 3: Bảng phân bố cân nặng của 30 trẻ
Tính các tham số đo lường độ tập trung của bộ số
Cân nặng (kg)
7,0 - 10,0 10,0 - 13,0 13,0 - 16,0 ≥ 16,0
Số trẻ ni
Trang 38mod 17,5
x
Nhóm đầu tiên có
cf ≥ n/2 Nhóm trung vị
Trang 39Một con số đại diện cho mức đường huyết của cả quần thể với bộ số liệu phân bố
Trang 40Mốt của bộ số liệu theo nhóm
(độ rộng các nhóm như nhau) là giá trị
A Có tần số xuất hiện cao nhất
Trang 41Trung vị của bộ số liệu không theo nhóm
là giá trị
A Chính giữa bộ số liệu đó
B Có tần số xuất hiện cao nhất trong bộ số liệu
C Chính giữa của bộ số liệu đã được sắp xếp theo một trật tự nhất định
D Lớn nhất của bộ số liệu đó
LƯỢNG GIÁ BÀI HỌC
Trang 42Trong một điều tra về tình trạng SDD của trẻ em ≤ 5 tuổi ở 1 tỉnh Các nhà nghiên cứu muốn biết 25%, 50%, 75% số trẻ có cân nặng thấp nhất nằm ở
Trang 43Khoảng ALTTĐMP (mmHg) Tần số n i
< 4,0 2 4,0 – 4,5 3 4,5 – 5,0 5 5,0 – 5,5 6 5,5 – 6,0 8 6,0 – 6,5 10 6,5 – 7,0 9 7,0 – 7,5 6 7,5 – 8,0 4 8,0 – 8,5 2
Bài tập lượng giá: Đo áp lực tâm trương động
mạch phổi (ALTTĐMP) của 57 người mắc bệnh A thu được:
Trang 45 03 tham số đo lường độ tập trung
6 57
25 ,
353 57
225,
610
)
242
57(5,
00
6 2
5 , 6 0
,
6mod
x
Trang 46 Đo lường độ phân tán
→ Tìm 1 giá trị trung tâm
5) Khoảng quan sát: (Range)
* 4) Sai số chuẩn của trung bình
(Std Error = SE)
Trang 47 CÁC THAM SỐ ĐO LƯỜNG ĐỘ PHÂN TÁN
1) Phương sai (Variance): S 2
Phương sai là trung bình của bình phương khoảng chênh lệch giữa xi và giá trị trung bình chung
Trang 48 CÁC THAM SỐ ĐO LƯỜNG ĐỘ PHÂN TÁN
3) Hệ số biến thiên (Coefficient of variation): C v
.100%
V
S C
Chiều cao (cm)
Hệ số biến thiên C V = 7,8% C V = 4,7%
Trang 49 CÁC THAM SỐ ĐO LƯỜNG ĐỘ PHÂN TÁN
Khoảng quan sát = x max -x min
* Chú ý: Đối với bộ số liệu phân thành k khoảng liên tục
có độ rộng như nhau không tính được khoảng quan
5) Khoảng quan sát: (Range)
* 4) Sai số chuẩn của trung bình
(Std Error = SE) S
SE
n
Trang 50Khoảng ALTTĐMP (mmHg) Tần số n i
< 4,0 2 4,0 – 4,5 3 4,5 – 5,0 5 5,0 – 5,5 6 5,5 – 6,0 8 6,0 – 6,5 10 6,5 – 7,0 9 7,0 – 7,5 6 7,5 – 8,0 4 8,0 – 8,5 2
Bài tập lượng giá: Đo áp lực tâm trương động
mạch phổi (ALTTĐMP) của 57 người mắc bệnh A thu được:
S
S 2 ; ;
Trang 526 57
25 ,
353 57
225,
610
)
242
57(5,
00
6 2
5 , 6 0
,
6mod
x
Trang 53S SE
6,197
V
S C
Trang 54 BÀI TẬP LƯỢNG GIÁ
Điều tra 1600 gia đình có 4 con thu được kết quả sau:
và C v của bộ số liệu trên?
x S
Trang 55• Trung bình:
5 1
Trang 57 BÀI TẬP LƯỢNG GIÁ
Trang 60số lần xuất hiện giá trị trong bộ số liệu
2 Tỷ lệ % hay tần suất % (Percent):
* Lưu ý:
+) Tỷ lệ phần trăm hợp lệ (loại bỏ các giá trị không có): Valid Percent
+) Tỷ lệ phần trăm tích lũy (% cộng dồn từ trên
xuống): Cumulative Percent
Trang 61• Tỷ suất là 1 số tương đối để đo lường tần suất xuất hiện
của hiện tượng n/c trong 1 khoảng thời gian nhất định
• Tỷ suất là 1 dạng đặc biệt của tỷ số trong đó: tử số là
các sự kiện mới phát sinh và mẫu số là số lượng cá thể
Trang 62 Tỷ suất chênh (Odds Ratio) : OR
(đánh giá cường độ mối liên quan giữa 2 biến định tính)
• OR = 1: Không có sự kết hợp giữa phơi nhiễm và bệnh.
• OR > 1: Có sự kết hợp giữa yếu tố phơi nhiễm và bệnh, nguy cơ mắc bệnh tăng lên ở nhóm có phơi nhiễm.
• OR < 1: Kết hợp đảo ngược, phơi nhiễm làm giảm nguy
cơ bệnh.
3.2 Phân tích mô tả số liệu định tính
Trang 63• CI(95%) của OR chứa 1 thì nguy cơ mắc bệnh của nhóm phơi
nhiễm và nhóm không phơi nhiễm là không có sự khác biệt với
Tỷ suất chênh (Odds Ratio): OR
1 1 1 1 1 1 1 1
ln 1,96 ln 1,96
Trang 64 Nguy cơ tương đối (Relative Risk) : RR
(đánh giá cường độ mối liên quan giữa 2 biến định tính)
Yếu tố Bệnh Không bệnh Tổng
Tổng a + c b + d a+ b + c + d = n
• RR =1: Không có sự kết hợp giữa phơi nhiễm và bệnh.
• RR > 1:Có sự kết hợp giữa yếu tố phơi nhiễm và bệnh, nguy cơ mắc bệnh tăng lên ở nhóm có phơi nhiễm.
• RR < 1: Kết hợp đảo ngược, phơi nhiễm làm giảm nguy cơ bệnh.
3.2 Phân tích mô tả số liệu định tính
/ ( ) RR
Trang 65• CI(95%) của RR chứa 1 thì nguy cơ mắc bệnh của nhóm phơi
nhiễm và nhóm không phơi nhiễm là không có sự khác biệt với
Nguy cơ tương đối (Relative Risk): RR
=[ e RR a b c d ; e RR a b c d ]
Trang 664 MỘT SỐ VÍ DỤ
Câu hỏi tự lượng giá:
Câu 1 – 2, Giáo trình XSTK trang 76
Bài tập lượng giá:
Bài 1; 2; 3; 4a),b); 5a); 6a)
- Bài tập XSTK trang 33 - 35
Trang 67TỔNG KẾT
1 Một số nội dung cần nhớ
Công thức tính các tham số mẫu của các dạng số
liệu định lượng và ý nghĩa.
Ý nghĩa của các số đo lường độ tập trung trong các đường cong phân bố (tần số) số liệu.
Công thức tính các tham số mẫu mô tả số liệu định
2 mod
; Me ; ; ; ; C ; V
Trang 695.1.2 Một số chú ý khi lập bảng
Đơn giản:
- Số lượng biến từ 1 đến 3 biến
- Nhiều biến nên chia nhiều bảng
Rõ ràng:
Vị trí đặt bảng phù hợp: ngay sau đoạn mô
tả
Trực tiếp:
- Chỉ đưa ra các thông tin cần thiết
- Khả năng tự giải thích và phiên giải số liệu
Trang 70x i
Tần số
n i
Tần suất
(%)
Tần số cộng dồn
cf
Tần suất cộng dồn (%)
Trang 71 Số liệu không đòi hỏi độ chính xác tuyệt đối.
Không thay thế được bảng biểu khi cần
trình bày số liệu chi tiết, cụ thể.
Minh họa một số loại biểu đồ chức năng
5.2 TRÌNH BÀY SỐ LIỆU BẰNG BIỂU ĐỒ
Trang 72TỔNG KẾT – HƯỚNG DẪN VỀ NHÀ
1 Một số nội dung cần nhớ
Cấu trúc bảng tần số
4 bước tạo lập cấu trúc bảng tần số
Một số loại biểu đồ chức năng trình bày số liệu
2 Hướng dẫn về nhà
LÀM BÀI TẬP THỰC HÀNH XỬ LÝ SỐ LIỆU
Trang 73
Đo huyết áp tối đa (đv: mmHg) cho 70 bệnh nhân
thu được kết quả:
Trang 74 Yêu cầu 1: Lập bảng tần số cho bộ số liệu trên
Yêu cầu 2: Tính các tham số mẫu đặc trưng của bộ số liệu
(Các tham số đo lường độ tập trung, độ phân tán).
Yêu cầu 3: Vẽ biểu đồ cột liên tục trình bày số liệu.