Khung mẫu: là danh sách các đơn vị mẫu hoặc bản đồ phân bố các đơn vị mẫu, giúp dễ dàng chọn được một mẫu từ quần thể nghiên cứu.. Vậy một mẫu nghiên cứu tốt là một mẫu phải đại di
Trang 21. Trình bày được lý do và các yếu tố ảnh hưởng đến cỡ mẫu nghiên cứu
2. Trình bày được cách tính cỡ mẫu nghiên cứu
3. Trình bày được các phương pháp chọn mẫu
4. Trình bày được các bước tiến hành chọn mẫu 30 chùm ngẫu nhiên.
Trang 3 Quần thể?
Quần thể nghiên cứu?
Quần thể đích?
Đơn vị quan sát?
Đơn vị mẫu?
Trang 4 Quần thể: Là tập hợp các cá thể có chung
một số các đặc điểm nhất định nào đó
Quần thể nghiên cứu: là tập hợp các cá thể
có chung những đặc trưng mà ta định nghiên
cứu. QT từ đó mẫu được rút ra
Quần thể đích: là quần thể mà người
nghiên cứu mong muốn kết quả nghiên cứu
của mình được ngoại suy ra
Lý tưởng: QT nghiên cứu QT đích
Trang 5• Đơn vị quan sát: một chủ thể hoặc người mà
sự quan sát hoặc đo lường sẽ được tiến hành
khi thực hiện nghiên cứu
• Đơn vị mẫu: chủ thể được sử dụng khi chọn
mẫu nghiên cứu
• VD: Đtra tình trạng SDD của trẻ em ≤ 5 tuổi
Tất cả trẻ em ≤ 5 tuổi trong các hộ gia đình
được chọn vào mẫu đơn vị quan sát: TE ≤ 5
tuổi, đơn vị mẫu: hộ gia đình
Trang 6 Mẫu nghiên cứu
Trang 7 Khung mẫu: là danh sách các đơn vị mẫu hoặc bản đồ phân bố các đơn vị mẫu, giúp dễ dàng
chọn được một mẫu từ quần thể nghiên cứu
Phân bố mẫu: Khi các mẫu có cùng kích cỡ
được rút ra từ một quần thể nghiên cứu, kết
quả thu được từ các mẫu cũng rất khác nhau
Sự biến thiên này được gọi là phân bố mẫu
Trang 8•Mẫu lý tưởng: nghiên cứu trên tất cả các cá thể
trong quần thể.
•Thực tế: chọn 1 nhóm các cá thể đại diện cho
quần thể để tham gia vào NC (chọn mẫu)
• • Tại sao phải chọn mẫu???
Trang 9Quần thể NC thường rất lớn, khó có đủ điều kiện
để nghiên cứu hết tất cả các cá thể
Nhân lực có hạn
Thời gian có hạn
Ngân sách có hạn
Trang 12 Yêu cầu của mẫu nghiên cứu:
◦Phải đại diện cho quần thể
◦Như hình ảnh thu nhỏ của quần thể.
◦Các phân phối đặc trưng NC mẫu phản ánh
trung thành phân phối đặc trưng đó trong quần thể.
Vậy một mẫu nghiên cứu tốt là một mẫu phải
đại diện cho quần thể nghiên cứu theo 2 nghĩa:
cỡ mẫu đủ lớn và chọn mẫu đúng kĩ thuật
Trang 13 Các yếu tố ảnh hưởng đến mẫu nghiên cứu:
◦Loại thiết kế NC: thường các loại NC dọc yêu
cầu cỡ mẫu cao hơn loại NC ngang
◦Loại pp chọn mẫu: mẫu chùm > mẫu khác
◦Độ lớn của tham số được NC: Sự kiện NC
càng hiếm thì cỡ mẫu càng phải cao
◦Đặc tính biến thiên của tham số NC: Sự khác
nhau của tham số này giữa các cá thể trong
quần thể càng lớn thì cỡ mẫu càng phải nhiều
Trang 14 Các yếu tố ảnh hưởng đến mẫu nghiên cứu:
◦Mức độ sai lệch cho phép giữa tham số mẫu
và tham số quần thể càng nhỏ thì cỡ mẫu
càng lớn
◦Kế hoạch phân tích SL: Phân tích đa biến yêu
cầu cỡ mẫu lớn hơn phân tích đơn biến Phân tích tầng yêu cầu cỡ mẫu lớn hơn phân tích
thô
Trang 15 Các yếu tố ảnh hưởng đến mẫu nghiên cứu:
◦Nếu người NC muốn khảo sát nhiều biến số
trong cùng một nghiên cứu thì cỡ mẫu phải
được xác định riêng với từng biến sau đó lựa
chọn cỡ mẫu lớn nhất
◦Khả năng thực thi của NC thường rất quan
trọng trong việc chọn cỡ mẫu như: kinh phí
hiện có, nhân lực (số lượng và chất lượng),
việc đi lại, thời gian giành cho nghiên cứu
Trang 16Cỡ mẫu cho các NC ước lượng trung bình
d: sai số ước lượng (do nhà NC định trước)
n: cỡ mẫu nghiên cứu
Trang 17Cỡ mẫu cho các NC ước lượng trung bình
Tính cỡ mẫu cho một nghiên cứu xác định cân
nặng trung bình của trẻ sơ sinh biết cân nặng
trung bình khoảng 3000g Cân nặng sơ sinh là một biến chuẩn và 95% cân nặng nằm trong khoảng
2000 – 4000g d=50
Trang 18Cỡ mẫu cho các NC ước lượng trung bình
Độ lệch chuẩn là (4000-2000)/4 = 500 g
Khoảng tin cậy 95 % dao động 2950 – 3050g
n = 1.962 x 5002 /502 = 384
Trang 19Cỡ mẫu cho ước tính một tỷ lệ trong quần thể:
Trong đó:
p: Tỷ lệ mắc bệnh tại một cộng đồng tương tự
: Khoảng sai lệch mong muốn giữa tỷ lệ thu được từ mẫu (p) và tỷ lệ của qthể (P) Tỷ lệ tuyệt đối (P-p)
: Mức ý nghĩa thống kê
Trang 20Cỡ mẫu cho ước tính một tỷ lệ trong quần thể:
Tuy nhiên nếu sử dụng công thức trên với 2 trường hợp sau:
◦ p=0,1
◦ p=0,9
=> có cỡ mẫu như nhau => vô lý vì tỷ lệ mắc bệnh cao thì cỡ mẫu nhỏ hơn
Trang 21 Để khắc phục nhược điểm của việc chọn giá trị tuyệt đối nêu trên, người ta sử dụng giá trị tương đối , khi đó công thức tính cỡ mẫu được viết như sau:
Trong trường hợp này được chọn là một tỷ lệ nào đó so với tỷ lệ bệnh p Nếu p càng lớn thì
tích số p. càng lớn và ngược lại
Trang 22Cỡ mẫu cho kiểm định sự khác nhau giữa 2 giá trị TB
s: Độ lệch chuẩn (ước tính từ 1 NC trước đó hoặc 1 NC thử) Ở đây s của hai nhóm được giả sử là như nhau.
: Sự khác biệt giữa 2 TB theo mong muốn của nhà NC
: Mức ý nghĩa thống kê, là 0,1 hoăc 0,5 hoặc 0,01 tương ứng với độ tin cậy là 90%, 95% và 99%.
β: xác suất của việc phạm phải sai lầm loại II thường được xác định là 0,1.
Trang 23Cỡ mẫu cho việc kiểm định sự khác nhau giữa 2
Trang 27 Là mẫu mà tất cả các cá thể trong quần thể có
cùng cơ hội (cùng xác suất) để được chọn vào
Trang 28Chọn mẫu ngẫu nhiên đơn
Tốn kém trong quá trình thu thập số liệu
Cần danh sách cá thể trong quần thể
Trang 29 Mỗi cá thể trong một danh sách được chọn bằng
cách áp dụng một khoảng hằng định theo sau bởi
một sự bắt đầu ngẫu nhiên.
Các bước:
◦ Tất cả các đơn vị mẫu trong quần thể định nghiên cứu
được ghi vào khung chọn mẫu.
◦ Xác định khoảng mẫu k = N/n (N: số cá thể trong quần thể, n: cỡ mẫu).
◦ Một số ngẫu nhiên (i) giữa 1 và k được chọn bằng cách
chọn ngẫu nhiên đơn.
◦ Các cá thể có số thứ tự i + 1k, i +2k, i + 3k, sẽ được chọn vào mẫu cho đến khi kết thúc khung chọn mẫu.
Trang 31 Ví dụ: Để thu thập số liệu về sẹo lao ở trẻ em trong
một cộng đồng nông thôn không biết danh sách các
hộ gia đình Người nghiên cứu có thể xác định quy
luật chọn mẫu:
◦ Hộ gia đình đầu tiên được điều tra là hộ thứ nhất nằm bên
trái của UBND xã.
◦ Các hộ tiếp theo được họn bằng cách nghiên người nghiên cứu tiếp tục đi về bên trái và cứ cách 7 gđình lại điều tra
một gia đình.
◦ Tất cả các trẻ em trong các hộ gia đình được chọn đều
được kiểm tra sẹo lao cho đến ó đủ óố trẻ cần được điều
tra.
Trang 32Chọn mẫu ngẫu nhiên hệ thống
Đơn vị mẫu không xếp ngẫu nhiên hoặc trùng
với k, thiếu đại diện.
Trang 33 Là mẫu đạt được bởi việc phân chia các cá thể
của quần thể nghiên cứu thành các nhóm riêng rẽ được gọi là tầng và cách chọn mẫu ngẫu nhiên
đơn hay ngẫu nhiên hệ thống sẽ được sử dụng
Trang 34 Các bước:
◦Phân chia quần thể nghiên cứu thành các tầng
khác nhau dựa vào một hoặc vài đặc điểm nào đó
như nhóm tuổi, giới Giữa các t ầng không có sự
chồng chéo.
◦Thực hiện việc chọn mẫu ngẫu nhiên đơn hoặc
ngẫu nhiên hệ thống trong từng tầng.
◦Các phân tích thống kê được tính toán riêng cho
từng tầng, sau đó sẽ kết hợp lại trên cơ sở kích cỡ
của từng tầng để cho kết quả của toàn bộ quần thể.
Trang 36Chọn mẫu phân tầng
Trang 37 Là mẫu đạt được bởi việc lựa chọn ngẫu nhiên
các nhóm cá thể được gọi là chùm từ nhiều chùm trong một quần thể nghiên cứu Trong trường hợp này đơn vị mẫu là các chùm chứ không phải là
các cá thể
Trang 38 Các bước:
◦Xác định các chùm thích hợp: chùm được làm bởi tập hợp các cá thể gần nhau (làng, xã, )
thường có chung 1 số đặc điểm nhưng
không có cùng kích cỡ
◦Lên danh sách tất cả các chùm
◦Chọn một cách xác suất một số chùm
Trang 39 Cách 1: tất cả các cá thể trong các chùm đã
chọn sẽ vào mẫu nghiên cứu Theo cách này,
đơn vị mẫu chính là chùm được chọn, yếu tố
Trang 41Chọn mẫu theo cụm (chùm)
Có thể áp dụng trong điều tra có phạm vi rộng, phân tán, không có được danh sách các đơn vị nghiên cứu
Khung mẫu đơn giản (danh sách các cụm), dễ lập
Điều tra dễ & nhanh=> Có hiệu quả kinh tế (kinh phí, thời gian)
Tính đại diện thấp (hệ số thiết kế)
Phân tích số liệu phức tạp
Trang 43Số TT Tên xã Dân số Cộng dồn dân
Trang 44Cảm ơn !