Việc xác định sai sẽ rất đến kết quả tính toán trên mẫu bị chệch và dẫn đến sai số phi chọn mẫu sẽ đề cập ở phần sau Ø Tổng điều tra là thu thập thông tin của tất cả các đơn vị thuộc t
Trang 1Chương I THIẾT KẾ MẪU ĐIỀU TRA
1
1 XÂY DỰNG PHƯƠNG ÁN ĐIỀU TRA THỐNG KÊ
Nội dung 4
Nội dung 3
Nội dung 2
Nội dung 1
Chọn phương pháp thu thập thông tin
Xác định nội dung điều tra
Xác định phạm vi, đối tượng và đơn vị điều tra Xác định mục
đích nghiên cứu
Nội dung 7
Nội dung 6
Nội dung 5
Lập kế hoạch tổ chức và tiến hành điều tra
Chọn mẫu điều tra
Soạn thảo bảng hỏi
2
1.6 Chọn mẫu điều tra (1)
Tại sao phải tiến hành chọn mẫu?
• Đối tượng của các nghiên cứu xã hội học thường có phạm
vi (quy mô) rất lớn
• Nên thường phải tiến hành chọn ra một mẫu để nghiên
cứu
• Nếu mẫu đảm bảo tính đại diện thì kết quả của mẫu có thể
dùng để phản ánh cho tổng thể
Khái niệm về tổng thể và mẫu (1)
• Tổng thể là một tập hợp bao gồm toàn bộ các đối
tượng nghiên cứu
• Tổng số đơn vị tổng thể được kí hiệu là N
• Xác định đúng tổng thể nghiên cứu rất quan trọng Việc xác định sai sẽ rất đến kết quả tính toán trên mẫu bị chệch và dẫn đến sai số phi chọn mẫu (sẽ đề cập ở phần sau)
Ø Tổng điều tra là thu thập thông tin của tất cả các đơn
vị thuộc tổng thể
– Điều tra tất cả các hộ gia đình của Việt Nam – Điều tra tất cả các sinh viên của NEU
Trang 2Khái niệm về tổng thể và mẫu (2)
• Mẫu là một tập hợp con được rút ra từ tổng thể
nghiên cứu
• Tổng số đơn vị của mẫu được kí hiệu là n
Ø Điều tra chọn mẫu là thu thập thông tin từ các đơn
vị trong mẫu
– Điều tra một bộ phận các hộ gia đình của Việt Nam
– Điều tra một bộ phận các sinh viên của NEU
5
Kỹ thuật chọn mẫu
• Kỹ thuật chọn mẫu là cách lấy mẫu từ tổng thể chung Ø Một yêu cầu quan trọng: mẫu phải đảm bảo tính đại
diện cho tổng thể Điều này có nghĩa là mẫu phải giống tổng thể ở một hoặc một vài đặc trưng nào đó
Ø Ví dụ: muốn mẫu các sinh viên được chọn của NEU
giống với tổng thể theo tiêu chí nào: giới tính, khu vực địa lý, giàu/nghèo,
Ø Điều cốt lõi là phải hiểu được đặc trưng của tổng thể để lựa chọn phương pháp chọn mẫu thích hợp
6
Từ tổng thể đến mẫu
TỔNG THỂ
Dàn chọn mẫu (danh sách tất cả các đơn vị thuộc đối tượng nghiên cứu)
Lý do tiến hành điều tra chọn mẫu
• Tổng điều tra cung cấp bức tranh đầy đủ về tổng thể nhưng nhìn chung không thể thực hiện được do
– Tổng điều tra tốn rất nhiều thời gian và kinh phí – Mẫu với quy mô nhỏ hơn so với tổng thể cho phép thu thập được nhiều thông tin chi tiết hơn
– Mẫu được rút ra từ tổng thể không phản ánh được bức tranh đầy đủ về tổng thể Tuy nhiên với cách lấy mẫu chính xác và một cỡ mẫu đủ lớn sẽ cho bức tranh rõ ràng về tổng thể đủ phục vụ cho mục đích ra quyết định
Ø Vậy một cỡ mẫu như thế nào là đủ lớn? Phải sử dụng các công thức tính toán trên cơ sở am hiểu đặc trưng của tổng thể (đề cập ở phần sau)
Trang 3Các cách tiến hành chọn mẫu
• Chọn mẫu ngẫu nhiên: là đảm bảo cho tất cả các
đơn vị của tổng thể được chọn vào mẫu một cách
ngẫu nhiên, không phụ thuộc vào ý muốn chủ quan
của người chọn mẫu
• Chọn mẫu phi ngẫu nhiên: là các đơn vị được chọn
vào mẫu phụ thuộc vào ý muốn chủ quan của người
đứng ra chọn mẫu (xem chi tiết giáo trình)
9
Các phương pháp chọn mẫu ngẫu nhiên
• Chọn ngẫu nhiên đơn giản
• Chọn ngẫu nhiên hệ thống (chọn máy móc)
• Chọn mẫu phân tổ (phân loại)
• Chọn mẫu phân tầng (nhiều cấp)
• Chọn mẫu chùm (cả khối)
10
Chọn mẫu ngẫu nhiên đơn giản (RS)
• RS được coi là xuất phát điểm của các phương
pháp chọn mẫu
• Đặc điểm của phương pháp: tất cả các đơn vị
của tổng thể có xác suất được chọn vào mẫu
bằng nhau
Ø Phương pháp phi chính thức: chọn ngẫu nhiên
các đơn vị Cách làm khá đơn giản => áp dụng
cho các tổng thể có quy mô nhỏ
Chọn mẫu ngẫu nhiên đơn giản (RS)
Ø Phương pháp chính thức: sử dụng bảng số ngẫu
nhiên => áp dụng cho tổng thể có quy mô lớn Năm bước áp dụng phương pháp này
i. Xây dựng dàn chọn mẫu: liệt kê tất cả các đơn vị của tổng thể
ii. Đánh số các đơn vị tổng thể bắt đầu từ 1 iii. Xác định cỡ mẫu
iv. Xác định số kí tự trong bảng số ngẫu nhiên sử dụng để chọn mẫu
v. Chọn vào mẫu các đơn vị tổng thể phù hợp với các số ngẫu nhiên được lựa chọn
Trang 4Bài tập tình huống 1
• Đọc tài liệu được phân phát và tiến hành chọn
mẫu ngẫu nhiên 10 người từ dàn chọn mẫu
13
Khi nào thì áp dụng RS
• Khi có dàn chọn mẫu đầy đủ và chính xác
• Khi tổng thể tập trung theo khu vực địa lý => giảm thiểu chi phí đi lại
• Nhược điểm của phương pháp RS
– Không phải lúc nào cũng có sẵn dàn chọn mẫu – Chi phí đi lại tăng
14
Chọn mẫu ngẫu nhiên hệ thống
• Tương tự RS nhưng đơn giản hơn
• Các bước tiến hành chọn mẫu ngẫu nhiên hệ thống
– Xây dựng dàn chọn mẫu
– Xác định quy mô tổng thể
– Xác định quy mô mẫu
– Tính khoảng cách chọn mẫu bằng cách lấy quy mô tổng
thể chia cho quy mô mẫu
– Chọn ngẫu nhiên điểm bắt đầu
– Sử dụng khoảng cách chọn mẫu để chọn các đơn vị tiếp
theo
Bài tập tình huống 2
• Tiến hành chọn mẫu ngẫu nhiên hệ thống 5 người
từ dàn chọn mẫu trong tài liệu được phân phát
Trang 5Ưu nhược điểm của chọn ngẫu nhiên hệ thống
• Ưu điểm:
– Cách chọn mẫu đơn giản hơn
– Giảm đáng kể thời gian và công sức so với RS
• Nhược điểm
– Tương tự RS
– Sai số hệ thống có thể xảy ra do cách chọn mẫu
17
Chọn mẫu phân tổ (phân loại)
• Chọn mẫu phân tổ cho mẫu có tính đại biểu cao hơn
và như vậy kết quả suy rộng từ mẫu cho tổng thể sẽ chính xác hơn
• Tuy nhiên thủ tục chọn mẫu sẽ phức tạp hơn
18
Các bước tiến hành chọn mẫu phân tổ
• Chọn biến phân tổ
• Phân tổ tổng thể theo biến phân tổ
• Áp dụng chọn mẫu hệ thống hoặc ngẫu nhiên để
chọn mẫu trong mỗi tổ
• Thường thì cỡ mẫu ở mỗi tổ được chọn tỉ lệ với quy
mô của tổ nhưng cũng có thể không theo tỉ lệ với
quy mô
Một ví dụ về chọn mẫu phân tổ (1)
• Lấy mẫu 100 doanh nghiệp từ tổng thể 2000 doanh nghiệp trên địa bàn TP Hà Nội
• Phân tổ tổng thể theo hình thức sở hữu:
– Doanh nghiệp nhà nước (SOEs): 500 – Doanh nghiệp tư nhân trong nước (PEs): 1200 – Doanh nghiệp có vốn đầu tư nước ngoài (FIEs): 300
• Yêu cầu: Chọn mẫu tỉ lệ với quy mô tổng thể ở mỗi
tổ
Trang 6Một ví dụ về chọn mẫu phân tổ (2)
• Các kí hiệu
– h: tổ thứ h
– N h : quy mô của tổng thể ở tổ h =>
– n h : số đơn vị mẫu được chọn ở tổ h =>
– là tỉ lệ quy mô các đơn vị trong tổ h so với tổng thể
=>
• Mẫu được chọn ở mỗi tổ bao gồm =>
» SOEs:
» PEs:
» FIEs:
1200
2000
300
2000
500
2000
1
h h
N= ∑N
1
h h
n= ∑n
h
W N h
N
=
1
1
h h
W =
∑
21
Sơ đồ mô phỏng chọn mẫu phân tổ
• Biến phân tổ: hình thức sở hữu
SOEs (500)
PEs (1200)
FIEs (300)
25
60
15
22
Yêu cầu khi tiến hành chọn mẫu phân tổ
• Tỉ lệ qui mô của mỗi tầng so với tổng thể cần
được biết trước
• Việc chọn mẫu phải được thực hiện riêng biệt ở
mỗi tầng
• Mức độ đồng nhất về thông tin của các đơn vị
nghiên cứu trong mỗi tầng càng cao, độ chính xác
của ước lượng càng cao
h
W
Ưu nhược điểm của chọn mẫu phân tổ
• Ưu điểm: cho mẫu có tính đại biểu cao hơn
• Nhược điểm:
– Một số nhược điểm giống như RS – Thủ tục chọn mẫu phức tạp hơn
Trang 7Chọn mẫu phân tầng (chọn nhiều cấp)
• Tương tự như chọn mẫu phân tổ nhưng liên quan đến
nhiều giai đoạn
• Phương pháp này được áp dụng khi biến động của
các đơn vị nghiên cứu ở các giai đoạn khác nhau là
cao hoặc để giảm kinh phí điều tra do các đơn vị
nghiên cứu không tập trung về mặt địa lý
• Ví dụ về chọn mẫu 100 doanh nghiệp
– Giả sử các doanh nghiệp có vị trí địa lý rất rải rác
– Kinh phí điều tra lớn
– Giải pháp: chọn mẫu phân tầng
25
Chọn mẫu phân tầng: ví dụ
• Chọn mẫu 100 doanh nghiệp theo nhiều giai đoạn - các bước tiến hành
i. Chia Hanoi ra thành các khu vực địa lý nhỏ (quận/huyện) - Đơn vị chọn mẫu cấp 1 (PSU)
ii. Nếu quan tâm đến thành thị/nông thôn thì chia các quận theo 2 nhánh thành thị/nông thôn
iii. Phân bổ số quận/huyện được lựa chọn cho mỗi nhánh dựa vào tỉ lệ quận/
huyện trong tổng thể
iv. Dùng phương pháp chọn mẫu ngẫu nhiên hoặc ngẫu nhiên hệ thống để chọn quận/huyện
v. Xây dựng dàn chọn mẫu cho mỗi quân/huyện được chọn
vi. Phân tổ dàn chọn mẫu theo hình thức sở hữu vii. Phân bổ số doanh nghiệp được chọn cho mỗi tầng viii. Dùng phương pháp chọn mẫu ngẫu nhiên hoặc ngẫu nhiên hệ thống để chọn doanh nghiệp – đơn vị chọn mẫu cấp cuối cùng
26
Sơ đồ mô phỏng chọn mẫu phân tầng
Urban
Rural
District A
District K District 1
District N
SOEs PEs
FIEs
Các vấn đề cần xem xét khi sử dụng chọn
mẫu phân tầng
• Số lượng các đơn vị chọn mẫu cấp 1,2
• Nguyên tắc: tối đa hóa đơn vị chọn mẫu cấp 1,2,
và tối thiểu hóa đơn vị chọn mẫu ở cấp cuối cùng
• Quy luật bù trừ giữa tính đại biểu của mẫu và kinh phí điều tra
Trang 8Chọn mẫu chùm (cả khối)
Trong chọn mẫu chùm trước hết tổng thể chung
được chia thành các khối sau đó chọn ngẫu nhiên
một số khối để điều tra Các đơn vị mẫu không
phải là từng đơn vị lẻ tẻ mà từng khối đơn vị
(chùm)
29
Chọn mẫu chùm và chọn nhiều giai đoạn
• Nguyên tắc chọn: Đầu tiên một số cụm lớn được lựa
chọn, và cứ tiếp tục chọn các cụm nhỏ hơn cho đến khi các đơn vị nghiên cứu được chọn ra từ các cụm ở giai đoạn cuối cùng
• Ví dụ: Để điều tra sinh viên trong một tỉnh Đầu tiên
ta chọn một số trường Từ các trường này chọn ra một
số lớp rồi điều tra tất cả các sinh viên của các lớp được chọn
30
Đặc điểm của chọn mẫu chùm
• Ưu điểm: tổ chức gọn nhẹ, giảm được chi phí;
• Nhược điểm: do số đơn vị được chọn chỉ tập
trung vào một số khối nên có thể dẫn đến sai số
lớn nếu giữa các khối có sự khác biệt nhau
nhiều;
• Điều kiện vận dụng: Chỉ nên áp dụng trong
trường hợp giữa các đơn vị trong một khối có sự
khác nhau đáng kể song giữa các khối lại giống
Bài tập tình huống 3
• Bạn được yêu cầu lấy một mẫu 300 sinh viên từ tổng thể 4000 sinh viên hệ chính quy năm thứ nhất của NEU để nghiên cứu thái độ học tập của sinh theo vùng địa lý (Bắc, Trung, Nam);
nơi sinh (thành thị/nông thôn), giới tính (nam/nữ) Giả sử bạn
có dàn chọn mẫu từ phòng đào tạo Dàn chọn mẫu có các thông tin về tên, nơi sinh, giới tính, nơi ở hiện tại, số điện thoại Từ dàn chọn mẫu, bạn tính được:
– 70% sinh viên đến từ miền Bắc và 30% đến từ miền Trung – Một nửa sinh viên của mỗi vùng sinh ra ở nông thôn – Sinh viên nữ chiếm 60% ở cả khu vực thành thị và nông thôn trong mỗi vùng
• Yêu cầu: Trình bày phương pháp lấy mẫu mà bạn cho là phù hợp nhất để đảm bảo mẫu mang tính đại biểu cao và giải thích tại sao?
Trang 9Xác định quy mô mẫu
• Quy mô mẫu phụ thuộc vào các yếu tố sau:
– Mức độ tin cậy của các ước lượng từ cuộc điều tra (1)
– Tính đồng nhất (homogeneity) của các đơn vị tổng thể (2)
– Chất lượng của số liệu thu thập được từ cuộc điều tra (3)
– Thời gian và kinh phí cho cuộc điều tra (4)
33
Xác định quy mô mẫu
• Quy mô mẫu được xác định dựa vào công thức
do Cochran (1977) đề xuất:
2 0
0
trong do 1
1 : kiem dinh z - tieu chuan (1) p: ap dung cho truong hop uoc luong % - tieu chuan (2) d: do chinh xac cua uoc luong - lien quan den z
N z
−
+
34
Sai số chọn mẫu và sai số phi chọn mẫu
• Sai số chọn mẫu:
– Xảy ra do chỉ tiến hành điều tra một phần của tổng thể
nghiên cứu
– Sai số chọn mẫu là khác biệt giữa kết quả tính toán trên mẫu
và kết quả tính toán trên tổng thể
Ø Ví dụ: chênh lệch giữa trung bình mẫu và trung bình
tổng thể
• Sai số phi chọn mẫu:
– Là chênh lệch giữa giá trị thực và giá trị thu được qua điều
tra của đối tượng điều tra
– Sai số này xảy ra ở tất cả các giai đoạn của quá trình điều tra
do rất nhiều nguyên nhân
Các nguyên nhân của sai số phi chọn mẫu
• Sai số do xác định mục đích nghiên cứu
• Sai số do xác định đối tượng điều tra
• Sai số do thiếu định nghĩa rõ ràng cho tiêu thức điều tra
• Sai số phát sinh trong thiết kế bảng hỏi và hướng dẫn cách ghi phiếu
• Sai số trong chuẩn bị địa bàn điều tra
• Sai số do tuyển chọn và tập huấn ĐTV
• Sai số trong lựa chọn phương pháp điều tra
• Sai số do đơn vị điều tra không trả lời
• Các loại sai số khác
Trang 10Tóm tắt chương
• Mục đích của môn học
• Khái niệm và đối tượng của điều tra xã hội học
• Quy trình của một cuộc điều tra xã hội học
• Quy trình xây dựng một phương án điều tra
• Các phương pháp chọn mẫu
Bài tập
• Đọc phương án điều tra trang 203-210 và xác định 7 nội dung của phương án điều tra