Một số khái niệm Khung mẫu (sampling frame): Danh sách các đơn vị lấy mẫu có sẵn để phục vụ cho việc lấy mẫu. STT Hộ 1 Nguyễn Văn A 2 Trần Thị B 3 Trần Thị B 4 Lê Văn CChọn mẫu (sampling) Là quá trình lựa chọn một bộ phận tương đối nhỏ từ tổng thể với tích cách là đại diện cho tổng thể cần nghiên cứu. Dựa trên kết quả thu được từ mẫu, nhà nghiên cứu sẽ suy diễn rộng ra cho tổng thể.Vì sao phải chọn mẫu? Để có thông tin nhanh hơn và tiết kiệm hơn. Vd: muốn có số liệu về thu nhập của các hộ gia đình ở Việt Nam thì nên điều tra toàn bộ hay điều tra chọn mẫu? Trường hợp khi tiến hành điều tra làm biến dạng hay phá hủy thuộc tính của đơn vị Vd: thử độ bền của vỏ xe sản xuấtVì sao phải chọn mẫu? Trường hợp số đơn vị của hiện tượng vô hạn hoặc không xác định Vd: muốn có số liệu về những người bệnh cao huyết áp tại TPHCM Khi muốn so sánh các hiện tượng với nhau mà chưa có thông tin cụ thể hoặc khi muốn kiểm định một giả thuyết đặt ra, người ta thường dùng điều tra chọn mẫu để thu thập dữ liệu. Vd: kiểm tra tác dụng của một loại thuốc đối với điều trị tim mạchQuá trình chọn mẫu B1: Định nghĩa tổng thể và phần tử B2: Xác định khung lấy mẫu B3: Xác định kích thước mẫu B4: Xác định phương pháp chọn mẫu B5: Tiến hành lấy mẫu theo phương pháp đã chọn
Trang 1CÁC PHƯƠNG PHÁP CHỌN MẪU
Trang 2Điều tra chọn mẫu
Trang 4Điều tra chọn mẫu
Tóm tắt các đặc trưng
Suy diễn cho các tham số của tổng thể
Trang 5Điều tra chọn mẫu
Tổng thể là toàn bộ bóng đèn mới mà công ty A sản xuất (tuổi thọ trung bình của bóng đèn mới chưa biết)
Mẫu
Tóm tắt các đặc trưng
Suy diễn cho các tham số của tổng thể
200 bóng đèn được chọn để kiểm tra tuổi thọ
Tính tuổi thọ trung bình của
200 bóng đèn này Tuổi thọ trung bình của bóng
đèn mới
Trang 6Một số khái niệm
Khung mẫu (sampling frame): Danh sách các đơn vị lấy mẫu có sẵn để phục vụ cho việc lấy mẫu.
Trang 7Chọn mẫu (sampling)
Là quá trình lựa chọn một bộ phận tương đối nhỏ từ tổng thể với tích cách là đại diện cho tổng thể cần nghiên cứu.
Dựa trên kết quả thu được từ mẫu, nhà nghiên cứu sẽ suy diễn rộng ra cho tổng thể.
Trang 8Vì sao phải chọn mẫu?
Để có thông tin nhanh hơn và tiết kiệm hơn.
Vd: muốn có số liệu về thu nhập của các hộ gia đình ở Việt Nam thì nên điều tra toàn bộ hay điều tra chọn mẫu?
Trường hợp khi tiến hành điều tra làm biến dạng hay phá hủy thuộc tính của đơn vị
Vd: thử độ bền của vỏ xe sản xuất
Trang 9Vì sao phải chọn mẫu?
xác định
Vd: muốn có số liệu về những người bệnh cao huyết áp tạiTPHCM
thông tin cụ thể hoặc khi muốn kiểm định một giả thuyếtđặt ra, người ta thường dùng điều tra chọn mẫu để thuthập dữ liệu
Vd: kiểm tra tác dụng của một loại thuốc đối với điều trịtim mạch
Trang 13Hạn chế
(1) Trong nhiều trường hợp không mang tính khả thi vì không thể có được danh sách tất cả các đối tượng liên hệ, hoặc nhà nghiên cứu không
đủ thời gian để tiếp cận các đối tượng khi họ phân tán ở nhiều địa bàn cách xa nhau.
(2) Tốn kém nhiều thời gian và công sức
Trang 14Chọn mẫu phi xác suất
Nhà nghiên cứu chọn các phần tử vào mẫu không theo quy luật ngẫu nhiên
Không biết xác suất xuất hiện của các phần tử Chọn mẫu tùy thuộc vào nhà nghiên cứu.
Ví dụ đến siêu thị phỏng vấn các bà nội trợ về chi tiêu hàng ngày cho lương thực
Nhược điểm: ?
Trang 15Hạn chế
Việc chọn mẫu phải dựa vào kỹ năng của nhà nghiên cứu hay của nhân viên chọn mẫu.
Trang 16Phân loại
Chọn mẫu xác suất Chọn mẫu phi xác suất
Ngẫu nhiên đơn giản
(simple random) Lấy mẫu thuận tiện (convenience)
Trang 17Chọn mẫu ngẫu nhiên đơn giản
Quy trình:
đơn vị mẫu
trong danh sách
Ví dụ: Khảo sát thực trạng hiểu
biết về luật giao thông đường
bộ trong 1000 học sinh tại một
trường phổ thông trung học,
chọn mẫu ngẫu nhiên 100 học
Trang 18Câu hỏi
Theo danh sách chọn mẫu, người thu thập
dữ liệu phải phỏng vấn sinh kế của hộ A Nhưng hộ A đi vắng, hộ B (không có trong danh sách mẫu) sẵn sàng cung cấp
dữ liệu sinh kế của gia đình mình (hộ B) Người thu thập dữ liệu nên chờ hộ A về phỏng vấn hay phỏng vấn hộ B?
Trang 21Chọn mẫu hệ thống
Trang 22Chọn mẫu hệ thống
Trang 23Chọn mẫu phân tầng (stratified random)
Tổng thể được chia ra nhiều tầng
(strata) theo nguyên tắc: “cùng tầng
đồng nhất, khác tầng dị biệt”.
Để chọn phần tử trong mỗi tầng: có thể
dùng p.p hệ thống.
Số phần tử trong mỗi tầng được xác
định theo tỷ lệ hoặc không theo tỷ lệ
với kích thước tổng thể.
Ví dụ về các tầng: Theo địa lý: bắc,
trung, nam, 7 vùng kinh tế; Tôn
giáo/sắc tộc; mức thu nhập; giới tính,
Trang 24Chọn mẫu phân tầng
Trang 25Các phương pháp chọn mẫu ngẫu nhiên
c Chọn mẫu phân tầng
Trang 26Chọn mẫu theo nhóm/cụm (cluster)
Tổng thể được chia làm nhiều nhóm
(mỗi nhóm mang tính đại diện cho tổng
thể) và tuân theo nguyên tắc: “cùng
nhóm dị biệt, khác nhóm đồng nhất”.
Các nhóm sẽ được chọn một cách ngẫu
nhiên để tạo thành mẫu
Ví dụ: Chọn mẫu điều tra cá nhân hộ gia
đình
Bước 1: lựa chọn ngẫu nhiên một số
huyện.
Bước 2: các hộ gia đình được lựa chọn
trong các huyện vừa được chọn.
Bước 3: Tất cả cá nhân từ hộ được chọn 26
Trang 27Các phương pháp chọn mẫu ngẫu nhiên
d Chọn mẫu theo nhóm
Trang 28Chọn mẫu theo nhóm (cluster)
Ví dụ 2: Chuỗi cửa hàng thức ăn nhanh muốn tìm hiểu món ăn nào được đặt nhiều nhất.
B1: Chọn ngẫu nhiên một vài cửa hàng
B2: Hỏi ý kiến tất cả khách hàng tại các cửa hàng được chọn.
Trang 29Ví dụ
Một nhà phân tích thị trường ô tô khảo sát mức độ hài lòng của những người mới mua ô tô Danh sách có tên của 10.000 chủ xe, trong đó 2.500 người mua Ford, 2.500 người mua Honda, 2.500 người mua Toyota, 2.500 người mua GM Nhà phân tích này lấy một mẫu danh sách 400 chủ
xe bằng cách chọn ngẫu nhiên 100 chủ xe ở mỗi nhãn hiệu Nhà phân tích đang sử dụng phương pháp chọn mẫu nào? Giải thích.
29
Trang 30Câu hỏi
Giống và khác giữa chọn mẫu phân tầng và chọn mẫu theo nhóm?
Trang 32Bài tập cá nhân
Tình huống: Có một NC cần quy mô mẫu
500 SV năm một của 5 trường đại học Tổng số SV năm một của 5 trường là 10.000 với số lượng từng trường 1, 2, 3, 4,
5 là 2000, 2000, 1000, 2500, 2500 Sinh viên hãy cho biết cụ thể cách chọn mẫu
500 SV theo 4 cách của phương pháp chọn mẫu xác suất.
Trang 33Số liệu giả định về số hộ gia đình nông thôn có vốn đầu tư cho sản xuất, kinh doanh phân theo vùng của địa bàn “Y”
Sv cho biết cách chọn mẫu 20 hộ.
Trang 34Chọn mẫu thuận tiện (convenience)
Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ lấy thông tin.
Nhược điểm: Không xác định được sai số lấy mẫu và không thể kết luận cho tổng thể từ kết quả mẫu.
Sử dụng phổ biến khi bị giới hạn về thời gian
và chi phí.
Vd: phỏng vấn các bà nội trợ tại các siêu thị để tìm hiểu về hành vi tiêu dùng của người nội trợ.
34
Trang 35Chọn mẫu phán đoán (judgment)
Nhà nghiên cứu tự phán đoán sự thích hợp của các phần tử để mời họ tham gia vào mẫu.
Đặc điểm giống như chọn mẫu thuận tiện, nhưng nếu khả năng/kinh nghiệm phán đoán tốt sẽ cho mẫu tốt hơn thuận tiện.
Ví dụ muốn tìm hiểu thói quen tiêu dùng của phụ
nữ thành đạt, nhà nghiên cứu theo phán đoán sẽ chọn những phụ nữ ăn mặc sang trọng để phỏng vấn.
35
Trang 36Chọn mẫu theo lớp (quota)
phần tử sao cho chúng đảm bảo tỷ lệ của tổng thể vàcác đặc trưng kiểm soát
tuổi, giới tính, thu nhập, loại hình DN…
Vd Cần phỏng vấn 800 người có tuổi trên 18 tại 1 thànhphố Phân tổ theo giới tính và tuổi như sau: chọn 400người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn
400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên
36
Trang 37Chọn mẫu theo mầm (snow ball)
Chọn ngẫu nhiên những người phỏng vấn ban đầu, những người tiếp theo được chọn dựa trên sự giới thiệu của người trước
37
Trang 38Sai lệch liên quan đến việc chọn mẫu
Sai lệch do chọn mẫu (do tính đại diện của mẫu)
Sai lệch không do chọn mẫu (xảy ra trong quá trình phỏng vấn, hiệu chỉnh, nhập dữ liệu, ).
38
Trang 39Bài tập
kiện điện tử với số lượng lần lượt tại các nhà máy là20%, 50% và 30% Bộ phận quản lý chất lượng củacông ty muốn kiểm tra ngẫu nhiên chất lượng 100 linhkiện ở ba nhà máy nên yêu cầu mỗi nhà máy gửi sốlượng linh kiện như sau: A gửi 20, B gửi 50, C gửi 30
ngẫu nhiên đơn giản không?
phương pháp nào?
Trang 40Bài tập
tử của những người trong độ tuổi từ 18 trở lên Ở gầnđịa bàn của công ty A có năm công ty khác nên A đếnphỏng vấn các nhân viên của năm công ty này
pháp gì?
ngân hàng điện tử của mẫu này có phản ánh đúng tổngthể không?
Trang 41BÀI TẬP
Cho danh sách 100 công ty được đánh số thứ tự từ 0 đến 99 và sản lượng sản xuất năm qua (ĐTV: 10.000 bảng Anh)
1 Lấy các mẫu theo phương pháp ngẫu nhiên đơn giản, mỗi mẫu chọn 10 công ty.
2 Tính trung bình sản lượng của các công
ty ở các mẫu.
Trang 42BÀI TẬP
Cho danh sách 100 công ty được đánh số thứ tự từ 0 đến
99 và sản lượng sản xuất năm qua (ĐTV: 10.000bảng Anh)
3 Giả sử trung bình tổng thể là 66,08900 bảng Anh.Trung bình mẫu so với trung bình tổng thể có sai lệchkhông?
Trang 43có thêm các công ty khác vào mẫu Nếu thăm bốc trùngthứ tự công ty thì bốc lại.
01/04/2017
701014 chuong 5- Thiết kế nghiên cứu
và các phương pháp lấy mẫu 43
Trang 44tệ hơn so với trung bình hai mẫu trên?
Trang 45701014 chuong 5- Thiết kế nghiên cứu
và các phương pháp lấy mẫu 45
Trang 46 Giả sử trung bình tổng thể là 660.89 Trung bình mẫu
so với trung bình tổng thể có sai lệch không?
Trang 47BÀI TẬP
như dưới đây Hãy chọn mẫu 10% theo quota
01/04/2017
701014 chuong 5- Thiết kế nghiên cứu
và các phương pháp lấy mẫu 47
Trang 48XÁC ĐỊNH CỠ MẪU
Xác định cỡ mẫu (số đơn vị mẫu) chính là xác định số lượng đơn vị điều tra trong tổng thể mẫu để tiến hành thu thập số liệu Yêu cầu của
cỡ mẫu là vừa đủ để vừa đảm bảo độ tin cậy cần thiết của số liệu điều tra vừa đảm bảo phù hợp với điều kiện về nhân lực và kinh phí và có thể thực hiện được, tức là có tính khả thi.
Trang 49với chỉ tiêu bình quân và chỉ tiêu tỷ lệ.
- t là hệ số tin cậy
- ε là phạm vi sai số chọn mẫu.
Trang 50hệ số tin cậy và xác suất tin cậy
Trang 51XÁC ĐỊNH CỠ MẪU
để xây dựng và quyết định phương án điều tra Trong
đó, số đơn vị tổng thể chung (N) lấy từ số liệu thống
(ε) do người tổ chức điều tra yêu cầu cho từng cuộc
p(1-p)) thì phải dựa và kết quả của các cuộc điều tratrước đó;
Trang 52XÁC ĐỊNH CỠ MẪU
hoặc có nhưng không tính được phương sai thì sẽ xử
lý như sau:
điều tra mẫu nhỏ để xác định phương sai
Hoặc
phương sai lớn nhất: p(1-p) = 0,5 x (1-0,5) =0,25
Trang 53VÍ DỤ XÁC ĐỊNH CỠ MẪU
Hãy xác định số hộ (cỡ mẫu) để điều tra thu nhập 1năm của hộ nông dân trên địa bàn tỉnh “Y” có200.000 hộ gia đình (N = 200.000), với xác xuất tincậy là 0,9875 (tức là t = 2,5), phạm vi sai số chọnmẫu (ε) không vượt quá 2,52 triệu đồng/năm trongđiều kiện có phương sai về thu nhập của hộ:
Trang 54VÍ DỤ XÁC ĐỊNH CỠ MẪU
Hãy xác định số hộ (cỡ mẫu) để điều tra thu nhập 1năm của hộ nông dân trên địa bàn tỉnh “Y” có200.000 hộ gia đình (N = 200.000), với xác xuất tincậy là 0,9875 (tức là t = 2,5), phạm vi sai số chọnmẫu (ε) không vượt quá 2,52 triệu đồng/năm trongđiều kiện có phương sai về thu nhập của hộ:
Trang 55Xác định cỡ mẫu trong nghiên cứu
Trang 56Xác định cỡ mẫu trong nghiên cứu
hỏi x số nhóm
Trang 57THANG ĐO LIKERT
Là thang đo thường có 5 (hoặc 7,9) mức độ
Ví dụ: “Xin đọc kỹ các phát biểu sau Sau mỗi phát biểu, vui lòng trả lời bằng cách khoanh tròn vào con số tương ứng với chọn lựa của Anh/Chị, với qui ước:
Số 1: Rất không đồng ý với câu phát biểu
Số 2: Không đồng ý với câu phát biểu
Số 3: Trung hoà với câu phát biểu
Số 4: Đồng ý với câu phát biểu
Số 5: Rất đồng ý với câu phát biểu”
Trang 581 Hãy xác định số hộ (cỡ mẫu) để xác định mức thu
nhập trung bình hàng năm của các hộ gia đình biết
đồng
Trang 591 Hãy xác định số hộ (cỡ mẫu) để xác định mức thu nhập
trung bình hàng năm của các hộ gia đình biết
a xác xuất tin cậy là 0,9875 (tức là t = 2.5),
b phạm vi sai số chọn mẫu (ε) không vượt quá 20 ngàn đồng
c Độ lệch chuẩn về thu nhập của hộ: S= 160 (S 2 = 160 2 )
Nếu xác xuất tin cậy là 0,9875
Nếu xác xuất tin cậy là 0,95 (t=2)
(hộ)
Trang 601 Ở 1 tỉnh người ta tổ chức điều tra để xác định tỷ lệ mù
chữ ở độ tuổi lớn hơn 8 tuổi biết
tỉnh này là 9%
Tính quy mô mẫu cho cuộc điều tra mù chữ năm nay
Trang 611 Ở 1 tỉnh người ta tổ chức điều tra để xác định tỷ lệ mù
chữ ở độ tuổi lớn hơn 8 tuổi biết