Bài giảng Nghiên cứu Marketing - Chương 5: Phương pháp chọn mẫu cung cấp các kiến thức giúp người học có thể hiểu được các khái niệm, các vấn đề cần giải quyết đối với một cuộc điều tra mẫu, quy trình chọn mẫu, sai số trong điều tra chọn mẫu, chọn mẫu trực tuyến. Mời các bạn tham khảo.
Trang 1Phương pháp chọn mẫu
Trang 3Tại sao phải chọn mẫu nghiên cứu?
Trang 4Các khái niệm cơ bản trong chọn mẫu
Tổng thể (Population): thị trường nhà nghiên cứu cần nghiên cứu để thỏa mãn mục đích và phạm vi nghiên cứu của mình Ký hiệu: N
Ví dụ: Điều tra nhu cầu tiêu thụ bia 333 của người tiêu dùng tại TP Long Xuyên có độ tuổi từ 18-45
Tổng thể: NTD tại TP Long Xuyên từ 18 - 45 tuổi
Trang 5Các khái niệm cơ bản trong chọn mẫu
Phần tử (Element): đối tượng cần thu thập
thông tin, là đơn vị nhỏ nhất của đám đông, đơn
vị cuối cùng của quá trình chọn mẫu
Ví dụ: Những thành viên tại TP Long Xuyên có
độ tuổi từ 18 – 45 là phần tử
Đơn vị (sampling Units): đám đông được
chia thành nhiều nhóm, mỗi nhóm được gọi là
đơn vị chọn mẫu
Ví dụ: Các quận, huyện, hộ gia đình là đơn vị mẫu
Hộ gia đình: tập hợp các thành viên cùng ăn chung và sống chung trong một nhà
Trang 6Các khái niệm cơ bản trong chọn mẫu
Khung chọn mẫu (Sampling Frame): danh sách
liệt kê thông tin cần thiết của tất cả các đơn vị và phần
tử của đám đông để thực hiện việc chọn mẫu
Ví dụ:
Tổng thể là sinh viên: khung chọn mẫu là danh sách lớp
Điều tra hộ gia đình ở các TP lớn thì khung chọn mẫu
là danh bạ điện thoại
Điều tra đối tượng kinh doanh mua bán thì khung
chọn mẫu có thể là danh sách nộp thuế ở chi cục,
phòng thuế
Nhược điểm: khi một thị trường mà thông tin thứ cấp
về dân số chưa hoàn chỉnh thì việc xác định khung
chọn mẫu rất khó khăn và tốn kém
Trang 7Hiệu quả chọn mẫu
Hiệu quả thống kê của một mẫu được đo lường
dựa vào sai lệch chuẩn của ước lượng Một mẫu có hiệu quả thống kê cao hơn mẫu khác khi cùng
một kích thước nó có sai lệch chuẩn nhỏ hơn
Hiệu quả kinh tế của một mẫu được đo lường dựa vào chi phí thu thập thông tin của mẫu với độ
chính xác mong muốn của nó
Trang 8Các vấn đề cần giải quyết đối với một cuộc điều tra mẫu
Vấn đề 1: Những thông tin gì cần tìm hiểu và
nghiên cứu?
Vấn đề 2: Tổng thể nào là phù hợp?
Vấn đề 3: Việc lấy mẫu được thực hiện như thế
nào?
Vấn đề 4: Thông tin được thu thập như thế nào?
Vấn đề 5: Việc suy luận các đặc trưng của mẫu
thành các đặc trưng của tổng thể được thực hiện
ra sao?
Vấn đề 6: Có thể kết luận gì đối với tổng thể?
Trang 9Vấn đề 1
Điểm khởi đầu và động lực của quá trình nghiên cứu
Nếu thông tin đã có sẵn hoặc khó có khả năng
thu thập thì không tiến hành quá trình chọn mẫu
Xác định rõ vấn đề quan tâm ngay từ khi bắt đầu quá trình chọn mẫu
Đặt trọng tâm khai thác thông tin ở những vấn đề chính
Trang 10Vấn đề 2
Đơn vị tổng thể
Thời gian lấy mẫu
Đơn vị mẫu Phạm vi
lấy mẫu
Điều tra nhu cầu dầu gội trên địa bàn TP Long Xuyên
Tất cả NTD nữ từ 18 tuổi trở lên
Trang 11Vấn đề 2
Thực tế có sự sai biệt giữa tổng thể và tổng thể
điều tra (tổng thể thực)
Tổng thể điều tra là tập hợp các đơn vị, phần tử
mà từ đó có một số mẫu điều tra thực sự
Tổng thể thực đôi khi không thể xác định
Xác định đơn vị mẫu giúp chỉ rõ đơn vị nhỏ nhất
mà mẫu sẽ được chọn Đơn vị mẫu có thể một hay nhiều phần tử: khu phố, công ty, hộ gia đình hay từng cá nhân
Tổng thể điều tra < Tổng thể
Trang 12 Cỡ mẫu tùy thuộc chủ yếu vào yêu cầu về
độ chính xác của suy luận thống kê và điều kiện tài chính của cuộc điều tra
Trang 14Vấn đề 5
Hiểu rõ bản chất của vấn đề nghiên cứu để sử
dụng đúng phương pháp suy luận
Phương pháp xử lý thông tin sai sẽ làm một trong những nguồn dẫn đến sai lầm trong kết luận
nghiên cứu
Trang 165. Thiết lập sơ đồ và kế hoạch lấy mẫu
6. Tiến trình chọn mẫu ngoài thực địa
Trang 17Xác định tổng thể N
Trang 18Xác định thị trường nghiên cứu
Được tiến hành khi thiết kế nghiên cứu
Trang 20Xác định khung chọn mẫu
Khung chọn mẫu là danh sách liệt kê người tiêu
dùng tại Tp Long Xuyên có độ tuổi từ 18 đến 35 cùng các dữ liệu cá nhân cần thiết cho việc chọn mẫu như: họ tên, địa chỉ, độ tuổi…
Trang 21
Xác định
PP chọn mẫu
Trang 22Chọn mẫu phi xác suất
• Thuận tiện
• Phán đoán
• Phát triển mầm
• Quota
Trang 23So sánh hai phương pháp chọn mẫu
Tính đại diện cao
Tổng quát hóa cho
đám đông
Ưu điểm
Tiết kiệm được thời gian và chi phí
Tốn kém thời gian và
chi phí
Nhược điểm
Tính đại diện thấp không tổng quát
Nghiên cứu mô tả và
nhân quả
Phạm vi
sử dụng
Nghiên cứu khám
phá
Trang 24Các phương pháp chọn mẫu theo xác suất
• Các mẫu tiếp theo sử dụng bước nhảy N=2000, n=200 k=N/n=10
• Mẫu tiếp 14(4+10), 24(14+10 )
•Chia đám đông
ra thành nhiều tầng gồm nhiều nhóm nhỏ
•Cùng nhóm đồng nhất, khác nhóm dị biệt
•Tính tỉ lệ của từng nhóm
• Ưu: tính đại diện cao
•Nhược:khó khăn
• Tổng thể quá lớn, địa bàn rộng
•Chia đám đông
ra thành nhiều nhóm nhỏ
• Cùng nhóm dị biệt, khác nhóm đồng nhất
• Tiếp tục chia các nhóm thành từng nhóm nhỏ
• Chọn nhóm
Trang 25Ngẫu nhiên đơn giản Simple Random Sampling (SRS)
Mỗi đơn vị mẫu có cơ hội bằng nhau để được chọn vào mẫu
Tạo ra những số ngẫu nhiên bằng cách bốc thăm hoặc sử dụng bảng tính Excel
Ưu điểm: tính đại diện cao và kết quả không chệch
Nhược điểm: tất cả các đơn vị mẫu cần được xác định
Tên STT
Nguyệt 1 Quang 2 Hằng 3 Nga 4 Tính 5
… Khang 200
Trang 26Ngẫu nhiên hệ thống (Systematic Random Sampling)
Ưu điểm: nhanh hơn và dễ hơn chọn mẫu ngẫu nhiên đơn giản
Nhược điểm: có thể có mẫu ẩn trong dữ liệu, có thể làm sai lệch kết quả nghiên cứu nhiều hơn
Tên STT
Nguyệt 1 Quang 2 Hằng 3 Nga 4 Tính 5
… Khang 200
Trang 27Chọn mẫu phân tầng (Stratified Sampling)
Chọn mẫu phân tầng theo tỉ lệ:
Chọn ngẫu nhiên các đơn vị từ mỗi tầng Cỡ mẫu từ mỗi tầng phụ thuộc vào kích cỡ của tầng tương quan với tổng thể mục tiêu
Ưu điểm: mẫu được chọn có tính đại diện cao, giảm đáng kể sai số trong nghiên cứu, tiết kiệm chi phí và thời gian
Nhược điểm: lựa chọn tiêu thức phân tầng khó khăn và phức tạp vì phải phù hợp với mục tiêu nghiên cứu và đảm bảo có đầy
đủ dữ liệu thứ cấp để dễ phân tầng
Trang 29
Chọn mẫu phân tầng
Phân tầng không theo tỉ lệ:
Tương tự như phương pháp phân tầng theo tỉ lệ Khác nhau là cỡ mẫu từ mỗi tầng độc lập với
kích thước của tầng tương quan với kích thước tổng thể
Trang 30Chọn mẫu theo cụm, nhóm (cluster sampling)
Ưu điểm: hiệu quả chi phí
Nhược điểm: một nhóm không thể mang tính đại diện cho tổng thể
4 tỉnh
m= 20 huyện
M=12 tỉnh
Trang 32Các phương pháp chọn mẫu phi xác suất
Thuận
tiện
Phán đoán
Phát triển mầm
• Chọn mẫu nhanh nhưng sai số khá lớn, tính đại diện phụ thuộc vào kiến thức và kinh nghiệm của nhà nghiên cứu
• Chọn ngẫu nhiên một số phần tử cho mẫu
• Phần tử ban đầu giới thiệu các
phần tử khác cho mẫu
• Ưu điểm: tiết kiệm được thời gian
• Nhược: sai số lớn
• Dựa vào đặc tính kiểm soát xác định trong đám đông để chọn số phần tử cho mẫu sao cho chúng có cùng tỉ
lệ của đám đông
• Phương pháp phổ biến nhất trong nghiên cứu Marketing
Trang 34Chọn mẫu theo quota
Hai thuộc tính kiểm soát
Nam (50%) Nữ (50%) (độ tuổi) 20-30 (30%)
Trang 35Chọn mẫu theo quota
Ba thuộc tính kiểm soát
Nữ
Nữ
Nữ Nam Nam
Nữ
Cao
TB Thấp Cao
TB Thấp Cao
TB
12
Tổng n=200
Trang 36Xác định
PP chọn mẫu
Xác định
cỡ mẫu
Trang 37 Cách tiếp cận dựa trên phân tích thống kê
(những đòi hỏi phân tích thống kê)
Cách tiếp cận dựa vào khoảng tin cậy (The
confidence interval approach)
Trang 38Xác định cỡ mẫu
Để xác định kích thước mẫu, ta phải xác định:
Khoảng dao động e của thông số đám đông và thông số mẫu
Mức tin cậy
Trang 39Một số định nghĩa
Thông số (parameter): đặc điểm mô tả một
tổng thể được gọi là một thông số (ví dụ:
trung bình tổng thể)
Thống kê (statistic): một đặc điểm mô tả một
mẫu được gọi là thống kê (ví dụ: trung bình
mẫu)
Trang 40Cách tiếp cận khoảng tin cậy
Ví dụ: một mẫu 100 sinh viên được chọn để đo
lường tuổi trung bình của sinh viên đại học An Giang
Trung bình mẫu (sample mean) = 20.0
Trung bình tổng thể (population mean) = 21.5
Sai số mẫu (sampling error) = 1.5
Một mẫu gồm 10o gia đình được chọn để đo lường số trẻ em trung bình của mỗi gia đình ở An Giang
Trung bình mẫu: 2.05
Trung bình tổng thể = ?
Trang 41Độ tin cậy (trung bình)
Điểm ước lượng (point of estimate): một số liệu thống kê ước lượng giá trị của một thông
số
Khoảng tin cậy (Confidence intervals): ước lượng điểm cộng/ trừ một giới hạn sai số
Trang 42 Độ tin cậy (Confidence level): xác suất mà
khoảng tin cậy bao gồm thông số tổng thể
Trang 43Khoảng tin cậy (trung bình)
Giới hạn sai bị ảnh hưởng bởi
Độ tin cậy (α)
Độ lệch chuẩn tổng thể được ước lượng (σ)
Cỡ mẫu (n)
• Để đạt độ tin cậy 90%, z value = 1.65
• Để đạt độ tin cậy 95%, z value = 1.96
• Để đạt độ tin cậy 99%, z value = 2.58
Trang 44Khoảng tin cậy (trung bình)
Tuổi trung bình của người dân ở An Giang là bao nhiêu?
Cỡ mẫu =100
Trung bình mẫu = 35.0
Độ lệch chuẩn tổng thể được ước lượng = 12
Khoảng tin cậy 95%= 35 +/- 1.96*[12 /sqrt(100)]
Trang 45Sử dụng khoảng tin cậy (TB) để tính cỡ mẫu
Nếu giới hạn sai số được cụ thể, chúng ta có thể sử dụng
công thức khoảng tin cậy để tính cỡ mẫu
Ví dụ, chúng ta đang kiểm tra thời gian trung bình các sinh
viên ĐH An Giang dành cho Facebook mỗi ngày Độ lệch
chuẩn được biết là 5 giờ Cỡ mẫu là bao nhiêu để cho phép
95% khoảng tin cậy với giới hạn sai số là 1 giờ?
n = [1.96 x 5 /1] 2 = 96.04 = 97
Trang 46Khoảng tin cậy (tỉ lệ)
Tỉ lệ các hộ gia đình ở TP HCM có ít nhất 1 chiếc ô tô là bao nhiêu?
Cỡ mẫu = 200
Tỉ lệ mẫu = 76%
Tỉ lệ tổng thể = ?
Trang 47Khoảng tin cậy (tỉ lệ)
Khoảng tin cậy =
* Nếu cỡ mẫu nhỏ hơn 5% tổng thể, và np (1-p) >= 10, thì phân phối của tỉ lệ mẫu là xấp xỉ chuẩn
Tỉ lệ các hộ gia đình ở TP HCM có ít nhất 1 chiếc ô tô là bao nhiêu?
Trang 48Sử dụng khoảng tin cậy (tỉ lệ) để tính cỡ mẫu
Nếu giới hạn sai số được chỉ rõ, thì chúng ta có thể sử
dụng công thức khoảng tin cậy để tính toán cỡ mẫu
Ví dụ, chúng ta đang kiểm tra tỉ lệ sinh viên ĐHAG
thích tham gia các câu lạc bộ học thuật Nghiên cứu trước đây cho thấy 20% sinh viên thích các câu lạc bộ học thuật Cỡ mẫu bao nhiêu để cho phép khoảng tin cậy 95% với giới hạn sai số 5%?
n = 20% * (1-20%) * (1.96/5%) 2 = 245.9 = 246
Trang 49Cỡ mẫu và Tổng thể hạn chế nhỏ
Nếu một tổng thể nhỏ tương đối với cỡ mẫu được tính, một hệ số hiệu chỉnh nên được sử dụng để xác định cỡ mẫu
Một tổng thể được xem là nhỏ nếu cỡ mẫu lớn hơn 5% của tổng thể
Hệ số hiệu chỉnh = sqrt [(N-n) / (N-1)]
N: kích thước tổng thể mục tiêu
n: cỡ mẫu được sử dụng công thức cơ mẫu
Trang 50Xác định
PP chọn mẫu
Xác định cỡ mẫu
Thiết lập sơ
đồ và
kế hoạch lấy mẫu
Trang 51Thiết lập sơ đồ và kế hoạch lấy mẫu
Vẽ sơ đồ địa bàn nghiên cứu để thực hiện các vị trí của các đơn vị mẫu ngoài thực địa (mapping)
Xác định cụ thể các nội dung, công việc cần tiến hành khi lấy mẫu: số lượng, thời gian tiến hành
và kết thúc, dự trù kinh phí cho từng công việc, thực hiện, phân công nhân sự
Trang 52Xác định PP chọn mẫu
Xác định cỡ mẫu
Thiết lập sơ
đồ và kế hoạch lấy mẫu
Tiến hành chọn mẫu ngoài thực địa
Trang 53Tiến hành chọn mẫu
Triển khai chọn mẫu theo phương pháp và các
nội dung đã hoạch định
Theo dõi kiểm tra tiến độ thực hiện để đôn đốc và
hỗ trợ những khó khăn, biến cố đột xuất xảy ra
trong quá trình thực hiện
Trang 54Sai số trong điều tra chọn mẫu
error)
từ tổng thể không thích hợp
trung thực trong các câu trả lời
quá cao
Trang 55Nguồn sai số tiềm năng
•Thông tin thay thế
•Đo lường sai
•Không hài lòng trả lời
Trang 56Chọn mẫu trực tuyến (Online sampling techniques)
1 Chọn mẫu ngẫu nhiên trực tuyến (Random Online Sampling
2 Chọn mẫu trực tuyến mời gọi (Invitation
Online Sampling)
3 Chọn mẫu nhóm tham chiếu trực tuyến
(Online Panel Sampling)
4 Những phương pháp chọn mẫu trực tuyến khác
Trang 57Chọn mẫu ngẫu nhiên trực tuyến
Chọn ngẫu nhiên những người vào trang web
Tổng thể: những người truy cập trang web
mẫu ngẫu nhiên đơn giản
Nếu chương trình chọn mẫu bắt đầu một cách
ngẫu nhiên và đưa vào khoảng nhảy chọn mẫu
hệ thống
Chương trình chọn mẫu xem những người truy cậy trang web như những tầng lớp chọn mẫu phân tầng
Trang 58Chọn mẫu trực tuyến mời gọi
Những người trả lời tiềm năng được mời gọi điền vào bảng câu hỏi trên trang web cụ thể
Phải thiết lập mối quan hệ với người trả lời tiềm năng, có khả năng tham gia khảo sát bằng thư điện tử
Có thể chọn mẫu xác suất hay phi xác suất tùy thuộc vào nhóm đại diện thực sự của tổng thể
Trang 59Chọn mẫu nhóm tham chiếu trực tuyến
đích thực hiện những cuộc thăm dò trực tuyến với những mẫu đại diện
đảm bảo mẫu cuối cùng đúng cho tổng thể mục tiêu của nhà nghiên cứu
cho một khu vực địa lý rộng lớn nhà nghiên cứu có thể xác định các tham số mẫu như đại diện về đặc điểm địa
lý, thu nhập, giáo dục, gia đình…
chiếu phù hợp với tham số mẫu được quy định bởi nhà nghiên cứu
Trang 60Những phương pháp lấy mẫu trực tuyến khác
Cần phân tích những đặc điểm về cách thức lựa chọn những người trả lời tiềm năng
Ví dụ: một người trả lời có thể được yêu cầu
chuyển tiếp bảng câu hỏi cho bạn bè (lấy mẫu tham khảo)