Trang 1 BỘ CÔNG THƯƠNG Trang 8 yĐơn vị sampling unit: đí̉ thuận tiệnẫyĐơn vị sampling unit: đí̉ thuận tiệnẫtrong việc chọn mẫu người ta chia đâmđông thănh nhiều nhóm có đặc tínhtrong vi
Trang 1BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TP.HCM
KHOA QUẢN TRỊ KINH DOANH VÀ DU LỊCH
Trang 3NỘI DUNG CHƯƠNG 3
Trang 8yĐơn vị (sampling unit): để thuận tiện
yKhung chọn mẫu (sampling frame): là
danh sách liệt kê dữ liệu cần thiết của
yKhung chọn mẫu (sampling frame): là
danh sách liệt kê dữ liệu cần thiết của
tất cả các đơn vị và phần tử của đám
danh sách liệt kê dữ liệu cần thiết của
tất cả các đơn vị và phần tử của đám
Trang 10ĐƠN VỊ: Chia Tp HCM thành quận 1, 2, 3…
KHUNG CHỌN MẪU: NC tại Tp HCM tuổi
Trang 11Xác định TT
NC
Xác định khung chọn
mẫu
Xác định kích thước mẫu
Chọn phương pháp chọn mẫu
Tiến hành chọn mẫu
Trang 15yVí dụ: ước lượng tỷ lệ hộ gia đình được tiếp cận với nước sạch trong
được tiếp cận với nước sạch trong thôn A
yKhung lấy mẫu: danh sách các hộ
Trang 16yĐơn giảnĐơn giản
yDễ dàng trong việc đo lường sai
lệch chọn mẫu
Trang 17Nh điể
yNhược điểm:
yPhải liệt kê tất cả các phần tử
yPhải liệt kê tất cả các phần tử
yKhông phải lúc nào cũng lấy được g p g ymẫu đại diện tốt nhất
Cá hầ ử ó hể hâ á à khó
yCác phần tử có thể phân tán và khó khăn thu thập
Trang 19sau khi đã chọn ngẫu nhiên một nhóm
nào đó trên cơ sở các đơn vị điều tra ị
được sắp xếp theo thứ tự
ắ
yNguyên tắc
yChọn mẫu trong khoảng thông thường
yChọn mẫu trong khoảng thông thường, tùy thuộc vào khoảng lấy mẫu y ộ g y
Trang 20yQuy trình chọn mẫu:
yKhung lấy mẫu: Tấm bản đồ hoặc danh sách các hộ gia đình (1200 hộ chọn 60 hộ)
yĐơn vị lấy mẫu: Hộ gia đìnhĐơn vị lấy mẫu: Hộ gia đình
yXác định khoảng cách mẫu: SI =
1200/60 = 20
Trang 21yB3: Chọn các hộ tiếp theo: 8+SI =>
8, 28, 48…
Trang 22Phải liệt kê tất ả á hầ tử
yPhải liệt kê tất cả các phần tử
yPhải có tính tuần hoàn
yPhải có tính tuần hoàn
Trang 24Chọn mẫu theo chùm (nhóm) ọ ( )
yNguyên tắc: Lấy mẫu theo chùm là
phương pháp chọn mẫu các nhóm
riêng biệt (thường được gọi là chùm
riêng biệt (thường được gọi là chùm hoặc cụm) của các đơn vị nhỏ hơn
tổng thể và gọi là phần tử Tức là tổng thể được phân chia ra làm các chùm
thể được phân chia ra làm các chùm
Trang 25y Mỗi đơn vị nghiên cứu được gphân vào một chùm
Mỗi hù ố ắ hứ hiề
y Mỗi chùm cố gắng chứa nhiều đơn vị khác nhau sao cho sự phân
đơn vị khác nhau sao cho sự phân
bố các đơn vị của nó giống như
tổng thể
y Giữ á hù ó ự hâ bố
y Giữa các chùm có sự phân bố tương đối đồng đều với nhau.g g
Trang 26yĐỡ tốn kém (đi điều tra ở các đơn
yĐỡ tốn kém (đi điều tra ở các đơn
vị ở gần nhau)ị g )
Trang 27mang những đặc trưng giống nhau,
do ảnh hưởng đến tính đại diện của g ạ ệmẫu và làm cho sai số lấy mẫu tăng lê
lên
Trang 28Ví dụ: Chọn mẫu theo chùm
Khu vực: 2 Khu vực 1
Khu vực: 3
Khu vực: 5
Trang 29Chọn mẫu phân tầng (nhiều giai
Chọn mẫu phân tầng (nhiều giai đoạn)
yNguyên tắc: Chọn mẫu liên tiếp
yPhần tử chọn mẫu: hộ gia đình
y Giai đoạn 1: Lựa chọn tỉnh
y Giai đoạn 1: Lựa chọn tỉnh
y Giai đoạn 2: Lựa chọn khu vựcGiai đoạn 2: Lựa chọn khu vực
(thôn)
y Giai đoạn 3: lựa chọn hộ gia đình
Trang 30Ư ể
yƯu điểm
y Có thể thu thập được thông tin
y Có thể thu thập được thông tin của toàn bộ tổng thể và cả từng ộ g gtầng nhỏ
y Tính chính xác cao nếu sự khác biệt trong mỗi nhóm nhỏ là đồng
biệt trong mỗi nhóm nhỏ là đồng nhất hơn sự khác biệt giữa các
nhóm
Trang 31yNhược điểm ợ
yKhó khăn trong việc xác định các ầ
tầng
yTính chính xác của mẫu không còn
yTính chính xác của mẫu không còn nếu có quá ít phần tử trong từng q p g g
tầng nhỏ
yCó thể khắc phục bằng cách lấy tỷ
lệ chọn mẫu theo tổng thể các mỗi
lệ chọn mẫu theo tổng thể các mỗi tầng
Trang 323.5 CHỌN MẪU PHI XÁC SUẤT Ọ
y Mẫu thuận tiện (dễ dàng lấy mẫu): là
phương pháp chọn mẫu phi xác suất trong
đó nhà nghiên cứu tiếp cận với phần tử
đó nhà nghiên cứu tiếp cận với phần tử
mẫu bằng phương pháp thuận tiện.
ễ ế
y Dựa trên tính “dễ tiếp xúc” và “cơ hội
thuận tiện” để chọn mẫu.
y Chỉ dùng cho nghiên cứu thăm dò, trắc
nghiệm, không dùng cho nghiên cứu mô tả
Trang 33vấn Nếu người được phỏng vấn
không đồng ý thì họ chuyển sang đốikhông đồng ý thì họ chuyển sang đối tượng khác
Trang 34Chọn mẫu có mục tiêu (chọn mẫu
có phán đoán):
y Là một phương pháp chọn mẫu không ngẫu nhiên Tuy nhiên phương pháp g y p g p p này nhà nghiên cứu tự đưa ra phán đoán về đối tượng cần chọn vào mẫu
đoán về đối tượng cần chọn vào mẫu Như vậy tính đại diện của mẫu phụ
ề
thuộc nhiều vào kinh nghiệm và sự hiểu biết của người tổ chức việc điều hiểu biết của người tổ chức việc điều tra việc điều và cả người đi thu thập dữ
Trang 35yVí dụ: Nhân viên phỏng vấn được
yVí dụ: Nhân viên phỏng vấn được yêu cầu đến các trung tâm thương
yêu cầu đến các trung tâm thương mại chọn các phụ nữ ăn mặc sang
trọng để phỏng vấn Như vậy
không có tiêu chuẩn cụ thể “thế
không có tiêu chuẩn cụ thể thế
nào là sang trọng” mà hoàn toàn
nào là sang trọng mà hoàn toàn dựa vào phán đoán để chọn ra
người cần phỏng vấn.
Trang 36Chọn mẫu theo phương pháp phát
Trang 37yVí dụ: Chúng ta cần nghiên cứu thị
yVí dụ: Chúng ta cần nghiên cứu thị
trường dụng cụ chơi golf tại TP.HCM g ụ g ụ g ạ
và đối tượng để thu thập dữ liệu là
những người chơi golf Chúng ta có thể chọn được một vài người chơi
thể chọn được một vài người chơi
golf (chọn mầm) và thông qua những
người này để tìm những phần tử khác (phát triển mầm) tham gia vào mẫu
(phát triển mầm) tham gia vào mẫu
Trang 38Chọn mẫu theo phương pháp định mức ( t )
y Dựa vào đặc tính kiểm soát (tiêu thức
hâ tổ) ủ từ hó để h phân tổ) của từng nhóm để chọn
Trang 39y Ví dụ: Nhà nghiên cứu yêu cầu các phỏng vấn viên đi phỏng vấn 800 người có tuổi trên 18 tại
viên đi phỏng vấn 800 người có tuổi trên 18 tại
1 thành phố Nếu áp dụng phương pháp chọn mẫu định ngạch, ta có thể phân tổ theo giới
tính và tuổi như sau: chọn 400 người (200 nam
tính và tuổi như sau: chọn 400 người (200 nam
người gần nhà hay thuận lợi cho việc điều tra
để dễ nhanh chóng hoàn thành công việc
để dễ nhanh chóng hoàn thành công việc.
Trang 403.6 CÁC TRƯỜNG HỢP SAI LỆCH TRONG CHỌN MẪU LỆCH TRONG CHỌN MẪU
ySai lệch do chọn mẫu SE (Sampling
Error):
yLà các sai lệch gây ra do việc chọn mẫuđể thu thập thông tin và từ thông tin củaẫ
mẫu này, chúng ta suy ra thông tin củathi trường thay vì thu thập thông tin của
Trang 413.6 Các trường hợp sai lệch trong chọn
ẫ
mẫu
ẫ
y Sai lệch do chọn mẫu SE (Sampling Error):
yNhư vậy sai lệch do chọn mẫu luôn luôn
yNhư vậy, sai lệch do chọn mẫu luôn luôn
xuất hiện nếu chọn mẫu được thực hiện
Khi kích thước mẫu càng tăng thì sai lệch
do chọn mẫu càng giảm.
Trang 423.6 Các trường hợp sai lệch trong chọn
ẫ
mẫu
ySai lệch không do chọn mẫu NE
(Non-ySai lệch không do chọn mẫu NE
(Non-sampling Error): là sai lệch còn lại, phátsinh trong quá trình thu thập thông tin
không do iệc chọn mẫ gâ nên như
các sai lệch xảy ra trong quá trình phỏngệ y g q p gvấn, hiệu chỉnh, nhập thông tin
yNhư vậy, sai lệch này càng tăng khi
Trang 433.7 CÁC PHƯƠNG PHÁP CHỌN KÍCH
THƯỚC MẪU KHI NGHIÊN CỨU (n)
y Cỡ mẫu: Dựa vào lý thuyết thống kê cơ bản ta có ba yếu tố
y Cỡ mẫu: Dựa vào lý thuyết thống kê cơ bản, ta có ba yếu tố chính ảnh hưởng đến quyết định cỡ mẫu cần chọn là: độ
biến động dữ liệu độ tin cậy trong nghiên cứu và tỷ lệ sai số
biến động dữ liệu, độ tin cậy trong nghiên cứu và tỷ lệ sai số cho phép
y + Cỡ mẫu được xác định theo công thức:
y + Cỡ mẫu được xác định theo công thức:
V= p(1-p): độ biến động dữ liệu f p: tỷ lệ xuất hiện các phần
tử trong đơn vị lấy mẫu đúng như mục tiêu chọn mẫu (0 ≤
p ≤ 1).
43
Trang 44y Z: giá trị tra bảng của phân phối chuẩn Z ứng với g ị g p p g
độ tin cậy
y MOE: sai số cho phép với cỡ mẫu nhỏ
y MOE: sai số cho phép với cỡ mẫu nhỏ
+ Trong trường hợp bất lợi nhất là độ biến động
ố
của dữ liệu ở mức tối đa thì:
y V=p(1- p) => max => V’ =1-2p =0 => p =0 5 (1) V p(1 p) > max > V 1 2p 0 > p 0,5 (1) + Sai số cho phép với cỡ mẫu nhỏ là 10% (2)
ế
+ Trong thực tế nhà nghiên cứu thường sử dụng độ tin cậy 95% (hay α=5%) ậy ( y )
=> Z α /2 = Z2.5% = -1,96 (3)
Trang 45y Kết hợp (1), (2) và (3) ta có cỡ mẫu n = 96 Kết hợp (1), (2) và (3) ta có cỡ mẫu n 96 quan sát Kết luận: Thông thường, các
hiê ứ t th tế hà hiê ứ
nghiên cứu trong thực tế nhà nghiên cứu
mặc nhiên sử dụng cỡ mẫu bằng hoặc lớn ặ ụ g g ặ hơn 100 mà không cần tính toán cỡ mẫu vì
cỡ mẫu này đã thuộc mẫu lớn bảo đảm cho
cỡ mẫu này đã thuộc mẫu lớn bảo đảm cho tính suy rộng, do đó tác giả chọn cỡ mẫu là
120 Tuy nhiên tùy thuộc vào giá trị Z (độ tin cậy) và sai số (MOE) mà ta có cỡ mẫu
tin cậy) và sai số (MOE) mà ta có cỡ mẫu khác nhau.
Trang 46y Kích cỡ mẫu phụ thuộc vào phương pháp phân
tí h hiê ứ à ó ử d hâ tí h hâ tố
tích, nghiên cứu này có sử dụng phân tích nhân tố khám phá (EFA) Phân tích nhân tố cần có mẫu ít ấ
nhất 200 quan sát (Gorsuch, 1983); còn Hachter
(kích thước mẫu) ít nhất phải bằng 4 hay 5 lần số
biến trong phân tích nhân tố n≥5x20=100 (Hoàng
ễ Trọng và Chu Nguyễn Mộng Ngọc – phân tích dữ
Trang 47yNgoài ra, theo Tabachnick & Fidell g ,(1991) để phân tích hồi quy đạt được
hình
hình