Chọn mẫu hệ thống có ưu điểm là đơn giản, ít tốn thời gian, các đơn vị mẫu trải đều theo dàn chọn mẫu, nên tính đại diện của mẫu có thể cao hơn so với chọn mẫu ngẫu nhiên đơn giản.. Tu
Trang 1Trong số k đơn vị đầu tiên của dàn chọn mẫu, chọn ngẫu nhiên một đơn
vị Đây là đơn vị đầu tiên được chọn vào mẫu Các đơn vị tiếp theo cách
đơn vị đầu tiên một khoảng cách là k; 2k; 3k;… như vậy lấy đến cuối dàn
chọn mẫu ta đã có đủ n đơn vị
Chọn mẫu hệ thống xoay vòng
Trong N đơn vị, chọn ngẫu nhiên một đơn vị (dùng bảng số ngẫu nhiên
hoặc rút thăm lấy ngẫu nhiên một số nằm trong khoảng (1, N) Đây là đơn vị
đầu tiên được chọn
Các đơn vị kế tiếp cách đơn vị đầu (về phía cuối dàn chọn mẫu) một khoảng cách là k; 2k; 3k;…
Khi đến cuối dàn chọn mẫu nếu chưa có đủ n đơn vị thì ta quay lại
đầu dàn chọn mẫu với qui ước:
N + 1 = 1
N + 2 = 2 để tiếp tục lấy cho đủ n đơn vị
Chọn mẫu hệ thống có ưu điểm là đơn giản, ít tốn thời gian, các đơn vị mẫu
trải đều theo dàn chọn mẫu, nên tính đại diện của mẫu có thể cao hơn so với chọn
mẫu ngẫu nhiên đơn giản Tuy nhiên khi N/n không phải là số nguyên thì ta phải
làm tròn số, như vậy các đơn vị được chọn không dùng xác suất và khi dùng đặc
trưng mẫu để ước lượng đặc trưng của tổng thể chung có thể bị lệch Mặt khác, chọn mẫu hệ thống có thể làm xuất hiện sai số hệ thống
c Chọn mẫu phân tổ:
Để thực hiện chọn mẫu phân loại, trước hết cần phân chia tổng thể nghiên
cứu thành các tổ (nhóm) có độ thuần nhất cao, sau đó chọn các đơn vị đại
diện cho từng tổ theo cách chọn ngẫu nhiên đơn giản hay máy móc Số đơn vị
được chọn từ mỗi tổ có thể tương ứng với tỷ trọng của tổ đó trongtổng thể
chung, gọi là phân loại theo tỷ lệ, hoặc có thể không tương ứng với tỷ trọng
đó
Trang 2- Trường hợp chọn mẫu phân tổ theo tỷ lệ, sai số trung bình chọn mẫu sẽ
được tính như sau:
Bảng 8.1
Nhiệm vụ ước lượng Chọn hoàn lại
Chọn không hoàn lại
2
Ước lượng số trung bình x i
n N
Ước lượng tỷ lệ
Trong đó:
p
(1
p p )(1n / N )
n
2 I = 2 InI /nI= 2 INI/NI
p ( 1 – p ) = pI ( 1 – pI) nI / nI = pI( 1 – pI) NI / NI
- Trường hợp chọn phân loại không theo tỷ lệ, sai số trung bình chọn mẫu tính theo công thức:
= 1 /N 2 I NI
Trong đó:
I : Sai số trung bình chọn mẫu từng tổ
NI :Số đơn vị trong từng tổ của tổng thể chung
Phương pháp chọn mẫu phân tổ thường được dùng để điều tra các hiện tượng
kinh tế xã hội phức tạp, bao gồm nhiều loại hình khác nhau Khi phân tổ ta
đã phân chia được các loại hình, trong từng tổ các đơn vị tương đối thuần
nhất Nếu chọn mẫu phân loại theo tỷ lệ ta lại có được mẫu có kết cấu gần
giống với kết cấu của tổng thể chung nên tính đại biểu cao Muốn cho tính
đại biểu của mẫu cao hơn nữa, người ta còn có thể rút mẫu tối ưu, tức là số
đơn vị mẫu chọn ra ở mỗi tổ không những tỷ lệ với tỷ trọng của tổ đó chiếm
trong tổng thể mà còn tương ứng với độ biến thiên tiêu thức ở mỗi tổ
d Chọn mẫu cả khối (mẫu chùm)
Trang 3Chọn mẫu cả khối là phương pháp tổ chức chọn mẫu trong đó số đơn vị mẫu được rút ra để điều tra không phải là từng đơn vị lẻ tẻ mà là từng khối
(chùm) đơn vị Như vậy, trước hết tổng thể chung phải được chia thành các khối, sau đó chọn ngẫu nhiên một khối để điều tra
Trong chọn mẫu cả khối, tính chính xác của tài liệu điều tra phụ thuộc vào sự chênh lệch giữa các số trung bình khối Vì vậy, khi tính sai số trung
bình mẫu người ta sử dụng phương sai giữa các số trung bình khối để tính
Ta có các công thức tính sai số trung bình:
- Trường hợp ước lượng số trung bình:
x = (2
x/r)[(R-r)/(R-1)]
- Trường hợp ước lượng tỷ lệ:
p = [Pr (1-Pr)/r][(R-r)/(R-1)]
Trong đó:
R: Toàn bộ các khối của tổng thể chung
r: Số khối chọn ra để điều tra (mẫu)
2 x = (xi – x)2ni /ni
pr = pini/ni
ni : là số đơn vị của từng khối
Chọn mẫu cả khối có ưu điểm là tổ chức gọn nhẹ, giảm được chi phí Song vì
số đơn vị được chọn chỉ tập trung vào một số khối nên có thể đưa đến sai số lớn nếu
giữa các khối có sự khác biệt nhiều
Vậy, để phát huy được ưu điểm của chọn cả khối chúng ta nên sử dụng nó
trong trường hợp giưã các đơn vị trong mỗi khối có sự khác nhau đáng kể, song giữa
các khối lại giống nhau về bản chất
e Chọn mẫu nhiều cấp:
Trong trường hợp các đơn vị của tổng thể phân tán quá rộng và thiếu thông
tin về chúng, người ta thường chọn mẫu theo nhiều cấp Khi chọn mẫu nhiều
cấp ta có các loại đơn vị chọn mẫu ở mỗi cấp khác nhau thường được gọi là
Trang 4đơn vị chọn mẫu cấp 1, cấp 2… Để chọn mẫu ở mỗi cấp chỉ cần có thông tin về các đơn vị ấy là đủ
Chẳng hạn, để điều tra mức sống của dân cư trong cả nước, có thể chọn mẫu
theo ba cấp như sau:
- Đơn vị mẫu cấp 1: Chọn các tỉnh, thành phố
quận huyện
điều tra
Việc chọn mẫu ở mỗi cấp có thể tiến hành theo phương pháp ngẫu nhiên đơn
giản, máy móc, hay phân loại
Giữa chọn mẫu cả khối và chọn mẫu nhiều cấp thì chọn mẫu nhiều cấp có
nhiều ưu điểm hơn Ta biết rằng trong một khối (chùm) thì các đơn vị riêng
biệt thường có xu hướng giống hoặc gần giống nhau theo các tiêu thức nghiên
cứu Vì vậy, không cần thiết điều tra hết các đơn vị riêng biệt trong khối
mẫu, mà chỉ cần điều tra ở một số đơn vị mẫu được chọn ra từ khối mẫu là có
thể có đủ thông tin cần thiết cho nghiên cứu Như vậy chọn mẫu cả khối
chuyển thành chọn mẫu hai cấp
Khi địa bàn nghiên cứu quá rộng, số đơn vị của tổng thể chung quá lớn, nhiều khi không xác định được thì tùy đặc điểm hiện tượng cần nghiên cứu có thể
áp dụng phương pháp chọn mẫu phân tổ, chọn mẫu cả khối hoặc chọn mẫu
nhiều cấp
8.2.3 Điều tra chọn mẫu nhỏ và chọn mẫu thời điểm
a Điều tra chọn mẫu nhỏ
Trong thực tế có nhiều trường hợp không thể điều tra một số đơn vị tương đối lớn vì nó liên quan đến việc hủy bỏ đơn vị điều tra như: kiểm tra chất lượng
đồ hộp,thử độ bền của bóng đèn, của sợi… Vì vậy, đã nảy sinh yêu cầu chọn
mẫu nhỏ, nghĩa là tìm hiểu đặc điểm của tổng thể chung từ một mẫu nhỏ (n
< 30) Trong thống kê toán người ta đã chứng minh rằng ngay trong chọn
Trang 5mẫu nhỏ, với phương pháp tính toán thích hợp vẫn có thể đảm bảo độ chính xác để suy rộng tài liệu
Trong điều tra chọn mẫu nhỏ, sai số trung bình chọn mẫu được tính theo công
thức:
0 = S2/(n –1)
0 = f(1 – f)/(n –1) Trong đó:
0 : Sai số trung bình chọn mẫu nhỏ
S2: Phương sai mẫu
f : Tỷ lệ mẫu
Trong chọn mẫu nhỏ, người ta đã chứng minh rằng các tham số của mẫu phân phối theo qui luật T-Student, nên khi tra bảng sẽ sử dụng bảng phân phối T- Student
d Điều tra chọn mẫu thời điểm
Điều tra chọn mẫu thời điểm là phương pháp điều tra chọn mẫu đặc biệt, thường được dùng trong sản xuất công nghiệp, bưu điện và giao thông vận tải Nội dung của phương pháp này là: Trong những thời điểm nhất định, người ta đăng ký sự tồn tại của các phần tử thuộc quá trình nghiên cứu, không
kể thời gian tồn tại đó dài hay ngắn
Chọn mẫu thời điểm thường được dùng để nghiên cứu tình hình sử dụng thời
gian làm việc của công nhân hoặc của thiết bị, sử dụng toa xe chở thư, toa xe
của ngành vận tải đường sắt… Nói chung, các trường hợp mà các phần tử của
quá trình nghiên cứu kế tiếp nhau một cách liên tục, nhưng không xuất hiện đồng thời
Ví dụ: Khi nghiên cứu tình hình sử dụng thời gian làm việc của công nhân trong phân xưởng, có thể chia thời gian ra thành hai phần: làm việc và ngừng
việc Trong ca làm việc, cứ sau một khoảng thời gian nhất định lại đi kiểm
tra các công nhân một lần Mỗi lần kiểm tra, đăng ký tình hình sử dụng thời