1. Trang chủ
  2. » Giáo án - Bài giảng

phuong phap Lay mau phan lop 1

33 416 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 33
Dung lượng 3,03 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Thảo luận hiệu quả của phương pháp lấy mẫu theo lớp ngẫu nhiên trong trường hợp này.. Ví dụ: Một nhân viên kiểm lâm muốn ước lượng tổng diện tích rừng được trồng trong các trang tr

Trang 1

Phương pháp chọn mẫu phân lớp

Trang 2

Phương pháp chọn mẫu phân lớp

Khi không có thông tin về tổng thể, chọn mẫu ngẫu nhiên là giải pháp tối ưu

Trang 3

Danh giới khu vực nghiên cứu

Đồng cỏ

Ô dạng tc

Rừng

Rừng

Thông tin bổ xung

Nhóm các phần tử hoặc ô

tiêu chuẩn giống nhau

Có thể chia tổng thể

thành các nhóm nhỏ

o Gọi là Lớp

 Nếu chọn mẫu ngẫu nhiên từ

các lớp này, độ chính xác sẽ tăng

đáng kể

Trang 4

Danh giớ khu vực nghiên cứu

Đồng cỏ

Ô dạng bản

Rừng

Rừng

Lấy mẫu phân lớp rât hữu ích khi

ta có thể chia khu vực nghiên

cứu thành các phần riêng biệt

và đồng nhất

Ví dụ, bạn quan tâm đến việc

điều tra sinh khối của của một

loài cây LSGN trong 20 ha

nghiên cứu

Trong ví dụ này, đồng cỏ và rừng

là các lớp

Sự phân lớp này có thể tăng độ

chính xác của ước lương sinh

khối

Ví dụ

Trang 5

Ví dụ khác?

Trang 6

Phương pháp chọn mẫu phân lớp

Trang 7

Kích thước mẫu là 4, chọn 2 từ mỗi lớp

Trang 8

Ước lượng trung bình của tổng thể

Uớc lượng trung bình của tổng thể

Trang 9

Một công ty quang cáo quyết định thực hiện 1 cuộc điều tra để ước lượng thời gian những hộ gia đình trong một khu vực xem ti vi trung bình bao nhiêu giờ 1 tuần Khu vực có 2 thị trấn, A và B và 1 vùng nông thôn Thị trấn A được xây dựng gần 1 nhà máy, hầu hết các gia đình đều có người làm công nhân trong nhà máy và có trẻ em đang tuổi đi học Thị trấn B là vùng ngoại ô của 1 thành phố gần đó, các gia đình thường có người già và chỉ có ít trẻ em ở nhà Có 155 gia đình ở thị trấn A, 62 gia đình ở thị trấn B, 93 gia đình ở khu vực nông thôn Thảo luận hiệu quả của phương pháp lấy mẫu theo lớp ngẫu nhiên trong trường hợp này

Giả sử kế hoạch điều tra đã được thực hiện Công ty quảng cáo đủ kinh phí và thời gian để phỏng vấn n=40 gia đình và chọn các mẫu ngẫu nhiên với kích thước n1=20

từ thị trấn A, n2=8 từ thị trấn B, n3=12 từ khu vực nông thôn Sau khi chọn mẫu

ngẫu nhiên và thực hiện phỏng vấn Kết quả điều tra được biểu thị trên bảng 5.1

Trang 10

số giờ xem ti vi trong vùng (giờ/tuần) Bảng 5.1

Trang 11

Bảng

Tổng hợp só liệu từ bảng 5.1

Trung bình Trung vị Độ lệch chuẩn T.T A

T.T B

N thôn

Trang 12

a) Ước lượng giá trị trung bình của tổng thể

b) Ước lượng với khoảng tin cậy là 95%

Trang 13

Ước lượng giá trị tổng số

Ước lượng  :

Phương sai của ước lượng

Trang 14

Ví dụ:

Sử dụng số liệu ở ví dụ trước và ước lượng tổng số giờ xem ti vi mỗi tuần của người dân thành phố với khoảng tin cậy 95%

với số liệu trong bảng 5.1:

Phương sai của ước lượng N Ӯst :

Ước lượng của tổng thể cùng với sai số cận biên:

Trang 15

Ví dụ:

với số liệu trong bảng 5.1:

Phương sai của ước lượng N Ӯst :

Ước lượng của tổng thể với độ tin cậy 95%:

Trang 16

Ví dụ:

Một nhân viên kiểm lâm muốn ước lượng tổng diện tích rừng được

trồng trong các trang trại của 1 bang Vì diện tích cây trồng thay đổi theo kích thước của trang trại nên nhân viên đó đã quyết định lấy mẫu theo lớp, với các lớp bao gồm các trang trại có kích thước khác nau

240 trang trại trong bang được phân ra thành 4 nhóm theo kích thước

1 mẫu 40 trang trại được chọn, kết quả được trình bày trong bảng

dưới Ước lượng tổng diện tích rừng trong các trang trại và với khoảng tin cậy 95%

lớp I

0-200 mẫu

lớp II 200-400 mẫu

lớp III 400-600 mẫu

lớp IV trên 600 mẫu

Trang 17

Dung lượng mẫu

Kích thước mẫu gần đúng cần thiết để ước lượng µ hoặc T với sai số cận biên B của ước lượng:

ai là tỉ lệ mẫu phân phối cho lớp i, Ϭi2 là phương sai của tổng thể của lớp i, và :

khi ước lượng µ

khi ước lượng 

Trang 18

ví dụ:

Người ta thức hiện cuộc khảo sát về thời gian phỏng vấn và cho thấy phương sai của các lớp là: Ϭ12 = 25, Ϭ22 = 225, Ϭ32 = 100 Chúng ta sử dụng Ӯst để ước lượng trung bình của tổng thể Xác định dung lượng mẫu cần thiết khi sai số cận biên mong

muốn của ước lượng là 2 giờ và tỉ lệ mẫu cho các lớp lần lượt là: a1= 1/3, a2=1/3, a3=1/3 (Lấy mẫu cùng tỉ lệ)

sai số cận biên = 2h:

do đó

Trang 19

ví dụ:

Trang 20

ví dụ

Do đó, người điều tra nên lấy n=57, với:

Trang 21

Như ví dụ 5.5, giả sử phương sai trong ví dụ 5.1 là Ϭ12 = 25, Ϭ22 = 225, Ϭ32 =

100 Chúng ta muốn ước lượng T với sai số cận biên của ước lượng là 400 giờ Chọn dung lượng mẫu cần thiết nếu số lượng khảo sát được chia đều cho từng lớp mẫu

Sai số cận biên của ước lượng là 400 giờ, vì vậy ta có,

Để tính n trong công thức 5.6, ta cần tính những giá trị sau:

ví dụ 5.5

với n1=n2=n3= 35

Trang 22

Phân bổ mẫu

Mục đích của ta, xác định số phần tử phân bổ cho từng lớp bị ảnh hưởng bởi 3 yếu tố sau:

1 Tổng số phần tử trong mỗi lớp của tổng thể

2 Mức độ biến động của các giá trị quan sát trong từng lớp

3 Chi phí thu thập/mẫu trong mỗi lớp

Dung lượng mẫu gần đúng để chi phí thu thập mẫu nhỏ nhất ứng với

1 giá tri V(ȳ st) cố định hoặc V(ȳ st) nhỏ nhất ứng với một lượng kinh phí cố định được xác định dựa vào công thức:

Trong đó Ni biểu thị cho kích thước của lớp thứ I, Ϭi 2 biểu thị cho phương sai của lớp thứ i,

và ci biểu thị cho chi phí thu thập một giá trị quan sát của lớp thứ i

Trang 23

ví dụ:

Một cuộc khảo sát thăm dò cho thấy phương sai của các lớp là: Ϭ12 = 25, Ϭ22 = 225,

Ϭ32 = 100 Chúng ta sử dụng Ӯst để ước lượnggiá trị trung bình của tổng thể Xác định dung lượng mẫu cần thiết khi sai số cận biên mong muốn của ước lượng là 2 giờ Chi phi để phỏng vấn mỗi người lần lượt là: c1= 10$, c2=15$, c3=20$

N1=155, N2=62, N3=93

sai số cận biên = 2h:

do đó

Trang 24

Thay thế ai vào công thức 5.6 ta có:

Trang 25

Ví dụ

Một cơ quan lâm nghiệp của 1 bang thực hiện 1 nghiên cứu những

người sử dụng công cụ cám trại của Bang Bang có 2 khu cắm trại, một

ở trên núi và một ở dưới chân núi Cơ quan này muốn ước lượng số

người trung bình trên 1 điểm cắm trại và tỉ lệ những điểm cắm trại

được sử dụng bởi những người cắm trại đến từ những Bang khác Sai số cận biên trong ước lượng số người trung bình trên một điểm cắm trại là 1 và tỉ lệ người ngoài bang là 0.1 Hai khu cắm trại có thể được coi là 2 lớp Với N1 = 120 và N2 = 80 điểm cắm trại Ước lượng dung lượng mẫu cần thiết để đạt được các sai số ước lượng cận biên như trên Giả sử mẫu được phân phối theo cùng tỉ lệ cho các lớp

Trang 26

Vì thế

Từ công thức 5.6:

Trang 27

Từ công thức 5.15

Vì vậy:

Trang 28

Ước lượng của tỉ lệ tổng thể:

Công thức ước lượng tỉ lệ của tổng thể p^:

Ước lượng phương sai của p^st :

Trang 29

Ví dụ

Một công ty quảng cáo muốn tính tỉ lệ số gia đình trong 1 vùng xem chương trình X như ví dụ 5.1 Vùng này được chia ra thành 3 phần, thị trấn A, thị trấn B, 1 khu vực nông thôn Coi mỗi vùng là một lớp Số lượng gia đình tương ứng của thị trấn A, B và vùng nông thôn lần lượt là N1 = 155, N2 = 62, N3 = 93 Lấy mẫu ngẫu nhiên phân lớp, với

n=40 gia đình đã được chọn theo tỉ lệ Cụ thể, kích thước các mẫu

như sau n1 = 20, n2 = 8, n3 = 12 Kết quả phỏng vấn được thể hiện trong bảng sau Ứớc lượng tỉ lệ số gia đình xem chương trình X với độ tin cậy 95%

Trang 30

Bảng 5.3

Số liệu của ví dụ 5.12

Lớp ni Số gia đình xem chương trình X

Trang 31

Kích thước mẫu cần thiết để ước lượng p với sai số cận biên B:

Trong đó ai là tỉ lệ mẫu phân bố cho lớp i, và D=B 2 /4

Trang 32

Phân bố gần đúng để chi phí thu thập mẫu là nhỏ nhất:

Ni biểu thị cho kích thước của lớp thứ i, pi biểu thị cho tỉ lệ của lớp thứ i,

và ci biểu thị cho chi phí thu thập 1 mẫu cho lớp thứ i

Trang 33

Số liệu trong bảng 5.3 có được khi thực hiện 1 khảo sát từ năm trước Công ty quảng cáo bây giờ muốn thực hiện một khảo sát mới với cùng 1 vùng đấy để ước lượng tỉ lể của tổng thể số lượng các gia đình xem

chương trình X mặc dù các tỉ lệ p1 , p2 , p3 xuất hiện trong công thức 5.15 và 5.16 đều chưa biết, nhưng họ có thể ước lượng xấp xỉ với khảo sát trước đó; p1 = 0.80, p2 = 0.25, p3 = 0.50 chi phí cần cho khảo sát là

9 đô la cho từng thị trấn và 16 đô la cho vùng nông thôn, c1 = c2 =9 và

c3 = 16 số gia đình trong các lớp là N1 = 155, N2 = 62 và N3 = 93 công

ty muốn ước lượng tỉ lệ của tổng thể p với sai số cận biên của ước lượng

la 0.1 Tìm kích thước mẫu n và kích thước mẫu của các lớp n1 , n2 và n3được mong muốn với chi phí tối thiểu

Ngày đăng: 08/12/2016, 12:04

TỪ KHÓA LIÊN QUAN