.3 Một số cách chọn mẫu Trần Minh Nguyệt ĐH THĂNG LONG Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 2 / 16 Xác định dữ liệu cần thu thập Xác định dữ liệu cần thu thập
Trang 1.
Chương 2: THU THẬP DỮ LIỆU
Trần Minh Nguyệt
Đại học THĂNG LONG
Tháng 8 năm 2014
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 1 / 16
Nội dung
.1 Xác định dữ liệu cần thu thập
.2 Dữ liệu thứ cấp và dữ liệu sơ cấp
.3 Một số cách chọn mẫu
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 2 / 16
Xác định dữ liệu cần thu thập Xác định dữ liệu cần thu thập
Khi thu thập dữ liệu cần xác định rõ:
Dữ liệu nào cần thu thập;
Thứ tự ưu tiên các dữ liệu;
Phạm vi, giới hạn dữ liệu cần thu thập
Trang 2.
Dữ liệu thứ cấp
Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn sẵn có, thường là những dữ liệu đã qua tổng hợp, xử lý
Dữ liệu thứ cấp có ưu điểm là thu thập nhanh, ít tốn kém chi phí Tuy nhiên, đôi khi dữ liệu thức cấp ít chi tiết và không đáp ứng đúng nhu cầu nghiên cứu
Nguồn cung cấp dữ liệu thức cấp: Nội bộ, cơ quan thống kê nhà nước, cơ quan chính phủ, báo, tạp chí,
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 4 / 16
Dữ liệu thứ cấp và dữ liệu sơ cấp
Dữ liệu sơ cấp
Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu
Dữ liệu sơ cấp rất chi tiết và đáp ứng tốt nhu cầu nghiên cứu
Tuy nhiên, khi thu thập dữ liệu sơ cấp phải tốn kém thời gian và chi phí khá nhiều
Nguồn cung cấp dữ liệu sơ cấp:
Trong nghiên cứu thử nghiệm, người nghiên cứu đo đạc và thu thập dữ liệu trên các kết quả của thử nghiệm
Trong nghiên cứu quan sát, dữ liệu có thể thu thập được từ nhiều nguồn: cá nhân, gia đình, cơ quan, tổ chức, bằng các hình thức phỏng vấn trực tiếp, qua thư, điện thoại,
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 5 / 16
Một số cách chọn mẫu Mẫu ngẫu nhiên
Chọn mẫu ngẫu nhiên là quá trình lựa chọn sao cho mỗi đơn vị tổng thể có cơ hội được chọn vào mẫu như nhau
Để một mẫu đại diện được cho tổng thể thì mẫu phải được chọn ngẫu nhiên từ tổng thể
Trong các phần sau này, mỗi mẫu được chọn ra đều giả sử có được từ một quá trình chọn mẫu ngẫu nhiên
Trang 3.
Chọn mẫu có hoàn lại và không hoàn lại
Chọn mẫu có hoàn lại là cách chọn mẫu mà mỗi đơn vị tổng thể
được chọn ra lại trả lại tổng thể
Chọn mẫu không hoàn lại là cách chọn mẫu mà mỗi đơn vị tổng
thể được chọn ra không được đặt trả lại tổng thể
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 7 / 16
Một số cách chọn mẫu Chọn mẫu có hoàn lại và không hoàn lại
Hãy xét xem trong các ví dụ sau là chọn mẫu có hoàn lại hay không hòan lại:
Chọn ngẫu nhiên 5 sinh viên từ một lớp học có 80 sinh viên
Chọn lần lượt 3 quả bóng từ một hộp chứa 10 quả bóng biết rằng mỗi lần lấy ra một bóng sau đó lại trả lại vào hộp
Chọn 5 người từ 10 người để làm 5 công việc biết rằng một người có thể làm nhiều việc
Chọn ngẫu nhiên 6 quân bài từ một bộ bài gồm 52 quân
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 8 / 16
Một số cách chọn mẫu Một số cách chọn mẫu ngẫu nhiên
Chọn mẫu ngẫu nhiên đơn giản;
Chọn mẫu hệ thống;
Chọn mẫu theo khối/cụm và chọn mẫu nhiều giai đoạn;
Chọn mẫu phân tầng
Trang 4.
Chọn mẫu ngẫu nhiên đơn giản
Để chọn mẫu ngẫu nhiên đơn giản, ta phải tạo một danh sách các phần tử
của tổng thể được đánh số từ1 đến N.
Nếu số phần tử của tổng thể N nhỏ (vài chục hoặc vài trăm) ta có
mảnh giấy, gập lại, trộn đều, rồi từ đó lấy ra số thăm bằng số phần tử
của mẫu cần chọn ta sẽ được một mẫu ngẫu nhiên cần chọn
Nếu số phần tử của tổng thể lớn (vài trăm vài nghìn và hơn nữa) ta
dùng bảng số ngẫu nhiên hoặc sinh số ngẫu nhiên từ các phần mềm
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 10 / 16
Một số cách chọn mẫu
Ví dụ
Chọn ngẫu nhiên 3 sinh viên đại diện cho lớp đi dự đại hội từ 10 sinh viên
tiêu biểu sau:
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 11 / 16
Một số cách chọn mẫu Chọn mẫu ngẫu nhiên đơn giản bằng R
Lệnh sample(x, size, replace = FALSE) để chọn mẫu ngẫu nhiên
trong R Trong đó:
? Dùng phần mềm R chọn ngẫu nhiên 3 sinh viên từ 10 bạn trên
Trang 5.
Lấy mẫu hệ thống
Trong trường hợp mẫu cần lấy có số phần tử lớn thì việc chọn mẫu ngẫu nhiên đơn giản sẽ trở nên nặng nề, thay vào đó người ta sử dụng cách lấy mẫu theo hệ thống Các bước thực hiện như sau:
Lập một danh sách các phần tử của tổng thể, đánh số từ 1 đến N Xác định cỡ mẫu cần lấy, ví dụ gồm n quan sát.
Chia tổng thể thành k nhóm theo công thức k= N
n (nếu k không phải
số nguyên dương thì được làm tròn đến số nguyên dương gần nhất)
Trong k đơn vị đầu tiên chọn ra một phần tử, đây cũng chính là đơn
vị mẫu đầu tiên, các đơn vị mẫu tiếp theo được lấy cách đơn vị này
một khoảng là k, 2k, 3k,
Nếu hết danh sách N đơn vị mà chưa đủ n phần tử trong mẫu ta quay trở lại đầu danh sách với quy ước N + 1 = 1, N + 2 = 2,
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 13 / 16
Một số cách chọn mẫu
Ví dụ:
Với N = 57, n = 10, lấy k = 6.
Giả sử số đầu tiên được chọn là2 thì các phần tử tiếp theo là:
8, 14, 20, 26, 32, 38, 44, 50, 56
Nếu số đầu tiên được chọn là 6 thì các phần tử tiếp theo của mẫu là:
12, 18, 24, 30, 36, 42, 48, 52, 1(= 57 + 1)
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 14 / 16
Một số cách chọn mẫu Chọn mẫu theo cả khối/cụm và chọn mẫu nhiều giai đoạn
Chọn mẫu theo khối/cụm là cách chọn mẫu bằng cách chia tổng thể thành nhiều khối, mỗi khối xem như một tổng thể con, lấy ngẫu nhiên đơn giản ra m khối, sau đó khảo sát hết các đối tượng trong các khối mẫu đã được lấy ra
Khi các khối được chọn ra quá lớn hoặc các phần tử trong cùng khối
có khuynh hướng giống nhau nên không nhất thiết phải khảo sát hết
cả khối mà chỉ khảo sát một số đơn vị trong khối này mà thôi Cách chọn mẫu này được gọi là chọn mẫu theo nhiều giai đoạn
Trang 6.
Chọn mẫu phân tầng
Chọn mẫu phân tầng được sử dụng khi các đơn vị tổng thể quá khác nhau
về tính chất liên quan đến vấn đề nghiên cứu và khảo sát Theo phương pháp này tổng thể nghiên cứu được chia thành các tầng lớp, sao cho các đối tượng tổng thể ta quan tâm thuộc cùng một tầng càng ít khác nhau càng tốt Sau đó các đơn vị mẫu được chọn từ các tầng này theo các phương pháp lấy mẫu thông thường như lấy mẫu ngẫu nhiên đơn giản hay lấy mẫu hệ thống
Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng trong kinh tế xã hội Tháng 8 năm 2014 16 / 16