thu thập dữ liệu, dữ liệu thứ cấp là gì, phân loại dữ liệu thứ cấp, ưu nhược điểm của dữ liệu thứ cấp, nguồn dữ liệu thứ cấp, dữ liệu sơ cấp là gì, ưu nhược điểm của dữ liệu sơ cấp, các phương pháp thu thập dữ liệu sơ cấp, các kĩ thuật lấy mẫu trong thu thập dữ liệu sơ cấp, các bước thiết kế mẫu: Tổng thể mục tiêu, Các tham số (parameters) cần quan tâm ,Khung mẫu, Phương pháp chọn mẫu phù hợp, xác định cỡ mẫu là gì, hai quan điểm về cỡ mẫu, Một số nguyên tắc ảnh hưởng đến xác định cỡ mẫu, Kỹ thuật lấy mẫu xác suất, Kỹ thuật chọn mẫu phi xác xuất (non-probability sampling); Xây dựng kế hoạch điều tra thống kê,Sai số trong điều tra thống kê, . Các loại sai số thống kê thường gặp.
Trang 1CHƯƠNG 2 THU THẬP DỮ LIỆU
Trang 2TẬP THỂ NHÓM 2 Trang 2
PHẦN NỘI DUNG CẦN TÌM HIỂU
2.1 Xác định dữ liệu cần thu thập
2.2 Dữ liệu thứ cấp và dữ liệu sơ cấp
2.3 Các phương pháp thu thập dữ liệu sơ cấp
2.4 Các kỹ thuật lấy mẫu trong dữ liệu sơ cấp
2.5 Xây dựng kế hoạch điều tra thống kê
2.6 Sai số trong điều tra thống kê
Trang 32.1 Xác định dữ liệu cần thu thập
Tức là chúng ta phải trả lời các câu hỏi như:
Nghiên cứu vấn đề gì?
Các yếu tố tác động đến vấn đề nghiên cứu?
Các mức độ thể hiện của các yếu tố?
Từ đó giúp ta xác định được loại dữ liệu nào phải được thu thập để đáp ứng cho nhu cầu
của việc nghiên cứu
Trang 4- Dữ liệu thứ cấp từ tài liệu.
- Dữ liệu thứ cấp từ các cuộc điều tra khảo sát
Phân loại
Trang 5Dữ liệu thứ cấp từ tài liệu
2.2 Dữ liệu thứ cấp và dữ liệu sơ cấp
2.2.1 Dữ liệu thứ cấp
Tài liệu bằng
Trang 6TẬP THỂ NHÓM 2 Trang 6
Dữ liệu thứ cấp từ các
cuộc điều tra khảo sát
2.2 Dữ liệu thứ cấp và dữ liệu sơ cấp
2.2.1 Dữ liệu thứ cấp
Điều tra thống kê
Khảo sát liên tục và định kỳ của chính phủ
và các tổ chức phi chính phủ
Các khảo sát đặc biệt của chính phủ, của các tổ chức phi chính phủ, của giới học thuật…
Trang 72.2 Dữ liệu thứ cấp và dữ liệu sơ cấp
2.2.1 Dữ liệu thứ cấp
Ưu và nhược điểm của nguồn dữ liệu thứ cấp
Ưu điểm
- Có sẵn, dễ tìm kiếm
- Tiết kiệm chi phí và thời gian
- Lạc hậu theo thời gian
- Bảo mật và bản quyền
- Lượng tài liệu có hạn
Hạn chế
Trang 92.2.2 Dữ liệu sơ cấp
2.2.2.1 Khái niệm
Dữ liệu sơ cấp là những dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu, được nhà nghiên cứu thiết kế thu thập và sử dụng
trực tiếp cho mục đích nghiên cứu của mình
Ví dụ: Phỏng vấn bất kì, Khảo sát qua các mẫu online,
Trang 10TẬP THỂ NHÓM 2 Trang 10
2.2.2 Dữ liệu sơ cấp
Ưu điểm và nhược điểm
Ưu điểm: Đáp ứng tốt nhu cầu và mục tiêu nghiên cứu
Hạn chế: Tốn kém chi phí và thời gian thực hiện
Trang 112.3 Các phương pháp thu thập dữ liệu sơ cấp
Bao gồm các phương pháp thông dụng như
Trang 12 Bao gồm các phương pháp sau:
- Quan sát trực tiếp và quan sát gián tiếp
- Quan sát ngụy trang và quan sát công khai
- Quan sát do con người và do thiết bị
Trang 132.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.1 Phương pháp quan sát
Ưu điểm
Nhược điểm
Phù hợp với các nghiên cứu về hành vi con người
Chỉ quan sát được hành vi mà không giải thích được ý nghĩ bên trong của con người
Đối tượng quan sát có thể thay đổi hành vi
Thiết bị quan sát trục trặc
Quan sát, ghi chép không cẩn thận
Trang 14 Thu thập được thông tin đa dạng trên một số đối tượng.
Khách quan do có nhiều ý kiến khác nhau.
Nhược điểm
Tính đại diện thấp do cỡ mẫu ít, không thể khái quát hóa vấn đề
Chất lượng thông tin phụ thuộc vào khả năng của điều tra viên
Trang 152.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.2 Nhóm tiêu điểm
Để nâng cao chất lượng thông tin cần phải tuân thủ các nguyên tắc sau:
Người tham gia: ít nhất từ 5 người, nhiều nhất là 12 người.
Người tham gia phải có đủ kiến thức và kinh nghiệm để trả lời trung thực và khách quan.
Người điều điều tra: phải cởi mở, thân thiện, am hiểu về thông tin lĩnh vực muốn khai thác.
Trang 172.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.3 Phương pháp thực nghiệm
Các loại biến cần thu thập trong phương pháp thực nghiệm
Biến độc lập: là các yếu tố, điều kiện bị thay đổi trên đối tượng nghiên cứu sẽ ảnh hưởng đến kết quả thí nghiệm.
Biến phụ thuộc: là những chỉ tiêu đo đạc và bị ảnh hưởng trong suốt quá trình thí nghiệm, hay có thể nói kết quả đo
đạc này phụ thuộc vào sự thay đổi của biến độc lập
Trang 18TẬP THỂ NHÓM 2 Trang 18
2.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Khái niệm
Là phương pháp sử dụng một loạt các câu hỏi mà nhà nghiên cứu chuẩn bị sẳn để phỏng vấn người trả lời
Các loại sai biệt trong điều tra phỏng vấn
Do chọn mẫu
Do điều tra viên.
Do người trả lời
Do xử lý dữ liệu.
Trang 192.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Phương pháp điều tra phỏng vấn có các cách thức sau:
Phỏng vấn cá nhân
Phỏng vấn qua điện thoại
Điều tra qua thư tín/internet/website
Trang 20TẬP THỂ NHÓM 2 Trang 20
2.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Phỏng vấn cá nhân (Face to face)
Là hình thức tiếp xúc trực tiếp theo đó người điều tra ở trong tình huống đối mặt với người được phỏng vấn.
Khái niệm
Trang 212.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Ưu điểm
Phỏng vấn cá nhân (Face to face)
Phản hồi thông tin nhanh và trực tiếp
Làm rõ những câu trả lời phức tạp của người được phỏng vấn
Độ dài của cuộc phỏng vấn linh hoạt
Khả năng hoàn tất bảng hỏi khá cao
Khả năng minh họa các câu hỏi khó cho người được phỏng vấn tốt
Tỷ lệ trả lời các câu hỏi thường cao do có sự tiếp xúc
Tỷ lệ hưởng ứng, chấp nhận khá cao do nể tình, do phép lịch sự
Trang 22TẬP THỂ NHÓM 2 Trang 22
2.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Phỏng vấn cá nhân (Face to face)
Hạn chế
Đôi khi khó được đối tượng điều tra chấp nhận do văn hóa, tập tục.
Chi phí cao do phải di chuyển và mất nhiều thời gian, và thuê mướn người điều tra.
Người được điều tra đôi khi từ chối trả lời câu hỏi có tính riêng tư, nhạy cảm.
Khả năng tái phỏng vấn hay phải điều tra thêm mẫu mới khá cao do người được phỏng vấn tránh né các câu hỏi riêng.
Trang 232.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Phỏng vấn qua điện thoại
Là hình thức người điều tra gọi điện thoại cho người được điều tra để thu thập dữ liệu bằng cách nêu câu hỏi và ghi nhận
câu trả lời của họ
Ưu điểm
Thời gian thực hiện nhanh
Chi phí thực hiện thấp hoặc không tốn phí
Giảm tính cá nhân trực tiếp
Khả năng hợp tác khá cao khi người được phỏng vấn là quen biết, được giới thiệu
Khả năng tái phỏng vấn thấp do người điều tra có sự chuẩn bị từ trước
Trang 24TẬP THỂ NHÓM 2 Trang 24
2.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Phỏng vấn qua điện thoại
Không gian giao tiếp có thể qua video trực tiếp nên có sự e dè, mất tự nhiên.
Tính đại diện của mẫu thấp vì thu mẫu theo lối thuận tiện.
Thời gian phỏng vấn ngắn.
Khả năng minh họa và giải thích có thể bị hạn chế do diễn tả bằng lời
Trang 252.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Điều tra qua thư tín/internet/website
Là phương thức thu thập dữ liệu không có sự tiếp xúc giữa người phỏng vấn và người được phỏng vấn mà chỉ có bảng câu hỏi và
các hướng dẫn trả lời được gửi đến cho người được phỏng vấn
Trang 26TẬP THỂ NHÓM 2 Trang 26
Các đặc điểm của điều tra qua thư
Sự năng động về mặt địa lý
Quy mô mẫu điều tra có thể nhiều
Chi phí điều tra thấp
Không phải có mặt của điều tra viên
Câu hỏi điều tra trong bảng hỏi phải chuẩn hóa cao
Phản hồi thông tin thấp do thiếu sự thúc ép
Thời gian hoàn tất rất chậm
Tỷ lệ trả lời toàn bộ các câu hỏi khá thấp
2.3 Các phương pháp thu thập dữ liệu sơ cấp
2.3.4 Phương pháp điều tra phỏng vấn
Trang 272.4 Các kỹ thuật lấy mẫu trong thu nhập dữ liệu sơ cấp
Khung mẫu: Danh sách tất cả các thành phần của tổng thể mà dựa vào đó chúng ta rút ra mẫu
Chọn mẫu là chọn lấy 1 số thành phần trong tổng thể để rút ra các kết luận về tổng thể đó
Đơn vị mẫu: 1 thành phần của tổng thể là một cá thể/cá nhân mà người nghiên cứu sẽ tiến hành các đo lường
Khái niệm
Trang 28Tính sẵn có của các thành phần tổng thể
Tốc độ thu thập dữ liệu
cao hơn
Trang 29Các bước thiết kế mẫu
1 Tổng thể mục tiêu
Khi xác định vấn đề nghiên cứu và đặt câu hỏi nghiên cứu, chúng ta phải đã biết mục tiêu nghiên cứu tổng thể để trả lời cho câu hỏi
gì
Đối tượng và phạm vi nghiên cứu
Ví dụ: Hộ gia đình, doanh nghiệp hoặc cá nhân và ở địa bàn nào, thông tin thu thập trong khoảng thời gian nào.
Trang 30TẬP THỂ NHÓM 2 Trang 30
2 Các tham số (parameters) cần quan tâm
Các chỉ số thể hiện cho tổng thể: là các chỉ số tổng hợp các biến của tổng mà chúng quan tâm qua các giá trị trung bình, phương sai,
…
Các chỉ số thống kê mẫu: cũng mô tả các biến trên nhưng là các mẫu
Từ các chỉ số thống kê mẫu dùng phép ước lượng và tham chiếu để xác định các chỉ số thống kê của tổng thể
Trang 313 Khung mẫu
Các bước thiết kế mẫu
Danh sách tất cả các thành phần trong tổng mà sẽ được rút mẫu ra.
Một khung mẫu lý tưởng: 1 danh sách hoàn thiện, đầy đủ và đúng tất cả các thành viên của tổng.
Trang 32TẬP THỂ NHÓM 2 Trang 32
Các bước thiết kế mẫu
4 Phương pháp chọn mẫu phù hợp
Người nghiên cứu phải quyết định phương pháp chọn mẫu nào phù hợp (chọn mẫu xác suất hay phi xác suất)
Việc chọn mẫu xác suất sẽ cho người nghiên cứu có thể đạt được các ước lượng cho nhiều chỉ tiêu nghiên cứu khác nhau
dựa trên sự tin cậy của xác suất
Trang 33Cả 2 quan điểm cũng chưa chính xác
Hai quan điểm về cỡ mẫu:
- Với mẫu phi xác suất: Số lượng nhóm phụ, các nguyên tắc
- Với mẫu xác suất: cỡ mẫu phụ thuộc vào sự biến thiên của các chỉ số thống kê của tổng và
mức độ chính xác của kết quả mà ta muốn có.
Xác định cỡ mẫu
Khái niệm
Trang 34TẬP THỂ NHÓM 2 Trang 34
Một số nguyên tắc ảnh hưởng đến xác định cỡ mẫu
Tổng thể biến thiên càng nhiều thì cỡ mẫu phải lớn để đạt tính chính xác
Nếu sai số càng nhỏ thì cỡ mẫu phải càng lớn
Mức độ tin cậy của ước lượng càng cao thì cỡ mẫu phải càng lớn
Khi tổng thể có nhiều nhóm phụ, thì cỡ mẫu phải càng lớn để cỡ mẫu của từng nhóm phụ phải đạt yêu cầu tối thiểu
Hạn chế về ngân sách cũng ảnh hưởng đến cỡ mẫu, cách chọn mẫu và phương pháp thu thập dữ liệu.
Hạn chế ngân sách làm các nhà nghiên cứu áp dụng các phương pháp chọn mẫu phi xác suất
Trang 352.4.1 Kỹ thuật lấy mẫu xác suất
2.4.1.1 Chọn mẫu ngẫu nhiên đơn giản (Simple random sampling)
Khái niệm
Tức chọn mẫu một cách ngẫu nhiên từ khung mẫu bằng các bảng số ngẫu nhiên, hoặc bằng máy
tính
Cách chức thực hiện
Đánh số mỗi phần tử trong khung mẫu với 1 con số duy nhất, từ 1, 2, 3
Lựa chọn các phần tử bằng con số ngẫu nhiên cho đến khi đạt được cỡ mẫu mong muốn (mỗi phần tử đều có xác suất được
chọn như nhau)
Trang 36TẬP THỂ NHÓM 2 Trang 36
2.4.1.2 Chọn mẫu hệ thống (Symtematic sampling)
Khái niệm
nhiên; sau đó cứ cách một khoảng cố định k đơn vị thì sẽ chọn thêm một quan sát mới.
Trong đó:
n: Cỡ mẫu cần khảo sátN: Tổng thể nghiên cứuk: Khoảng cách lấy mẫu
Các bước thực hiện
Trang 37
2.4.1.3 Chọn mẫu ngẫu nhiên phân tầng
Khái niệm
mẫu ngẫu nhiên đơn giản / hệ thống trong mỗi tầng để chọn ra các quan sát của mẫu.
Cần chú ý khi phân tầng
Chi phí: nếu phân nhiều tầng thì chi phí điều tra càng lớn, phải chọn kích cỡ tổng mẫu cần có và phân bổ mẫu như thế nào để phù hợp cho các tầng.
Đối với phân mẫu theo tầng khác nhau: Chúng ta có thể căn theo tỷ lệ hoặc không theo tỷ lệ trong từng tầng Nếu chọn mẫu phân tầng theo tỷ lệ thì
cỡ mẫu của mỗi tầng đúng theo tỷ lệ của các thành phần có trong từng tầng so với tổng số
Trang 38TẬP THỂ NHÓM 2 Trang 38
2.4.1.4 Chọn mẫu theo nhóm (cluster)
Tổng thể được chia làm nhiều nhóm (mỗi nhóm mang tính đại diện cho tổng thể) và tuân theo nguyên tắc: “cùng nhóm dị biệt, khác nhóm đồng nhất”.
Các nhóm sẽ được chọn một cách ngẫu nhiên để tạo thành mẫu
Ví dụ: Chọn mẫu điều tra hộ gia đình
Bước 1: Lựa chọn ngẫu nhiên một số huyện
Bước 2: Các hộ gia đình được lựa chọn trong các huyện vừa được chọn
Bước 3: Những cá nhân được lựa chọn từ hộ
38
Trang 392.4.1.5 Chọn mẫu nhiều giai đoạn (Double sampling):
Chọn mẫu nhiều giai đoạn hay còn gọi là chọn mẫu nhiều cấp, là phương pháp tổ chức chọn mẫu phải thông qua ít nhất hai giai đoạn
(cấp) chọn trung gian
Đầu tiên xác định các đơn vị mẫu cấp 1 sau đó các đơn vị mẫu cấp 1 lại được phân chia thành các đơn vị chọn mẫu cấp 2 và cứ như
thế cho đến cấp cuối cùng
Khái niệm
Ví dụ: Muốn chọn ngẫu nhiên 50 hộ từ một thành phố có 10 khu phố, mỗi khu phố có 50 hộ Cách tiến hành như sau: Trước tiên đánh
số thứ tự các khu phố từ 1 đến 10, chọn ngẫu nhiên trong đó 5 khu phố Đánh số thứ tự các hộ trong từng khu phố được chọn Chọn ngẫu nhiên ra 10 hộ trong mỗi khu phố ta sẽ có đủ mẫu cần thiết
Trang 40TẬP THỂ NHÓM 2 Trang 40
Ưu, nhược điểm của chọn mẫu nhiều giai đoạn
Ưu điểm
nhanh vì đối tượng nghiên cứu được nhóm lại; Nâng cao chất lượng giám sát và đảm bảo chất lượng số liệu; Tiết kiệm kinh phí, thời gian
Nhược điểm
Trang 412.4.2 Kỹ thuật chọn mẫu phi xác xuất (non-probability sampling)
Khái niệm
Tuy nhiên, một số lý do để chọn phương pháp này là
kiến chuyên gia.
Trang 42TẬP THỂ NHÓM 2 Trang 42
2.4.2.1 Chọn mẫu thuận tiện (Convenient Sampling):
Chọn mẫu thuận tiện thường dùng phổ biến trong nghiên cứu khám phá, để có thể xác định điều gì xảy ra trong thực tế và kiểm tra tính
phù hợp của bảng hỏi trước khi tiến hành điều tra đại trà
Người nghiên cứu chọn một cách tình cờ những phần tử dễ lấy nhất cho mẫu của họ Quy trình chọn mẫu được tiếp tục
cho đến khi đạt cỡ mẫu cần thiết.
Ví dụ: Phỏng vấn các bà nội trợ tại các siêu thị để tìm hiểu về hành vi tiêu dùng của người nội trợ.
Trang 432.4.2.2 Chọn mẫu theo mục đích (Purposive Sampling) hay phán đoán (Judgemental
Sampling)
Người nghiên cứu sử dụng phán đoán của mình để lựa chọn các phần tử nhằm trả lời các câu hỏi nghiên cứu và đạt được các mục tiêu một cách tốt nhất
Cách chọn mẫu kiểu này được sử dụng khi làm việc với mẫu rất nhỏ như nghiên cứu tình huống hay lựa chọn các phần tử đặc biệt chứa
nhiều thông tin (chuyên gia), hoặc phù hợp khi sử dụng vào các giai đoạn đầu của nghiên cứu khám phá
Ví dụ: muốn tìm hiểu thói quen tiêu dùng của phụ nữ thành đạt, nhà nghiên cứu theo phán đoán sẽ chọn những phụ nữ ăn mặc sang
trọng để phỏng vấn
Trang 44TẬP THỂ NHÓM 2 Trang 44
2.4.2.3 Chọn mẫu theo hạn ngạch
Khái niệm
Đây là cách lấy mẫu phân tầng nhưng sự lựa chọn những phần tử trong mỗi tầng hoàn toàn phi ngẫu nhiên Cách này được áp dụng
trong các cuộc khảo sát phỏng vấn
Các bước thực hiện
Chia tổng thể thành những nhóm cụ thể
Tính toán hạn mức cho mỗi nhóm dựa vào dữ liệu liên quan có sẵn
Giao một nhiệm vụ cho mỗi người phỏng vấn, nói rõ số lượng các phần tử trong mỗi hạn mức mà họ phải thu thập dữ liệu
Tổng hợp dữ liệu của những người phỏng vấn để cung cấp 1 mẫu đầy đủ
Trang 452.4.2.4 Chọn mẫu mở rộng dần:
Phương pháp này được thực hiện khi khó xác định/khó tiếp cận các thành viên của tổng thể mong muốn Nó chỉ phù hợp cho các nghiên cứu
định tính
Do đó, ta cần:
- Liên lạc với một hoặc hai phần tử
- Đề nghị các phần tử này giới thiệu các phần tử tiếp theo
- Đề nghị các phần tử mới này giới thiệu các phần tử tiếp theo và tiếp tục như thế cho các phần tử tiếp theo khác; Dừng lại khi không tìm
thêm phần tử mới hay cỡ mẫu đủ lớn để nghiên cứu
Trang 46TẬP THỂ NHÓM 2 Trang 46
2.4.3 Xác định kích cỡ mẫu
Trong nghiên cứu khoa học, cỡ mẫu tối thiểu được xác định qua công thức:
Kích cỡ mẫu tối thiểu = số biến × 5
Nếu số biến là 20, thì kích cỡ mẫu tối thiểu là 20 x 5 = 100; nếu ta làm một khảo sát cần thu thập 20 biến quan sát thì cỡ mẫu tối
thiểu cần phải có là 100
Mẫu tối thiểu trong thống kê là 30 cho mỗi nhóm Tuy nhiên, một mẫu lớn hơn để đại diện cho tổng thể cần phải xét đến trong các
trường hợp sau:
- Khi có sự biến động trong các nhóm lớn, nghĩa là giữa các nhóm không có sự tương đồng thì cần có cỡ mẫu lớn
- Khi muốn sự khác biệt giữa 2 nhóm (between two groups) được giảm bớt thì cũng cần kích cỡ mẫu lớn