Thu thập và xử lí số liệu
Trang 2 Số liệu sơ cấp và số liệu thứ cấp
Số liệu sơ cấp : Những số liệu được quan sát hay thu thập lần
đầu tiên bởi nhà nghiên cứu Số liệu dạng này thường các nhà nghiên cứu tự thu thập từ: bản câu hỏi, phỏng vấn, quan sát, nghiên cứu tình huống, …
Số liệu thứ cấp: Những số liệu đã được công bố hay thu thập trong quá khứ hay do một nhóm thứ ba thu thập Số liệu này thường được thu thập từ các cơ quan có liên quan, các nghiên cứu trước đó, cơ
quan thống kê của chính phủ, Internet, …
nguồn số liệu thứ cấp trước khi quyết định
sử dụng số liệu sơ cấp do chi phí thấp hơn
Số liệu thứ cấp thường được thu thập theo mục
đích của người khác nên đôi khi không phù hợp với mục tiêu đang
nghiên cứu.
Các loại số liệu
Trang 3Số liệu chuổi thời gian, cắt ngang,
và hỗn hợp
• Số liệu chuổi thời gian (Time-series
data): Số liệu chuổi thời gian là một
tập hợp của những quan sát về những giá trị mà một biến số nhận được tại
những thời điểm khác nhau Số liệu này
có thể được thu thập hàng ngày, tuần,
tháng, quý, năm, 5 năm, …
• Số liệu chuổi thời gian thường được sử
dụng trong phân tích kinh tế vĩ mô để thấy
Trang 4Tốc độ tăng trưởng và lạm phát của Việt Nam 1989-2007
Năm Tốc độ tăng trưởng (%) Tỷ lệ lạm phát (%)
Trang 5Số liệu cắt ngang (Cross
section data)
Là số liệu về một hay nhiều biến số
Ví dụ: như tổng điều tra dân số được Cục Tổng điều tra thực hiện mỗi 5
năm, Điều tra về chi tiêu tiêu dùng
Trang 6Sản lượng trứng của các tiểu bang
Hoa Kỳ
Trang 7Số liệu hỗn hợp (Panel
data)
là số liệu được kết hợp bởi cả số liệu chuổi thời gian và cắt ngang: cùng một đơn vị cắt ngang (chẳng hạn,
một gia đình hay một công ty) được quan sát theo thời gian
Trang 8Ví dụ về số liệu hỗn hợp
Trang 9Các phương pháp chọn mẫu
1. Chọn mẫu phi xác suất: Chọn mẫu
theo ý định chủ quan của người NC.
2. Chọn mẫu xác suất: Dựa vào lý
thuyết xác suất để lấy mẫu ngẫu
nhiên
Trang 11Chọn mẫu thuận tiện
Các đơn vị mẫu được chọn ở tại một địa điểm và vào một thời gian nhất định
Vd: chọn mẫu những người đi mua sắm ở Metro
CT và tiếp cận họ khi họ bước vào sthị hoặc khi họ mua sắm món hàng mà ta muốn khảo sát.
Ưu điểm: dễ dàng tập hợp các đơn vị mẫu
Nhược điểm: không đạt được độ xác thực cao
Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện”
Trang 12Chọn mẫu phán đoán
Các đơn vị mẫu được chọn dựa vào sự phán đoán của người nghiên cứu mà họ nghĩ rằng những mẫu này có thể đại diện cho tổng thể
Vd: Chọn mẫu một số ít liên doanh lớn có thể
chiếm phần lớn tổng sản lượng ngành công nghiệp
Trang 13Chọn mẫu chỉ định
Là chọn mẫu theo tỷ lệ gần đúng của các nhóm đại diện
trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi nhóm
Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát để
so sánh kết quả thống kê về thái độ khách hàng Hoặc tổng thể NC bao gồm 1.000 c.ty, trong đó 600 c.ty vừa và nhỏ,
300 trung bình và 100 qui mô lớn Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 c.ty vừa và nhỏ, 30 trung bình
Ưu điểm: đảm bảo được số mẫu cần thiết cho từng nhóm
trong tổng thể phục vụ khách hàng
Trang 14Chọn mẫu theo mạng quan hệ
lời đầu tiên để tiếp cận những người trả lời
F
Trang 15Chọn mẫu theo mạng quan hệ
Các mẫu đầu tiên được chọn theo
phương pháp xác suất
Các mẫu tiếp theo được chọn ra từ việc cung cấp thông tin qua hình
thức nhờ giới thiệu
Áp dụng cho các nội dung NC khá
đặc biệt, không phổ biến
Ưu điểm: Giúp cho người NC chọn
được các mẫu mà họ cần NC.
Trang 17Chọn mẫu ngẫu nhiên đơn giản
Là cách chọn mẫu mà mỗi phần tử trong tổng thể có cùng cơ hội được chọn với xác suất như nhau Để chọn được mẫu, người NC phải có danh sách tổng thể NC
Vd: Chọn ngẫu nhiên 100 mẫu sinh
viên trong tổng số 4.000 sinh viên
Khoa Kinh Tế & QTKD.
Trang 18Chọn mẫu có hệ thống
Chọn ngẫu nhiên mẫu đầu tiên.
Sau đó dùng bước nhảy (lặp đi lặp lại)
Áp dụng tốt nếu danh sách tổng thể được xếp ngẫu nhiên (giảm sai lệch
do tuần hoàn bước nhảy)
Vd: PV các hộ gia đình vùng nông
thôn
Trang 19Chọn mẫu ngẫu nhiên phân tầng
Là phân chia các đối tượng nghiên cứu thành các nhóm, tầng theo các đặc tính, sau đó lấy mẫu
theo tầng, nhóm.
Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức nào đó gọi là tiêu thức phân tầng (thu nhập, giới tính, tuổi tác, TĐHV, nhân khẩu,…).
Chọn ngẫu nhiên hay hệ thống trong từng nhóm phân tầng theo tỷ lệ với nhóm.
Trang 20SO SÁNH CHỌN MẪU XÁC
SUẤT VÀ PHI XÁC SUẤT
Xác suất Phi xác suât
Ưu điểm Tính đại diện cao.
Khái quát hóa cho tổng thể.
Tiết kiệm thời gian
và chi phí.
Nhược điểm Tốn kém thời gian và
chi phí. Tính đại diện thấp.Phạm vi sử dụng Nghiên cứu mô tả,
nhân quả và khám phá. Nghiên cứu thăm dò, thử nghiệm.
Trang 21Thiết kế bảng câu hỏi
Trang 222 Nội dung BCH
Phần giới thiệu
Giới thiệu bản thân phỏng vấn viên.
Giới thiệu lý do, mục đích nghiên cứu.
Khoảng thời gian cần thiết để hoàn thành Phần sàng lọc
Chọn đúng đối tượng để thu dữ liệu.
Thường dùng BCH phân đôi.
Phần nội dung chính
Đa số câu hỏi liên quan đến nội dung NC.
Phần quản lý: xác nhận, lời cam đoan, mẫu số.
Trang 23Ví dụ
Phần giới thiệu
Xin chào, tôi là thuộc nhóm
nghiên cứu Chúng tôi đang thực hiện
đề tài Anh (chị) vui lòng dành chút thời gian khoảng để giúp chúng tôi trả lời một
số câu hỏi dưới đây
Chúng tôi rất hoan nghênh sự cộng tác và giúp đỡ của anh (chị) Các ý kiến trả lời
của anh (chị) sẽ được đảm bảo giữ bí mật tuyệt đối
Trang 25Những việc cần làm khi thiết kế
BCH
1 Xác định thông tin cần thiết
Dự án nghiên cứu Bảng câu hỏi Nhóm người trả lời
Danh mục các
thông tin cần có Các câu hỏi cần được chi tiết Các dữ liệu cần thu thập
Vd: năng suất lúa Sản lượng từng vụ
Diện tích từng vụ Sản lượng đã thu hoạch
Diện tích gieo trồng
Trang 262 Xác định hình thức phỏng vấn
Thư tín: tiện lợi, chi phí thấp nhưng
tỷ lệ trả lời thấp, khó xác định độ tin cậy của thông tin được thu thập.
Điện thoại: tốn kém, chỉ áp dụng khi thu thập ít thông tin và thời gian
phỏng vấn ngắn; thông tin tương đối tin cậy
Trực tiếp: thông tin tin cậy, tỷ lệ trả lời cao nhưng tốn kém
Trang 273 Lựa chọn cấu trúc câu hỏi
Câu hỏi mở:
Phần trả lời không định trước, đáp viên tự trả lời theo suy nghĩ
Khai thác ý kiến mới
Tạo quan hệ mật thiết khi trả lời
Khó khăn khi đáp viên trả lời dài dòng, lạc
đề
Trang 294 Từ ngữ sử dụng trong BCH
Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ: Who, What, Where, When, Why, How.
Sử dụng từ ngữ đơn giản, thông dụng.
Tránh dùng từ ngữ trừu tượng (Vd: đi sthị có
thường không?)
Tránh dùng câu hỏi có 2 vế song song (vừa - vừa).
Cẩn thận câu hỏi liên quan đến tự ái cá nhân (hỏi
Trang 316 Nhập số liệu
nhập,
để phục vụ cho việc đọc số liệu trong tập tin dữ liệu
xử lý bảng tính: Excel, SPSS, Stata,
Limdep, …
sánh ngẫu nhiên một số mẫu; tổ chức
nhiều người nhập liệu song song, …
Trang 32XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU
i Phân tích thống kê mô tả
dãy biến động, hệ số biến động
ii Phân tích tần số: đếm tần số xuất hiện,
Trang 33Các bước trong phân tích số liệu và viết
báo cáo
Những câu hỏi
cần trả lời
Các bước cần thực hiện
Các công việc chính trong
mỗi bước
Các số liệu đã được thu
thập cho mỗi mục tiêu
NC là gì?
Số liệu có hoàn chỉnh
và chính xác không?
Chuẩn bị số liệu cho phân tích
-Xem xét lại việc thu thập tại thực địa,
-Lập bảng kiểm kê các số liệu cho mỗi mục tiêu,
-Xếp thứ tự các số liệu và kiểm tra chất lượng,
-Kiểm tra output của máy tính
Các số liệu trông như thế
nào?
Các số liệu có thể được
tóm tắt như thế nào cho
phân tích đơn giản?
Tóm tắt số liệu và
mô tả các biến/xác định biến mới
B ảng tần suất, biểu đồ, biểu đồ phát triển, tỷ trọng, tần suất chéo, hệ số tương quan, các thống kê
Trang 34-B ảng tần suất chéo, -Đo lường sự tương quan, -Xử lý các biến nhiễu.
C ó đo lường sự chênh
lệch hay tương quan
giữa các biến không ?
Chu ẩn bị cho phân tích thống kê
- C ác đo lường sự phân tán, phân phối chuẩn và sự biến động mẫu
X ác định loại của phân tích thống kê
T-test, chi-square test paired t-test
Mc-Nemar’s chi-square test
L àm thế nào sự tương
quan giữa các biến có
thể được xác định ?
Th ực hiện các đo lường về sự tương quan
Bi ểu đồ phân tán, Đường hồi quy, và
H ệ số tương quan
Trang 35B áo cáo nên được
viết như thế nào ? Viết báo cáo và xây
dựng các kiến nghị
-Chu ẩn bị dàn ý của báo cáo,
-Trình bày và diễn dịch số liệu,
-Bản nháp và bản nháp lần 2.
-Thảo luận và tóm tắt kết luận
Thảo luận những tóm tắt
và kế hoạch thực hiện đối với những người liên quan