Với bộ dữ liệu đã thu thập, ta phân tích dữ liệu như thế nào để đáp ứng các Mục tiêu, Câu hỏi, Giả thuyết nghiên cứu?. Quy trình phân tích dữ liệu 4 Đề cương NC Thu thập và chuẩn bị
Trang 1Chiến lược xử lý dữ liệu
Trần Tiến Khai Khoa Kinh tế Đại học Kinh Tế TP Hồ Chí Minh
Trang 2Cấu trúc bài
2 Quy trình phân tích dữ liệu
3 Chuẩn hóa dữ liệu
4 Phân tích đơn biến
5 Phân tích đa biến
2
Trang 31 Câu hỏi thường gặp
Ta có các Mục tiêu, Câu hỏi, Giả thuyết nghiên cứu nào?
Với bộ dữ liệu đã thu thập, ta phân tích dữ liệu như thế nào để đáp ứng các Mục tiêu, Câu hỏi, Giả thuyết nghiên cứu?
Ta có thể sử dụng các thống kê phân tích nào?
Trình tự phân tích nên như thế nào?
3
Trang 42 Quy trình phân tích dữ liệu
4
Đề cương NC
Thu thập và chuẩn
bị dữ liệu
Phân tích và diễn giải dữ liệu
Phân tích thống kê mô tả các biến số
Phân tích thống kê mối liên quan, tương quan giữa các biến số
Trắc nghiệm giả thuyết
Trắc nghiệm giả thuyết Trắc nghiệm giả thuyết Làm sạch, kiểm tra, đánh giá, thăm dò bộ dữ liệu
Trang 53 Chuẩn hóa dữ liệu
Trang 63 Chuẩn hóa dữ liệu
Trang 73 Chuẩn hóa dữ liệu
Phát hiện những giá trị dị biệt
7
Trang 8Dùng Excel: công cụ filter
8
Trang 9Dùng Excel: Hàm min, max
9
Trang 10Dùng SPSS: scatter, bar chart,
pie chart, histogram, box plot
10
Trang 11Dùng SPSS: scatter, bar chart,
pie chart, histogram, box plot
11
Trang 12Dùng SPSS: scatter, bar chart,
pie chart, histogram, box plot
12
Trang 13Dùng SPSS: scatter, bar chart,
pie chart, histogram, box plot
13
Trang 14Dùng SPSS: scatter, bar chart,
pie chart, histogram, box plot
Các giá trị lớn hơn 3 lần so với độ dài của hộp tính từ giá trị tứ phân vị thứ 3 (75 th percentile) (extremes)
Các giá trị lớn hơn 1,5 lần so với độ dài của hộp tính từ giá trị tứ phân vị thứ 3 (75 th percentile) (outliers)
Giá trị lớn nhất quan sát được không phải là giá trị bất thường
Tứ phân vị thứ 3 (75 th PERCENTILE) Trung vị (MEDIAN)
Trang 15Dùng SPSS: scatter, bar chart,
pie chart, histogram, box plot
15
Trang 164 Phân tích đơn biến
Mục tiêu và kiểu của các câu hỏi nghiên cứu
So sánh nhóm
Tóm lược
dữ liệu Quan hệ giữa các biến Thuần Mô tả
Thống kê khác biệt (v.d t-test,
ANOVA)
Thống kê liên
quan (v.d tương quan, hồi quy)
Thống kê mô
tả (v.d trung bình, tỷ lệ, tần suất)
Trang 174 Phân tích đơn biến
Trang 18Thống kê mô tả cho biến định lượng: cho toàn bộ mẫu
so nhan khau trong
Trang 19Thống kê mô tả cho biến định
lượng: cho các mẫu phụ
19
95% Confidence Interval for
Trang 20Thống kê mô tả cho biến định tính: bảng tần suất và bảng chéo
20
trinh do hoc van cua chu ho
Cumulative Percent
Trang 21Thống kê mô tả cho biến định tính: bảng tần suất và bảng chéo
Trang 224 Phân tích đơn biến
likelihood-• Spearman's correlation coefficient
• Nominal: Contingency coefficient, Phi (coefficient) and Cramér's V, Lambda
• Ordinal: Gamma, Kendall's tau-b, and Kendall's tau-c
• Nominal by Interval: Eta
• Others
Hình 3 Các bước thống kê liên quan
22
Trang 23Phân tích tương quan:
23
Correlations
so nhan khau trong
ho
so lao dong chinh
so lao dong nam
so lao dong
nu
so nguoi phu thuoc
so nhan khau
trong ho
Pearson Correlation
Trang 24Phân tích tương quan:
24
Correlations
Tinh trang kinh te
ho
tinh trang suckhoe
trinh do hoc van cua chu
ho
ky nang cua chu
ho Kendall's tau_b Tinh trang kinh
te ho
Correlation Coefficient
tinh trang suckhoe
Correlation Coefficient
trinh do hoc van cua chu ho
Correlation Coefficient
ky nang cua chu ho
Correlation Coefficient
Trang 254 Phân tích đơn biến
Measurement
scale
One-sample Case
Two-Samples Tests k-Samples Tests
Related Samples
Independent Samples
Related Samples
Independent Samples
• χ2 one-sample test
test
• χ2 sample test
two-• Cochran Q • χ2 for
k-samples
Kolmogorov-Smirnov sample test
one-• Runs test
• Sign test
• Wilcoxon matched-pairs test
• Median test
• Whitney U
Mann-• Smirnov
Kolmogorov-• Wolfowitz-
Wald-• Friedman two-way ANOVA
• Median extension
• Wallis one-way ANOVA
Kruskal-Interval and Ratio • T-test
• Z test
• T-test for paired samples
• T-test
• Z test
• measured ANOVA
Repeated-• One-way ANOVA
• n-way ANOVA
Các kiểm định thống kê so sánh thường dùng phân theo thang đo của dữ liệu và số lượng mẫu phụ
25
Trang 265 Phân tích đa biến
Metric multi- dimen- sional scaling
Canonical analysis with dummy variables
Linear proba- bility models
Multivariate methods
Conjoi
nt analysi
s
Cluster analysis
variate analysis of variance Canonical analysis
Multi-Multiple discrimi -nant analysi
n
Factor ana- lysis
Metric canonic
al analysi
s
Nonmetric multi- dimen- sional scaling
ponden-
Corres-ce analysis
Interdependence methods
Multiple dependent and indepen- dent variables
Metric Nonmetric Several
dependent variables
Dependence methods
Trang 27Bài tập ứng dụng
Phân tích dữ liệu Điều tra hộ gia đình tại xã A
Yêu cầu phân tích ở nhà trước giờ giảng
Đọc kỹ slide của Bài trình bày (gởi kèm), đọc tài liệu về phân tích đa biến và nhớ lại các kỹ thuật phân tích thống kê từ
giản đơn đến phức tạp đã biết
Sử dụng phần mềm SPSS để mở file dữ liệu (Dieu tra tai xa A)
Quan sát phần mô tả đặc điểm của các biến và xem kỹ thang
đo của các biến
Suy nghĩ đề xuất các mục tiêu phân tích phù hợp; phác họa chiến lược phân tích dữ liệu theo các bước
27
Trang 2828
Trang 29 Giá trị trung bình về số nhân khẩu, số lao động chính, số lao động nam, số người phụ thuộc theo Phân loại nghèo theo địa phương
29
Trang 30Bài tập ứng dụng
3 Kiểm định các giả thuyết
Giữa các biến số nhân khẩu, số lao động chính,
số lao động nam, số người phụ thuộc
30