Phaân tích döõ lieäu nghieân cöùu 1 BÀI 1 TỔNG QUAN VỀ PHÂN TÍCH DỮ LIỆU THỐNG KÊ 2 Phần mềm phân tích dữ liệu & dự báo? SPSS Eviews STATA Excel ForecastX SAS Metastock 3 3 Thống kê là[.]
Trang 1BÀI 1: TỔNG QUAN
VỀ PHÂN TÍCH DỮ LIỆU THỐNG KÊ
Trang 2Phần mềm phân tích dữ liệu & dự báo?
Eviews
Excel
ForecastX
Metastock
Trang 33 3
Thống kê: là ngành khoa học nghiên cứu hệ thống các phương pháp thu thập, xử lý và phân tích các
mặt lượng của hiện tượng số lớn để tìm hiểu bản
chất và tính qui luật vốn có của chúng trong điều
kiện thời gian và địa điểm cụ thể.
Thống kê là gì?
Trang 4Các loại dữ liệu
Dữ liệu
– Chéo (cross-sectional data): thu thập trong cùng hay gần cùng một thời điểm
– Chuỗi thời gian (time-series data): thu thập trong các thời điểm liên tiếp nhau
– Bảng (Panel Data): các quan sát của dữ liệu bao gồm quan sát chéo và các quan sát chéo này lại được quan sát theo thời gian
Dữ liệu
– sơ cấp: trực tiếp thu thập
– thứ cấp: đã qua xữ lý
Dữ liệu định tính/ định lượng
Trang 5115
X
Chi tiêu và thu nhập của hộ gia đình:
Trang 6Năm Mức tiêu dùng (Yi) Thu nhập (Xi) Năm Mức tiêu dùng (Yi) Thu nhập (Xi)
1971 48.34 52.02 1981 57.17 63.36
1972 48.54 52.41 1982 60.84 67.42
1973 47.44 51.55 1983 60.73 67.86
1974 54.58 58.88 1984 76.04 83.39
1975 55 59.66 1985 76.42 84.26
1976 63.49 68.42 1986 69.34 77.41
1977 59.22 64.27 1987 61.75 70.08
1978 57.77 63.01 1988 68.78 77.44
1979 60.22 65.61 1989 67.07 75.79
1980 55.4 61.05 1990 72.94 81.89
Trang 7Quy trình chuẩn bị, phân tích dữ liệu
Trang 8Các loại biến
Biến định tính (nhãn hiệu, giới tính, nghề
nghiệp …)
Biến định lượng
- Rời rạc : số người trong hộ, số bàn ghi được trong một trận bóng đá
- Liên tục: chiều cao của thanh niên, trọng lượng của sản phẩm, giá sản phẩm …
Trang 9Các loại thang đo
Thang đo định danh (Nominal)
Thang đo thứ bậc (Ordinal)
Thang đo khoảng (Interval)
– Likert, dạng Likert,
– thang đo đối nghĩa (thang đo tính từ cực, Osgood)
– …
Thang đo tỷ lệ (Ratio)
Trang 10Thang đo định danh
10
Các loại thang đo
Ví dụ:
Tribeco 3 Sprite 4
Trang 11Thang đo thứ bậc
11
Các loại thang đo
Cũng được sử dụng cho biến định tính, khi mà các biểu hiện của dữ liệu có sự hơn kém, khác biệt về thứ bậc.
Ví dụ: Trình độ văn hóa Mã số hóa
Trung cấp 1
Trang 12Thang đo khoảng
12
Các loại thang đo
Ví dụ:
Rất không thích 1
Không thích 2
Bình thường 3
Rất thích 5
9 -> 10 1
8 ->9 2
7 -> 8 3
5 -> 7 4
< 5 5
Trang 1313
Trang 14Phân tích đơn biến
Thống kê mô tả
Bảng tần số
One-sample T-test
…
Trang 15Phân tích nhị biến
Phân tích quan hệ giữa 2 biến định tính:
Chi-square
Phân tích quan hệ giữa 2 biến định lượng:
Correlation, Simple Regression
Phân tích ảnh hưởng của một biến định tính đến một biến định lượng:
- Independent samples t-test
- ANOVA
Trang 16Phân tích đa biến
Phân tích ảnh hưởng của các biến độc lập (biến giải thích) đến 1 biến phụ thuộc Y=f(X1,X2,X3,…Xm)
Khi Y là biến định lượng : Multiple regression Model Khi Y là biến định tính có 2 thuộc tính: Logit Model/ Probit Model/ Discriminant Analysis
Nhóm các quan sát theo từng cụm: Cluster Analysis
Rút gọn các biến : Factor Analysis
Kiểm định độ tin cậy của thang đo: Cronbach’s Alpha
Các công cụ phân tích đa biến khác: MDS, CFA, SEM…
Trang 17Chú ý
Các kỹ thuật trên sử dụng cho cả 3 loại dữ liệu
Tuy nhiên, người ta đã phát triển nhiều mô hình kinh tế lượng chuyên sâu hơn dành cho dữ liệu bảng (Pooled, FEM, ECM…)
Nhiều mô hình hinh tế lượng chuyên sâu dành cho dữ liệu chuỗi thời gian: ARIMA, SARIMA, ARCH-GARCH, VAR, mô hình động, hệ
phương trình …
Trang 18Phân tích dữ liệu để làm gì?
Để hỗ trợ quá trình ra quyết định
Kiểm định lý thuyết
Gợi ý chính sách
Dự báo
Trang 19Các kỹ thuật dự báo định lượng trong kinh doanh
Mô hình chuỗi thời gian
- Đơn giản
- Hàm xu thế
- San mũ
- Phân tích các thành phần của chuỗi thời gian
Mô hình nhân quả
Nguồn: Wilson (2007)