Đo lường định lượng; Thực hiện phân tích định lượng; Một số dạng mô hình phân tích định lượng chủ yếu
Trang 2Nội dung
Đo lường định lượng
Thực hiện phân tích định lượng
Một số dạng mô hình phân tích định
lượng chủ yếu
Trang 3I Đo lường định lượng
định tính
3
Trang 4Tại sao phải đo lường?
lường”????
4
Trang 5So sánh đo lường định lượng
(Q1) với đo lường định tính (Q2)
trước và tách biệt với việc thu thập hay phân tích số liệu;
số liệu
5
Trang 6So sánh đo lường định lượng
(Q1) với đo lường định tính (Q2)
tạo ra các con số định lượng;
dạng viết, nói, hành động, âm thanh, hình ảnh, vật thể
6
Trang 7So sánh đo lường định lượng
(Q1) với đo lường định tính (Q2)
hệ) (linkages) giữa khái
niệm và số liệu:
Q1 xây dựng kỹ thuật đo
lường làm cầu nối (suy
diễn)
7
Trang 8So sánh đo lường định lượng (Q1) với đo lường định tính (Q2)
Q2: Phát triển nhiều khái
niệm trong khi thu thập dữ
liệu;
Đồng thời tái xem xét dữ liệu
và khái niệm trong mối quan
hệ qua lại;
Trong quá trình thu thập dữ
liệu và tạo ra cách thức đo
lường, có thể phát các ý tưởng
Trang 9Các bước trong đo lường định
lượng
Operationalization (thao tác hóa)
9
Trang 10Conceptualization vs
Operationalization
10
Trang 11Chỉ số đo lường (5 điều cần nhớ)
11
Trang 12Yêu cầu đối với đo lường định lượng: reliability & validity
dependability (tin cậy) hoặc consistency (chính xác)
lường): match bw a construct and a
measure
12
Trang 13các đặc điểm của quá trình đo lường
hay công cụ đo lường
reliability!!!
13
Trang 14Cải thiện reliability: 4 cách
Xây dựng các khái niệm rõ ràng: các khái
niệm phân biệt nhau và (thường) mỗi một sự
đo lường ứng với một và chỉ một khái niệm
Dùng đơn vị/mức độ/ thang đo lường chính xác
Sử dụng các kiểm tra thí điểm
Sử dụng nhiều chỉ tiêu cùng lúc cho 1 đo
lường
14
Trang 16conceptual definition (định nghĩa khái niệm)và operational definition (định
nghĩa thao tác)
16
Trang 17Có thể đạt được:
17
Trang 18Nhưng,
validity!!!
trong khi các chỉ tiêu là cụ thể
18
Trang 19Ba kiểu của validity
khoa học (sự đồng thuận)
Ví dụ: Tăng trưởng kinh tế (GDP hay
GNP?), lạm phát (chỉ số giá tiêu dùng CPI hay chỉ số giá sản xuất PPI?)
19
Trang 20 Content validity: Đánh giá nội dung của định nghĩa của một cấu trúc và xây dựng chỉ số bao hàm các nội dung ấy
(3 bưới tiến hành: a Chỉ ra toàn bộ nội
dung của định nghĩa của cấu trúc; b chọn
mẫu từ các khía cạnh khác nhau của
định nghĩa; c phát triển một chỉ số bao
hàm tất cả các bộ phận của định nghĩa)
20
Trang 21 Criterion validity: Đánh giá dựa vào các tiêu chuẩn
phải đồng thuận/tương hợp (không
nhất thiết phải perfectly) với các chỉ số đã có trước đó (có face validity)
21
Trang 22 Predictive validity: Khả năng tiên đoán tương lai (không phải là dự báo tương lai!)
Ví dụ: Điểm SAT cao đo lường năng lực học tập: SAT cao -> học tốt: có
predictive validity)
22
Trang 23 Concurrent validity: Chỉ số phải có
tương quan cao với 1 chỉ số khác đã có face validity
kiện tương lai có quan hệ lô gích với
cấu trúc (ý tưởng và khái niệm)
23
Trang 24Một số lưu ý về đo lường định
lượng: Mức độ đo lường (levels)
Biến liên tục: số thực
Biến rời rạc: theo các phạm trù, phân
loại, phân nhóm, tình trạng
24
Trang 25 Nominal: định danh
+ khoảng cách
25
Trang 26Bốn mức độ đo lường
26
Trang 27II Thực hiện phân tích định
lượng
biến)
27
Trang 28Mã hóa, nhập liệu và làm sạch số liệu
checking): kiểm tra loại dữ liệu
cleaning): kiểm tra độ chính xác (kiểm tra chéo)
28
Trang 29Thống kê mô tả: đơn biến
phối tần số
29
Trang 30 Histogram, bar
chart, pie chart
30
Trang 31 Frequency polygon (đa giác tần số)
31
Trang 32Thống kê mô tả: đơn biến
Trang 33Thống kê mô tả: đơn biến
Trang 34Thống kê mô tả: nhị biến (mối quan hệ)
means
xu hướng, không có mối quan hệ
34
Trang 35Thống kê mô tả: nhị biến
35
Trang 36Thống kê mô tả: nhị biến
Cross-tabulation
36
Trang 39Suy luận thống kê: Sai lầm
Loại I và sai lầm Loại II
nói mối quan hệ tồn tại (tham chiếu giả thuyết đối) nhưng thực tế mối quan hệ ấy KHÔNG tồn tại
nói mối quan hệ KHÔNG tồn tại (tham chiếu giả thuyết không) nhưng thực tế mối quan hệ ấy tồn tại
39
Trang 40Null Hypothesis (H 0 ) is true
Alternative Hypothesis (H 1 ) is true
Fail to Reject
Null
Hypothesis Right decision
Wrong decision Type II Error False Negative
Reject Null
Hypothesis
Wrong decision Type I Error False Positive Right decision
40
Trang 41Suy luận thống kê: mức ý
nghĩa
0.05, và 0.01): Xác suất bác bỏ sai giả thuyết không, nếu nó thực sự đúng
=anpha
(Luôn biết chính xác từ mẫu)
41
Trang 42Suy luận thống kê: power
không khi nó thật sự sai
Power = 1 - P(type II error) = 1- beta
Lý tưởng khi Power tiến tới 1
(Không biết chính xác)
42
Trang 43nghĩa thấp hơn 1%
1%
chạy mô hình), chọn mức ý nghĩa 10%
43
Trang 44III Mô hình phân tích định
lượng
trưởng kinh tế, đến chuyển dịch cơ cấu kinh tế, đến đổi mới công nghệ
kinh tế, đến chuyển dịch cơ cấu kinh tế, đến đổi mới công nghệ, đến thay đổi
chất lượng lao động
44
Trang 45III Mô hình phân tích định
lượng
phương pháp nghiên cứu!!!
dụng phương pháp nghiên cứu định
tính hay định lượng
tích định lượng cụ thể
45
Trang 46Mô hình phân tích định lượng
Số liệu liên tục dạng chéo (cross-sectional)
Số liệu liên tục theo thời gian (time series)
Số liệu dạng bảng (panel: vừa
cross-sectional vừa time series)
Số liệu rời rạc
Số liệu phân tầng
46
Trang 47Mô hình phân tích định lượng
1 Mô hình hồi quy tuyến tính sử dụng số liệu chéo
2 Mô hình hồi quy tuyến tính theo thời gian
3 Mô hình hồi quy tuyến tính với số liệu dạng bảng (panel)
4 Các mô hình lựa chọn với biến rời rạc
(discrete choice models)
47
Trang 48Mô hình phân tích định lượng
6 Phân tích thành tố (factors)
7 Phân tích phi tham số (non-parametric)
8 Kinh tế lượng không gian (spatial
econometrics)
(Ghi chú: phần chữ đỏ dành cho nâng
cao)
48
Trang 49Mô hình hồi quy tuyến tính
Phân tích hồi quy quan tâm:
Ước lượng giá trị trung bình của biến phụ
thuộc (Y) với giá trị đã cho của biến độc lập (Xi): E(Y/Xi)
Kiểm định giả thiết về bản chất của sự phụ
thuộc
Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của các biến độc lập
49
Trang 50Mô hình hồi quy tuyến tính
Hồi quy và tương quan:
Phân tích hồi quy đo mức độ quan hệ tuyến tính giữa hai biến; ước lượng hay dự báo một biến trên cơ sở giá trị đã cho của một biến
khác; các biến không có tính đối xứng; biến phụ thuộc là đại lượng ngẫu nhiên, biến giải thích là phi ngẫu nhiên.
Phân tích tương quan không có sự phân biệt giữa các biến, chúng có tính chất đối xứng.
50
Trang 51Mô hình hồi quy tuyến tính
Hàm hồi quy và quan hệ nhân quả:
Quan hệ nhân quả nếu biến X là nguyên nhân mang lại kết quả Y và ngược lại, nếu có kết quả Y thì có thể suy luận do nguyên nhân X.
Quan hệ nhân quả tồn tại dựa trên các xác
lập của lý thuyết kinh tế.
Phân tích hồi quy không nhất thiết phải là
phân tích quan hệ nhân quả
51
Trang 52Mô hình hồi quy tuyến tính
Quan hệ thống kê và quan hệ hàm số:
Phân tích hồi quy nghiên cứu quan hệ thống kê của một biến phụ thuộc vào một biến (hay nhiều biến) độc lập theo nghĩa, ứng với một giá trị của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc Đo đó biến phụ thuộc là đại lượng ngẫu nhiên Có phân phối xác suất.
Quan hệ hàm số: Ứng với mỗi giá trị của biến độc lập có duy nhất một giá trị của biến phụ thuộc; các biến số không phải là ngẫu nhiên.
52
Trang 54Mô hình hồi quy tuyến tính
Tuyến tính Y=1+2X
Tuyến tính log (log-linear) LnY=1+2LnX
Log – lin LnY=1+2X
Lin – log Y=1+2LnX
Nghịch đảo Y=1+2(1/X)X)
54
Trang 55Mô hình hồi quy tuyến tính
log LnY=X 1+2Ln 1, 2 2 (Y/X)Y/X)) 2
Log – lin LnY=1+2X 1, 2 2 Y 2 X
Lin – log Y=1+2LnX 1, 2 2 (Y/X)1/X)) 2 (1/X)Y) Nghịch
đảo Y=1+2(1/X)X) 1, 2 -2(1/X)X
2 ) -2 (1/X)XY)
55
Trang 56Hệ số co dãn
nghĩa như sau:
(EY/X)X) cho biết khi X tăng 1% thì Y tăng
(hay giảm) bao nhiêu %
56
/X)
/X) /X)
Trang 57Mô hình hồi quy tuyến tính
quy
57
Trang 58Ví dụ
USD) phụ thuộc “tỷ lệ lao động trong
nông nghiệp, x1 (%)” và “số năm được đào tạo đối với lao động trên 25 tuổi, x2 (số năm)”
58
Trang 59Giả thuyết lý thuyết vs giả
thuyết thống kê
Hai giả thuyết kinh tế trong bài toán này:
Giả thuyết 1: Mức thu nhập của nền kinh tế phụ thuộc vào mức độ phụ thuộc vào nông nghiệp của nền kinh tế đó Cụ thể, thu nhập bình quân đầu người có quan hệ nghịch với mức độ phụ thuộc vào nông nghiệp của nền
kinh tế.
59
Trang 60Giả thuyết 2: Mức thu nhập của nền kinh tế phụ thuộc vào trình độ đào tạo của lao động Nói cách khác, trình độ đào tạo của lao động cao có xu hướng đi cùng với thu nhập bình quân cao.
60
Trang 61Biến lý thuyết vs biến đại
diện
61
Trang 62Biến đại diện (proxy variable)
“tỷ lệ lao động trong nông nghiệp, x1 (%)”
-> biến số kinh tế “mức độ phụ thuộc vào
nông nghiệp của nền kinh tế”
“số năm được đào tạo đối với lao động trên
25 tuổi, x2 (số năm)” -> biến số kinh tế
“trình độ đào tạo của người lao động”
“thu nhập bình quân (USD)” -> “mức thu
nhập”
62
Trang 63Kiểm định giả thuyết thống kê
thuyết hệ số hồi quy của x1 bằng không và đồng thời nêu ý nghĩa kinh tế của hệ số này
63
Trang 64 Giả thuyết không: Tỷ lệ lao động trong
nông nghiệp không ảnh hưởng đến thu
nhập bình quân,
nghiệp có ảnh hưởng đến thu nhập bình
Trang 65 Kết quả kiểm định: có thể bác bỏ giả thuyết không nói rằng tỷ lệ lao động trong nông nghiệp không ảnh hưởng đến thu nhập bình quân ở mức ý nghĩa 5% Nói cách khác, chúng ta chấp nhận giả thuyết cho rằng tỷ lệ lao động trong nông nghiệp có ảnh hưởng đến thu nhập bình quân ở mức ý nghĩa 5%.
Kết quả kiểm định còn cho thấy mối quan hệ giữa thu nhập bình quân và tỷ lệ lao động trong nông nghiệp là nghịch chiều.
65
Trang 66Giả thuyết lý thuyết vs giả
thuyết thống kê
Quy trình: Từ giả thuyết kinh tế đi
đến giả thuyết thống kê, trình bày kết quả kiểm định, phát biểu kết quả kiểm định (bác bỏ hay chấp nhận giả thuyết không), phát biểu mối quan hệ theo
giả thuyết thống kê, và phát biểu mối quan hệ theo giả thuyết kinh tế.
66
Trang 67Ý nghĩa kinh tế của biến liên tục
Tên Mô
hình Dạng mô hình Ý nghĩa kinh tế của hệ số hồi quy 2
Tuyến tính Y=1+2X X) tăng 1 đơn vị, Y tăng 2
đơn vị
Tuyến tính
log LnY=1+2LnX X) tăng 1%, Y tăng 2 %
Log – lin LnY=1+2X X) tăng 1 đơn vị, Y tăng
100* 2 (Y/X)%)
Lin – log Y=1+2LnX X) tăng 1%, Y tăng 0.01* 2
đơn vị
Trang 68Ý nghĩa kinh tế của biến liên tục
Nghịch đảo Y=1+2(1/X)X)
(2 dương)
X) tăng 1 đơn vị, Y giảm 2 *(Y/X)1/X) 2 )
Y=1+2(1/X)X) (2 âm)
X) tăng 1 đơn vị, Y tăng 2 *(Y/X)1/X) 2 )
1 Là giá trị ngưỡng (giới hạn) khi X tiến tới vô cùng
Ghi chú (vi phân): 2 =d(biến phụ thuộc)/X)d(biến giải thích)
Trang 69Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
69
Trang 70Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
70
Trang 71Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
71
Trang 72Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
72
Trang 73Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
73
Trang 74Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
74
Trang 75Binary choice model
Khái niệm: Biến ẩn (Y/X)latent variable)
Giả sử biến “tình trạng hộ” (yi*) là biến liên tục thuộc
(-, +) tùy thuộc vào mức độ thu nhập của hộ Giả sử
yi* là hàm tuyến tính như sau:
y i* = xi’ + ui = jxji + ui, trong đó ui ~ (0,2 )
Nhưng: Không quan sát được y i* mà chỉ quan sát được yi
lấy hai giá trị như sau:
Khi y i* 0, y i = 1
Khi y i* 0, y i = 0
75
Trang 76Binary choice model
Ta có:
prob (y i = 1) = prob (yi* > 0) = prob (u i > - x i ’)
u i có phân phối đối xứng:
Trang 77Nếu F là hàm phân phối logistic:
Khi x’i nhận các giá trị từ - đến + thì pi
nhận giá trị từ 0 đến 1.pi phi tuyến với cả tham
số và biến số Ước lượng hợp lý tối đa
(Maximum likelihood) để ước lượng tham số
Các ước lượng nhận được (hat, hat) là các
ước lượng TỐI ĐA HÓA giá trị của hàm hợp lý
L, với mẫu cho trước
' ( 1)
' 1
i i
i
x e prob y
x e
' 1
i i
i
x e prob y
x e
Trang 78Nếu F là hàm phân phối logistic:
L(,2|data) = prob(ydata) = prob(y1=0)*prob(y2=0) *… *
Trong đó n0=r, n1=n-r (n0: số các giá trị 0;
n1: số các giá trị 1)
Trang 79Nếu F là hàm phân phối logistic:
' ˆ
' 1
i i
i
x e p
x e
Trang 80Nếu F là hàm phân phối logistic:
hơn đi bằng phương tiện cá nhân 30 phút, khả năng phương tiện cá nhân được lựa
chọn và mức gia tăng khả năng được chọn
là bao nhiêu?
0.221 0.051 ˆ
0.2221 0.051 1
i
X e
p
X e
Trang 81Nếu F là hàm phân phối logistic:
chênh lệch này tăng thêm 1 phút thì mức xác suất
chọn phương tiện cá nhân sẽ tăng 0.009
i
p X
Trang 82Trường hợp: F là hàm PROBIT
Nếu F là hàm phân phối chuẩn tắc:
prob (y i = 1) = (x i ’ ) và
prob (y i = 0) = 1-(x i ’ ) Cụ thể:
Độ thỏa dụng I: Y sẽ nhận giá trị 1 hoặc 0 tùy
độ thỏa dụng I được xác định bởi các biến độc lập.
I =1+2X, giả sử tồn tại một mức giới hạn I* để: Y=1 nếu I>I*; Y=0 nếu I<I*
I* không quan sát được, giả sử I*=I + U
Trang 83Trường hợp: F là hàm PROBIT
I* =1+2X+ui
có:
pi=P(Y=1/X)X)=P(I*i<Ii)=F(Ii), trong đó F là
phân bố chuẩn hóa nên:
Trang 84Trường hợp: F là hàm PROBIT
như sau:
Trang 85Trường hợp: F là hàm PROBIT
2 1/X) 2
ˆ ( )
Trang 86Trường hợp: F là hàm PROBIT
PROBIT không nghiên cứu ảnh hưởng trực
giá trị bằng 1 hay kỳ vọng của Y
Trang 87Trường hợp: F là hàm PROBIT
Ví dụ 1: probit y x
Iteration 0: log likelihood = -11.090355
Iteration 1: log likelihood = -6.3946952
Iteration 2: log likelihood = -6.1358723
Iteration 3: log likelihood = -6.1321415
Iteration 4: log likelihood = -6.1321402
Probit regression Number of obs = 16
Trang 88-Trường hợp: F là hàm PROBIT
giữa thời gian đi phương tiện công cộng và
thời gian đi bằng phương tiện cá nhân thì xác suất đi bằng phương tiện cá nhân sẽ tăng
Trang 89Phân tích thành tố (factors
analysis): mục đích
Các phương pháp thống kê (hồi quy) được sử dụng để nghiên cứu mối quan hệ thống kê (hồi quy) giữa biến độc lập và biện phụ thuộc
Phân tích thành tố được sử dụng để nghiên cứu hình mẫu về mối quan hệ giữa các biến phụ
thuộc, với mục tiêu là khám phá ra cái gì đó
thuộc về bản chất của các biến độc lập có ảnh hưởng đến các biến phụ thuộc
89
Trang 90Phân tích thành tố (factors
analysis): ví dụ
Giả sử có 500 người đều quen thuộc với tất cả các
loại xe gắn máy Bạn có thể hỏi “Bạn thích chiếc xe gắn máy nào?” (Dĩ nhiên là bạn có thể hỏi bằng câu hỏi khác để có
thể đo lường ở chiều kích khác) Lý thuyết về nhân tố thứ
nhất cho rằng người ta chỉ giản đơn thích loại xe mắc tiền
nhất Lý thuyết về nhân tố thứ hai cho rằng người ta thích
loại xe thể thao, trong khi đó một số người khác thì thích loại
xe sang trọng Lý thuyết thành tố thứ ba và thứ tư có thể là
an toàn và tin cậy Thay vì xe gắn máy để nghiên cứu hành
vi thì người ta có thể chọn lương thực, chính sách chính trị,
ứng viên chính trị hoặc nhiều vật khác
90