des crime enroll priv police lenroll lpolice storage display value variable name type format label variable label --- crime int %9.0g total campus crimes enroll float %9.0g total enrol
Trang 12014
Tên thành viên nhóm:
1 Nguyễn Hoàng Mai: 1214160072 (20%)
2 Nguyễn Thị Nga: 1211160079 (20%)
3 Vũ Nhật Minh: 1214160075 (20%)
4 Vũ Hồng Minh: 1211160074 (20%)
5 Nguyễn Thị Ngân: 1212160080 (20%)
Trang 3
2 | P a g e
Lờ ở đầu
viên
p
v
Trang 4
3 | P a g e
Trang A
I 6
1 6
1.1 6
1.2 7
2 8
2.1 Crime: 8
2.2 Enroll: 9
2.3 Priv: 10
2.4 Police: 11
2.5 Lenroll: 12
2.6 Lpolice: 13
II 14
1 14
2 16
3 18
3.1 18
3.2 19
3.3 19
III 21
1 21
1.1 21
1.2 Nguyên nhân: 21
1.3 22
1.4 Cách khắc ph c: 22
2 i: 23
2.1 23
2.2 Nguyên nhân: 23
2.3 n d u hi u c ươ i: 23
3 Ki nh v v phân ph i chuẩn của sai s : 25
4 27
Trang 54 | P a g e
I 29
1 29
1.1 29
1.2 31
2 32
2.1 ColGPA: 32
2.2 Hs GPA 32
2.3 ACT: 33
2.4 PC: 34
2.5 Bgfriend: 34
2.6 Skipped: 35
2.7 Voluntr: 35
II 36
1 37
2 38
3 40
3.1 40
3.2 41
III 42
1 42
1.1 42
1.2 Nguyên nhân: 42
1.3 42
i: 43
2.1 43
2.2 Nguyên nhân: 43
2.3 n d u hi u c ươ i: 43
3 Ki nh v v phân ph i chuẩn của sai s : 45
4 47
-
Trang 65 | P a g e
A Ả G SỐ LIỆU SỐ 5 (C
)
thêm nhanh
Trang 7
6 | P a g e
I
1
sau: - crime -
X1: enroll X2: priv X3: police X4: lenroll X5: lpolice 1.1
D t qu c c a nhóm khi ti n hành mô t th ng kê bi n ph thu c và các bi c l p bằng l nh des
“de e e e e e”
des crime enroll priv police lenroll lpolice storage display value variable name type format label variable label
-
crime int %9.0g total campus crimes enroll float %9.0g total enrollment priv byte %9.0g =1 if private college police byte %9.0g employed officers lenroll float %9.0g log(enroll) lpolice float %9.0g log(police) D
Trang 87 | P a g e
1.2
Ti p t c sử d ng l n sum mô t s li u L nh sum cho bi t s ng quan sát (Obs) Giá tr trung bình (Mean l ch chuẩn (Std dev l n nh t (Max) và giá tr nh nh t( Min ) c a các bi n
“ e e e e e e”
sum crime enroll priv police lenroll lpolice Variable | Obs Mean Std Dev Min Max -+ -
crime | 97 394.4536 460.7839 1 2052
enroll | 97 16076.35 12298.99 1799 56350
priv | 97 .1237113 .3309624 0 1
police | 97 20.49485 15.63058 1 74
lenroll | 97 9.378556 .8317719 7.494986 10.93934 Crime %9.0g
Enroll %9.0g Sinh viên
Priv %9.0g -
Police %9.0g
Lenroll %9.0g -
Lpolice %9.0g -
Trang 9
l ch chuẩn
Giá tr nhỏ nhất
Giá tr lớn nhất
Trang 15enroll priv, police, lenroll, lpolice
y ta có hàm h i qui t ng th PRF bi u di n m i quan h ph thu c gi a Y và các bi
Crime = β 0 + β 1 * enroll + β 2 * priv + β 3 * police + β 4 * lenroll + β 5 * lpolice + u i
̂ = ̂ + ̂* enroll + ̂* priv + ̂* police + ̂* lenroll + ̂* lpolice
1
Trang 16
15 | P a g e
2
ử
“ e e e e e”
corr crime enroll priv police lenroll lpolice (obs=97) | crime enroll priv police lenroll lpolice -+ -
crime | 1.0000 enroll | 0.8360 1.0000 priv | -0.2226 -0.3038 1.0000 police | 0.7233 0.7151 -0.2838 1.0000 lenroll | 0.7195 0.9099 -0.3588 0.6485 1.0000 lpolice | 0.6537 0.6940 -0.3568 0.9005 0.6924 1.0000
- crime enroll 0.8360
- crime priv - 0.2226 - crime police 0.7233
- crime lenroll 0.7195
- crime lpolice 0.6537
enroll
crime 6
enroll
enroll crime
priv
crime - 0.2226
D
priv crime
Trang 1716 | P a g e
D
D
D
enroll, police, lcrime, lpolice
priv
ằ
e e
e e
D
2
ử
“ e e e e e e”
reg crime enroll priv police lenroll lpolice Source | SS df MS Number of obs = 97
-+ - F( 5, 91) = 52.60 Model | 15143382 5 3028676.39 Prob > F = 0.0000 Residual | 5239508.09 91 57577.012 R-squared = 0.7429 -+ - Adj R-squared = 0.7288 Total | 20382890 96 212321.771 Root MSE = 239.95 -
crime | Coef Std Err t P>|t| [95% Conf Interval] -+ -
enroll | .0315662 .0053609 5.89 0.000 0209175 042215
priv | 38.41752 80.93085 0.47 0.636 -122.3417 199.1767 police | 9.733369 3.946817 2.47 0.016 1.893502 17.57324 lenroll | -106.5999 76.66161 -1.39 0.168 -258.8788 45.67894 lpolice | -48.7223 76.75522 -0.63 0.527 -201.1871 103.7425 _cons | 815.5561 619.467 1.32 0.191 -414.9391 2046.051
Trang 18
17 | P a g e
P-value
815.5561 1.32 0.191 [-414.9391; 2046.051] Enroll 0.0315662 5.89 0.000 [0.0209175; 0.042215] Priv 38.41752 0.47 0.636 [-122.3417; 199.1767] Police 9.733369 2.47 0.016 [1.893502; 17.57324] Lenroll -106.5999 -1.39 0.168 [-258.8788; 45.67894] Lpolice -48.7223 -0.63 0.527 [-201.1871; 103.7425]
Crime = 815.5561+ 0.0315662 * enroll + 9.733369 * police - 106.5999 * lenroll - 48.7223 * lpolice + u i.
- S quan sát Obs = 97 - T t ng c ng SST = 20382890 - T s c gi i thích SSE = 15143382 - T
- B c t do c a ph c gi i thích Dfm= 5 - B c t do c a ph Df
H s nh R2(R-squared) = 0.7429 th hi n m phù h p c a hàm h i quy m Bên c 0.7429 còn th hi n
c gi i thích b i các bi c l
74
H s u ch nh ̅̅̅̅ 7
Ý ĩ s h i quy trong mô hình: ̂ 6 ằ
6
Trang 1918 | P a g e
̂ = 66
66
̂ = 4 7
4 7
̂ = 7 6
7 6
̂ = - 6
6
̂ = -48.7223
0.487223
-
3
3.1
- Mụ ki nh ng c a t ng bi c l p lên giá tr trung bình c a bi n ph thu c crime Có c p gi thuy t th ng kê: {
N u giá tr P-value nh thì bác b Ho, ch p nh n H1, t c là bi c l i v i crime - Theo b ng ch y h i qui m c 2, ta th y: o enroll: P-value = 0.000 0 enroll
crime o priv: P-value = 0.636 0 priv crime
Trang 21Vì giá tr P-value = 0.0000 < 0.05 nên bác b H0, ch p nh n H1
K t lu n: Có ít nh t 1 trong 2 y u t enroll priv n
Vì giá tr P-value = 0.0000 < 0.05 nên bác b H0, ch p nh n H1
K t lu n: Có ít nh t 1 trong 3 y u t enroll, priv và police n
Trang 22Vì giá tr P-value = 0.0027 < 0.05 nên bác b H0, ch p nh n H1
K t lu n: Có ít nh t 1 trong 3 y u t police, lenroll và lpolice n crime
III
1
Mô hình t t là mô hình ph c các tính ch t BLUE (tuy n tính, không ch ch,
hi u qu nh t) Tuy nhiên trên th c t do xây d ng sai mô hình ho c do b n ch t c a d li u,
o ng tuy n hoàn h o x t mô hình sai, trên th c t hi
c ng tuy n hoàn h o ít khi x y ra
o ng tuy n không hoàn h o x y ra do b n ch t hi ng kinh t xã h i
mà các bi c l ẵn m i quan h c ng tuy n v i nhau
o ng tuy n không hoàn h o x y ra do s li l n, hay s
li u tra không ng u nhiên
Trang 2322 | P a g e
Dùng l nh corr [indep] ki ng tuy n N u gi a 2 bi n có giá tr
corr > 0.8 thì mô hình có kh ng tuy n
corr (enroll, lenroll) = 0.9099 > 0.8
corr (police, lpolice)= 0.9005 > 0.8
s khi bi trong mô hình
Tă k ỡ mẫu:
Trang 2423 | P a g e
ng tuy a m u nên có th có m n cùng các
bi n trong m u mà c ng tuy n có th không nghiêm tr ng n u này th c hi n
c khi chi phí cho vi c l y m u khác có th ch p nh c trong th c t i v i nghiên
ch y làm m t hi u l c c a ki u này làm cho mô hình kém hi u qu
a mỗi m t ng u nhiên Ui u ki n giá tr a bi n gi i
:
– = = ; = , ,3…
Khi gi thi vi ph m thì mô hình m c lỗi thay i Tên g i c a
lỗi này là Heteroskedasticity
2.2 Nguyên nhân:
guyên nhân sai s i:
o Do b n ch t c a các hi ng kinh t : N u các hi ng kinh t theo không
u tra trên nh ng có quy mô khác nhau ho c các hi ng kinh t theo th n có m c bi ng khác nhau
s có th u
o D nh d ng hàm c a mô hình
o Do s li u không ph n ch t c a hi ng kinh t , chẳng h n
xu t hi n các quan sát ngo i lai
o Do kỹ thu t thu th p, b o qu ử lý s li cc i ti nnên sai s có xu
Trang 25White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
Trang 26t qu ki nh bằng l nh imtest, white cho th y Prob > chi2 =
0.0229< 0.05 => Bác b gi thi t H0, H1 hay mô
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of crime
chi2(1) = 72.08
Prob > chi2 = 0.0000
T 0000 < 0.05 => Bác b gi thi t H0
Trang 27P value = 0, bác b H0, u không phân ph i chuẩn, không có cách sửa ch a ngoài vi c
u ho c thay bằng m u có giá tr l sửa ch a, m u càng nhi u,
kernel = epanechnikov, bandwidth = 41.5518
Kernel density estimate
Trang 28ằ
ẳ
ẳ
ằ
Trang 29
c bi i v i các b n sinh viên, GPA là m t trong nh c
c c a m t cá nhân trong quá trình h c t p và rèn luy n t ng trung
h c và gi i h c tính b m trung bình chung các môn h c hay h c ph n
G A t qu h c t p c a cá nhân , d m khác nhau c a mỗi
ng trung h c và h ẳ i h c Nghiên c u, xem xét s ng c a các y u t
m trung bình GPA góp ph ẩy m nh c i cách và hoàn thi n giáo d c và
h n ch nh ng ng tiêu c c t ng xung quanh và b n thân mỗi cá nhân
c sử d ng b s li u th m GPA c a sinh viên và m t s thông s liên quan t i h c bang Michigan, Hoa K xem xét xem, li m GPA c a sinh viên ph thu c vào nh ng y u t nào và m ng c a các y u t ằng nh có ng d ng Stata – công c a kinh
t ng, b n báo cáo s c nhi u thú v và b ích
Trang 30storage display value
variable name type format label variable label
-
-age byte %9.0g in years
soph byte %9.0g =1 if sophomore
junior byte %9.0g =1 if junior
senior byte %9.0g =1 if senior
senior5 byte %9.0g =1 if fifth year senior male byte %9.0g =1 if male
campus byte %9.0g =1 if live on campus
business byte %9.0g =1 if business major
engineer byte %9.0g =1 if engineering major colGPA float %9.0g MSU GPA
hsGPA float %9.0g high school GPA
ACT byte %9.0g 'achievement' score
job19 byte %9.0g =1 if job <= 19 hours
job20 byte %9.0g =1 if job >= 20 hours
Trang 3130 | P a g e
drive byte %9.0g =1 if drive to campus
bike byte %9.0g =1 if bicycle to campus walk byte %9.0g =1 if walk to campus
voluntr byte %9.0g =1 if do volunteer work
PC byte %9.0g =1 of pers computer at sch greek byte %9.0g =1 if fraternity or sorority
car byte %9.0g =1 if own car
siblings byte %9.0g =1 if have siblings
bgfriend byte %9.0g =1 if boy- or girlfriend more
Sau khi cân nh ỡng chúng em quy nh ch n bi n colGPA làm bi n ph thu c
và các bi n: ACT, hsGPA, PC, bgfriend, skipped, voluntr làm bi c l p Ti n hành mô t
bi c l p và bi n ph thu c bằng l c k t qu
des colGPA hsGPA ACT PC bgfriend skipped voluntr
storage display value
variable name type format label variable label
-
-colGPA float %9.0g MSU GPA
hsGPA float %9.0g high school GPA
ACT byte %9.0g 'achievement' score
PC byte %9.0g =1 of pers computer at sch
bgfriend byte %9.0g =1 if boy- or girlfriend
skipped float %9.0g avg lectures missed per week
voluntr byte %9.0g =1 if do volunteer work
Theo b ng trên ta có th hi a các bi
o colGPA m GPA t i MSU
o hsGPA m GPA t ng trung h c
o ACT m trong kì thi ACT
o PC: bi n gi cho bi t có s h u máy vi tính hay không
Trang 3231 | P a g e
o bgfriend: bi n gi có b n trai/b n gái hay không o skipped: s bu i ngh h c trung bình m t tu n o voluntr: bi n gi cho bi t có tham gia tình nguy n hay không 1.2
Ti p t c sử d ng l n sum mô t s li u L nh sum cho bi t s ng quan sát (Obs) Giá tr trung bình (Mean l ch chuẩn (Std dev l n nh t (Max) và giá tr nh nh t( Min ) c a các bi n sum colGPA hsGPA ACT PC bgfriend skipped voluntr Variable | Obs Mean Std Dev Min Max -+ -
colGPA | 141 3.056738 .3723103 2.2 4
hsGPA | 141 3.402128 .3199259 2.4 4
ACT | 141 24.15603 2.844252 16 33
PC | 141 .3971631 .4910547 0 1
bgfriend | 141 .4751773 .5011638 0 1
-+ -
skipped | 141 1.076241 1.088882 0 5
voluntr | 141 .2198582 .4156269 0 1
Bi n S quan sát Trung bình l ch chuẩn Giá tr nhỏ nhất Giá tr lớn nhất
colGPA 141 3.056738 0.3723103 2.2 4
Bgfriend 141 0.4751773 0.511638 0 1
voluntr 141 0.2198582 0.4156269 0 1