1. Trang chủ
  2. » Giáo Dục - Đào Tạo

kinh te luong le kim long nhom 10 bang so lieu 15 va 39 ban final cuuduongthancong com

50 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Kinh tế lượng Lê Kim Long Nhóm 10 Bảng số liệu 15 và 39 Bản final
Tác giả Nguyễn Hoàng Mai, Nguyễn Thị Nga, Vũ Nhật Minh, Vũ Hồng Minh, Nguyễn Thị Ngân
Trường học Cuu Duong Than Cong
Chuyên ngành Kinh tế lượng
Thể loại Báo cáo cuối kỳ
Năm xuất bản 2014
Định dạng
Số trang 50
Dung lượng 1,41 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • I. (24)
    • 2.1. Crime (9)
    • 2.2. Enroll (10)
    • 2.3. Priv (11)
    • 2.4. Police (12)
    • 2.5. Lenroll (13)
    • 2.6. Lpolice (14)
  • II. (37)
  • III. (0)
    • 1.2. Nguyên nhân (22)
    • 1.4. Cách khắc ph c (23)
    • 2. i (0)
      • 2.2. Nguyên nhân (24)
      • 2.3. n d u hi u c ươ i (0)
    • 3. Ki nh v v phân ph i chuẩn của sai s (26)
      • 2.1. ColGPA (33)
      • 2.2. Hs GPA (33)
      • 2.3. ACT (34)
      • 2.4. PC (35)
      • 2.5. Bgfriend (35)
      • 2.6. Skipped (36)
      • 2.7. Voluntr (36)
      • 2.1. a mỗi m t ng U u ki n giá tr c a bi n (0)

Nội dung

des crime enroll priv police lenroll lpolice storage display value variable name type format label variable label --- crime int %9.0g total campus crimes enroll float %9.0g total enrol

Crime

tab crime total | campus | crimes | Freq Percent Cum

S ng v án x y ra t ng t 4 4 bi n nh t là 170 v v i m c t l 3.09% T n s c a các không ho c ít l p l i.

Enroll

 tab enroll total | enrollment | Freq Percent Cum

S tr u t 1799 sinh viên n 56350 không có m nào c u m c 1.03%.

Priv

=1 if | private | college | Freq Percent Cum

Police

 tab police employed | officers | Freq Percent Cum

S ng c nh sát d ng t n 74 v i m c ph bi n nh t là 7 i m c t l là 6.19%.

Lenroll

tab lenroll log(enroll) | Freq Percent Cum

Giá tr logarit t nhiên c a bi ng t 7 4 4 6 4 mỗi m c giá tr u chi m 1.03%

Lpolice

 tab lpolice log(police) | Freq Percent Cum

Giá tr logarit t nhiên d ng t 4 4 6 1.94591 và giá tr 2.197225 xu t hi ng xuyên nh t v i m c 6.19%

 Hàm h i quy tổng thể (PRF) và hàm h i quy mẫu (SRF):

Trong bài viết này, biến Y đại diện cho phạm tội và năm biến độc lập X1, X2, X3, X4, X5 lần lượt được gán nhãn enroll, priv, police, lenroll, lpolice Ta xây dựng một hàm hồi quy tuyến tính (PRF) để biểu diễn mối quan hệ giữa Y và các biến X, từ đó xác định ảnh hưởng của từng biến lên mức độ phạm tội Mô hình này cho phép phân tích tác động của các yếu tố liên quan đến bảo mật riêng tư, sự hiện diện của cơ quan công quyền và các biến đăng ký khi đánh giá dữ liệu, đồng thời hỗ trợ dự đoán nguy cơ phạm tội dựa trên giá trị của X Các bước tiền xử lý dữ liệu, kiểm định giả thuyết và đánh giá độ chính xác được thực hiện nhằm tối ưu hóa hiệu suất dự báo của Y dựa trên các biến X.

Crime = β 0 + β 1 * enroll + β 2 * priv + β 3 * police + β 4 * lenroll + β 5 * lpolice + u i

 ̂ = ̂ + ̂* enroll + ̂* priv + ̂* police + ̂* lenroll + ̂* lpolice

“ e e e e e” corr crime enroll priv police lenroll lpolice

| crime enroll priv police lenroll lpolice -+ - crime | 1.0000 enroll | 0.8360 1.0000 priv | -0.2226 -0.3038 1.0000 police | 0.7233 0.7151 -0.2838 1.0000 lenroll | 0.7195 0.9099 -0.3588 0.6485 1.0000 lpolice | 0.6537 0.6940 -0.3568 0.9005 0.6924 1.0000

- crime lpolice 0.6537 enroll crime 6 enroll enroll crime priv crime - 0.2226

D enroll, police, lcrime, lpolice priv ằ e e e e

 ử “ e e e e e e” reg crime enroll priv police lenroll lpolice

Source | SS df MS Number of obs = 97 -+ - F( 5, 91) = 52.60 Model | 15143382 5 3028676.39 Prob > F = 0.0000 Residual | 5239508.09 91 57577.012 R-squared = 0.7429 -+ - Adj R-squared = 0.7288 Total | 20382890 96 212321.771 Root MSE = 239.95

- crime | Coef Std Err t P>|t| [95% Conf Interval] -+ - enroll | 0315662 0053609 5.89 0.000 0209175 042215 priv | 38.41752 80.93085 0.47 0.636 -122.3417 199.1767 police | 9.733369 3.946817 2.47 0.016 1.893502 17.57324 lenroll | -106.5999 76.66161 -1.39 0.168 -258.8788 45.67894 lpolice | -48.7223 76.75522 -0.63 0.527 -201.1871 103.7425 _cons | 815.5561 619.467 1.32 0.191 -414.9391 2046.051

- B c t do c a ph c gi i thích Dfm= 5

H s nh R 2 (R-squared) = 0.7429 th hi n m phù h p c a hàm h i quy m Bên c 0.7429 còn th hi n c gi i thích b i các bi c l

H s u ch nh ̅̅̅̅ 7 Ý ĩ s h i quy trong mô hình:

- Mụ ki nh ng c a t ng bi c l p lên giá tr trung bình c a bi n ph thu c crime

Có c p gi thuy t th ng kê:

N u giá tr P-value nh thì bác b Ho, ch p nh n H1, t c là bi c l i v i crime

- Theo b ng ch y h i qui m c 2, ta th y: o enroll : P-value = 0.000 0 enroll crime o priv : P-value = 0.636 0 priv crime o police : P-value = 0.016 0 police crime o lenroll : P-value = 0.168 0 lenroll crime o lpolice : P-value = 0.527 n H0 lpolice crime

→ n priv, lenroll, lpolice không th c s n crime

- Mụ ng h p các tham s c a bi c l p ng th i bằng 0 có th x y ra hay không

Có c p gi thuy t th ng kê:

N u giá tr Prob > F m thì bác b Ho, ch p nh n H1 t c là hàm h i quy m u phù h p

“ e e e e e” test enroll priv police lenroll lpolice

Prob > F = 0.0000 y, Prob > F = 0.05, vì th Ho

→ s h i qui c a các bi c l p không ng th i bằng 0, mô hình h i quy phù h p

 Gi sử 2 y u t là enroll và priv u cùng không ng t i crime :

Sử d ng l nh test ki nh, “ e e ” : sau: test enroll priv

Vì giá tr P-value = 0.0000 < 0.05 nên bác b H 0 , ch p nh n H 1

K t lu n: Có ít nh t 1 trong 2 y u t enroll priv n crime

 Gi sử 3 y u t là enroll , priv và police u cùng không ng t i crime :

Sử d ng l nh test trong S ki nh :

Vì giá tr P-value = 0.0000 < 0.05 nên bác b H0, ch p nh n H1

K t lu n: Có ít nh t 1 trong 3 y u t enroll , priv và police n crime

 Gi sử 3 y u t là police , lenroll và lpolice u cùng không ng t crime:

Sử d ng l nh test ki nh

Vì giá tr P-value = 0.0027 < 0.05 nên bác b H 0 , ch p nh n H 1

K t lu n: Có ít nh t 1 trong 3 y u t police , lenroll và lpolice n crime

Mô hình tuyến tính là một khung phổ biến có các đặc tính BLUE (tuyến tính, không chệch, hiệu quả nhất) Tuy nhiên trên thực tế, do cách xây dựng mô hình sai hoặc do bản chất của dữ liệu, các đặc tính này có thể bị vi phạm Một trong những vấn đề phổ biến là vi phạm các giả định của mô hình hồi quy tuyến tính, xảy ra khi các biến độc lập Xi có tương quan với nhau (đa cộng tuyến), làm ảnh hưởng đến ước lượng và độ tin cậy của các tham số.

1.2 Nguyên nhân: o ng tuy n hoàn h o x t mô hình sai, trên th c t hi c ng tuy n hoàn h o ít khi x y ra o ng tuy n không hoàn h o x y ra do b n ch t hi ng kinh t xã h i mà các bi c l ẵn m i quan h c ng tuy n v i nhau o ng tuy n không hoàn h o x y ra do s li l n, hay s li u tra không ng u nhiên

Dùng l nh corr [indep] ki ng tuy n N u gi a 2 bi n có giá tr corr > 0.8 thì mô hình có kh ng tuy n

corr crime enroll priv police lenroll lpolice

| crime enroll priv police lenroll lpolice -+ - crime | 1.0000 enroll | 0.8360 1.0000 priv | -0.2226 -0.3038 1.0000 police | 0.7233 0.7151 -0.2838 1.0000 lenroll | 0.7195 0.9099 -0.3588 0.6485 1.0000 lpolice | 0.6537 0.6940 -0.3568 0.9005 0.6924 1.0000

 Bỏ m t s bi n c ng tuy n ra khỏi mô hình: lenroll và lpolice ta có k t qu l nh corr ư

corr crime enroll priv police

-+ - crime | 1.0000 enroll | 0.8360 1.0000 priv | -0.2226 -0.3038 1.0000 police | 0.7233 0.7151 -0.2838 1.0000 c lo i b bi n ra kh i mô hình ph c cân nh c cẩn th n gi a sai l ch khi b bi n c ng tuy n v i vi i c ng h s khi bi trong mô hình

Khi tách bỏ mẫu, người nghiên cứu nên đảm bảo mẫu chứa đầy đủ các biến cần thiết và các biến liên quan được ghi nhận rõ ràng để đảm bảo tính nhất quán của quá trình phân tích Tuy nhiên, trong thực tế có thể xảy ra trường hợp không nghiêm ngặt nếu chi phí cho việc thu thập mẫu khác có thể được chấp nhận trong thời gian nghiên cứu; vẫn cần cân nhắc để giảm thiểu rủi ro ảnh hưởng đến độ tin cậy và tính hợp lệ của kết quả, đồng thời tối ưu hóa sự cân đối giữa chi phí và độ chính xác Việc chọn mẫu phù hợp với mục tiêu nghiên cứu và áp dụng kiểm tra chéo, hiệu chuẩn sẽ tăng tính khả dụng và độ tin cậy của kết quả.

Một ví dụ phổ biến về sai lệch trong mô hình AI là dữ liệu huấn luyện không đại diện cho thực tế, khiến mô hình trở nên kém hiệu quả và dễ bị lệch kết quả Sự cân bằng và đa dạng của dữ liệu, cùng với việc đánh giá mô hình trên nhiều ngữ cảnh khác nhau, quyết định mức độ tin cậy và hiệu suất thực sự của hệ thống Việc kiểm tra chéo, xác minh giá trị và xem xét các điều kiện đầu vào giúp làm rõ giới hạn và điều chỉnh tham số để tránh tình trạng hiệu suất giảm ở các tình huống ngoài phạm vi đã huấn luyện Kết quả là mô hình có thể tối ưu trên dữ liệu hiện có nhưng kém hiệu quả với dữ liệu mới nếu không xem xét đầy đủ giá trị biến và điều kiện vận hành Vì vậy, tối ưu hóa toàn diện, đánh giá trên nhiều bộ dữ liệu và chú ý đến ngôn ngữ, ngữ cảnh và các biến thể là cách đảm bảo mô hình hoạt động ổn định và đáng tin cậy.

Khi gi thi vi ph m thì mô hình m c lỗi thay i Tên g i c a lỗi này là Heteroskedasticity

2.2 Nguyên nhân: guyên nhân sai s i: o Do b n ch t c a các hi ng kinh t : N u các hi ng kinh t theo không u tra trên nh ng có quy mô khác nhau ho c các hi ng kinh t theo th n có m c bi ng khác nhau s có th u o D nh d ng hàm c a mô hình o Do s li u không ph n ch t c a hi ng kinh t , chẳng h n xu t hi n các quan sát ngo i lai o Do kỹ thu t thu th p, b o qu ử lý s li cc i ti nnên sai s có xu ng gi m o H c c các sai l m trong quá kh , nh th c i ti n trong hi n t i

Trong cách này ta s sử d th c a sai s c a h i qui e (ph i giá tr d

T d li n m ử rvfplot, yline (0) ta xây d ng th sau:

D a vào lí thuy t kinh t c h th v a xây d ằ tuy nhiên t l r i xa giá tr trung bình bằng 0 còn khá l d c mô hình có hi i

N u giá tr Prob > chi2 chi2 =

0.0229< 0.05 => Bác b gi thi t H 0 , H 1 hay mô

 Cách 3: Dùng ki nh Breusch – Pagan:

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Variables: fitted values of crime chi2(1) = 72.08

: V i k t qu c a các ki nh trên ta có th k t lu c rằng có x y ra hi i

3 Ki nh v v phân ph i chuẩn của sai s : ước 1: D

- T o bi n ph a mô hình, sử d ng l nh : predict r, resid ( v i r là bi n th hi n giá tr c a ph

- Sử d ng l nh : kdensity r, normal

 Sử d ng l ki nh, ta có b ng k t qu sau: sktest r

Skewness/Kurtosis tests for Normality

Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2

P value = 0, bác b H0, u không phân ph i chuẩn, không có cách sửa ch a ngoài vi c u ho c thay bằng m u có giá tr l sửa ch a, m u càng nhi u, kh i chuẩn càng l n

Kernel density estimate Normal density kernel = epanechnikov, bandwidth = 41.5518

Dữ liệu GPA của sinh viên tại Đại học Michigan State cho thấy GPA là một chỉ số quan trọng phản ánh quá trình học tập và rèn luyện GPA thể hiện mức độ nỗ lực và kết quả học tập, giúp đánh giá sự tiến bộ và khả năng nắm bắt kiến thức ở các môn học Điểm trung bình của các môn hay học phần cho thấy mức độ đều đặn và chất lượng học tập của sinh viên, từ đó hỗ trợ lên kế hoạch học tập và xác định định hướng nghề nghiệp Việc theo dõi GPA giúp nhận diện điểm mạnh, điểm yếu và đề ra chiến lược cải thiện trình độ Dữ liệu GPA còn được dùng bởi nhà trường và giảng viên để đánh giá hiệu quả của chương trình giảng dạy và chất lượng rèn luyện, cũng như làm cơ sở cho các quyết định về tuyển dụng, học bổng và tư vấn học tập.

Một nghiên cứu xem xét cách các yếu tố cá nhân và môi trường học tập khác nhau ảnh hưởng đến điểm trung bình GPA của sinh viên và vai trò của GPA trong quá trình học tập, phát triển cá nhân và hoàn thiện giáo dục Nghiên cứu xem xét các yếu tố xung quanh và ảnh hưởng đến cá nhân, đồng thời đánh giá mức GPA như một biến đầu vào cho thành tích học tập và sự hài lòng của bản thân Dữ liệu được khai thác từ điểm GPA của sinh viên và một số thông số liên quan tại bang Michigan, Hoa Kỳ, nhằm xác định các yếu tố ảnh hưởng đến GPA và ước lượng tác động của chúng bằng phần mềm Stata — công cụ thống kê nổi bật trong kinh tế và khoa học xã hội Kết quả cho thấy có mối quan hệ giữa GPA và các yếu tố như thời gian dành cho học tập, tham gia hoạt động ngoại khóa, và sự hỗ trợ từ gia đình hoặc trường học, với các tác động có ý nghĩa thống kê và gợi ý các biện pháp cải thiện giáo dục.

1 tài này chúng em nêu ra và phân tích các y u t m trung bình (GPA) t i h U t nhi u y u t nh m GPA c a sinh viê m GPA trung h A

Sử d ng l nh des mô t các bi n trong b ng d li c k t qu :

Contains data from C:\Users\Sovietskiy Soyuz\Desktop\file data\39_GPA1.DTA obs: 141 vars: 29 8 Jul 1998 11:14 size: 5,781

- - storage display value variable name type format label variable label

MSU student data includes age in years and binary indicators for class standing (sophomore, junior, senior, and fifth-year senior), along with a binary gender flag (male) It also records on-campus residence, major indicators for business and engineering, and two GPA measures: colGPA (MSU GPA) and hsGPA (high school GPA).

ACT achievement score is derived from a set of binary indicators: job19 is 1 if job hours are 19 or fewer, job20 is 1 if job hours are 20 or more, drive is 1 if the person drives to campus, bike is 1 if they bike to campus, walk is 1 if they walk to campus, and voluntr is 1 if they do volunteer work Together, these indicators capture work hours, commuting method, and community involvement to produce a single measure of overall achievement.

Binary indicators are used to capture core personal attributes in the dataset A personal computer at school is coded as 1 if the respondent uses a PC at school, and 0 otherwise Greek life is recorded as 1 if the respondent belongs to a fraternity or sorority Car ownership is indicated by 1 if the respondent owns a car The siblings field is 1 if the respondent has siblings (0 if not) Finally, dating status is captured with 1 if the respondent has a boyfriend or girlfriend.

Sau khi cân nhắc, ColGPA được xác định là biến phụ thuộc và các biến độc lập gồm ACT, hsGPA, PC, bgfriend, skipped và voluntr Tiến hành mô tả biến độc lập và biến phụ thuộc bằng thống kê mô tả, kiểm tra phân phối và phân tích tương quan nhằm làm rõ mức độ ảnh hưởng của từng biến lên ColGPA Kết quả sẽ được trình bày trong bảng tóm tắt và đồ thị để dễ hiểu và tối ưu cho SEO, đồng thời hỗ trợ diễn giải kết quả một cách có hệ thống.

des colGPA hsGPA ACT PC bgfriend skipped voluntr storage display value variable name type format label variable label

- - colGPA float %9.0g MSU GPA hsGPA float %9.0g high school GPA

PC byte %9.0g =1 of pers computer at sch bgfriend byte %9.0g =1 if boy- or girlfriend skipped float %9.0g avg lectures missed per week voluntr byte %9.0g =1 if do volunteer work

Theo bảng trên, các biến quan trọng cho MSU gồm colGPA (GPA tại MSU) và hsGPA (GPA từ cấp trung học) Biến ACT phản ánh điểm thi ACT Biến PC cho biết một người có sở hữu máy tính hay không Biến bgfriend cho biết có bạn trai hoặc bạn gái hay không Biến skipped cho biết số buổi nghỉ học trung bình mỗi tuần Biến voluntr cho biết có tham gia tình nguyện hay không.

Ti p t c sử d ng l n sum mô t s li u L nh sum cho bi t s ng quan sát

(Obs) Giá tr trung bình (Mean l ch chuẩn (Std dev l n nh t (Max) và giá tr nh nh t( Min ) c a các bi n sum colGPA hsGPA ACT PC bgfriend skipped voluntr

Variable | Obs Mean Std Dev Min Max

Bi n S quan sát Trung bình l ch chuẩn Giá tr nhỏ nhất Giá tr lớn nhất colGPA 141 3.056738 0.3723103 2.2 4 hsGPA 141 3.402128 0.3199259 2.4 4

 Ti p t c sử d ng lênh tab mô t chi ti t các bi c: tab colGPA

MSU GPA | Freq Percent Cum

Total | 141 100.00 m trung bình tr i dài t 4 c 3.0 là ph bi n nh t v i 24 l n xu t hi n, chi m 17.02%

Total | 141 100.00 m GPA trung h t t 4 4 c GPA 3.5 là ph bi n nh t v i 19 l n xu t hi n chi m 13.48%

'achievemen | t' score | Freq Percent Cum

M m ACT ng t 6 c 24 là ph bi n nh t v i 17.73%

=1 of pers | computer at | sch | Freq Percent Cum

Trong s 4 c h i có 85 sinh viên không s h u máy tính (60.28%) và

56 sinh viên có s h u máy tính (39,72%)

=1 if boy- | or | girlfriend | Freq Percent Cum

Trong s 4 c h 67 i có b n trai/b n gái chi m 47.52%

tab skipped avg | lectures | missed per | week | Freq Percent Cum

Trong s 4 4 i b h c trung bình m t bu i trong tu n chi m 34.04%

=1 if do | volunteer | work | Freq Percent Cum

Trong s 4 c h i có 110 sinh viên không tham gia ho ng tình nguy n (78.01%) và 31 sinh viên tham gia (21.99%).

Nguyên nhân

Những mô hình xã hội hoàn hảo thường là giả định sai và hiếm khi được áp dụng trong thực tế Mô hình sai xuất hiện khi giả định kinh tế–xã hội không phù hợp với hiện trạng hoặc khi các yếu tố con người và các mối quan hệ xã hội thay đổi Bản chất kinh tế–xã hội và cơ cấu xã hội khiến các biện pháp nhằm cải thiện quan hệ giữa con người với nhau khó đạt được độ tin cậy cao và dễ bị biến động Mô hình không hoàn hảo là kết quả của sự bất cân xứng về lợi ích hoặc các yếu tố ngẫu nhiên tác động, khiến kết quả thực nghiệm khác xa so với dự đoán.

Dùng l nh corr [indep] ki ng tuy n N u gi a 2 bi n có giá tr corr > 0.8 thì mô hình có kh ng tuy n

corr crime enroll priv police lenroll lpolice

| crime enroll priv police lenroll lpolice -+ - crime | 1.0000 enroll | 0.8360 1.0000 priv | -0.2226 -0.3038 1.0000 police | 0.7233 0.7151 -0.2838 1.0000 lenroll | 0.7195 0.9099 -0.3588 0.6485 1.0000 lpolice | 0.6537 0.6940 -0.3568 0.9005 0.6924 1.0000

Cách khắc ph c

 Bỏ m t s bi n c ng tuy n ra khỏi mô hình: lenroll và lpolice ta có k t qu l nh corr ư

corr crime enroll priv police

-+ - crime | 1.0000 enroll | 0.8360 1.0000 priv | -0.2226 -0.3038 1.0000 police | 0.7233 0.7151 -0.2838 1.0000 c lo i b bi n ra kh i mô hình ph c cân nh c cẩn th n gi a sai l ch khi b bi n c ng tuy n v i vi i c ng h s khi bi trong mô hình

i

Trong quá trình lấy mẫu cho nghiên cứu, sự không ngẫu nhiên trong tuyển chọn có thể tạo ra sai lệch nghiêm trọng, nhưng nếu chi phí cho các phương án lấy mẫu khác được xem là chấp nhận được trong thực tế và nghiên cứu vẫn duy trì mức nghiêm ngặt cần thiết, thì có thể tối ưu hóa thiết kế lấy mẫu để giảm chi phí mà không làm suy giảm đáng kể độ tin cậy của kết quả.

M t v g p ph a sai s thay i H u qu c nh t v n là không ch u qu n a, cùng v ng c b ch y làm m t hi u l c c a ki u này làm cho mô hình kém hi u qu a mỗi m t ng u nhiên Ui u ki n giá tr a bi n gi i :

Khi gi thi vi ph m thì mô hình m c lỗi thay i Tên g i c a lỗi này là Heteroskedasticity

2.2 Nguyên nhân: guyên nhân sai s i: o Do b n ch t c a các hi ng kinh t : N u các hi ng kinh t theo không u tra trên nh ng có quy mô khác nhau ho c các hi ng kinh t theo th n có m c bi ng khác nhau s có th u o D nh d ng hàm c a mô hình o Do s li u không ph n ch t c a hi ng kinh t , chẳng h n xu t hi n các quan sát ngo i lai o Do kỹ thu t thu th p, b o qu ử lý s li cc i ti nnên sai s có xu ng gi m o H c c các sai l m trong quá kh , nh th c i ti n trong hi n t i

Trong cách này ta s sử d th c a sai s c a h i qui e (ph i giá tr d

T d li n m ử rvfplot, yline (0) ta xây d ng th sau:

D a vào lí thuy t kinh t c h th v a xây d ằ tuy nhiên t l r i xa giá tr trung bình bằng 0 còn khá l d c mô hình có hi i

N u giá tr Prob > chi2 chi2 =

0.0229< 0.05 => Bác b gi thi t H 0 , H 1 hay mô

 Cách 3: Dùng ki nh Breusch – Pagan:

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Variables: fitted values of crime chi2(1) = 72.08

: V i k t qu c a các ki nh trên ta có th k t lu c rằng có x y ra hi i.

Ki nh v v phân ph i chuẩn của sai s

- T o bi n ph a mô hình, sử d ng l nh : predict r, resid ( v i r là bi n th hi n giá tr c a ph

- Sử d ng l nh : kdensity r, normal

 Sử d ng l ki nh, ta có b ng k t qu sau: sktest r

Skewness/Kurtosis tests for Normality

Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2

P value = 0, bác b H0, u không phân ph i chuẩn, không có cách sửa ch a ngoài vi c u ho c thay bằng m u có giá tr l sửa ch a, m u càng nhi u, kh i chuẩn càng l n

Kernel density estimate Normal density kernel = epanechnikov, bandwidth = 41.5518

M ICHIGAN S TATE U M ) GPA1_DTA c bi i v i các b n sinh viên, GPA là m t trong nh c c c a m t cá nhân trong quá trình h c t p và rèn luy n t ng trung h c và gi i h c tính b m trung bình chung các môn h c hay h c ph n

Các yếu tố cá nhân và hoàn cảnh học tập khác nhau giữa các cấp học từ trung học đến đại học hình thành sự đa dạng trong kết quả học tập Nghiên cứu xem xét sự ảnh hưởng của GPA trung bình đến cách sinh viên cải thiện hành vi học tập, hoàn thiện giáo dục và giảm bớt các tiêu cực có thể tác động tới môi trường xung quanh và bản thân mỗi người Dữ liệu được sử dụng là GPA của sinh viên và một số biến liên quan tại bang Michigan, Hoa Kỳ, nhằm kiểm tra xem GPA của sinh viên bị chi phối bởi những yếu tố nào và những yếu tố đó có tác động như thế nào đến kết quả học tập nói chung Phương pháp phân tích dựa trên Stata – công cụ kinh tế lượng, cho phép xây dựng các kết quả có ý nghĩa và hữu ích cho cả nghiên cứu lẫn thực tiễn giáo dục.

1 tài này chúng em nêu ra và phân tích các y u t m trung bình (GPA) t i h U t nhi u y u t nh m GPA c a sinh viê m GPA trung h A

Sử d ng l nh des mô t các bi n trong b ng d li c k t qu :

Contains data from C:\Users\Sovietskiy Soyuz\Desktop\file data\39_GPA1.DTA obs: 141 vars: 29 8 Jul 1998 11:14 size: 5,781

- - storage display value variable name type format label variable label

This dataset captures student attributes and academic indicators, including age in years and binary indicators for class standing: sophomore (soph = 1), junior (junior = 1), senior (senior = 1), and fifth-year senior (senior5 = 1) It also records gender (male = 1 for male), on-campus residency (campus = 1 if living on campus), and major indicators (business = 1 if pursuing a business major; engineer = 1 if pursuing engineering) Academic performance is represented by two GPA fields: colGPA, the MSU college GPA, and hsGPA, the high school GPA.

An ACT achievement score is constructed from several binary indicators: job19 equals 1 if total job hours are 19 or fewer, and job20 equals 1 if total job hours are 20 or more; drive, bike, and walk each equal 1 when the respective campus commute method is used (drive to campus, bicycle to campus, or walk to campus); and voluntr equals 1 if volunteer work is performed Collectively, these flags feed into the ACT achievement score, summarizing work hours, commuting choices, and volunteer activity into a concise performance metric.

Binary indicators encode key student attributes in the dataset: a personal computer at school equals 1 if the student has access to a PC at school; Greek life equals 1 if the student is in a fraternity or sorority; car ownership equals 1 if the student owns a car; siblings equals 1 if the student has siblings; and a boyfriend or girlfriend equals 1 if the student is dating someone These 0/1 variables simplify data analysis and help reveal patterns in student demographics while keeping individual identities private.

Sau khi cân nhắc dữ liệu, chúng em xác định biến colGPA làm biến phụ thuộc và các biến ACT, hsGPA, PC, bfriend, skipped và volunteer làm biến độc lập Tiến hành mô tả các biến và ước lượng mối quan hệ giữa biến phụ thuộc và các biến độc lập bằng các thống kê mô tả và phân tích hồi quy Mô hình được thiết lập để đánh giá tác động của ACT, hsGPA, PC, bfriend, skipped và volunteer lên colGPA, từ đó rút ra những kết luận về mức độ đóng góp của từng biến đối với kết quả GPA Kết quả trình bày rõ ràng, tối ưu cho SEO và dễ dàng áp dụng trong bài viết.

des colGPA hsGPA ACT PC bgfriend skipped voluntr storage display value variable name type format label variable label

- - colGPA float %9.0g MSU GPA hsGPA float %9.0g high school GPA

PC byte %9.0g =1 of pers computer at sch bgfriend byte %9.0g =1 if boy- or girlfriend skipped float %9.0g avg lectures missed per week voluntr byte %9.0g =1 if do volunteer work

Theo bảng trên, các biến được liệt kê và có ý nghĩa như sau: hsGPA là GPA ở cấp THPT; GPA tại MSU là điểm GPA tích lũy khi học tại MSU; ACT là điểm thi ACT trong kỳ thi tương ứng; PC là biến cho biết sinh viên có sở hữu máy tính hay không; bgfriend là biến cho biết có bạn trai hoặc bạn gái hay không; skipped là số buổi nghỉ học trung bình mỗi tuần; voluntr là biến cho biết có tham gia tình nguyện hay không Những biến này được sử dụng trong phân tích dữ liệu sinh viên tại MSU để dự báo kết quả học tập và hành vi.

Ti p t c sử d ng l n sum mô t s li u L nh sum cho bi t s ng quan sát

(Obs) Giá tr trung bình (Mean l ch chuẩn (Std dev l n nh t (Max) và giá tr nh nh t( Min ) c a các bi n sum colGPA hsGPA ACT PC bgfriend skipped voluntr

Variable | Obs Mean Std Dev Min Max

Bi n S quan sát Trung bình l ch chuẩn Giá tr nhỏ nhất Giá tr lớn nhất colGPA 141 3.056738 0.3723103 2.2 4 hsGPA 141 3.402128 0.3199259 2.4 4

 Ti p t c sử d ng lênh tab mô t chi ti t các bi c: tab colGPA

MSU GPA | Freq Percent Cum

Total | 141 100.00 m trung bình tr i dài t 4 c 3.0 là ph bi n nh t v i 24 l n xu t hi n, chi m 17.02%

Total | 141 100.00 m GPA trung h t t 4 4 c GPA 3.5 là ph bi n nh t v i 19 l n xu t hi n chi m 13.48%

'achievemen | t' score | Freq Percent Cum

M m ACT ng t 6 c 24 là ph bi n nh t v i 17.73%

=1 of pers | computer at | sch | Freq Percent Cum

Trong s 4 c h i có 85 sinh viên không s h u máy tính (60.28%) và

56 sinh viên có s h u máy tính (39,72%)

=1 if boy- | or | girlfriend | Freq Percent Cum

Trong s 4 c h 67 i có b n trai/b n gái chi m 47.52%

tab skipped avg | lectures | missed per | week | Freq Percent Cum

Trong s 4 4 i b h c trung bình m t bu i trong tu n chi m 34.04%

=1 if do | volunteer | work | Freq Percent Cum

Trong s 4 c h i có 110 sinh viên không tham gia ho ng tình nguy n (78.01%) và 31 sinh viên tham gia (21.99%)

 Hàm h i quy tổng thể (PRF) và hàm h i quy mẫu (SRF):

Y( colGPA ): Đ m GPA bậ ại học tại MSU

- X 1 (hsGPA ) : Đ m GPA tạ ường trung học

- X 2 ( ACT) : Đ m trong kì thi ACT

- X 3 (PC) : Có hay không có máy tính cá nhân tạ ường ( bi n gi , = 1 n u có; =

- X 4 ( bgfriend) : Có hay không có bạn trai hoặc bạn gái ( bi n gi ,= 1 n u có ; = 0 n u không có)

- X 5 (skipped) : S buổi nghỉ học trung bình m t tuần( ổi/tuần)

- X 6 (voluntr ) : Có tham gia tình nguy n hay không ( bi n gi ; =1 n u có tham gia;

 y ta có hàm h i qui t ng th PRF bi u di n m i quan h ph thu c gi a Y và các bi

ColGPA = β 0 + β 1 * hsGPA + β 2 * ACT + β 3 * PC + β 4 * bgfriend + β 5 * skipped + * voluntr + u i

 ̂ = ̂ + ̂ * hsGPA + ̂* ACT + ̂* PC + ̂* bgfriend + ̂* skipped + ̂ * voluntr

corr colGPA hsGPA ACT voluntr PC bgfriend skipped

| colGPA hsGPA ACT voluntr PC bgfriend skipped -+ - colGPA | 1.0000 hsGPA | 0.4146 1.0000

T b ng trên có th th y:

Kết quả phân tích cho thấy, trong các yếu tố liên quan đến hành vi và thành tích học tập của sinh viên MSU, có một yếu tố liên hệ với GPA trung bình của sinh viên MSU (corr = 0,4146) Hệ số ước lượng cho các biến ACT, hsGPA, PC và bgfriend cho thấy chúng có ảnh hưởng tới colGPA, dù một số biến có thể bị bỏ qua Khi GPA trung bình của sinh viên càng cao, tác động của các biến này càng giảm.

D : hsGPA, ACT, PC, bgfriend ed

Ngoài ra, vì giá tr tuy i c a các ch s u nh không x y ra hi ng tuy n

reg colGPA hsGPA ACT PC bgfriend skipped voluntr

Source | SS df MS Number of obs = 141 -+ - F( 6, 134) = 8.62 Model | 5.40458682 6 900764469 Prob > F = 0.0000 Residual | 14.0015126 134 1044889 R-squared = 0.2785 -+ - Adj R-squared = 0.2462 Total | 19.4060994 140 138614996 Root MSE = 32325

- colGPA | Coef Std Err t P>|t| [95% Conf Interval] -+ - hsGPA | 4220895 092043 4.59 0.000 2400444 6041345 ACT | 01307 0104019 1.26 0.211 -.0075031 0336431

PC | 1280678 0570175 2.25 0.026 0152971 2408385 bgfriend | 0856602 0547883 1.56 0.120 -.0227016 194022 skipped | -.0747544 0263763 -2.83 0.005 -.1269221 -.0225867 voluntr | -.0788779 0668163 -1.18 0.240 -.2110289 0532731 _cons | 1.311245 3271558 4.01 0.000 6641874 1.958302

Tên bi n H s h i quy P-value Kho ng tin c y

T b ng s li u t ng t m GPA b i h c c a sinh viên t i

- Có 3 bi n ACT, bgfriend, voluntr có (P-value> |t|) > 0.05 nên chúng không có ý c l i v i các bi n còn l i

 i quy tuy n tính m u c n tìm là: ̂ = 1,311245+ 0, 4220895 * hsGPA + 0,01307* ACT + 0,1280678 * PC +

- B c t do c a ph c gi i thích Dfm= 6

H s nh R 2 = 0 2785 th hi n m phù h p c a hàm h i quy m i l n 7

 Ch y mô hình h i quy m u v i 3 bi n X1, X3, X5 v i l nh reg [bi n ph thu c] [bi n c l p] ta có b ng k t qu sau:

reg colGPA hsGPA PC skipped

Source | SS df MS Number of obs = 141 -+ - F( 3, 137) = 15.25 Model | 4.85887844 3 1.61962615 Prob > F = 0.0000 Residual | 14.547221 137 106184095 R-squared = 0.2504 -+ - Adj R-squared = 0.2340 Total | 19.4060994 140 138614996 Root MSE = 32586

- colGPA | Coef Std Err t P>|t| [95% Conf Interval] -+ - hsGPA | 4554308 0864439 5.27 0.000 2844938 6263677

B ng 4 Mô hình h i quy v i 3 bi n X 1 , X 3 , X 5

1.1 c ng tuy n là m t lỗi c a mô hình phân tích h i quy, x y ra khi gi a các bi c l p Xi có n tính v i nhau

1.2 Nguyên nhân: o ng tuy n hoàn h o x t mô hình sai, trên th c t hi ng tuy n hoàn h o ít khi x y ra o ng tuy n không hoàn h o x y ra do b n ch t hi ng kinh t xã h i mà các bi c l ẵn m i quan h c ng tuy n v i nhau o ng tuy n không hoàn h o x y ra do s li l n, hay s li u u tra không ng u nhiên

Dùng l [ ] ki ng tuy n N u gi a 2 bi n có giá tr corr > 0.8 thì mô hình có kh ng tuy n

corr colGPA hsGPA ACT PC bgfriend skipped voluntr

| colGPA hsGPA ACT PC bgfriend skipped voluntr

T b y mô hình không m ng tuy n

2.1 a mỗi m t ng U u ki n giá tr c a bi n gi – = = ; = , ,3…

Khi giả thiết đồng nhất phương sai sai số trong mô hình hồi quy bị vi phạm, ta gặp hiện tượng heteroskedasticity, tức là sai số có phương sai thay đổi theo mức độ biến giải thích hoặc theo không gian và thời gian Nguyên nhân phổ biến gồm: các hiện tượng theo không gian hoặc theo thời gian với quy mô hoặc cường độ biến thiên sai số khác nhau gây biến thiên sai số; sai lệch trong đặc trưng hoặc cấu trúc hàm của mô hình; dữ liệu thiếu phân tích đầy đủ các biến giải thích hoặc chứa quan sát ngoại lai; kỹ thuật thu thập, bảo quản và xử lý dữ liệu dẫn tới sai lệch đo lường; và các sai lầm trong tiền xử lý hoặc bỏ sót biến quan trọng Hệ quả là ước lượng từ OLS có thể vẫn không sai lệch về giá trị, nhưng sai số chuẩn bị lệch, làm giảm tin cậy của các kiểm định và dự báo, từ đó đòi hỏi các biện pháp sửa chữa như điều chỉnh sai số chuẩn hoặc dùng mô hình phù hợp hơn.

Trong cách này ta s sử d th c a sai s c a h i qui e (ph i giá tr d Y u di n s a e và Yi)

T d li n m ử : rvfplot, yline (0) ta xây d th sau:

D a vào lí thuy t kinh t c h th v a xây d ằ l r i xa giá tr trung bình bằ i l d c mô hình có th có hi thay i

N u giá tr Prob > chi2 chi2

Cách 3: Dùng ki nh Breusch – Pagan :

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance

Variables: fitted values of colGPA chi2(1) = 3.46 Prob > chi2 = 0.0628

: V i k t qu c a các ki nh trên ta có th k t lu c rằng không x y ra hi i

3 Ki nh v v phân ph i chuẩn của sai s : ước 1: D

- T o bi n ph a mô hình, sử d ng l nh : predict r, resid ( v i r là bi n th hi n giá tr c a ph

- Sử d ng l nh : kdensity r, normal

 Có th ch ch so v i phân ph i chuẩn ước 2: Ki nh

 Sử d ng l sktest r ki nh, ta có b ng k t qu sau:

Skewness/Kurtosis tests for Normality

- joint - Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -+ - r | 141 0.9922 0.0482 3.97 0.1372

T ta th y rằng giá tr (Prob>chi2) = 0,1372 > 0,05 nên mô hình có phân ph i chuẩn c a sai s c sửa ch c lo i b

Bài viết trình bày cách lựa chọn các biến phù hợp ảnh hưởng đến GPA của sinh viên MSU, dựa trên kiến thức suy luận xã hội và hành vi, và sử dụng mô hình hồi quy của Stata để kiểm định các biến này Ta giả định rằng các biến được chọn có tác động tới GPA của sinh viên MSU và phân tích mối quan hệ giữa chúng Kết quả cho thấy thời gian dành cho việc học có tác động đáng kể lên GPA, và các yếu tố như mức độ tham gia hoạt động ngoài giờ lên lớp, thói quen tự học và sự hỗ trợ của giảng viên cũng đóng vai trò giải thích sự biến động của điểm số Mô hình hồi quy trong Stata được áp dụng để ước lượng ảnh hưởng của từng biến trên GPA, đảm bảo tính khách quan và phù hợp với dữ liệu của sinh viên MSU.

A m hsGPA có m i quan h thu n chi u v i nhau và v m

Có hay không sự cân bằng giới giữa nam và nữ trong quá trình học và tuyển sinh, và liệu sinh viên có thể được tiếp cận và tham gia đầy đủ trong suốt thời gian học tại MSU hay không? Bài viết đặt ra các lập luận mang tính pháp lý và luân lý nhằm bảo đảm quyền bình đẳng và thỏa mãn nhu cầu học tập của mọi người Tuy nhiên, khi phân tích dữ liệu bằng Stata trên một mẫu có tính đại diện, chúng ta thấy mức GPA trung bình của sinh viên MSU là hợp lý và không cho thấy sự lệch đáng kể giữa hai giới Kết quả này có thể hỗ trợ các quyết định về giáo dục và phát triển toàn diện, đồng thời khuyến khích các chiến lược tuyển sinh và hỗ trợ sinh viên nhằm tăng cường sự tham gia của tất cả sinh viên vào quá trình học tập và xã hội.

Mô hình kinh t i nh ng thông tin b ích và khách quan, ng th c t r h n ch c nh ng nh nh ch quan c a xã h i.

Trong quá trình học tập và nghiên cứu môn Kinh tế, các thành viên đã trình bày cách phân tích và vận dụng kiến thức liên quan vào thực tiễn, áp dụng các phân tích để nhận diện lợi ích và hệ quả của các hiện tượng kinh tế – xã hội trong đời sống thực tế một cách logic và khoa học Quá trình này cho thấy sự liên hệ chặt chẽ giữa lý thuyết và thực tiễn, giúp làm rõ tác động của biến động kinh tế đến xã hội và đề xuất các giải pháp mang tính thực tiễn Vì còn nhiều điểm cần hoàn thiện, mong rằng cô giáo và các bạn có thể mang thêm ý kiến đóng góp để chúng em hoàn thiện những nội dung tiếp theo.

Chúng em xin chân thành c ng cô s n báo cáo này !./

Ngày đăng: 30/12/2022, 13:13

🧩 Sản phẩm bạn có thể quan tâm