Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến .... Phân tích mối quan hệ tương quan giữa các biến.... Lập bảng tương quan và phân tích mối quan hệ tương quan giữa
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG KHOA KINH TẾ QUỐC
TẾ =====000=====
BÁO CÁO KINH TẾ LƯỢNG
NHÓM 28: PHÂN TÍCH SỰ ẢNH HƯỞNG CỦA MỘT SỐ YẾU TỐ
ĐẾN TỈ LỆ PHẠM TỘI
Giảng viên hướng dẫn: Ths Chu Thị Mai Phương
Nhóm sinh viên thực hiện:
HÀ NỘI – THÁNG 3 NĂM 2016
Trang 2MỤC LỤC
LỜI MỞ ĐẦU 3
CƠ SỞ LÝ THUYẾT 4
Mô tả tổng quan 4
PHÂN TÍCH HỒI QUY 6
1 Phương trình hồi quy tuyến tính 6
2 Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến 6
2.1 Lập bảng tương quan 6
2.2 Phân tích mối quan hệ tương quan giữa các biến 7
3.2 Phân tích kết quả sau khi chạy mô hình 8
4 Kiểm định giả thuyết về hệ số hồi quy 9
5 Một số kiểm định F 11
Kiểm định sự phù hợp của mô hình 11
6 Kiểm tra khuyết tật của mô hình 12
Phương sai sai số thay đổi 12
TỔNG KẾT 14
TÀI LIỆU THAM KHẢO 15
ĐÁNH GIÁ THÀNH VIÊN 16
Trang 3LỜI MỞ ĐẦU
Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh
tế Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu thập được từ đó có thể đưa ra các dự báo về các hiện tượng kinh tế
Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo lường sắc bén để đo các quan hệ kinh tế Là những sinh viên đang theo học khối ngành kinh
tế, chúng em nhận thấy được sự cần thiết của việc học tập và tìm hiểu về Kinh tế lượng trong việc phân tích logic và nghiên cứu vấn đề Để hiểu sâu hơn về việc đưa Kinh tế lượng vào trong thực tế cuộc sống và áp dụng Kinh tế lượng sao cho đúng và hiệu quả, nhóm 28 chúng
em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự hướng dẫn của
Ths.Chu Thị Mai Phương Trong bài báo cáo, nhóm em đã sử dụng công cụ phân tích kinh tế
lượng là phần mềm stata để phân tích, nghiên cứu đề tài “Phân tích sự ảnh
hưởng của một số yếu tố đến tỉ lệ phạm tội.”
Chúng em xin chân thành cảm ơn giảng viên hướng dẫn – Ths.Chu Thị Mai Phương đã giúp đỡ chúng em thực hiện bài báo cáo này Trong quá trình làm bài báo cáo,
dù đã rất cố gắng nhưng chắc chắn chúng em không thể tránh khỏi những sai sót, kính mong được cô góp ý để nhóm chúng em có thể hoàn thiện hơn bản báo cáo này
Trang 4CƠ SỞ LÝ THUYẾT
I MÔ TẢ SỐ LIỆU
Mô tả tổng quan
Trong bối cảnh xã hội ngày càng phát triển với tốc độ đô thị hóa cao cũng như việc đất nước mạnh dạn mở cửa để tiếp thu với các nền văn hóa khác nhau thì tình trạng vi phạm pháp luật ngày càng trở thành một vấn đề đáng lo ngại Có rất nhiều yếu tố tác động
đến tỉ lệ phạm tội Sau khi xem xét ý nghĩa của từng biến trong file số liệu NC_CRIME trong phần mềm Gretl, nhóm em đã quyết định chọn mô hình hồi quy gồm các biến sau:
Biến phụ thuộc: Y: crmrte
Biến độc lập: gồm 5 biến: X1: county
X2: year
X3: polpc
X4: probarr
X5: density
Mô tả dữ liệu bằng lệnh des, ta thu được kết quả như sau:
Ta có bảng sau:
Tên biến Đơn vị tính Ý nghĩa biến
polpc Cảnh sát Số lượng cảnh sát trên 1000 dân
density Người Mật độ dân số trên 1 dặm vuông
Trang 5Tiếp tục sử dụng lệnh su để mô tả dữ liệu Lệnh su cho biết số lượng quan sát (Obs),
giá trị trung bình (mean), độ lệch chuẩn (std dev.) cũng như giá trị lớn nhất (max) và nhỏ nhất (min) của các biến
Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Tên biến Số quan Giá trị Độ lệch Giá trị nhỏ Giá trị lớn
sát trung bình chuẩn nhất nhất
Có thể nhận thấy biến tỉ lệ phạm tội có sự chênh lệch khá lớn giữa mức cao nhất và mức thấp nhất, lên tới xấp xỉ 4.2 lần
Trang 6PHÂN TÍCH HỒI QUY
1 Phương trình hồi quy tuyến tính
Chọn biến phụ thuộc Y là crmrte các biến độc lập X1, X2, X3, X4, X5 lần lượt là county,
year, polpc, prbarr, density
Ta có:
Hàm hồi quy tổng thể:
(PRF): crmrte = β0 + β1 county+ β2 year + β3 polpc + β4 prbarr+ β5density+ ui
Hàm hồi quy mẫu:
(SRF): ̂ = ̂+ ̂ county + ̂ year + ̂ polpc + ̂ prbarr+ ̂density
0 1 2 3 4 5 Trong đó: u i là yếu tố ngẫu nhiên (nhiễu).
2 Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các
biến 2.1 Lập bảng tương quan
Trước khi chạy mô hình hồi quy, chúng ta xem xét mức độ tương quan giữa các biến
bằng cách sử dụng lệnh corr crmrte county year polpc prbarr density Ta thu được
bảng tương quan giữa các biến như sau:
Kết luận:
Nhìn chung các biến độc lập có tương quan với biến phụ thuộc không cao Hầu hết các biến độc lập đều có hệ số tương quan dương, cho thấy tác động cùng chiều nhiều lên biến phụ thuộc
6
Trang 7Mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số
tương quan cao nhất cũng chỉ là 0.4930 giữa biến density và polpc.
2.2 Phân tích mối quan hệ tương quan giữa các biến
Từ bảng tương quan trên ta thấy:
- Hệ số tương quan giữa biến crmrte và county là -0.4832
- Hệ số tương quan giữa biến crmrte và year là 0.0197
- Hệ số tương quan giữa biến crmrte và polpc là 0.7816
- Hệ số tương quan giữa biến crmrte và prbarr -0.1629
- Hệ số tương quan giữa biến crmrte và density là 0.8090
Như vậy, trong các nhân tố được nghiên cứu, biến density có mối tương quan mạnh nhất đến crmrte, hay mật độ dân số có ảnh hưởng khá lớn đến tỉ lệ phạm tội Hệ số tương
quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến, như nếu mật độ dân số tăng thì tỉ lệ phạm tội cũng tăng
Ngược lại, biến prbarr ít ảnh hưởng nhất đến crmrte, hay mối tương quan giữa số
lượng cảnh sát trên 1000 dân và tỉ lệ phạm tội không mạnh như các nhân tố khác Hệ số tương quan giữa 2 biến mang dấu âm thể hiện mối quan hệ ngược chiều giữa 2 biến, nếu số lượng cảnh sát trên 1000 dân tăng thì tỉ lệ phạm tội giảm nhưng giảm không đáng kể
3 Chạy mô hình hồi quy và phân tích kết quả
3.1 Chạy mô hình hồi quy
Bước đầu tiên ta sử dụng lệnh reg để chạy mô hình hồi quy với cấu trúc câu lệnh là:
“reg crmrte county year polpc prbarr density”, thu được kết quả là bảng:
Trang 8Sau khi chạy Stata được toàn bộ dữ liệu như trình bày ở trên, chúng ta tiến hành đọc
và phân tích số liệu Trước hết, chúng ta thành lập được một bảng số liệu như sau:
Tên biến Hệ số hồi quy Thống kê t P-value Khoảng tin cậy
Từ bảng trên ta có phương trình hàm hồi quy mẫu SRF:
̂ = 0.0005126 + 0.0032916 * county - 0.0001684 * year + 6.433313 * polpc - 0.0085402 * prbarr + 0.0156787 * density
3.2 Phân tích kết quả sau khi chạy mô hình
− Số quan sát Obs = 28
− Tổng bình phương sai số được giải thích SSE = 0.002294383
− Tổng bình phương các phần dư SSR = 0.000158354
− Tổng bình phương sai số tổng cộng SST = 0.002452737
− Bậc tự do của phần được giải thích Dfm = 5
− Bậc tự do của phần dư Dfr = 22
8
Trang 9Hệ số xác định R2 (R-squared) = 0.9354 thể hiện mức độ phù hợp của hàm hồi quy mẫu
là tương đối lớn Bên cạnh đó, giá trị 0.9354 còn thể hiện tỷ lệ phần trăm biến động tổng
Tỷ lệ phạm tội được giải thích bởi các biến độc lập gồm: “Nhận diện dân sự”, “Khả năng
bị bắt”, “Dân số trên một dặm”, “Số lượng cảnh sát trên 1000 người dân”, “Năm từ 81 đến 87” là 93.54%
− Hệ số xác định điều chỉnh ̅̅̅ 2 = 0.9208 Hệ số này có ý nghĩa: trong trường hợp nếu
R
ta đưa thêm biến vào mô hình, hệ số xác định điều chỉnh mà tăng thì việc đưa biến ấy có ý nghĩa, và ngược lại
− Ý nghĩa của các hệ số hồi quy trong mô hình:
̂0 = 0.0005126 có ý nghĩa là: khi giá trị của các biến độc lập bằng 0 trong điều kiện các yếu tố khác không đổi thì tỷ lệ phạm tội là 0.0005126.
1 = 0.0032916 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu số nhận diện dân sự tăng thêm một đơn vị thì tỷ lệ phạm tội tăng thêm 0.0032916.
̂ 2 = -0.0001684 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu trong khoảng từ 81 – 87, năm tăng lên một đơn vị thì tỷ lệ phạm tội giảm đi 0.0001684.
̂ 3 = 6.433313 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu tăng tỷ lệ cảnh sát trên 1000 người dân lên một đơn vị thì tỷ lệ phạm tội tăng thêm 6.433313.
̂ 4 = -0.0085402 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu tăng khả năng bị bắt của tội phạm lên một đơn vị thì tỷ lệ là phạm tội giảm đi 0.0085402.
̂ 5 = 0.0156787 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu tăng
số dân trên một dặm lên một đơn vị thì tỷ lệ phạm tội tăng thêm 0.0156787
- Tuy nhiên, ta chỉ biết chắc chắn biến độc lập có ảnh hưởng đến biến phụ thuộc với ý nghĩa hệ số hồi quy như ta đã phân tích ở trên hay không sau khi kiểm định hệ số hồi quy cho mô hình
4 Kiểm định giả thuyết về hệ số hồi quy
Cặp giả thuyết thống kê: { H 0 : βj = 0j = 0
H 1 : βj = 0j ≠ 0
9
Trang 10βj = 0j−β̂βj = 0̂∗
Sử dụng giá trị tới hạn: T =
se(βj)βj = 0j)
Ta có: ∝ −β̂ −β̂1= 0,0521= 1.721
Từ bảng trên ta thấy
biến year có p-value = 0.572> 0.05
biến polpc có p-value = 0.132>0.05
biến prbarr có p-value = 0.340>0.05
Nên 3 biến year, polpc ,prbarr không có ảnh hưởng mang ý nghĩa thống kê đến biến phụ thuộc crmrte.
Các biến còn lại là density, county có ảnh hưởng trực tiếp về mặt thống kê tới biến
crmrte
Sau đây là mức ảnh hưởng cụ thể:
a. Density
Có:| | = 3.84 > 1.721 Bác bỏ H 0 , chấp nhận H 1 với mức ý nghĩa 5%.
Biến Density có ảnh hưởng mang ý nghĩa thống kê đến biến crmrte
Kết luận:
-Mật độ dân số có ảnh hưởng mang ý nghĩa thống kê đến tỉ lệ phạm tội
- Mật độ dân số trên một dăm vuông tăng thì tỉ lệ phạm tội cũng tăng
10
Trang 11-Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy mật độ dân số trên một dặm vuông đất tăng 1 đơn vị thì tỉ lệ phạm tội tăng 0.0156787 với điều kiện các yếu tố khác không đổi
b County
Có: | | = 3.29 > 1.721 Bác bỏ H 0 , chấp nhận H 1 với mức ý nghĩa 5%.
Biến county có ảnh hưởng mang ý nghĩa thống kê đến biến
crmrte Kết luận:
Nhận diện dân sự có ảnh hưởng mang ý nghĩa thống kê đến tỉ lệ phạm tội
Nhận diện dân sự tăng thì tỉ lệ phạm tội cũng tăng
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm nhận diện dân sự thì tỉ lệ phạm tội tăng 0,0032916 với điều kiện các yếu tố khác không đổi
Vậy trong các biến độc lập, với mức ý nghĩa 5%, cả 2 biến county và biến density đều
có ảnh hưởng mang tính thống kê đến biến crmrte.
5 Một số kiểm định F
Kiểm định sự phù hợp của mô hình
Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập β i đồng thời bằng 0 có thể xả y ra hay không.
Cặp giả thuyết thống kê: {H0: βj = 01 = βj = 02 = βj = 03 = βj = 04 = βj = 05 = 0 hoặc:{ Ho: R 2 = 0
H 1 : Tồn tại ít nhất 1 βj = 0 i ≠ 0 H1:R 2 ≠0
Phương pháp P-value
Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa α = 0.05 thì bác bỏ H0 chấp nhận H1
tức là mô hình hồi quy phù hợp Ta sử dụng lệnh test:
11
Trang 12Ta có: Prob > F = 0.0000 < 0.05 => Bác bỏ H0, chấp nhận H1.
Kết luận: Mô hình phù hợp tại mức ý nghĩa 5%
6 Kiểm tra khuyết tật của mô hình
Phương sai sai số thay đổi
a) Bản chất:
Một vấn đề khác mà mô hình cũng có thể gặp phải, đó là phương sai của sai số thay đổi Hậu quả của phương sai sai số thay đổi là các ước lượng bình phương nhỏ nhất vẫn là không chệch nhưng không còn hiệu quả nữa, cùng với đó ước lượng của các phương sai
sẽ bị chệch, như vậy làm mất hiệu lực của kiểm định Điều này làm cho mô hình kém hiệu quả hơn
Phương sai của mỗi một ngẫu nhiên Ui, trong điều kiện giá trị đã cho của biến giải thích
Xi là không đổi, nghĩa là:
Khi giả thiết đó bị vi phạm thì mô hình mắc lỗi phương sai sai số thay đổi Tên gọi
của lỗi này là Heteroskedasticity.
b) Nguyên nhân:
Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian được điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế theo thời gian được điều tra qua các giai đoạn có mức biến động khác nhau thì phương sai sai số có thể không đồng đều
Do định dạng không đúng dạng hàm của mô hình Có thể do bỏ sót biến thích hợp hoặc giải tích của hàm là sai
Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các quan sát ngoại lai Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất lớn đến phân tích hồi quy
Do kỹ thuật thu thập, bảo quản và xử lý số liệu được cải tiến nên sai số có xu hướng giảm
Do con người học được hành vi trong quá khứ.
c) Cách phát hiện phương sai sai số thay đồi:
Để kiểm định phương sai sai số thay đổi ta có cặp giả thuyết sau:
0 : Mô hình có phương sai thuần nhất
{
1 : Mô hình có phương sai sai số thay ổi đổi
12
Trang 13Nếu giá trị [Prob>chi2] < 0.05 thì bác bỏ giả thiết H0 và chấp nhận giả thiết H1.
Kiểm định Breusch-Pagan
Thực hiện lệnh estat hettest ta thu được kết quả sau:
Kết quả kiểm định bằng lệnh estat hettest cho thấy Prob>chi2 = 0.4745 > 0.05
Kết luận: Từ cách kiểm định trên có thể kết luận rằng mô hình có phương sai thuần
nhất.
Từ việc kiểm định mô hình trên, ta thấy chỉ có biến year, polpc, prbarr không có ảnh hưởng mang ý nghĩa thống kê đến biến crmrte trong mô hình Ta sẽ tiến hành chạy mô
hình mới để kiểm tra như sau:
Sau khi chạy hồi quy mô hình mới, mức độ phù hợp của mô hình R2 =
0.9240, giảm đi một chút so với trước đó R2 = 0.9354
Trang 14Các giá trị p-value đều nhỏ hơn 0.05 nên các biến độc lập trong mô hình đều có ý nghĩa thống kê ở mức ý nghĩa 5%
TỔNG KẾT
Bản báo cáo trên được hoàn thành trên cơ sở sự đóng góp của các thành viên với vốn kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Kinh tế lượng Đây cũng là một cơ hội thực hành khiến chúng em có thể hiểu rõ hơn về các phân tích và kiểm định đặc trưng có liên quan, áp dụng kiến thức trên giảng đường để tự tìm hiểu và rút ra được nhưng kết luận bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự ảnh hưởng lẫn nhau giữa các hiện tượng kinh tế xã hội Nhóm chúng em đã hoàn thành xong mô hình
kinh tế lượng về “Các yếu tố ảnh hưởng đến tỉ lệ phạm tội” Mô hình đã lượng hóa cho các
yếu tố để chúng ta có thể có những biện pháp, chiến lược phá án hiệu quả hơn Ngoài ra, vẫn còn nhiều yếu tố ảnh hưởng đến biến phụ thuộc được nghiên cứu chưa được đưa vào mô hình như vùng,… cần được xem xét để có báo cáo với kết quả chính xác hơn
Qua đây, nhóm 28 chúng em cũng xin chân thành cảm ơn sự hướng dẫn và giảng dạy nhiệt tình của cô Chu Thị Mai Phương Do vốn kiến thức và kĩ năng còn hạn chế nên chắc hẳn bản báo cáo này không thể tránh khỏi sai sót, chúng em rất mong nhận được sự góp ý động viên của cô để chúng em có thể hoàn thiện hơn, áp dụng tốt hơn trong các công việc sau này