R = 0,973 nên giữa GDP và Tel có mối quan hệ đồng biến tương quan rất chặt .Giải thích ý nghĩa của hệ số tương quan: Vì hệ số tương quan bội Pearson Cerelation = 0.973 nên giữa GDP và TE
Trang 1BÀI TẬP MÔN TIN HỌC ỨNG DỤNG TRONG QUẢN LÍ KINH TẾ.
Bài 1 Cho bảng số liệu
Obs thunhap tieudung Obs thunhap tieudung
- Elements/ Show data tables /chỉnh sửa đồ thị/click chuột phải/ properties window / lựa chọn các lệnh tương ứng.
1
Trang 4b Vẽ biểu đồ histogram của thu nhập trên đó có vẽ đường cong chuẩn, hãy nhận xét phân bố của biến thu nhập.
4
Trang 5c Hãy sử dụng các thủ tục cần thiết phân tích mối quan hệ giữa thu nhập và tiêu dùng
Correlations
thunhap tieudung thunhap Pearson Correlation 1 975 **
** Correlation is significant at the 0.01 level (2-tailed).
Hệ số tương quan bội giữa thu nhập và tiêu dùng có r = 0.975 nên nó có tương quan rất chặt và đồng biến.Sig = 0,000< α = 0,05
Tiêu dùng YAxis
5
Trang 6Thu nhập XAxis
Y = 0,08 + 0,48 *Y
6
Trang 7Bài 2 Cho bảng số liệu doanh thu trong ngày của 2 cửa hàng của công ty như sau:
Cửa
hàng 1
4.5 4.75 4.85 3.85 3.9 4.35 4.7 4.25 5.3 3.9 5.4 5.3 4.5 3.95 4.35 Cửa
hàng 2
3.4 4.25 4.5 4.9 4.6 4.45 3.95 3 4.7 3.7 5.05 3.3 3.43 4.15 5.2 Hãy dùng các thủ tục cần thiết trong SPSS để phân tích và so sánh doanh thu của hai cửa hàng nói trên Cửa hàng nào cho doanh thu cao hơn (giả thiết rằng doanh thu trong ngày có phân bố gần phân bố chuẩn).
Trang 8*Bước 1: Kiểm định phương sai 2 mẫu :
H0= Var1= var 2
H1= var1≠ var2
Nhìn vào bảng Independent Samples Test ta thấy: Cột Sig=0,216 > α =0,05 nên ta có
cơ sở chấp nhận H0 Phương sai 2 mẫu bằng nhau.
Independent Samples Test
Levene's Test forEquality ofVariances t-test for Equality of Means
Sig tailed)
(2-MeanDifference
Std ErrorDifference
95% ConfidenceInterval of theDifferenceLower UpperDoanh
Trang 9theo mùa trong nhiều năm Hãy thực hiện xử lý dữ liệu thích hợp, phân tích ảnh hưởng của mùa tới lượng tiêu thụ của sản phẩm.
Lower Bound
Upper Bound
Trang 10So sánh giá trị bình quân >= 3 mẫu độc lập
H0: M1 = M2=M3=M4
H1: Có ít nhất M ≠ khác biệt với các mùa còn lại.
Nhìn vào bảng ANOVA ta thấy: Cột Sig ANOVA =0,001 < α =0,05 nên ta có cơ sở
bác bỏ H0
Có ít nhất 1 mùa có số lượng tiêu thụ khác biệt đáng kể so với 3 mùa còn lại.
10
Trang 11* The mean difference is significant at the 0.05 level.
Cột Mean Difference (I-J) các dòng có dấu * có sự khác biệt đáng kể với mức ý nghĩa thống kê 5% Vì vậy mùa Đông có số lượng tiêu thụ thấp hơn 1 cách đáng kể so với 3 mùa còn lại.
11
Trang 12Bài 4: Một xưởng sản xuất ván ép, người ta sản xuất hai loại ván ép, loại 1 có
bề dày 10mm, loại 2 có bề dày 20mm Sau đây là dữ liệu do bề dầy của các mẻ
ép của hai loại:
van10mm 9.87 9.89 10.03 10.03 9.97 9.86 9.99 10.13 9.99 10.04 van20mm 19.82 19.99 20.05 19.82 20.14 20.37 20.03 19.97 19.92 20.01 van10mm 10.08 10.01 9.93 10.04 9.87 9.87 9.89 10.03 10.03 9.97 van20mm 19.8 20.07 19.81 19.85 20.07 19.82 19.99 20.05 19.82 20.14
Hãy phân tích xem sai số bề dầy có phụ thuộc vào loại ván sản xuất hay không?
Kết quả từ bảng 1.1 cho thấy bề dày cuả loại ván 20mm lớn hơn 1 cách đáng kể so với
bề dày loại ván 10mm(với mức ý nghĩa thống kê 5%).
12
Trang 13Independent Samples Test
Levene's Test for Equality of Variances t-test for Equality of Means
Sig.
tailed )
(2-Mean Differenc e
Std Error Differenc e
95% Confidence Interval of the Difference Lower Upper
-38 000 -10.00100 03760
10.0771 1
9.92489
-29.10
4 .000 -10.00100 .03760
10.0778 8
9.92412
-Nhìn vào bảng Independent Samples Test cột Sig ta thấy:
Bởi vì cột sig dòng 1 = 0.027 < α = 0.05 nên bề dày 2 loại ván có sự khác biệt đáng kể với sự khác biệt α = 0.05.
Bài
5: Tìm hiểu về nhu cầu sử dụng điện thoại, ông Bình đã sử dụng bộ dữ liệu của Singapore giai đoạn 1960-1981 với 2 biến sau:
TEL: Số lượng máy điện thoại trên 1000 người.
GDP: Tổng sản phẩm quốc nội theo đầu người, tại mức giá cơ cấu tính theo đô la Singapore năm 1968.
P
13
Trang 15Biểu đồ 5.1 đồ thị phân tán điểm cho TEL và GDP.
b Hãy tính các trị thống kê tổng hợp cho biến GDP và TEL (trung bình, phương sai, độ lệch chuẩn, đồng phương sai).
15
Trang 16Deviation(độ lệch chuẩn)
Variance (phương sai)
a Dependent Variable: Số điện thoại
b. All requested variables entered.
Model Summary
Std Error of the Estimate
a Predictors: (Constant), GDP binh quan
Descriptive Statistics
16
Trang 17R = 0,973 nên giữa GDP và Tel có mối quan hệ đồng biến tương quan rất chặt
Giải thích ý nghĩa của hệ số tương quan: Vì hệ số tương quan bội (Pearson
Cerelation = 0.973) nên giữa GDP và TEL có mối quan hệ rất chặt và đồng biến (với mức ý nghĩa thống kê 1%).
d Xây dựng mô hình hồi quy giữa TEL và GDP.
Trang 18Dựa vào biểu đồ 5.3 ta thấy đồ thị của biến TEL bị lệch phải.Vì vậy chúng ta phải thực hiện chuyển đổi biến bằng lệnh Transform.
LnTEL = Ln(TEL)
LnGDP= Ln(GDP)
LnTEL= β0+ β1 LnGDP
18
Trang 20*Kiểm định sự tồn tại của mô hình hồi quy.
Nhìn vào bảng ANOVAa ta thấy:
a Predictors: (Constant), GDP binh quan
Nhìn vào bảng Model Summary ta thấy Adjusted R Square = 0,973
Trong các nhân tố ảnh hưởng đến Tel thì biến GDP giải thích được 97,3 % còn lại 2,7
% được giải thích bởi các nhân tố khác mà ta chưa có điều kiện để đưa vào mô hình.
Mô hình tương đối phù hợp.
*Kiểm định sự tồn tại hệ số hồi quy.
20
Trang 21Nhìn vào bảng Coefficientsa ta thấy :
Standardized Coefficients
a Dependent Variable: lnTEL
*Viết phương trình của mô hình hồi quy
Nhìn vào bảng Coefficientsa cột B ta thấy : LnTel = -7,265+1,502*Ln GDP.
Vì β = 1,502 >0 nên giữa GDP và Tel có mối quan hệ đồng biến Mô hình Log - Log Khi GDP tăng lên 1% và các nhân tố khác không đổi thì Tel tăng 1,502% và ngược lại.
Trang 246: Tìm hiểu về năng suất của của loại cây trồng Y khi bón phân bón loại X người ta ghi nhận số liệu gồm 2 dữ liệu đó là lượng phân bón (tạ/ha) và năng suất (tạ/ha) trong thời gian 10 năm từ năm 1965 đến năm 1975 Anh chị hãy ước lượng
mô hình hồi quy năng suất phụ thuộc vào mức phân bón và trả lời các câu hỏi (Dữ liệu anh/chị tự nhập tùy ý)
a Mức phân bón X có ảnh hưởng đến năng suất của cây trồng Y? Viết câu lệnh và kết quả thu được.
b Viết câu lệnh tính và giải thích ý nghĩa của mô hình.
c Với mức bón phân X 20 tạ/ha hãy dự báo năng suất Viết câu lệnh và kết quả thu được.
NĂM LUONGPHAN
(TA/HA)
NANGSUAT (TA/HA)
NĂ M
LUONGPHA N(TA/HA)
NANGSUAT (TA/HA)
a Mức phân bón X có ảnh hưởng đến năng suất của cây trồng Y? Viết câu lệnh
và kết quả thu được.
24
Trang 26b Viết câu lệnh tính và giải thích ý nghĩa của mô hình.
Variables Entered/Removeda
Model Variables Entered Variables Removed Method
26
Trang 27a Dependent Variable: NANGSUAT (TA/H
A)
b All requested variables entered.
Model Summaryb
27
Trang 28Model R R Square Adjusted R Square
Std Error of the
a Predictors: (Constant), LUONGPHAN(TA/HA)
b Dependent Variable: NANGSUAT (TA/HA)
a Dependent Variable: NANGSUAT (TA/HA)
b Predictors: (Constant), LUONGPHAN(TA/HA)
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
Trang 31a Dependent Variable: NANGSUAT (TA/HA)
b Predictors: (Constant), LUONGPHAN(TA/HA)
c Với mức bón phân X 20 tạ/ha hãy dự báo năng suất Viết câu lệnh và kết quả thu được.
Ta thấy Sig ANOVA với α = 0.009 < 0.05.nên mô hình luôn luôn tồn tại mức ý nghĩa đơn thống kê α=0.05
a Predictors: (Constant), LUONGPHAN(TA/HA)
b Dependent Variable: NANGSUAT (TA/HA)
Ta thấy Adjusted R Square = 0.226.Trong các nhân tố ảnh hưởng biến Lượng phân thì biến năng suất giải thích được 22,6 % còn lại 77,4% được giải thích bởi các nhân tố khác mà ta chưa có điều kiện đưa vào mô hình Mô hình tương đối phù hợp
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
B Std Error Beta
a Dependent Variable: NANGSUAT (TA/HA)
Ta thấy Sig coeff với α = 0.000 <α = 0,05 vì thế cho nên bác bỏ H0 và mô hình tồn tại.
31
Trang 32e Với mức bón phân X 20 tạ/ha hãy dự báo năng suất Viết câu lệnh và kết quả thu được.
LnLUONGPHAN=3.382+0.436*LnNANGUAT
VÌ β =0.436 >0 nên đồng biến Giữa lượng phân và năng suất có mối quan hệ đồng biến Mô hình log – log Khi lượng phân tăng 1% ,các nhân tố khác không đổi thì năng suất tăng 0.436 % và ngược lại
Bài 7: Để nghiên cứu về mức thu nhập tại tỉnh A trong thời gian 10 năm từ năm
1995 đến năm 2005 Người ta ghi nhận các số liệu gồm mức thu nhập, học vấn, giới tính, tình trạng hôn nhân, kinh nghiệm Anh chị hãy ước lượng mô hình hồi quy mức thu nhập phụ thuộc vào học vấn, giới tính, tình trạng hôn nhân, kinh nghiệm
và trả lời các câu hỏi (Dữ liệu anh/chị tự nhập tùy ý)
Năm giới tính Trình độ tuổi tình trạng hôn nhân Thu nhập kinh nghiệm
a Học vấn, kinh nghiệm có ảnh hưởng đến mức thu nhập không? Viết câu lệnh
và kết quả thu được.
32
Trang 33Variables Entered/Removeda
1 tuổi, kinh nghiệm, giới tính, tình trạng
a Dependent Variable: Thu nhập
Model Summaryb
Adjusted R Square
Std Error of the
a Predictors: (Constant), tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, Trình độ
b Dependent Variable: Thu nhập
a Dependent Variable: Thu nhập
b Predictors: (Constant), tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, Trình độ
Collinearity Statistics
hôn nhân
33
Trang 34i tính
Trình độ
tình trạng hôn nhân
kinh nghiệ
a Dependent Variable: Thu nhập
34
Trang 36*Kiểm tra khuyết tật của mô hình: Kiểm tra hiện tượng đa cộng tuyến ta thấy cột VIF
<10 nên mô hình hồi quy không có hiện tượng đa cộng tuyến.
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
hôn nhân 3005103.804 8968350.884 .075 .335 .744 850 1.176kinh nghiệm 19980536.551 8947915.326 512 2.233 050 813 1.230tuổi -313457.470 370531.964 -.197 -.846 417 785 1.274
a Dependent Variable: Thu nhập
*Kiểm tra hiện tượng tương tự tương quan.
Model Summaryb
Std Error of the Estimate Durbin-Watson
a Predictors: (Constant), tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, Trình độ
b Dependent Variable: Thu nhập
1 < d= 1,456 <3 nên mô hình không có hiện tượng tương tự quan.
*Kiểm tra hiện tượng phương sai của sai số thay đổi: Đồ thị phân bố của phần dư tiệm cận phân phối chuẩn nên mô hình không có hiện tương phương sai số thay đổi.
*Kiểm định sự tồn tại của mô hình
a Dependent Variable: Thu nhập
b Predictors: (Constant), tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, Trình độ
36
Trang 37Vì cột Sig ANOVA=0.08 7; Ho:β 1=0,22; β=0,297; β=0.075; β=0512 ; β= -0,197 H0: β1 = β2 = β3 = β4 = 0 H1: có ít nhất βj ≠ 0 Bác bỏ H0, chấp nhận H1
Vì vậy mô hình luôn luôn tồn tại với ý nghĩa thống kê 5% Vì cột Sig ANOVA = 0,087
*Kiểm định sự phù hợp của mô hình
Model Summaryb
Model R R Square Adjusted R Square
Std Error of the Estimate Durbin-Watson
a Predictors: (Constant), tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, Trình độ
b Dependent Variable: Thu nhập
Ta thấy Adjusted R Square= 0,359 Nên trong các nhân tố ảnh hưởng đến thu nhập thì
4 nhân tố trong mô hình giải thích được 35,9 % còn lại 64,1% được giải thích bởi các nhân tố khác chưa có điều kiện đưa vào mô hình Mô hình hồi quy tương đối phù hợp.
*Kiểm định sự tồn tại: Căn cứ và đối chiếu với bảng Coefficientsa
Coefficients a
Model
Unstandardized Coefficients
Standardized Coefficients
a Dependent Variable: Thu nhập
37
Trang 38a Predictors: (Constant), tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, Trình độ
b Dependent Variable: Thu nhập
Ta thấy R2 hiệu chỉnh = 0.359 Vì vậy trong các nhân tố ảnh hưởng đến thu nhập thì 4 nhân tố trong mô hình giải thích được 35,9 % còn lại 64,1 % được giải thích bởi các nhân tố khác chưa có điều kiện đưa vào mô hình Vì vậy mô hình tương đối phù hợp
t Sig
Collinearity Statistics
1 (Constant) 14554181.160 24319239.338 598 .563
giới tính 893588.063 8616226.204 022 104 .919 921 1.086Trình độ 4967186.238 3809797.156 297 1.304 .222 824 1.214tình trạng hôn nhân 3005103.804 8968350.884 075 335 .744 850 1.176kinh nghiệm 19980536.551 8947915.326 512 2.233 .050 813 1.230
38
Trang 39tuổi -313457.470 370531.964 -.197 -.846 .417 785 1.274
a Dependent Variable: Thu nhập
Ta thấy VIF = 1.086; VIF = 1.214 VIF = 1.176; VIF =1.230; VIF =1.274 <10
e Lập mô hình hồi qui nghiên cứu ảnh hưởng của tình trạng hôn nhân tới mức thu nhập.
Collinearity Diagnostics a
Model Dimension Eigenvalue
Condition Index
Variance Proportions
(Constant) giới tính Trình độ
tình trạng hôn nhân kinh nghiệm tuổi
Trang 408: Anh/chị tự đề xuất một yêu cầu nghiên cứu trong thực tế tại đơn vị, cơ quan mình công tác và ứng dụng công cụ SPSS để tính toán, xây dựng mô hình, giải thích ý nghĩa và đề xuất giải pháp nếu có.
1 Hạnh kiểm,
Khối, giới tính,
tuổi b
Enter
a Dependent Variable: Điểm trung bình
b All requested variables entered.
Model Summary b
Model R R Square
Adjusted R Square
Std Error of the Estimate Durbin-Watson
1 677 a 459 456 1.0500 1.347
a Predictors: (Constant), Hạnh kiểm, Khối, giới tính, tuổi
b Dependent Variable: Điểm trung bình
Coefficients a
Model
Unstandardized Coefficients
Standardized Coefficients
a Dependent Variable: Điểm trung bình
40
Trang 41Collinearity Diagnostics
Model Dimension Eigenvalue Condition Index
Variance Proportions (Constant) giới tính tuổi Khối Hạnh kiểm
Trang 44*Kiểm tra khuyết tật của mô
hình:
Kiểm tra hiện tượng đa cộng tuyến.Nhìn vào bảng Coefficientsa cột VIF ta thấy cột VIF
>10 nên mô hình hồi quy có hiện tượng đa cộng tuyến.
Vì thế ta phải loại bỏ biến có VIF >0 và lớn nhất.Ta chạy lại mô hình
Ln Output =β0+β1(Lnfertiliser)+β2(Lnlabour)+β3(Lnmachine)+β(Vùng miền)
VIF < 10 nên mô hình phương trình : Ln Output =β0+β1(Lnfertiliser)+β2(Lnlabour)+β3(Lnmachine)+β(Vùng miền)
< d =1.352nên mô hình không có hiện tương tự tương quan.
44
Trang 45*chạy lại mô hình:
-Vì đồ thị phân bố của phần dư là phân phối chuẩn nên mô hình không có hiện tương phương sai của sai số chuẩn thay đổi.
*Kiểm định sự tồn tai của mô hình (bảng ATOVA –CỘT SIG) Ho:β1= β2=β3=β4=0
H1:có ít nhất βj≠0
Vì giá trị cột sig ATOVA = 0.000 <α= 0,05 NÊN MÔ HÌNH
LUÔN LUÔN TỒN TẠI VỚI MỨC Ý NGHĨA THỐNG KÊ 5%.
*KIỂM ĐỊNH SỰ LỆCH CHUẨN CỦA MÔ HÌNH
đình ,các nhân tố trong mô hình giải thích được 95,8% còn lại 4,2 % được giải thích bởi các nhân tố khác mà chưa có điều kiện đưa vào mô hình.
Mô hình tương đối phù hợp
KIỂM TRA SỰ TỒN TẠI CỦA CÁC HỆ SỐ HỒI
Vì cột Sig coeff< α= 0.05 nên các hệ số hồi quy ddeuf khác 0.
Cả 4 nhân tố phân bón,lao động máy móc thiết bị và vùng miền đều có ảnh hưởng đến sản lương lúa của hộ gia đình.
VIẾT PHƯƠNG TRÌNH HỒI QUY(Cột β của bảng Coeffcients)
Ln output =2,930 +0.448 Lnfertiliser+0.328 Lnlabour+ 0.331 Lnmachine 0.378 Vùng miền
Nếu phân bón tăng 1% trong khi tất cảcác yếu tố khác không thay đổi
XÁC ĐỊNH TẦM QUAN TRỌNG CÁC BIẾN TRONG MÔ HÌNH
45
Trang 46+Thực hiện bằng cách nào?Khi nào?
+ Kết quả mong đợi.
-46
Trang 47Bài 9: Cho số liệu về sản xuất lúa ở tệp "RiceProduction", các biến tương ứng là:
1- Biến phụ thuộc:- Output: sản lượng lúa (kg) của hộ gia đình
2- Biến giải thích: Hai loại:
Các đầu vào:
- Land: diện tích đất trồng lúa (ha)
- Fertilizer: đầu tư cho phân bón
- Labour: đầu tư về lao động (ngày công)
- Machine: đầu tư cho MMTB (giờ máy)
Các điều kiện sản xuất và đặc trưng của hộ gia đình
- Plot: số mảnh ruộng của hộ gia đình
- LandClass: Cấp đất (cấp đất càng cao đất càng xấu)
- Crop: hệ số mùa vụ (số vụ lúa bình quân/năm)
- Age: tuổi của chủ hộ
- Hhsize: số người trong hộ gia đình
- Vùng miền: Các quan sát từ 1-192 là các hộ gia đình ở miền Bắc (mã hóa Miền Bắc
=1), các quan sát từ số 193 trở đi là các hộ gia đình miền Nam (mã hóa Miền Nam=0).
Yêu cầu:
1 Nhập dữ liệu từ file Excel vào phần mềm SPSS và ghi vào file
RiceProduction_STT.sav
2 Bỏ đi 10 quan sát ngẫu nhiên (STT và 9 quan sát khác)
3 Xây dựng hàm hồi quy nghiên cứu các nhân tố ảnh hưởng đến sản lượng lúa của
hộ gia đình, ước lượng hàm hồi quy, phân tích ảnh hưởng của các nhân tố, gợi mở hoặc đề xuất chính sách.
Cod
e Output Land Fertiliser Labour Machine Plot LandClass Age Hhsize Region
47