Vào cửa sổ Variable view click chọn thuộc tính value của biến cần khai báo.kiểm tra số lựa chọnNHẬP LIỆU VỚI CÂU HỎI NHIỀU LỰA CHỌN... Chọn công cụ Compare Means / MeansĐỔ BẢNG MÔ
Trang 1Hồ Thanh Trí
XỬ LÝ DỮ LIỆU VỚI SPSS
Trang 2 Là loại thang đo mà trong đó số đo dùng để xếp loại
Dùng cho dữ liệu định tính
Có thể gán các ký tự,trị số…để mã hóa dữ liệu
Các con số không có ý nghĩa về lượng
THANG ĐO ĐỊNH DANH(NOMINAL SCALE)
Trang 3Câu hỏi nhiều lựa chọn
CÁC DẠNG CÂU HỎI CỦA THANG ĐO ĐỊNH DANH
Trang 4 Là loại thang đo trong đó số đo dùng để so sánh thứ tự
Dùng cho dữ liệu định tính
Không đo lường được chênh lệch thứ bậc hơn kém
Không có ý nghĩa về lượng
Có thể gán các ký tự,trị số….để mã hóa dữ liệu
Các mã số không mang ý nghĩa
THANG ĐO THỨ BẬC(ORDINAL
SCALE)
Trang 5THANG ĐO THỨ BẬC(ORDINAL
SCALE)
Trang 6 EditOptionsGeneralMục Character Encoding for Data and Syntax click chọn UnicodeOk
TIẾNG VIỆT THEO UNICODE
Trang 9 Xác định những giá trị vô nghĩa:giá trị khác với giá trị
Trang 10 Bước 1: lập bảng tần số từng biến,để tìm số liệu bất thường
Trang 11 Hãy mã hóa lại biến TUOI
Tuổi dưới 20
Từ 20 đến dưới 40
Từ 40 đến dưới 60
Trên 60
Nên mã hóa và lưu lại trên biến mới
Transform Recode into Different Variable
MÃ HÓA LẠI BIẾN
Trang 12MÃ HÓA LẠI BIẾN
Trang 13Analyze Descriptive Statistics Frequencies
THỐNG KÊ MÔ TẢ TẦN SỐ
Trang 14THỐNG KÊ MÔ TẢ TẦN SỐ
Trang 15KẾT QUẢ THỐNG KÊ MÔ TẢ
Trang 17 Cột Frequency là tần số của từng biểu hiện, được tính bằng cách đếm
Cumulative Percent: phần trăm tích lỹ do cộng dồn
KẾT QUẢ THỐNG KÊ MÔ TẢ
Trang 18 Bạn cho biết các loại điện thoại di động mà bạn đã sử dụng qua
Có thể lựa chọn nhiều hơn 1 phương án làm sao để nhập dữ liệu được?
NHẬP LIỆU VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 19 Vào cửa sổ Variable view click chọn thuộc tính value của biến cần khai báo.(kiểm tra số lựa chọn)
NHẬP LIỆU VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 20 Analyze Multiple Response Define Variable set
THỐNG KÊ VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 21THỐNG KÊ VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 22 Analyze Multiple Response Frequencies
THỐNG KÊ VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 23KẾT QUẢ
THỐNG KÊ VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 24 Analyze Multiple Response Crosstabs
THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN (PHÂN TÍCH 2 BIẾN)
Trang 25KẾT QUẢ
THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN (PHÂN TÍCH 2 BIẾN)
Trang 26 Analyze Descriptive statistics Descriptives
ĐỔ BẢNG MÔ TẢ VỚI BIẾN
ĐỊNH LƯỢNG
Trang 27ĐỔ BẢNG MÔ TẢ VỚI BIẾN
ĐỊNH LƯỢNG
Trang 28 Chọn công cụ Compare Means / Means
ĐỔ BẢNG MÔ TẢ BIẾN ĐỊNH LƯỢNG (BIẾN PHỤ THUỘC) TRONG MỐI QUAN HỆ VỚI CÁC BIẾN ĐỊNH TÍNH KHÁC (BIẾN ĐỘC LẬP)
Trang 29Vào AnalyzeTablesCustom Tables
THỐNG KÊ MÔ TẢ VỚI CUSTOM
TABLES
Trang 30HÌNH THÀNH CÁC BẢNG BIỂU
Trang 32 Analyze Tables Multipe Response
THỐNG KÊ VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 33THỐNG KÊ VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 34 Sau đó quay trở về bảng Custom Table và thực hiện bình thường với biến vừa tạo
THỐNG KÊ VỚI CÂU HỎI NHIỀU
LỰA CHỌN
Trang 35 Áp dụng trong trường hợp biến phụ thuộc là biến định lượng
HỒI QUY TUYẾN TÍNH(REGRESSION)
Trang 36HỒI QUY(REGRESSION)
Trang 38 Estimates :hệ số hồi quy
Part and partial correlations: phân tích tương quan tuyếntính các biến độc lập
Collinearity diagnostics : kiểm soát đa cộng tuyến
HỒI QUY(REGRESSION)
Trang 40 Đồ thị giúp ta biết được sự tương quan giữa các biến độc lập so với biến phụ thuộc
Trang 41 Correlations ( bảng tương quan ma trận)
= 1 : chặt chẽ
Tiến về 0 : không chặt chẽ
Ở giữa : trung bình
Model Summary :tóm tắt mô hình
Anova :phân tích phương sai
Coefficient : hệ số hồi quy
ĐỌC DỮ LIỆU TỪ MÔ HÌNH
Trang 42 Xét cột Sig và VIF(mức độ phóng đại phương sai) ở bảngCoefficients
Sig<0,05,VIF<5(VIF giải thích hiện tượng đa cộng tuyến)
Đa cộng tuyến là kiểm tra xem các biến độc lập trong mô hình có tương quan chặt chẽ với nhau.
dữ liệu thực tế.Các biến độc lập có tương quan tuyến tính với biếnphụ thuộc
Hệ số Durbin Watson(1<DW<3):giải thích hiện tượng tương quan chuỗi(coi thử các mẫu có lặp đi lặp lại hay không)
R square có ý nghĩa:các biến độc lập giải thích được bao nhiêu % biến phụ thuộc
ĐỌC DỮ LIỆU TỪ MÔ HÌNH
Trang 43Giải thích ý nghĩa của hệ số R²
Trang 44GIẢI THÍCH KẾT QUẢ
Trang 46 Viết phương trình dựa vào hệ số Bgọi là phương trình
ở dạng chưa chuẩn hóa
Viết phương trình dựa vào hệ số Betaphương trình ở
Trang 47 Beta nào càng lớn thì càng ảnh hưởng đến biến phụ thuộc
Ưu tiên giải pháp cho Beta lớn nhất nhưng cũng phải giải thích cácbiến bị loại
Sau đó xét tới hệ số Mean(GTTB) của từng thành phần nếu:
Caoduy trì
Thấptìm giải pháp nâng cao lên
GIẢI THÍCH Ý NGHĨA PHƯƠNG
TRÌNH
Trang 481 Dùng Lệnh Analysis > Regression > Cure Estimation để
định dạng và tìm các thông số b0, b1, b2, b3…của hàm
(nguyên tắc giá trị F càng lớn là càng phù hợp).
2 Dùng lệnh Transform > Compute Variable để tính lại giá
trị tuyến tính của biến bằng cách thế các thông số b0, b1, b2,b3…vào công thức tính.
3 Chạy hồi quy bằng SPSS dạng tuyến tính.
4 Viết phương tr.nh hồi quy dạng đổi biến và dạng gốc.
BIẾN ĐỔI BIẾN
Trang 491 Linear Model whose equation is Y = b0 + (b1 * t) The series values
are modeled as a linear function of time
2 Logarithmic Model whose equation is Y = b0 + (b1 * ln(t)).
3 Inverse Model whose equation is Y = b0 + (b1 / t).
4 Quadratic Model whose equation is Y = b0 + (b1 * t) + (b2 *t**2)
The quadratic model can be used to model a series which "takes off" or a series which dampens
5 Cubic Model defined by the equation
Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3).
6 Power Model whose equation is Y = b0 * (t**b1) or ln(Y) = ln(b0) +
(b1 * ln(t)).
CÁC HÀM ĐỔI BIẾN
Trang 507 Compound Model whose equation is Y = b0 * (b1**t) or ln(Y) =
10 Growth Model whose equation is Y = e**(b0 + (b1 * t)) or ln(Y) =
b0 + (b1 * t)
11 Exponential Model whose equation is Y = b0 * (e**(b1 * t)) or
ln(Y) = ln(b0) + (b1 * t)
CÁC HÀM ĐỔI BIẾN
Trang 51ƯỚC LƯỢNG ĐƯỜNG CONG
Đưa biến phụ thuộc vào ô Dependent
Đưa biến độc lập vào ô independent
Chọn các hàm
để ước lượng
Trang 52ƯỚC LƯỢNG ĐƯỜNG CONG
Dựa vào constant, b1,b2, b3
để viết lại hàm mới
Trang 53Đơn giản chỉ có vậy bạn hãy nhớ mình cần đọc những gì và giải thích nó như thế nào?
Trang 54 Cách 1:
Vào Variable View đặt tên biến mới
Ô Target Variable(biến mục tiêu) đánh lại tên biến
đã đặt ở trên
Sau đó chọn biến độc lập để mã hóa
variable(tạo một biến giả mới)
MÃ HÓA BIẾN(BIẾN GIẢ
DUMMY)
Trang 55 Áp dụng trong trường hợp biến phụ thuộc là biến định tính có 2 thuộc tính(VD: có hay không; tăng hay giảm….)
Analyse Regression Binary Logistic
Chuyển biến phụ thuộc Y vào Dependent variable box.
Chuyển các biến độc lập có liên quan vào Covariates box.
Chọn Enter trong ô Method
Click Option
Đánh dấu vào CI for Exp(B), 95%
Click Continue
Click OK
Xem bảng Variable in the equation
Xem cột sig nếu biến Xi có sig <0.05 có ý nghĩa thống kê với mức ý nghĩa 5%.
Cột EXP(B)= của từng biến độc lập
HỒI QUY LOGISTIC
Trang 56Giới thiệu: Theo tiêu chuẩn của World Bank (1 USD/người/ngày), năm
2010, tỷ lệ nghèo ở Việt Nam là 10,3% Tuy nhiên, nếu áp dụng chuẩnmới ( 2 USD/người/ngày) thì tỷ lệ nghèo sẽ cao hơn nhiều Nền kinh tếkhông thể phát triển bền vững khi còn tình trạng nghèo cao Đó là tháchthức và đương đầu của các nước đang phát triển Cải thiện tình trạngnghèo theo quá trình tăng trưởng và phát triển đang được Chính phủ ViệtNam quan tâm Để giải quyết điều này, trước hết phải nhận diện đượccác yếu tố ảnh hưởng đến nghèo Tuy nhiên, cách nào để định lượng mốiquan hệ giữa các yếu tố và nghèo vẫn còn bỏ ngỏ trong nghiên cứu Phầnnghiên cứu này sẽ giải quyết vấn đề đặt ra, tập trung vào các nội dung:(1) Cơ sở lý thuyết để hình thành mô hình hồi quy Binary Logistic đốivới tình trạng nghèo; (2) Phân tích mô hình dựa trên chương trình SPSS18
MÔ HÌNH CÁC YẾU TỐ ẢNH HƯỞNG
ĐẾN NGHÈO Ở NÔNG THÔN
Trang 571 Các yếu tố ảnh hưởng đến nghèo
Các công trình nghiên cứu tại Việt Nam trước đây như: Van de Walle, D và Dileni, G.(2001), Minot, N (2004), WB (2007), Đinh Phi Hổ và Nguyễn Trọng (2007), đã nhận diện có tám yếu tố ảnh hưởng đến nghèo.
Quy mô diện tích đất của hộ gia đình
Quy mô vốn vay từ định chế chính thức
Khả năng tiếp cận cơ sở hạ tầng
CƠ SỞ LÝ THUYẾT CỦA MÔ HÌNH
Trang 58 Nghề nghiệp, tình trạng việc làm
Người nghèo thường không có việc làm, làm thuê hoặc làm việc trong nông nghiệp, trong khi người giàu thường có việc làm trong những lĩnh vực có thu nhập cao và tương đối ổn định như buôn bán, dịch vụ, công chức.
Trình độ học vấn
Vì không có đủ tiền để trang trải cho chi phí học tập nên con cái họ thường bỏ học rất sớm hay thậm chí không đi học Hơn nữa, người nghèo không những thiếu hiểu biết mà còn thiếu khả năng tiếp thu kiến thức chuyên môn cần thiết trong hoạt động kinh tế Hệ quả là rơi vào cái bẫy: ít học – nghèo.
Trang 59 Quy mô hộ
Quy mô hộ gia đình càng lớn thì hộ có chi tiêu bình quân đầu người thấp hơn Do
đó, có nhiều khả năng nghèo hơn hộ có ít người.
Số người sống phụ thuộc
Tỷ lệ người ăn theo càng cao, họ phải gánh chịu nhiều chi phí hơn cho học hành, khám chữa bệnh Do đó nhiều khả năng nghèo hơn hộ có ít người phụ thuộc.
Quy mô diện tích đất của hộ gia đình
Ở nông thôn, đất là tư liệu sản xuất chủ yếu của nông nghiệp, nguồn tạo ra thu nhập Không có đất hoặc quy mô đất ít thường đi đôi với nghèo.
Quy mô vốn vay từ định chế chính thức
Thiếu vốn đầu tư dẫn tới năng suất thấp, kéo theo thu nhập hộ gia đình thấp Do đó, vay vốn từ định chế chính thức là công cụ quan trọng giúp hộ nông thôn thoát nghèo.
Khả năng tiếp cận cơ sở hạ tầng
Cơ sở hạ tầng nông thôn bao gồm đường giao thông, điện, chợ, nước sạch, hệ thống thông tin liên lạc Cơ sở hạ tầng nông thôn phát triển, nhất là thông qua thực hiện các dự án phát triển cơ sở hạ tầng, sẽ tạo nhiều cơ hội việc làm cho người nghèo ở vùng nông thôn.
Trang 60 Mô hình hồi quy Binary Logistic phân tích những yếu tố tác động đến khả năng nghèo của hộ gia đình như sau:
Y là biến giả, có giá trị bằng 1(nếu hộ gia đình nghèo) và bằng 0 (cho tất cả các hộ gia đình khác); Xj là các yếu tố ảnh hưởng đến nghèo (j=1-n); u là phần dư.
Mô hình định lượng
Trang 61 Dạng tổng quát của mô hình hồi quy Binary Logistic:
Trong đó, P(Y=1)=Po: Xác xuất hộ nghèo;
P(Y=0)=1-Po: Xác xuất hộ không nghèo
Mô hình định lượng
Trang 62Mô hình định lượng
Trang 63 Bảng 1: Giải thích các biến trong mô hình
Biến phụ thuộc
liệu
Kỳ vọng dấu hệ số hồi quy
DANGHO Biến giả (dummy), nhận giá trị 1 nếu
hộ thuộc diện nghèo và nhận giá trị 0 nếu hộ thuộc diện không nghèo
DTOC Biến giả, nhận giá trị 1 nếu hộ là
người Khmer và nhận giá trị 0 nếu
hộ là người Kinh Hoa
Điều tra +
GTINH Biến giả, nhận giá trị 1 nếu chủ hộ
thuộc giới nam và nhận giá trị 0 cho trường hợp thuộc giới nữ
Điều tra - HOCVAN Số năm đi học của chủ hộ Điều tra -
PTHUOC
Tổng số người trên 15 tuổi mà không tạo ra được thu nhập trong hộ gia đình
+
NGHE
Biến giả, nhận giá trị 0 nếu chủ hộ làm việc liên quan tới nghề nông hay nhận giá trị 1 nếu chủ hộ làm việc trong các ngành phi nông nghiệp
-
KCACH Số Km từ nhà hộ gia đình đến chợ
mà người dân có thể mua bán
+ DUONGOTO
Biến giả, nhận giá trị 1 nếu hộ có đường ô tô đến tận nhà và nhận giá trị 0 nếu hộ không có đường ô tô đến nhà
Biến giả, nhận giá trị 1 nếu hộ có vay và nhận giá trị 0 nếu hộ không
có vay từ các tổ chức tín dụng chính thức
-
Trang 64PHÂN TÍCH MÔ HÌNH DỰA TRÊN
Trang 65 Nhập dự liệu vào mô hình hồi quy Binary Logistic
Analyze/ Regression/ Binary Logistic, sẽ xuất hiện hộp thoại
Trang 66 Đưa biến DANGHO vào hộp thoại Dependent (biến phụ thuộc) Đưa các biến còn lại vào Covariates (biến độc lập).
Chọn hộp thoại Save Kết quả như sau:
Trang 67Chọn các bảng số liệu cần thiết, Copy và Paste qua giao diện Excel hoặc World để phân tích
Trang 681 Phân tích các kiểm định.
Kiểm định hệ số hồi quy
Phân tích hồi quy Binary Logistic
Các biến trong mô hình (Variables in the Equation)
B S.E Wald df Sig Exp(B) 95% C.I.for EXP(B)
Lower Upper
Step 1a
DANTOC 1.528 580 6.952 1 008 4.609 1.480 14.352 GIOITINH -.558 492 1.286 1 257 572 218 1.502 HOCVAN -.326 099 10.739 1 001 722 594 877 PHUTHUOC 227 241 888 1 346 1.255 783 2.012 NGHE -1.951 669 8.493 1 004 142 038 528 KCACH 188 166 1.276 1 259 1.206 871 1.670 DUONG -1.368 516 7.025 1 008 255 093 700 LAMXA -1.689 1.019 2.746 1 097 185 025 1.361 DIENTICH 015 028 275 1 600 1.015 961 1.071 COVAY -2.238 594 14.195 1 000 107 033 342 Constant 798 644 1.536 1 215 2.222
a Variable(s) entered on step 1: DANTOC, GIOITINH, HOCVAN, PHUTHUOC, NGHE, KCACH, DUONG,
LAMXA, DIENTICH, COVAY
Trang 69 Biến DANTOC có Sig = 0,008 < 0,01 Do đó, biến DANTOC tương quan có ý nghĩa với biến DANGHO với độ tin cậy 99%.
Biến GIOITINH có Sig = 0,257 > 0,05 Do đó, biến GIOITINH tương quan không có ý nghĩa với biến DANGHO với độ tin cậy 95%.
Trang 70 Kiểm định mức độ phù hợp của mô hình.
Phân loại dự báo (Classification Table)
Classification Table a
Step 1
Hộ nghèo và không nghèo
Kiểm định Omnibus đối với các hệ số của mô hình
(Omnibus Tests of Model Coefficients)
Omnibus Tests of Model Coefficients
Trang 71Thông qua các kiểm định, có thể khẳng định: Các yếu tố ảnh hưởng đến nghèo theo thứ tự tầm quan trọng là thành phần dân tộc, vay tiền từ định chế tín dụng chính thức, nhà gần đường ô
tô, làm việc ở khu vực phi nông nghiệp và trình độ văn hóa của chủ hộ.
Gợi ý chính sách:
Cần có chính sách giảm nghèo riêng cho người dân tộc thiểu số.
Phát triển ngành nghề dịch vụ ở nông thôn.
Mở rộng hoạt động tín dụng cho người nghèo.
Phát triển cơ sở hạ tầng nông thôn, nhất là đường nông thôn.
Nâng cao trình độ văn hóa cho người dân nông thôn.
Kết luận:
Trang 72 Vận dụng mô hình hồi quy Binary Logistic phân tích cácnhân tố ảnh hưởng đến quyết định cho vay của ngânhàng thương mại cổ phần…….chi nhánh……
Đề tài gợi ý
Trang 731 Lựa chọn biến số
Với mô hình hồi quy Binary Logistic cần phải xác định biến nào là
biến độc lập và biến phụ thuộc Các biến được lựa chọn như sau:
a)Biến phụ thuộc
Trong nghiên cứu này biến phụ thuộc (Y) được lựa chọn như sau
Y = 1 nếu KH có khả năng đảm bảo trả nợ
Y = 0 nếu KH không có khả năng trả được toàn bộ nợ
b)Biến độc lập
Đề tài: Xây dựng mô hình logistic về khả năng trả nợ của khách hàng NC trường hợp ngân hàng…….
Trang 74Bảng 2.10: Biến độc lập sử dụng trong nghiên cứu
1 Giới tính 1: Nam – 0: Nữ +/- Gioitinh
3 Trình độ học vấn 1: Dưới TH
2: TH 3: ĐH 4: Trên ĐH
+/- TĐHV
4 Tính chất công việc 1: Cấp quản lý
2: Cấp chuyên viên, kinh doanh có đăng ký 3: Lao động được đào tạo, công nhân, kinh doanh tự do 4: Lao động thời vụ, thất nghiệp, nghỉ hưu
7 Thời gian làm công việc hiện tại Tháng + Thoigianlamviec
8 Số người phụ thuộc Người - Songuoiphuthuoc
9 Lịch sử tín dụng 1: Có nợ – 0: Không có thông tin - LichsuTD
10 Số dịch vụ sử dụng Số dịch vụ + Sodichvu
11 Thu nhập hàng tháng Triệu đồng + Thunhap
12 Tiết kiệm hàng tháng Triệu đồng + Tietkiem
13 Số tiền vay Triệu đồng - Tienvay
14 Giá trị tài sản đảm bảo Triệu đồng + Taisan
Trang 752 Phân tích thống kê mô tả
(Nguồn: Số liệu tính toán từ dữ liệu của Ngân hàng TMCP Sài Gòn)Với bảng 2.11, số liệu khách hàng không có khả năng trả nợ là 19,38%
và 80,62% khách hàng có đủ khả năng trả nợ Ngoài ra, đề tài cũngthống kê mô tả toàn bộ dữ liệu và cho ra các thông số sau:
Bảng 2.11: Phân loại khách hàng theo khả năng trả nợ Nhóm (Y) Số lượng Tỷ trọng
0 31 19,38%
1 129 80,62%
Tổng 160 100%
Trang 76Bảng 2.12: Số liệu thống kê mô tả mẫu nghiên cứu
Biến độc lập Trung bình Mode Độ lệch Maximum Minimum