thống kê, được sự gợi ý và giúp đỡ của các thầy cô, tác giả đã thực hiện đề tài “Ứng dụng lý thuyết thống kê vào mô hình kinh tế lượng trong phân tích mức sống cúa các hộ gia đình Việt N
Trang 1thống kê, được sự gợi ý và giúp đỡ của các thầy cô, tác giả đã thực hiện đề tài
“Ứng dụng lý thuyết thống kê vào mô hình kinh tế lượng trong phân tích mức sống cúa các hộ gia đình Việt Nam”
Tác giả xin chân thành cảm ơn PGS-TS Nguyễn Văn Quảng - giảng
viên, chủ nhiệm bộ môn XSTK khoa Toán, khoa sau Đại học, trường Đại học Vinh; TS Hồ Đăng Phúc - Viện Toán Học Việt Nam; đặc biệt là TS Nguyễn
Thị Minh - Chủ nhiệm bộ môn Toán kinh tế, khoa Toán kinh tế, trường Đại
học Kinh Tế Quốc Dân Hà Nội đã tận tình giúp đỡ hướng dẫn và chỉ bảo để bài Luận văn được hoàn thành
Toàn bộ nội dung của luận văn gồm 3 chương:
Chương 1 Tổng quan về luận văn
Chương 2 Cơ sở lý thuyết Toán học
Chương 3 Ứng dụng phần mềm SPSS và STATA để phân tích đánh giá các
yếu tố ảnh hưởng đến thu nhập và chỉ tiêu của các hộ gia đình Việt Nam
Trong quá trình nghiên cứu mặc dù có nhiều cố gắng song cũng không thể tránh khỏi những thiếu sót Rất mong nhận được những ý kiến đóng góp từ
phía những người quan tâm đến bài Luận văn để bài Luận văn được hoàn
thiện hơn Tuy nhiên tác giả cũng hy vọng Luận văn sẽ cung cấp cho mọi người một cái nhìn tổng quát về thu nhập chỉ tiêu của các hộ gia đình kể từ
Trang 2nâng cao đời sống cho người dân Ngoài ra tác giả cũng muốn kết quả của Luận Văn sẽ gợi ý cho các doanh nghiệp tập trung sản xuất một số mặt hàng, khai thác các thị trường tiềm năng
1.2 Đối tượng nghiên cứu
Đối tượng nghiên cứu của Luận văn là hộ gia đình và một số chỉ tiêu
kinh tế xã hội của hộ gia đình Việt nam Luận văn sử dụng bộ số liệu điều tra
mức sống dân cư hộ gia đình Việt Nam năm 2006 (VHLSS 2006), là bộ số liệu mới nhất hiện có VHLSS thực hiện bởi Tổng cục Thống kê với sự hỗ trợ
kỹ thuật của Ngân hàng Thế giới và các tổ chức quốc tế Mẫu điều tra gồm
hơn 9000 hộ và rất nhiều chỉ tiêu, các đặc điểm liên quan đến hộ gia đình
1.3 Mục đích nghiên cứu
Luận văn hướng tới 4 mục đích:
- Trình bày một cách tổng quát về thực trạng mức sống hộ gia đình Việt Nam, chủ yếu dựa vào thu nhập, chi tiêu; ngoài ra còn đề cập đến giáo dục, y tế, lao động, việc làm theo các tiêu chí khác nhau dựa vào đặc điểm cộng đồng như khu vực thành thị/nông thôn, theo vùng hoặc theo đặc điểm của hộ gia đình như nghề nghiệp, trình độ học vấn, nhóm chỉ tiêu
- Phân tích các yếu tố ảnh hưởng đến thu nhập của hộ gia đình Việt Nam như
giáo dục, lao động, việc làm, khác biệt vùng địa lý
- Phân tích các đặc điểm hộ, các khác biệt vùng ảnh hưởng như thế nào đến
hành vi chỉ tiêu của hộ gia đình
- Nêu lên cơ sở Toán học (lý thuyết về hôi qui trong thống kê) trong ứng dụng
các chương trình phân tích các chỉ số kinh tế xã hội lớn nhất hiện nay là SPSS
và STATA
Trang 31 Ước lượng các tham số của hàm hồi quy
2 Kiểm định giả thiết về giá trị của các tham số đó
3 Đánh giá các sai số ước lượng và kiểm tra tính phù hợp hay đúng đắn của hàm hồi quy
4 Dự báo (hay dự đoán) các giá trị của Y theo X,,X, X,
1.4 Phương pháp nghiên cứu
1 Sử dụng phương pháp thống kê mô tả và phân tích tổng hợp để đưa ra cái
nhìn tổng quát về mức sống dân cư các hộ gia đình Việt Nam năm 2006 Phần này thực hiện các bước sau:
Bước 1: Xác định số liệu thu nhập và chỉ tiêu bình quân đầu người/tháng của
mỗi hộ gia đình (ở đây luân văn chỉ điều chỉnh sự khác biệt của các vùng chứ
không điều chỉnh về giá tiêu dùng) Số liệu được lấy từ kết quả điều tra năm
Trang 4sống của các hộ gia đình ở Việt Nam giai đoạn hiện nay Đặc biệt là bức tranh
về thu nhập và chỉ tiêu của các hộ gia đình Kết quả nghiên cứu cũng hy vọng
đưa ra các khuyến nghị về mặt chính sách trong việc giải quyết vấn đề về
nghèo đói và bất bình đẳng trong thu nhập ớ Việt Nam
- Có thể sử dụng làm tài liệu tham khảo cho sinh viên trong việc áp dung
toán trong phân tích kinh tế xã hội.
Trang 5PHAN TICH HOI QUY
Trong thực tế, nhiều khi cần dự báo giá trị của một biến số hoặc đánh giá tác động của sự thay đổi trong giá trị của một (hay một số) biến số lên một
biến số khác thông qua một công thức nào đó Nói cách khác, chúng ta phải nghiên cứu trực tiếp nhiều chỉ tiêu khác nhau đối với một đối tượng nghiên cứu Các chỉ tiêu này có thể là định lượng (tức là các biến ngẫu nhiên) hay định tính (được gọi là các dấu hiệu nhân tổ ) Các chỉ tiêu này được xác định
cụ thể trên đối tượng quan sát (phân biệt đối tượng nghiên cứu và đối tượng quan sát) và được “đo lường” (thu thập thông tỉn) trực tiếp trên các đơn vị quan sát Đó là các phần tử thuộc tập hợp đối tượng quan sát mà ta sẽ trực tiếp thu nhận thông tin từ đó Ví dụ, đối tượng quan sát là cán bộ CNV trong một
công ty chẳng hạn, theo đơn vị quan sát là các công nhân; cán bộ lãnh đạo
Công ty đó Tùy theo vấn đề cần nghiên cứu, phân tích mà các chỉ tiêu có thể
là: tuổi, thời gian làm việc, năng suất lao động (chỉ tiêu định lượng) hay
giới tính, tay nghề, loại hình nghề nghiệp, trình độ văn hóa (chỉ tiêu định tính)
Như vậy để giải quyết vấn đề cụ thể người ta phải nghiên cứu, phân tích
nhiều chỉ tiêu (cũng gọi là chỉ tiêu thống kê) đó là các biến ngẫu nhiên (chỉ tiêu định lượng), các nhân tố, dấu hiệu (chỉ tiêu định tính) Một phương pháp hữu hiệu giúp chúng ta có thể làm rõ bản chất của hiện tượng hay sự việc cần nghiên cứu để tìm ra quy luật, dự đoán được xu thế biến động của hiện tượng,
sự việc đó trong tương lai, đó là
phương pháp phân tích hồi quy Cụ thể chúng ta sẽ đề cập đến những vấn đề
sau:
Trang 6E(Y/X,) =B, +B„X,, + + B,X «i» hay viet dưới dạng ngầu nhiên
Y, = B, + BX), + + BX + Uy
Trong đó, 6, với i=1,k là tham số và U¡ là các sai số ngẫu nhiên độc lập với nhau và tuân theo quy luật phân phối N(0,ø° ) Tuy nhiên trong thực tế việc xác định hay xây dựng PRF là rất khó, vì vậy chỉ có cách xây dựng ham
hồi quy mẫu lấy từ tổng thê hay gọi là hồi quy mẫu SRE Sau đó từ các hệ số
Trang 7Trong khuôn khổ của bài luận văn này tác giả xin đưa ra phân tích vấn đề 3,
và cũng chính là nội dung của bài toán phân tích hồi quy
I KHÁI NIỆM HAM HOI QUY VÀ PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHÁT
2.1.1 Khái niệm hàm hồi quy
Có nhiều bài toán trong các lĩnh vực sinh học, kinh tế, giáo dục, khí tượng học, xã hội học khi biết được một số giá trị thực nghiệm của các đại lượng, ví dụ ta có p biến ngẫu nhiên: X,,X,,X, X,.Ta muốn nghiên cứu
rõ hơn sự tác động của một, hay nhiều biến trong số đó đến sự biến động của
một biến nào đó, ví dụ xX, chẳng hạn Có nghĩa là chúng ta muốn giải thích được nhiều hơn và cụ thể hơn sự biến động của X, thông qua sự tác động của
những biến đó Đó chính là mục đích của phương pháp phân tích hồi quy Để
tiện cho việc trình bày, chúng ta xét một tập hợp p biến ngẫu nhiên, nhưng trong đó X, được thay thế bằng Y, tức là ta có: Y,X,,X; X,
Giả sử ta muôn tìm hàm nào đó của X,,X, X, sao cho nó xâp xi Y
tốt nhất theo nghĩa cực tiéu sai số bình phương trung bình, có nghĩa là:
Trang 8- Với p > 2 theo fy (X,,X, Xp) =B, + BX, + B3X,+- + BpXp, gọi là
hàm hồi quy tuyến tính bội
E(Y- {(X))? > min khi f(X) = E(Y/X,, X, X,)
Ta chứng minh mệnh đề trên cho trường hợp p = 2 nghĩa là: f(X) = E(Y/X) Chứng mình:
E(Y- f(X))? = E(Y-E(Y/X)) + E(Y/X) - f(X))?
= E(Y - E(Y/X))? + E(E(Y/X) - f(X))’
+ 2E(Y - E(Y/X)E(Y/X) - f(X))
Số hạng thứ ba bằng 0, cũng hai số hạng cũng lại là > 0 Ta bỏ đi số E(E(Y/X) - f(X))?, nói cách khác, nếu chọn f(X) = E(Y/X) theo số hạng đó
triệt tiêu Vậy ta có:
E(Y- f(X))? ¬ min khi f(X) = E(Y/X)
2.1.4 Các giả thiết cơ bản của phương pháp bình phương nhỏ nhất
Trong phân tích hồi quy, mục đích chúng ta là ước lượng, dự báo về tổng thể, tức là ước lượng E(Y/X,) Tuy nhiên chúng ta chỉ có các ước lượng của nó,
và trong thực tế chúng ta dùng các ước lượng này để suy diễn cho tổng thể
Do đó để các suy diễn này đáng tin cậy thì các ước lượng này phải là các đại
diện tốt cho các hệ số của tổng thể Chất lượng của các ước lượng phụ thuộc
vào:
Trang 9- Phụ thuộc vào kích thước mẫu
Đề các suy diễn thống kê trên là đáng tin cậy, mô hình cần thỏa mãn các giả thiết cơ bản sau đây:
Giá thiết 1: Biến (các biến) giải thích là phi ngẫu nhiên, tức là các giá trị của chúng là các số đã được xác định
Giả thiết này không có gì mới, vì phân tích hồi quy được đề cập là phân tích hồi quy có điều kiện, phụ thuộc vào các giá trị X đã cho
Giả thiết 2: Kỳ vọng của các yếu tố ngẫu nhiên U bằng không, tức là:
Trang 10Đồ thị chỉ ra rằng với mỗi giá trị của X, các giá trị có thể có của Y xoay quanh giá trị trung bình Phân bó của phần lớn hơn hay nhỏ hơn giá trị trung bình chính là các U,, theo giả thiết này trung bình của các chênh lệch này bằng 0 Chú ý: Giả thiết E(U,/X,) = 0 kéo theo E(Y,/X,) = B, + B,X,,-
Giả thiết 3: Phuong sai bằng nhau (phương sai thuần nhất) của các U,
Var(U,/X,) = Var(U /X ) = o Vizj
Giả thiết 3 có nghĩa là phân bố có điều kiện của Y với giá trị đã cho của X có phương sai bằng nhau, các giá trị cá biệt của Y xoay quanh giá trị trung bình với phương sai như nhau
Giả thiết 3 kéo theo Var(Y,/X,) = ø?
Giá thiết 4:
Không có sự tương quan giữa các U,:
Cov(U,U,)=0 Vi#j
Giả thiết này có nghĩa là U, là ngẫu nhiên Về mặt hình học có nghĩa là nếu
như có một giá trị U nào đó lớn hơn hay nhỏ hơn giá trị trung bình không có nghĩa là giá trị khác cũng lớn hơn hay nhỏ hơn giá trị trung bình
Giả thiết 5: U, và X, không tương quan với nhau:
Chứng mình:
Trang 11Ta chứng minh x e,X, = 0, thật vậy:
Var(B, ) = Var(S: W,X,) => W2Var(Y,) = 07S W?
i=l i=l i=l
Trang 12II MÔ HÌNH HỎI QUY TUYẾN TÍNH k - BIEN BANG PHUONG PHAP
MA TRAN
Giả sử hàm hồi quy có dạng:
Y, =B, + B,X,, + + BX, + U, (1)
Trong dé p, 14 hé sé tu do (hé sé chan)
B, id= 2,k là các hệ số hồi quy riêng
Giả sử có n quan sát thực tế, mỗi quan sát gồm k giá trị (Y,-Xg,-X Gy)
Vậy ta có:
Yị =Bị¡ +B¿X¿i + t B Xu + U,
Y, = B, +B, X 2 + + BX FU,
|Y; | |B, | |U,| h Xo Xị co Xia |
Ký hiệu Y=| |: ð=| |; Us| fs X=] - "
Khi đó ta có: Y = XB +U
Giả thiết 4 nói rằng giữa các biến độc lập không có quan hệ tuyến tính
với nhau, khi đó các cột của ma trận X là độc lập tuyến tính Do đó hạng của
ma trận X bằng số cột của ma trận này tức là R(X) = k, ma trận X không suy
biến
Như trình bày ở trên, trong thực tế việc sử dụng phương trình hồi quy
tổng thể theo số liệu tông quát là rất khó khăn, vì vậy cũng như hồi quy 2 hay
3 biến, việc ước lượng phải dựng đến hàm hồi quy mẫu SRF
2.2.1 Ước lượng các tham số - OLS (Ordinary Least Squares)
Trang 13Từ hàm hồi quy tổng quát (1), hàm hồi quy mẫu có dạng:
Ta thu được B, lñy Bn là nghiệm của hệ phương trình tuyến tính sau:
(2S(B,.B.„ ô§(BỊ.B; -.Bp) _
l J= lp
Bằng cách sử dụng phương pháp hình học và một số phép tính cơ bản của ma
trận ta có:
Nếu coi ÿ như một vectơ biến theo F = XB chính là phương trình của một
siêu phẳng trong không gian R" với các cơ sở la cdc vecto (I, X,, X„ ) Tức
Trang 14là ta cũng phải gia thiét rang (1, X ;›.›X„ ) là độc lập tuyến tính hay ma trận X
cơ sở hạng là p
Vì lv - vỗ| = lv - | = min nén tasuyrarang Y là hình chiêu của Y lên siêu phẳng F Tức là ta có: (Y - Ý ) trực giao với F Vì (1, X,, Xa ) là cơ sở của F do đó (Y - Ÿ ) cũng trực giao với tất cả những vectơ đó
(,Y-Ÿ) =XƠ, -Y)) =0
Sử dụng ký hiệu ma trận ta có thể viết lại như sau:
Trang 15Vì hạng của X bằng p nên (X'X) cũng có hạng bằng p, do đó sẽ tồn tại ma trận
nghịch đảo (xxY" (theo giả thiết 4, X không suy biến nên (XX) cũng không suy biến) Ta có: (X'X) X'Y = (X'X}X'Xô
Vậy B =(XX) 'XY
2.2.2 Ma trận hiệp phương sai của Š
Để kiểm định giả thiết, tìm khoảng tin cậy, cũng như thực hiện các suy
luận thống kê khác cần phải tìm Var(8,) i=l,k Và CoviB,.B,) Phuong phap
ma tran cho phép ching ta tim mét cach dé dang
Ta có ma trận hiệp phương sai của Ệ :
[ Vart(Š) CovÐ,Š;) Covi, By.) |
ICovjl¿) - Var¿) Covi 8
Trang 162.2.3 Hệ số xae dinh béi R? va hệ số xác định bội đó hiệu chỉnh R?
Trong mô hình hồi quy hai biến, rˆ đo độ thích hợp của hàm hồi quy Nó
chính là tỷ lệ của toàn bộ sự biến đổi của biến phụ thuộc Y do biến giải thích
X gây ra Trong mô hình hồi quy bội tỷ lệ của toàn bộ sự khác biệt của biến Y
do tất cả các biến giải thích X,,X; X, gây ra, được gọi là hệ số xác định bội, ký hiệu Rˆ
Từ hình vẽ trên ta thấy rằng:
ly -š[ ~jr-Y[ : l -Y|
Hay >(Y, -Y)?= SƠ, -Y)? +x(¥ -Y)? =TSS
Đặt ESS = y(Ÿ -Y)? (Explained sum of squares)
RSS = EY, - Y)? (Residual sum of squares)
Ta có TSS = ESS +RSS (TSS: Total sum of squares)
Chi y rang: ESS = ÿ(Ÿ - Y)?= Dax + 6-Y)?
Trang 17càng nhỏ theo độ chính xác của ước lượng càng cao Tức là R? càng lớn thì
mô hình càng IỗI
Cụ thể: 0<R? <1 Nếu R? = 1, có nghĩa là đường hồi quy giải thích 100% sự
thay đổi của Y Nếu R? = 0, có nghĩa là mô hình không giải thích sự thay đổi
nào đo của Y
Một tính chất quan trọng của R? là nếu là hàm không giảm của số biến
~ z x n
giải thích có trong mô hình Dê thây rang > I= Ji => (Vi-Y)” không phụ i=
thuộc vào số biên giải thích có trong mô hình, nhung >
i=l e là hàm giảm của
số này
Do đó, nếu tăng số biến giải thích trong mô hình theo R 2 cting tang Van
đề đặt ra là khi nào thì nên đưa thêm biến giải thích vào mô hình ?
Chúng ta không thể dùng R7 làm tiêu chuẩn dé xem xét việc đưa thêm hay không một biến giải thích mới vào mô hình Bởi vì R? cũng phụ thuộc số
Trang 181 Nếu k>l, R?<RŸ” <1, điều này có nghĩa là nếu số biến giải thích tăng lên
theo R7 tăng chậm hơn so với RỶ
2 R’> 0, nhung Rˆ có thể bé hơn Như vậy khi R? cũng tăng theo, ta cũng
phải đưa thêm biến mới R? cũng có thé tăng khi mà hệ số của biến mới trong
hàm hồi quy khác không Lúc đó các giả thiết bị bác bỏ
2.2.4 Đánh giá mô hình qua việc kiểm định các giải thiết thống kê
Hệ số tương quan bội R của phương trình hồi quy chưa nói lên đầy đủ được chất lượng của mô hình
-_ Nếu hai mô hình có các biến mô tả khác nhau xuất hiện trong phương trình hồi quy theo dựng hệ số tương quan bội không kết luận được mô hình nao tét hơn
-_ Có thể việc loại bỏ bớt một số biến nào đó ra khỏi phương trình hồi quy tuy làm thay đổi hệ số tương quan bội, song về thực chat lại không làm giám đáng kế chất lượng của mô hình
- Trong thực hành, nhiều khi bỏ bớt biến mô tá trong phương trình hồi quy thì sẽ “kinh tế” hơn, mặc dù sai số ước lượng có thê lớn hơn
Như vậy, phải dựa vào các phép kiểm định đề tiến hành đánh giá, lựa chọn mô hình
Trang 192.2.5 Dw bao
Chúng ta có thể sử dụng mô hình hồi quy vào dự báo: Dự báo giá trị trung bình và dự báo giá trị cá biệt, nhằm đưa ra những thông tin chính xác định hướng cho việc phát triển những vấn đề cần thống kê trong tương lai
Cho vectơ chuyển vị: X? = (1 X°.X) XE)
- Dự báo giá trị trung bình: E(Y/X')
Suy ra: Ÿ, -t,„(n-k)Se(Ÿ,/X”) < E(V/X,) < Ÿ, +t „(n-k)Se(Ý,/X?)
- Dự báo giá trị cá biệt:
Với Y, = Xb+ = Var(¥,/X°) = Var(X °6) + s2
Var(Y,/X")= §?[I + X°@X'X) 'XỈ];
Se(Y,/X°) = (vary, /X°)
Suy ra: Y, -t,,(n-k)Se(¥,/X") < E(Y/X,) < Yy + t,,)(n-k)Se(Y,/X°).
Trang 20II HÒI QUY VỚI BIẾN GIÁ
Trong mô hình hồi quy, ngoài các biến số lượng ra theo người ta cũng dựng đến biến chất lượng Trong trường hợp này để mô hình có thể đồng bộ hóa người ta phải dùng đến biến giả
Biến chất lượng thường chỉ ra có hoặc không có một thuộc tính nào đó,
chẳng hạn nam hay nữ; khu vực tư nhân hay nhà nước Các biến này nhiều
khi cũng có ảnh hưởng đến biến phụ thuộc Để đánh giá được các tác động này, người ta sử dụng phương pháp biến giả
Các biến giả được áp dụng trong mô hình được trình bày trong chương III
Trang 21Chuong II
PHAN I
SU DUNG MO HINH HOI QUY PHAN TICH ANH HUONG CUA MOT
SO YEU TO CHINH LEN HANH VI CHI TIEU VA TIET KIEM CUA HO
GIA DINH
3.1.1 Số liệu
Luận văn sử dụng bộ số liệu điều tra mức sống dân cư hộ gia đình Việt Nam năm 2006 (VHLSS 2006) VHLSS thực hiện bởi cơ quan phát triển và UNDP tài trợ với sự hỗ trợ kỹ thuật của Ngân hàng Thế giới Mẫu điều tra
gồm hơn 9000 hộ và rất nhiều chỉ tiêu, các đặc điểm liên quan đến hộ gia
đình, rất hữu ích trong việc phân tích và xây dựng mô hình
Luận văn chủ yếu quan tâm đến chỉ tiêu thu nhập và chỉ tiêu của hộ gia
đình nên để hiểu rõ hơn các tính toán và kết quả đưa ra của mô hình sau đây chúng ta sẽ tìm hiểu cách tính thu nhập và chỉ tiêu 1 người/1 tháng của hộ gia
đình trong bộ số liệu điều tra Các số liệu về thu nhập và chỉ tiêu được lấy chủ
yếu ở trong phần điều tra về thu nhập và chỉ tiêu của chủ hộ, chỉ có một vải khoản thu và chỉ tiêu từ giáo dục, y tế là được lấy từ phần điều tra về giáo dục,
y tế chăm sóc sức khỏe
Các tính toán đều dựa vào hai bảng thu nhập và chỉ tiêu (đơn vị tính là nghìn đồng)
Trang 22Bảng 1: Cách tính thu nhập bình quân đầu người/một tháng của hộ
Nguôn: Bộ câu hỏi điều tra nức sống dân cư VHLSS 2006
Trang 23Cách tính thu nhập và chỉ tiêu từ các số liệu:
Tổng thu: l =mã 2 + 3 +4 + 13 + 14
Thu nhập = mã 2 + 3 + 4 + (5 - 18) + (6 - 19) + (7 - 20) + (§ - 21) + (9 - 22) + (10 - 23) + (11-24) + 12 + 14
Thu nhập bình quân/người/tháng = thu nhập/(số nhân khâu của hộ * 12) Tổng chỉ: 15 = mã 16 + 17 + 18 + + 34 + 35
Chỉ tiêu bình quân/người/tháng = chỉ tiêu/(số nhân khẩu của hộ * 12)
Bang 2: Cách tính chỉ tiêu bình quân đầu người một tháng cúa hộ gia
Trang 24
24 Chị cho phi nông nghiệp
25 Chỉ cho ăn uống lễ Tết
26 Chỉ cho ăn uống thường xuyên
27 Chỉ không phải lương thực thực phâm hàng ngày
28 Chi không phải lương thực thực phẩm hàng năm
29 Chi khác tính vào chi tiêu
30 Chi khác không tính vào chi tiêu
31 Chỉ sữa chữa lớn tài sản có định
32 Chỉ mua tài sản có định
33 Chi mua đồ dùng lâu bền
34 Chi mua đất nhà, mua sắm, sữa chữa, xây mới
35 Chi điện, nước, thuê nhà, gas
đây Trong mỗi tập hợp biến mô tả như phân loại vùng thì một vùng bị bỏ qua
xem như nhóm tham khảo Ví dụ như vùng Tây Bắc Bộ là nhóm bị bỏ qua cho
biên “reg”, vì thê hệ sô vùng khác phản ánh tác động của mức sông của vùng
đó so với vùng Tây Bắc Bộ
Trang 25Lax: logarit thụ nhập bình quân/người /tháng (nghìn đồng/người/tháng)
Lay: logarit chỉ tiêu bình quân/người /tháng (nghìn đồng/người/tháng)
Nhóm các biến đại diện cho đặc điểm của chủ hộ như: trình độ học vấn, tuổi, giới tính, tình trạng hôn nhân, dân tộc, việc làm Cụ thể gồm 17 biến sau:
1 nếu chủ hộ đã tốt nghiệp THCS Edul =
0 nếu ngược lại
1 nếu chủ hộ tôt nghiệp THPT Edu2 =
0 néu ngược lại
1 nếu chủ hộ tốt nghiệp trung cấp KT, dạy nghề ngắn và
Edu3 = dai han
0 néu ngược lại
1 nếu chủ hộ có trình độ Cao đẳng, Đại học và sau Đại học
Edu4 =
0 nếu ngược lại
Age: tuổi của chủ hộ (năm)
Agesa = tuôi * tuổi (bình phương tuôi của chủ hộ)
Trang 27
Regs = 1 nếu hộ gia đình sống ở vùng duyén hai mién Trung
Tên biến giả được | „
gan
1 nếu hộ ở thành thị
0 nêu hộ ở nông thôn
1 nếu chủ hộ là người dân tộc kinh
Trang 28
0 nêu ngược lại
1 nếu chủ hộ không có bằng cấp hoặc
0 nếu ngược lại I1 nếu chủ hộ đã có bằng tiểu học hoặc
0 nếu ngược lại
1 nếu chủ hộc đã có bằng PTTH
0 nêu ngược lại
1 nếu chủ hộ có trình độ cao đẳng, đại học
và bang 0 nêu ngược lại
1 nếu chủ hộ có trình độ trên Đại học
0 nêu ngược lại
1 nếu chủ hộ làm việc trong ngành nông,
0 nếu ngược lại
1 nếu chủ hộ làm việc trong ngành công
12 |INDS nghiệp, xây dựng cơ bản
Trang 29
1 nếu chủ hộ làm trong thành phần kinh tế
14 |STAT Nhà nước, kinh tế tập thé
0 nêu ngược lại
1 nếu chủ hộ làm trong thành phần kinh tế
15 |PRIV tư nhân hoặc cá thé, tiểu chủ
0 nêu ngược lại
1 nếu chủ hộ làm trong thành phần kinh tế
16 | FORE có vốn đầu tư nước ngoài
0 nêu ngược lại
Trang 30
TT | Tén bién Mô tả biến
1 |LnX Logarit thu nhập bình quân đầu người (biến phụ
thuộc)
2 Edu0 - Edu4 | Trình độ học vấn của chủ hộ
3 |Age Tuôi của chủ hộ
4 |Agesq Bình phương tuổi của chủ hộ
5 | Ethnic Chủ hộ có là dân tộc thiểu số
6 Sex Giới tính của chủ hộ
7 |Maricd Tình trạng hôn nhân của chủ hộ
8 | tpkt Thành phần kinh tế chính mà chủ hộ tham gia
9_ | nganh Nghề nghiệp chính của chủ hộ
10 | Hhsize Quy mô hộ gia đình
11 |old Tý lệ người già (trên 60 tuôi) trong hộ
12 | child Tý lệ người trẻ (dưới 15 tuổi) trong hộ
13 |Urban Vùng nông thôn/thành thị
Bảng 3: Các biến dùng đánh giá thu nhập và chỉ tiêu
Dạng hàm: do thu nhập có phân bố rất chênh lệch nên phải chuyển thu nhập của hộ sang dạng logarit sẽ lệch ít hơn; điều này là cần thiết bởi vì độ lệch sẽ
Trang 31làm cho một số giả thiết cơ bản của mô hình hồi quy không còn đúng nữa Biến phụ thuộc do vậy trở thành logarit của thu nhập bình quân đầu người
Ta có phương trình sau:
Ln(X,)= B, + B,X,, ++ BYX,, + U;
Trong đó x, là thu nhập bình quân đầu người của hộ thứ ¡
X,, là vectơ các đặc điểm của hộ thứ
8, là vectơ các hệ số ước lượng
U, là sai số ngẫu nhiên
3.1.3.2 Kết quả ước lượng mô hình
Sau khi dùng phần mềm STATA để xử lý và nối các File số liệu lại với nhau thành 1 File thống nhất, sử dụng chương trình chuyển File chuyên dụng để Import File sang phần mềm SPSS để phân tích, các kết quả thu được như sau:
a Phân tích thống kê
Số hộ tham gia điều tra trong bộ số liệu phân tích gồm 6080 hộ
- Phân tích số hộ chia theo khu vực, dân tộc của chủ hộ và vùng
Khu vue
Cumulative Frequency |Percent |Valid Percent|Percent
Trang 32Cumulative Frequency |Percent |Valid Percent|Percent
Dan toc
Cumulative Frequency |Percent [Valid Percent |Percent Valid |Khac |729 12.0 12.0 12.0
Trang 33
Walid
Trang 34
Hinh 2 - Biéu dé phan chia các dân tộc trong quá trình điều tra
Trang 35Dong Nam Bo
[Db song Cuu Long
Hinh 3 - Biéu dé phan chia ving
Phân tích tổng số người trong hộ ta thấy:
- Số người trung bình trong hộ gia đình là 4, trung vị và mod đều là 4
chứng tỏ mô hình gia đình ở Việt Nam là mô hình gia đình có 1, 2 thế hệ sống
cùng nhau Qui mô gia đình không lớn Tổng số người trong hộ nhiều nhất là
15 người.( Có đồ thị kèm theo)