Khái quát chung và nhắc lại mục đích Về tổng quát, việc phân tích thị trường lao động và vai trò của khu vực phi chính thức nhằm mục đích: - hiểu rõ hơn sự vận hành của thị trường lao độ
Trang 1Lớp chuyên đề 1
Phân tích dữ liệu cấp độ II: củng cố và ứng dụng phân tích thị trường việc làm và khu vực phi chính thức ở Việt Nam
Ludovic Lebart, Marie Piron, Mireille Razafindrakoto,
François Roubaud và Jean-Pierre Cling
Trang 3Ludovic Lebart, Marie Piron, Mireille Razafindrakoto,
François Roubaud và Jean-Pierre Cling
Trang 4Tiếp theo hai lớp học chuyên đề được tổ chức năm
ngoái (“Phương pháp khảo sát đa chiều” – Ludovic
Lebart và Marie Piron, và “Điều tra hộ gia
đình” – nhóm IRD-DIAL), năm nay, chúng tôi đề xuất
ứng dụng các phương pháp phân tích dữ liệu đã
được giới thiệu năm 2007 vào các dữ liệu mới của
Việt Nam được thu thập trong khuôn khổ dự án
IRD-DIAL/Tổng Cục Thống kê
Đề dẫn
Trong giai đoạn đầu, các cuộc điều tra sử dụng phương
pháp thống kê dựa trên lý thuyết điều tra chọn mẫu đại
diện Ngoài ra, các phương pháp thu thập thông tin từ
các cá thể (hay các đơn vị thống kê khác) cũng được
sử dụng Những thông tin này có thể là thực tế khách
quan hoặc chủ quan, định tính hay định lượng Trong
giai đoạn xử lý dữ liệu, các cuộc điều tra sử dụng bộ
công cụ thống kê với các phương pháp phân tích dữ
liệu đóng vai trò quan trọng Tuy nhiên, những phương
pháp này chưa phổ biến, do đó lớp học chuyên đề lần
này muốn chứng tỏ lợi ích của các phương pháp thông
qua các ứng dụng thực tế
Chiến lược áp dụng phụ thuộc vào mức độ rõ ràng và
chính xác của các mục tiêu Những mục tiêu này định
hướng cho các lựa chọn trong thực hiện điều tra, tức
trong thu thập dữ liệu và xử lý thống kê Việc xử lý dữ
liệu điều tra theo cách truyền thống áp dụng các kỹ
thuật đơn giản, quen thuộc và dễ làm Đó là các kỹ
thuật phân loại, lập bảng chéo, có nghĩa là tính phần
trăm từng nhóm cá thể theo một biến định tính (các
biến định tính như giới tính, vùng hay nghề nghiệp)
và tính trung bình cho các biến định lượng (như tuổi,
chi tiêu) Bên cạnh đó còn có xây dựng chỉ số như hệ
số, giao nhau giữa các biến định tính Đôi khi, các
phương pháp thống kê phức tạp hơn, chuyên sâu hơn
như hồi quy, phân tích phương sai, phân tích loại trừ bổ
sung cho những kết quả ban đầu trong giai đoạn hai
Phương pháp được giới thiệu ở đây đi xa hơn phương
pháp xử lý dữ liệu truyền thống và dựa trên các kỹ
thuật phân tích dữ liệu (phân tích thành phần chính,
phân tính đa biến đơn giản và phức tạp, phân loại theo
thứ bậc tăng dần, phân loại xung quanh trung tâm di
động ) Các kỹ thuật này được áp dụng ngay trong
các giai đoạn đầu của xử lý dữ liệu và là các công cụ
khảo sát để đánh giá các tập dữ liệu lớn Phương pháp
này cho phép kiểm soát, thông qua biểu diễn trực
quan, đa phần các giai đoạn, tiếp cận các thông tin
vốn không thể tiếp cận bằng phân tích một chiều
Toàn bộ các kỹ thuật này nhằm đưa ra cách nhìn tổng
thể về các tập thông tin lớn để rút ra được các hình thái
đặc trưng, các cấu trúc, tính hợp thức và các pattern
Như vậy nó cho phép thể hiện và cơ cấu những chênh
lệch trong một tổng thể đã cho thay vì chỉ phân bổ hay
phân tán một biến xung quanh xu hướng trọng tâm
của nó Nó làm xuất hiện các nhóm thuần nhất và đối
lập, lần lượt định vị các biến, các cá thể, các nhóm cá thể với nhau Ở đây không nhằm mô tả và tìm hiểu các
cá thể, các hộ gia đình, người tiêu dùng, người sản xuất trung bình mà là chính là tính đa dạng phong phú của chúng
Trong thời gian diễn ra lớp học chuyên đề này, chúng
ta sẽ ôn lại các nguyên tắc của phương pháp thống kê khảo sát và các nguyên tắc của phương pháp tương tác là cơ sở cho phương pháp luận đã được giới thiệu tại Khóa học mùa hè về Khoa học Xã hội năm 2007 Tuy nhiên, trong phần một của tài liệu, chúng tôi muốn nhấn mạnh đến hoạt động cơ cấu thông tin, tức quá trình chuyển từ điều tra sang định dạng các
dữ liệu để tiến hành khảo sát và sang khái niệm
“Mô tả theo Chủ đề”
Tiếp đó trong phần hai, chúng tôi sẽ giới thiệu một nghiên cứu phân tích thị trường lao động và các doanh nghiệp cá thể tại Việt Nam dựa trên kết quả điều tra mức sống hộ gia đình VHLSS (Vietnamese Household Living Standard Surveys) 2004
Mục đích cuối cùng của lớp học chuyên đề này là đưa phương pháp vào ứng dụng thực tế (thực hành các công cụ, phân tích và diễn giải)
Phần I Cơ cấu dữ liệu và chiến lược phân tích
Chiến lược phân tích dữ liệu điều tra là một quy trình lặp lại theo ba giai đoạn chính:
- xây dựng bảng dữ liệu bao gồm định dạng dữ liệu,
cụ thể là đánh mã các biến, cơ cấu dữ liệu theo chủ
đề điều tra;
- kết hợp các phương pháp nhân tố và phân loại bằng cách phát huy tính bổ sung của hai nhóm phương pháp này Trong khuôn khổ các dữ liệu điều tra kinh tế - xã hội, chủ yếu ta sử dụng phương pháp phân tích đa biến phức tạp, phương pháp này đặc biệt thích hợp cho phân tích bản hỏi hay phân tích thành phần chính cho một nhóm biến liên tục hợp thành một chủ đề;
- giải thích và đánh giá các kết quả đòi hỏi phải xem xét lại các dữ liệu để thay đổi mã, xác định chính xác hơn các chủ đề hay loại bỏ một số tác động của một số biến
Chiến lược đưa ra xuất phát từ thực tế là các câu hỏi xuất hiện trong cuộc điều tra thường được nhóm theo một số chủ đề tương ứng với các mô-đun khác nhau của cuộc điều tra
Tiếp theo, ta kết hợp theo đúng quy tắc các phương pháp có vai trò bổ sung cho nhau và phân biệt các phần tử tích cực và phẩn tử bổ sung
Sự phân biệt này tác động rất lớn không chỉ đến giải thích các kết quả mà đến việc cơ cấu toàn bộ các dữ liệu và xây dựng một mô hình toán học cơ sở
Trang 51 Định dạng dữ liệu
Các kỹ thuật phân tích dữ liệu đều đòi hỏi phải làm chủ
quy trình xây dựng bảng dữ liệu Các cuộc điều tra có
thể có cấu trúc phức tạp tuỳ theo việc có tồn tại hay
không các cấp quan sát, các chiều theo thời gian hay
không gian
1.1 Từ bảng hỏi đến bảng dữ liệu
Các dữ liệu điều tra phải được định dạng thành các
bảng (lớn) hình chữ nhật mà ta thường gọi là: X Các
dòng (i=1,…,n) của bảng đại diện cho n cá thể thống
kê tương ứng với chủ đề điều tra (hộ gia đình, doanh
nghiệp, cá nhân), và các cột (j=1,…p) đại diện cho p
biến tương ứng với các câu hỏi mà các câu trả lới có thể
là kết quả đo lường, đặc điểm, thứ bậc hay các điểm số
(xem sơ đồ cuối trang)
Thông thường các câu hỏi là câu hỏi đóng và chủ yếu
tạo ra hai loại biến sau:
- Biến định tính như giới tính, nghề nghiệp, bằng
cấp, vùng có giá trị là các tiêu thức cần đánh mã
sao cho phép toán đại số có ý nghĩa Việc bố trí một
biến định tính phụ thuộc vào tỷ lệ phần trăm hay tần
số (ví dụ tỷ lệ nam giới và nữ giới)
Ta phân biệt biến định danh tức biến không xác
định thứ tự giữa các tiêu thức (ví dụ như giới tính,
hoạt động) với biến có thứ tự có các tiêu thức được
phân loại (ví dụ các câu hỏi về quan điểm đưa ra
các câu trả lời “hoàn toàn”, “có vẻ”, “ít”, “hoàn toàn
không” hài lòng) Giống như các biến định danh,
các biến lô-gích có hai tiêu thức “có/không hoặc có
mặt/vắng mặt) như trong trường hợp mã hoá các
câu hỏi trắc nghiệm
- Biến định lượng có các giá trị được xác định trên
một thang độ, nơi thực hiện các phép toán đại số
như cộng, tính trung bình Việc bố trí một biến định
lượng được quyết định bởi kết quả tính toán các
chỉ số xu hướng trung tâm như trung bình, trung
vị, mod và các chỉ số phân tán như phương sai, độ
lệnh chuẩn, lượng phân
Ta phân biệt các biến liên tục như tuổi, thu nhập, chiều cao với các biến ngẫu nhiên rời rạc như quy mô hộ gia đình, số trẻ em là các biến ít có giá trị Các biến định lượng có thể trở thành biến định tính nhờ phân tổ các giá trị
Những biến trực tiếp rút ra từ bảng hỏi này chính là các biến gốc làm cơ sở cho việc xây dựng các biến phái sinh phục vụ công tác nghiên cứu Các biến này là các chỉ số phục vụ cho một mục tiêu cụ thể (kết hợp hai biến định danh, hệ số ví dụ như tỷ lệ sử dụng nơi ở thể hiện tỷ lệ giữa số thành viên trong một hộ gia đình với
số phòng của căn nhà)
Các câu hỏi mở đem lại các câu trả lời tự do có nội dung (giá trị) thể hiện bằng lời văn Đó là trường hợp các câu hỏi “tại sao?” để giải thích một câu hỏi đóng hay các câu hỏi mà người ta không muốn hạn chế câu trả lời bằng việc đưa ra một số lựa chọn hạn chế Những câu hỏi này sau đó có thể trở thành các câu hỏi đóng và do đó tạo ra các biến định danh với việc hình thành một danh mục các đặc điểm được xây dựng kỹ lưỡng Nhưng thường câu hỏi mở được đưa ra vì không muốn giới hạn các đặc điểm và khai thác các câu trả lời như nó vốn có Các câu hỏi mở dẫn đến việc phải
mã hoá thành các bảng từ vựng được mô tả qua phân tích đa biến
Xây dựng một bảng dữ liệu thu thập từ cuộc điều tra
có nghĩa là lựa chọn các dòng, tức đơn vị thống kê tập hợp thành tổng thể nghiên cứu, tức các biến và các giá trị đáp ứng một cách tối ưu cho mục tiêu nghiên cứu đề ra
1.2 Trường hợp các cuộc điều tra có cấu trúc phức tạp
Thường các cuộc điều tra có cấu trúc phức tạp hơn và các thông tin được thu thập ngay trong bảng hỏi và liên quan đến các đơn vị quan sát khác nhau và có đặc điểm riêng Đó là các cuộc điều tra có nhiều cấp quan sát Các cuộc điều tra khác như điều tra phỏng vấn hay
có bước lặp Ngoài ra, còn có các cuộc điều tra tiểu sử với bảng hỏi dựa vào lịch trình Cũng cần phải kể đến các cuộc điều ra có rất nhiều các câu hỏi mở Tất cả các cuộc điều tra này cho thấy cấu trúc phức tạp mà đối với chúng mỗi lần cần phải xác định tốt các đơn vị thống kê và các biến
câu hӓi mà các câu trҧ lӟi có thӇ là kӃt quҧ ÿo lѭӡng, ÿһc ÿiӇm, thӭ bұc hay các ÿiӇm sӕ
Thông thѭӡng các câu h͗i là câu hӓi ÿóng và chӫ yӃu tҥo ra hai loҥi biӃn sau :
- Bi͇n ÿ͓nh tính nhѭ giӟi tính, nghӅ nghiӋp, bҵng cҩp, vùng có giá trӏ là các tiêu thӭc cҫn ÿánh
mã sao cho phép toán ÿҥi sӕ có ý nghƭa ViӋc bӕ trí mӝt biӃn ÿӏnh tính phө thuӝc vào tӹ lӋ phҫntrăm hay tҫn sӕ (ví dө tӹ lӋ nam giӟi và nӳ giӟi)
Ta phân biӋt biӃn ÿ͓nh danh tӭc biӃn không xác ÿӏnh thӭ tӵ giӳa các tiêu thӭc (ví dө nhѭ giӟi tính, hoҥt ÿӝng) vӟi biӃn có thͱ t có các tiêu thӭc ÿѭӧc phân loҥi (ví dө các câu hӓi vӅ quan
ÿiӇm ÿѭa ra các câu trҧ lӡi « hoàn toàn », « có vҿ », « ít », « hoàn toàn không » hài lòng)
Giӕng nhѭ các biӃn ÿӏnh danh, các biӃn lô-gích có hai tiêu thӭc « có/không hoһc có mһt/vҳng
mһt) nhѭ trong trѭӡng hӧp mã hoá các câu hӓi trҳc nghiӋm
- Bi͇n ÿ͓nh l˱ͫng có các giá trӏ ÿѭӧc xác ÿӏnh trên mӝt thang ÿӝ, nѫi thӵc hiӋn các phép toán ÿҥi
sӕ nhѭ cӝng, tính trung bình ViӋc bӕ trí mӝt biӃn ÿӏnh lѭӧng ÿѭӧc quyӃt ÿӏnh bӣi kӃt quҧ tính toán các chӍ sӕ xu hѭӟng trung tâm nhѭ trung bình, trung vӏ, mod và các chӍ sӕ phân tán nhѭphѭѫng sai, ÿӝ lӋnh chuҭn, lѭӧng phân
Ta phân biӋt các biӃn liên tͭc nhѭ tuәi, thu nhұp, chiӅu cao vӟi các biӃn ng̳u n hiên rͥi r̩c nhѭ
quy mô hӝ gia ÿình, sӕ trҿ em là các biӃn ít có giá trӏ Các biӃn ÿӏnh lѭӧng có thӇ trӣ thành biӃnÿӏnh tính nhӡ phân tә các giá trӏ
Nhӳng biӃn trӵc tiӃp rút ra tӯ bҧn hӓi này chính là các biӃn gӕc làm cѫ sӣ cho viӋc xây dӵngcác biӃn phái sinh phөc vө công tác nghiên cӭu Các biӃn này là các chӍ sӕ phөc vө cho mӝt mөctiêu cө thӇ (kӃt hӧp hai biӃn ÿӏnh danh, hӋ sӕ ví dө nhѭ tӹ lӋ sӱ dөng nѫi ӣ thӇ hiӋn tӹ lӋ giӳa sӕthành viên trong mӝt hӝ gia ÿình vӟi sӕ phòng cӫa căn nhà)
Các câu h͗i mͧ ÿem lҥi các câu trҧ lӡi tӵ do có nӝi dung (giá trӏ) thӇ hiӋn bҵng lӡi văn Ĉó là
trѭӡng hӧp các câu hӓi « tҥi sao ? » ÿӇ giҧi thích mӝt câu hӓi ÿóng hay các câu hӓi mà ngѭӡi ta
không muӕn hҥn chӃ câu trҧ lӡi bҵng viӋc ÿѭa ra mӝt sӕ lӵa chӑn hҥn chӃ Nhӳng câu hӓi này sau
ÿó có thӇ trӣ thành các câu hӓi ÿóng và do ÿó tҥo ra các biӃn ÿӏnh danh vӟi viӋc hình thành mӝt
danh mөc các ÿһc ÿiӇm ÿѭӧc xây dӵng kӻ lѭӥng Nhѭng thѭӡng câu hӓi mӣ ÿѭӧc ÿѭa ra vì không muӕn giӟi hҥn các ÿһc ÿiӇm và khai thác các câu trҧ lӡi nhѭ nó vӕn có Các câu hӓi mӣdүn ÿӃn viӋc phҧi mã hoá thành các bҧng tӯ vӵng ÿѭӧc mô tҧ qua phân tích ÿa biӃn
Xây dng m͡t b̫ng dͷ li͏u thu th̵p tͳ cu͡c ÿi͉u tra có nghƭa là la ch͕n các dòng, tͱc ÿ˯n v͓ th͙ng kê t̵p hͫp thành t͝ng th͋ nghiên cͱu, và các c͡t, tͱc các bi͇n và các giá tr͓ ÿáp ͱng m͡t cách t͙i ˱u cho mͭc tiêu nghiên cͱu ÿ͉ ra
1.2 Trѭӡng hӧp các cuӝc ÿiӅu tra có cҩu trúc phӭc tҥp
Indiv n
question 1 question 2 question j question p
1 j p1
in
xij
valeur de la variable j prise par l'individu i
X =
(n,p)
Indiv i
question 1 question 2 question j question p
Indiv 2
question 1 question 2 question j question p
Cá thể j
Câu hỏi 1 Câu hỏi 2 Câu hỏi j Câu hỏi p
Cá thể 2
Câu hỏi 1 Câu hỏi 2 Câu hỏi j Câu hỏi p
Trang 6154 Khóa học Tam Đảo 2008
a) Các cuộc điều tra có nhiều cấp độ quan sát
Ví dụ như điều tra về Nhà ở: người ta tiến hành quan sát những nơi ở (quy chế, loại nhà, vật liệu xây dựng, trang thiết bị ) và tất cả các hộ gia đình ở trong đó đều được điều tra (đặc điểm kinh tế-xã hội của chủ hộ) cũng như tất cả các thành viên trong các hộ gia đình này (đặc điểm kinh tế-xã hội)
Cấu trúc thông tin được phân theo thứ tự và có hình dạng như sau:
5
Il est courant que des enquêtes révèlent en fait une structure plus complexe et qu‟au sein d‟un
même questionnaire soient collectées des informations concernant des types d‟unités
d‟observation différentes et possédant leur propre jeu de caractéristiques Ce sont des enquêtes à
plusieurs niveaux d‟observation D‟autres enquêtes, comme les panels, font l‟objet de passages
répétés D‟autres, comme les enquêtes biographiques, ont un questionnaire qui repose sur un
calendrier D‟autres, enfin, comportent de nombreuses questions ouvertes Toutes ces enquêtes
présentent des structures complexes pour lesquelles il faut à chaque fois bien identifier les unités
statistiques et les variables
a) Enquêtes à plusieurs niveaux d‟observation
Prenons par l‟exemple d‟une enquête Habitat : des logements sont observés (statut, type,
matériaux de construction, équipements, …) et au sein de ceux-ci sont enquêtés tous les ménages
(caractéristiques socio-économiques du chef de ménage) et tous les membres de ces ménages
(caractéristiques socio-économiques)
La structure de l‟information est hiérarchique et se présente sous la forme suivante :
HousingHouseholdMember
Structure hiérarchique de l‟information
Trois fichiers se déduisent de cette enquête donnant lieu à trois tableaux de données :
Housing
Household
Member
1 p
1 m
1
.
n
Tableaux de données correspondant à chacun des trois niveaux d‟observation
L‟intérêt d‟une telle enquête est de mettre en relation les trois niveaux d‟observation On peut
procéder :
– soit par affectation (ou en désagrégation) en répétant l‟information des logements
(respectivement sur les ménages) autant de fois qu‟il y a de personnes dans le logement
(respectivement le ménages) :
Cấu trúc thông tin phân theo thứ tự
Ba tệp thông tin được rút ra từ cuộc điều tra và tạo thành ba bảng dữ liệu :
5
Construire un tableau de données issues d‟enquête, c‟est donc faire le choix des lignes
dire de l‟unité statistique dont l‟ensemble constitue la population d‟étude, des colonnes
c‟est-à-dire des variables et des valeurs qui répondront au mieux à l‟objectif fixé par l‟étude
1.2 Cas d’enquêtes à structure complexe
Il est courant que des enquêtes révèlent en fait une structure plus complexe et qu‟au sein d‟un
même questionnaire soient collectées des informations concernant des types d‟unités
d‟observation différentes et possédant leur propre jeu de caractéristiques Ce sont des enquêtes à
plusieurs niveaux d‟observation D‟autres enquêtes, comme les panels, font l‟objet de passages
répétés D‟autres, comme les enquêtes biographiques, ont un questionnaire qui repose sur un
calendrier D‟autres, enfin, comportent de nombreuses questions ouvertes Toutes ces enquêtes
présentent des structures complexes pour lesquelles il faut à chaque fois bien identifier les unités
statistiques et les variables
a) Enquêtes à plusieurs niveaux d‟observation
Prenons par l‟exemple d‟une enquête Habitat : des logements sont observés (statut, type,
matériaux de construction, équipements, …) et au sein de ceux-ci sont enquêtés tous les ménages
(caractéristiques socio-économiques du chef de ménage) et tous les membres de ces ménages
(caractéristiques socio-économiques)
La structure de l‟information est hiérarchique et se présente sous la forme suivante :
Housing Household Member
Structure hiérarchique de l‟information
T rois fichiers se déduisent de cette enquête donnant lieu à trois tableaux de données :
Housing
Household
Member
1 p
1 m
1
.
n Id.HS var Housing Id.HH var Household Id.MB var Member
Tableaux de données correspondant à chacun des trois niveaux d‟observation
L‟intérêt d‟une telle enquête est de mettre en relation les trois niveaux d‟observation On peut
procéder :
– soit par affectation (ou en désagrégation) en répétant l‟information des logements
(respectivement sur les ménages) autant de fois qu‟il y a de personnes dans le logement
(respectivement le ménages) :
Các bảng dữ liệu tương ứng với ba cấp quan sát
Ích lợi của cuộc điều tra dạng này là tạo các mối quan
hệ tương tác giữa ba cấp quan sát Ta có thể thực hiện:
– hoặc qua phân bổ (hay phân tổ) bằng cách lặp lại thông tin về nhà ở (và hộ gia đình) số lần đúng bằng
số thành viên trong căn nhà (trong hộ gia đình):
p m n
population Members
Tableau de données au niveau des membres du ménage – soit par agrégation en sommant l‟information des ménages qui appartiennent à un même
logement et des personnes qui appartiennent à un même ménage Par exemple, si les membres
sont caractérisés par le fait d‟être actif ou non, on obtient une nouvelle variable au niveau Ménage
qui est le nombre de personnes actives du ménage Si la population d‟étude est le ménage, on
désagrège l‟information du logement et l‟on agrège celle des membres au niveau du ménage
1 p
Id.HS var Housing var Household var Member
Dans le cadre d‟enquêtes à passages répétés, il convient de bien identifier :
– les unités statistiques d‟observation qui correspondent aux individus enquêtés, renouvelées ou
non dans le dispositif ;
– les variables qui sont conservées ou non d‟un passage à l‟autre ;
- la périodicité des passages d‟enquêtes portant sur les mêmes individus ou non et sur les mêmes
variables ou non
Bảng dữ liệu cấp các thành viên trong hộ gia đình
– hoặc tổng hợp thông tin về các hộ gia đình ở cùng một nơi và những thành viên trong cùng một hộ gia đình Ví dụ, nếu giữa các thành viên phân biệt với nhau qua việc có việc làm hay không, ta thu được một biến ở ở quy mô hộ gia đình là số lượng thành viên có công ăn việc làm trong hộ gia đình Nếu tổng thể nghiên cứu là hộ gia đình, ta phân tổ thông tin về nơi ở và tổng hợp thông tin về các thành viên
p m n
population Members
Tableau de données au niveau des membres du ménage – soit par agrégation en sommant l‟information des ménages qui appartiennent à un même logement et des personnes qui appartiennent à un même ménage Par exemple, si les membres sont caractérisés par le fait d‟être actif ou non, on obtient une nouvelle variable au niveau Ménage qui est le nombre de personnes actives du ménage Si la population d‟étude est le ménage, on désagrège l‟information du logement et l‟on agrège celle des membres au niveau du ménage
1 p
Id.HS var Housing var Household var Member
b) Enquêtes à passages répétés Dans le cadre d‟enquêtes à passages répétés, il convient de bien identifier : – les unités statistiques d‟observation qui correspondent aux individus enquêtés, renouvelées ou non dans le dispositif ;
– les variables qui sont conservées ou non d‟un passage à l‟autre ;
- la périodicité des passages d‟enquêtes portant sur les mêmes individus ou non et sur les mêmes variables ou non
p m n
population Members
Tableau de données au niveau des membres du ménage – soit par agrégation en sommant l‟information des ménages qui appartiennent à un même logement et des personnes qui appartiennent à un même ménage Par exemple, si les membres sont caractérisés par le fait d‟être actif ou non, on obtient une nouvelle variable au niveau Ménage qui est le nombre de personnes actives du ménage Si la population d‟étude est le ménage, on désagrège l‟information du logement et l‟on agrège celle des membres au niveau du ménage
1 p
Id.HS var Housing var Household var Member
b) Enquêtes à passages répétés Dans le cadre d‟enquêtes à passages répétés, il convient de bien identifier : – les unités statistiques d‟observation qui correspondent aux individus enquêtés, renouvelées ou non dans le dispositif ;
– les variables qui sont conservées ou non d‟un passage à l‟autre ;
- la périodicité des passages d‟enquêtes portant sur les mêmes individus ou non et sur les mêmes variables ou non
Bảng dữ liệu về hộ gia đình
Trong cấu trúc phân theo thứ tự của thông tin, ta có số lượng tổng thể thống kê tương đương với số lượng các cấp quan sát
b) Điều tra có bước lặp
Trong điều tra có bước lặp, cần xác định:
- các đơn vị quan sát thống kê tương ứng với các cá thể được điều tra, được lặp lại hoặc không trong hệ thống;
- các biến được giữ lại hay không khi chuyển từ bước
nọ sang bước kia;
- tính chu kỳ của các bước điều tra về cùng hay không cùng các cá thể và cùng hay không cùng các biến
Cấu trúc dữ liệu của một hệ thống như vậy có thể được biểu diễn như sau:
Les échantillons sont indépendants (populations I1 et I2), et l‟ensemble des variables, J, est identique
On dispose du tableau de données suivant :
Trang 7Phân tích dữ liệu cấp độ II
Bộ mẫu được thay đổi theo chu kỳ hai giai đoạn Nhiều trường hợp khác được sử dụng để xây dựng bảng dữ liệu:
- Bộ mẫu là một nhĩm người tham gia điều tra,
I (cùng các cá thể được điều tra) và hoạt động của các biến khác khau trong các giai đoạn, J1
Population
L‟échantillon est renouvelé toutes les deux périodes Différents cas de figures sont posées pour la
construction du tableau de données :
L‟échantillon est un panel, I (mêmes individus enquêtés) et les jeux de variables sont différents
sur les périodes, J1 et J2
(Panel) I
Ce cas de figure se ramène à une analyse d‟enquête classique ó nous avons au moins deux
thèmes, le premier défini par les variables de la première période et le deuxième par celles de la
- Các bộ mẫu độc lập (tổng thể I1 và I2), và tồn bộ các biến, J, giống nhau
Population
L’échantillon est renouvelé toutes les deux périodes Différents cas de figures sont posées pour la
construction du tableau de données :
L’échantillon est un panel, I (mêmes individus enquêtés) et les jeux de variables sont différents
sur les périodes, J1 et J2
(Panel) I
Ce cas de figure se ramène à une analyse d’enquête classique ó nous avons au moins deux
thèmes, le premier défini par les variables de la première période et le deuxième par celles de la
- Đĩ là một nhĩm người tham gia điều tra và hoạt động của các biến giống nhau
Trong trường hợp này, đĩ là một bảng gồm ba yếu tố quen thuộc (các cá thể, các biến, thời gian) được biểu diễn như sau:
7
Population I1
Population I Population I2
d1ng bng d0 li"u :
- B( mu là m(t nhĩm ng*i tham gia iu tra, I (cùng các cá th +c iu tra) và hot (ng
c-a các bin khác khau trong các giai on, J1 và J2
(nhĩm ng*i tham gia iu tra) I
Tr*ng h+p này ịi h$i phi áp d,ng k2 thut phân tích iu tra c' i n trong n v kinh t
tuyên b thu nhp din bin theo chiu h#ng tích c)c th$ng nm v phía các n v
Ghi chú :
CA : Doanh thu EBE : L%i nhun tr#c thu và lãi Cat : nhóm 1 n 4 t' thp nht (1) n cao nht (4)
Chúng ta cng có th xem xem nh(ng n v kinh t phân b" th nào tu theo m&c u t
ban u, chiu h#ng phân b" theo sát $ng cong i t' các giá tr thp nht (1, 2 và 3) t#i các giá tr cao nht ( ! th 5) Tng t), nh ta có th mong %i, các n v kinh t
tuyên b thu nhp din bin theo chiu h#ng tích c)c th$ng nm v phía các n v
Ghi chú:
Trang 31Chúng ta cũng có thể xem xem những đơn vị kinh tế phân bổ thế nào tuỳ theo mức đầu tư ban đầu, chiều hướng phân bổ theo sát đường cong đi từ các giá trị thấp nhất (1, 2 và 3) tới các giá trị cao nhất (đồ thị 5) Tương tự, như
ta có thể mong đợi, các đơn vị kinh tế tuyên bố thu nhập diễn biến theo chiều hướng tích cực thường nằm về phía các đơn vị kinh tế có năng lực (đồ thị 6)
Đồ thị 5 Không gian năng lực kinh tế của các đơn vị kinh tế (ACM: trục 1 và 2)
46
Ghi chú : Tamountc : Tng mc u t ban u Cat : nhóm 1 n 4 t thp nht (1) n cao nht (4) Cat5 : không tr li (giá tr còn thiu)
Ghi chú :
ReveChan_canr4 : không tr li hay n v kinh t mi thành lp (giá tr còn thiu)
46
Ghi chú : Tamountc : Tng mc u t ban u Cat : nhóm 1 n 4 t thp nht (1) n cao nht (4) Cat5 : không tr li (giá tr còn thiu)
Ghi chú :
ReveChan_canr4 : không tr li hay n v kinh t mi thành lp (giá tr còn thiu)
46
Ghi chú : Tamountc : Tng mc u t ... động
khu vực phi thức so với khu vực thức?
Đâu mức thu nhập đơn vị kinh tế khu
vực phi thức? Có thể khẳng định đơn vị kinh
tế thuộc khu vực phi thức Việt Nam tương
đối... quan hệ khu vực phi thức với khu vực kinh tế khác
Về cụ thể, để phân tích thị trường lao động, khái niệm đặc biệt quan tâm: lực luợng lao động, việc làm, thất nghiệp, thiếu việc làm Đâu... tế gặp phải, thơng qua việc phân
biệt nhóm HB khu vực thức (chính
thức= có đăng ký theo định nghĩa nêu trên)
và nhóm HB khu vực phi thức; việc
phân biệt dựa đặc điểm