Tæi công xin ch¥n th nh c£m ìn c¡c th¦y cæ Pháng Sau ¤i håc ¢ nhi»t t¼nh gióp ï tæi trong suèt thíi gian håctªp... Mæ h¼nh hçi quy Logistic kh¡c vîi mæ h¼nh hçi quy tuy¸n t½nh thængth÷ín
Trang 1I HÅC QUÈC GIA H NËI TR×ÍNG I HÅC KHOA HÅC TÜ NHIN
- - - - O 0 O
-Nguy¹n Huy·n Trang
KT LUN THÈNG K V NHU CU CHM SÂC SÙC KHÄE Ð HI D×ÌNG
Chuy¶n ng nh: X¡c su§t v Thèng k¶ to¡n håc
M¢ sè: 60 46 15 LUN VN THC S KHOA HÅC TON HÅC
Ng÷íi h÷îng d¨n khoa håc:
PGS.TS Hç «ng Phóc
H Nëi - 2011
Trang 2Möc löc
1 Ph÷ìng ph¡p ph¥n t½ch hçi quy logistic 61.1 Sè ch¶nh v t sè ch¶nh 71.2 Hçi quy Logistic 81.3 Mæ h¼nh hçi quy Logistic 111.3.1 ×îc l÷ñng c¡c tham sè cõa mæ h¼nh hçi quy logistic 121.3.2 Kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic 131.4 Mæ h¼nh hçi quy Logistic bëi 161.4.1 ×îc l÷ñng mæ h¼nh hçi quy Logistic bëi 191.4.2 Kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic
bëi 211.5 Þ ngh¾a h» sè cõa mæ h¼nh hçi quy Logistic 23
2 Mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n 272.1 Mæ h¼nh tuy¸n t½nh nhi·u mùc 282.2 Mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n 302.3 Giîi thi»u ph¦n m·m xû lþ sè li»u SPSS v STATA 33
Trang 33 K¸t luªn thèng k¶ v· nhu c¦u ch«m sâc sùc khäe ð H£i
3.1 Mæ t£ sè li»u 36
3.2 Ph¥n t½ch sè li»u m¨u 1 42
3.3 Ph¥n t½ch sè li»u m¨u 2 51
3.4 K¸t luªn 58
Trang 4Líi nâi ¦u
Thèng k¶ to¡n håc l cæng cö nghi¶n cùu ÷ñc sû döng rëng r¢i trongh¦u h¸t c¡c ng nh khoa håc thüc nghi»m nh§t l trong y håc, sinh håc,x¢ hëi håc, kinh t¸ v mæi tr÷íng Thèng k¶ to¡n håc gióp cho c¡c
ng nh khoa håc kh¡m ph¡ ra tø c¡c sè li»u thüc nghi»m c¡c quy luªtnëi t¤i cõa c¡c hi»n t÷ñng trong tü nhi¶n v trong x¢ hëi
C¡c nghi¶n cùu v· y t¸ cëng çng công ái häi sû döng c¡c cæng cöcõa thèng k¶ to¡n håc º gi£i ¡p c¡c c¥u häi li¶n quan ¸n h» thèngch«m sâc sùc khäe to n d¥n, ÷a ra c¡c b¬ng chùng gióp x¥y düng c¡cchõ tr÷ìng, ch½nh s¡ch li¶n quan ¸n m¤ng l÷îi cung c§p c¡c dàch vöch«m sâc sùc khäe, n¥ng cao hi»u qu£ phöc vö cõa h» thèng y t¸
Nghi¶n cùu n y câ möc ½ch ¡nh gi¡ c¡c y¸u tè £nh h÷ðng ¸n nhuc¦u kh¡m chúa b»nh t¤i nh èi vîi hai nhâm èi t÷ñng ng÷íi trong ëtuêi lao ëng v tr´ em d÷îi 16 tuêi, thæng qua vi»c ¡p döng mæ h¼nhhçi quy logistic nhi·u mùc ph÷ìng ph¡p thèng k¶ hi»n ¤i ang ÷ñc
sû döng rëng r¢i trong nghi¶n cùu ð nhi·u n÷îc tr¶n th¸ giîi v b÷îc
¦u ÷ñc sû döng t¤i Vi»t Nam
Luªn v«n K¸t luªn thèng k¶ v· nhu c¦u ch«m sâc sùc khäe ð H£iD÷ìng bao gçm 3 ch÷ìng v danh möc t i li»u tham kh£o
Ch÷ìng 1 tr¼nh b y c¡c v§n · cì b£n v· ph÷ìng ph¡p ph¥n t½ch hçi
Trang 5quy logistic v mæ h¼nh hçi quy logistic bëi.
Ch÷ìng 2 giîi thi»u ph÷ìng ph¡p ph¥n t½ch thèng k¶ ÷ñc dòng trongnghi¶n cùu n y l mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n, °c bi»t l
mæ h¼nh hçi quy logistic nhi·u mùc
Düa tr¶n cì sð lþ thuy¸t cõa hai ch÷ìng ¦u, Ch÷ìng 3 ÷a ra c¡ck¸t qu£ ph¥n t½ch £nh h÷ðng cõa c¡c y¸u tè kinh t¸ - x¢ hëi ¸n nhu c¦ukh¡m chúa b»nh t¤i nh cõa hai nhâm èi t÷ñng ng÷íi trong ë tuêilao ëng v tr´ em d÷îi 16 tuêi Ph¦n cuèi cõa ch÷ìng 3 ÷a ra mët sè
þ ki¸n v· x¥y düng v ph¡t triºn mæ h¼nh y t¸ gia ¼nh nh¬m n¥ng caoch§t l÷ñng y t¸ cëng çng
Tr÷îc ti¶n, tæi xin ÷ñc b y tä láng bi¸t ìn s¥u sc tîi th¦y gi¡oh÷îng d¨n PGS TS Hç «ng Phóc Vi»n To¡n håc Vi»n Khoa håc
v Cæng ngh» Vi»t Nam, ng÷íi th¦y ¢ luæn ëng vi¶n, gióp ï v ch¿d¨n nhi»t t¼nh cho tæi trong suèt qu¡ tr¼nh nghi¶n cùu
Tæi xin tr¥n trång c£m ìn c¡c th¦y gi¡o trong khoa To¡n Cì Tin,
°c bi»t c¡c th¦y trong tê Bë mæn X¡c su§t v Thèng k¶ Tr÷íng ¤ihåc Khoa håc Tü nhi¶n ¢ cung c§p cho tæi c¡c ki¸n thùc chuy¶n ng nhc¦n thi¸t º thüc hi»n · t i Tæi công xin ch¥n th nh c£m ìn c¡c th¦y
cæ Pháng Sau ¤i håc ¢ nhi»t t¼nh gióp ï tæi trong suèt thíi gian håctªp Tæi xin gûi líi c£m ìn ¸n c¡c anh chà em trong lîp Cao håc Lþthuy¸t X¡c su§t v Thèng k¶ 2009 2011, còng c¡c b¤n çng nghi»p v gia ¼nh ¢ nhi»t t¼nh âng gâp þ ki¸n, ëng vi¶n, gióp ï tæi trong suètqu¡ tr¼nh l m luªn v«n
°c bi»t tæi xin ch¥n th nh c£m ìn s¥u sc tîi sð y t¸ H£i D÷ìng ¢nhi»t t¼nh v nghi¶m tóc cung c§p nhúng dú li»u ch½nh x¡c v quþ b¡u,
Trang 6m n¸u thi¸u nguçn sè li»u n y tæi khæng thº thüc hi»n ÷ñc.
Tuy ¢ câ nhi·u cè gng nh÷ng b£n luªn v«n n y công khæng tr¡nhkhäi nhúng thi¸u xât, t¡c gi£ r§t mong câ sü tham gia âng gâp þ ki¸ncõa c¡c th¦y cæ gi¡o, c¡c nh nghi¶n cùu X¡c su§t Thèng k¶ , nghi¶ncùu y t¸ v c¡c ëc gi£ quan t¥m tîi luªn v«n n y
H Nëi, ng y 12 th¡ng 1 n«m 2012
Håc vi¶n: Nguy¹n Huy·n Trang
Trang 7Ch֓ng 1
Ph÷ìng ph¡p ph¥n t½ch hçi quy
logistic
Trong nghi¶n cùu y khoa v khoa håc thüc nghi»m nâi chung th÷íng
câ nhu c¦u ph¥n t½ch mèi quan h» giúa mët (hay nhi·u ) y¸u tè nguy cì
v kh£ n«ng x£y ra mët sü cè(bi¸n cè) n o â, ch¯ng h¤n nh÷ èi vîimët nghi¶n cùu v· mèi quan h» giúa thâi quen hót thuèc l¡ v ÷ng th÷phêi, th¼ y¸u tè nguy cì ð ¥y l thâi quen hót thuèc l¡ v sü cè c¦nquan t¥m l hi»n t÷ñng b»nh ung th÷ phêi Trong c¡c nghi¶n cùu n y
èi t÷ñng ph¥n t½ch th÷íng ÷ñc thº hi»n qua c¡c bi¸n sè nhà ph¥n, tùc
l câ/ khæng, mc b»nh/ khæng mc b»nh, ch¸t/ sèng, Y¸u tè nguy
cì câ thº l c¡c bi¸n sè li¶n töc, c¡c bi¸n nhà ph¥n hay c¡c bi¸n mang
°c t½nh thù bªc
V§n · °t ra cho c¡c nghi¶n cùu d¤ng n y l l m c¡ch n o º ÷îct½nh mùc ë li¶n quan giúa y¸u tè nguy cì v kh£ n«ng x£y ra sü cè.C¡c ph÷ìng ph¡p ph¥n t½ch nh÷ mæ h¼nh hçi quy tuy¸n t½nh khæng thº
¡p döng ÷ñc bði v¼ bi¸n phö thuëc khæng ph£i l bi¸n li¶n töc m l bi¸n nhà ph¥n Ph÷ìng ph¡p phê bi¸n nh§t sû döng º ph¥n t½ch c¡c dú
Trang 8li»u vîi c¡c bi¸n ph£n ùng l÷ïng ph¥n l hçi quy Logistic.
1.1 Sè ch¶nh v t sè ch¶nh
Trong nghi¶n cùu dàch t¹ ng÷íi ta th÷íng so s¡nh t¦n su§t mc b»nhgiúa hai têng thº phìi nhi¹m (thû) v khæng phìi nhi¹m (chùng).V½ dö: Khi nghi¶n cùu b»nh phêi, c¦n so s¡nh t¦n su§t mc b»nh phêicõa nhâm ng÷íi hót thuèc l¡ v nhâm ng÷íi khæng hót thuèc l¡
Khi t¦n su§t ang x²t l lîn câ thº xem x²t hi»u cõa hai t¦n su§t.N¸u hi»u sè â kh¡c 0 câ þ ngh¾a th¼ câ thº k¸t luªn t¦n su§t cõa nhâmthû kh¡c t¦n su§t cõa nhâm chùng
Tuy nhi¶n khi hai t¦n su§t r§t nhä th¼ vi»c so s¡nh hi»u cõa chóngr§t khâ, c¦n so s¡nh b¬ng th÷ìng (t sè) giúa hai t¦n su§t T sè n y
÷ñc gåi l t sè t¦n su§t( hay ë rõi ro t÷ìng èi) N¸u t sè â kh¡c
1 câ þ ngh¾a th¼ câ thº k¸t luªn t¦n su§t cõa nhâm thû kh¡c t¦n su§tcõa nhâm chùng
B¶n c¤nh t sè t¦n su§t c¡c nh nghi¶n cùu th÷íng dòng sè ch¶nh(odds)
v t sè ch¶nh (odds ratio) º so s¡nh nhâm chùng vîi nhâm thû
Sè ch¶nh cõa mët sè sü ki»n x£y ra ÷ñc ành ngh¾a l t¿ sè cõa sèl¦n x£y ra sü ki»n v sè l¦n khæng x£y ra sü ki»n
T sè ch¶nh l t sè cõa hai sè ch¶nh T sè n y g¦n 1 th¼ hai nhâmkhæng câ sü kh¡c bi»t Ng÷ñc l¤i t sè ch¶nh n y c ng xa 1 th¼ c ng thºhi»n sü kh¡c bi»t giúa hai nhâm
Trang 9Phìi nhi¹m Khæng phìi nhi¹m
+ T sè ch¶nh a/c
b/d
1.2 Hçi quy Logistic
Ph¥n t½ch hçi quy nghi¶n cùu mèi quan h» phö thuëc cõa mët bi¸n(gåi l bi¸n phö thuëc ho°c bi¸n ÷ñc gi£i th½ch) vîi mët hay nhi·u bi¸nkh¡c (÷ñc gåi l bi¸n ëc lªp hay bi¸n gi£i th½ch) Chóng ta sû döngc¡c kþ hi»u sau:
Y l bi¸n phö thuëc (hay bi¸n ÷ñc gi£i th½ch);
Xi l bi¸n ëc lªp (hay bi¸n gi£i th½ch thù i)
Mët trong nhi·u v§n · m ph¥n t½ch hçi quy gi£i quy¸t l ÷îc l÷ñnggi¡ trà trung b¼nh cõa bi¸n phö thuëc ùng vîi gi¡ trà ¢ cho cõa bi¸n ëclªp E(Y/Xi)
Nâi chung, E(Y/Xi) l mët h m cõa Xi sao cho:
E(Y /Xi) = f (Xi)
Trang 10f (Xi) ÷ñc gåi l h m hçi quy têng qu¡t Khi â
+ H m hçi quy têng qu¡t câ mët bi¸n ëc lªp ÷ñc gåi l h m hçiquy ìn
+ N¸u h m hçi quy têng qu¡t câ nhi·u hìn mët bi¸n ëc lªp th¼ ÷ñcgåi l h m hçi quy bëi
+ N¸u h m hçi quy têng qu¡t câ d¤ng f(Xi) = β0 + β1X, trong â
β0, β1 l c¡c h» sè ch÷a bi¸t, nh÷ng cè ành, th¼ f(Xi) ÷ñc gåi l h mhçi quy tuy¸n t½nh ìn v β0, β1 gåi l h» sè hçi quy
Mæ h¼nh hçi quy Logistic kh¡c vîi mæ h¼nh hçi quy tuy¸n t½nh thængth÷íng ð ché bi¸n phö thuëc cõa mæ h¼nh Logistic l mët bi¸n l÷ïngph¥n m khæng ph£i l bi¸n ành l÷ñng li¶n töc º thuªn ti»n trongqu¡ tr¼nh t½nh to¡n ta th÷íng m¢ hâa hai gi¡ trà cõa bi¸n phö thuëc l
1 v 0 Khi â bi¸n l÷ïng ph¥n ÷ñc gåi l bi¸n nhà ph¥n N¸u khæng
câ ghi chó g¼ °c bi»t, trong luªn v«n n y chóng ta luæn x²t bi¸n phöthuëc l bi¸n nhà ph¥n
Hçi quy logistic l hçi quy phi tuy¸n trong â bi¸n ëc lªp l ành t½nhho°c ành l÷ñng, bi¸n phö thuëc l nhà ph¥n
V§n · ÷ñc °t ra l : Trong tr÷íng hñp bi¸n phö thuëc l nhà ph¥nth¼ h m hçi quy π(x) ph£i câ d¤ng nh÷ th¸ n o?
Câ nhi·u d¤ng h m kh¡c nhau ¢ ÷ñc nhi·u t¡c gi£ · xu§t º x¥ydüng mæ h¼nh to¡n håc cho b i to¡n hçi quy n y Trong sè c¡c t¡c gi£
â, Cox (1970) ¢ ÷a ra h m logistic Câ hai lþ do º bi»n minh chovi»c chån h m logistic ÷a v o mæ h¼nh hçi quy câ bi¸n phö thuëc l nhàph¥n, â l :
Trang 11- T½nh m·m d´o to¡n håc, thuªn ti»n trong t½nh to¡n;
- Cung c§p ÷ñc c¡c gi£i th½ch ¦y õ v· þ ngh¾a sinh håc cõa mæh¼nh
Gi£ sû bi¸n ng¨u nhi¶n Y l mët bi¸n nhà ph¥n, cán X l mët bi¸n
ëc lªp vîi c¡c gi¡ trà t§t ành ÷ñc cho tr÷îc Khi â, º di¹n t£ mèiquan h» giúa bi¸n Y v bi¸n X , công nh÷ ¡nh gi¡ kh£ n«ng xu§t hi»nc¡c gi¡ trà cõa bi¸n Y theo c¡c gi¡ trà ¢ bi¸t cõa X , ta câ thº ÷a ramët ành ngh¾a cõa mæ h¼nh hçi quy logistic d¤ng ìn gi£n nh§t nh÷sau:
ành ngh¾a 1 H m hçi quy logistic ìn cõa hai bi¸n X v Y câ d¤ng:
E(Y /X) =
eβ0 +β 1 X
1 + eβ0+β1X (1.2.1)Trong â
Trang 12ành ngh¾a 2 Ph²p bi¸n êi sau ÷ñc gåi l ph²p bi¸n êi logit:
N¸u y = 1 th¼ ε = 1 − π(x) vîi x¡c su§t π(x)
N¸u y = 0 th¼ ε = −π(x) vîi x¡c su§t 1 − π(x)
Tø â, ε câ ph¥n phèi nhà thùc vîi E (ε) = 0 v V ar (ε) = V ar (Y ) =
π (x) [1 − π (x)]
1.3 Mæ h¼nh hçi quy Logistic
X²t bi¸n phö thuëc l bi¸n nhà ph¥n Y v X1, X2, , Xk bi¸n ëc lªp.Muèn dü o¡n t¦n su§t xu§t hi»n gi¡ trà 1 cõa bi¸n Y theo c¡c bi¸n ëclªp, câ thº lªp ph÷ìng tr¼nh hçi quy:
T¦n su§t = a1X1 + a2X2 + · · · + akXk + bH¤n ch¸ cõa mæ h¼nh tr¶n: t¦n su§t ð v¸ tr¡i ch¿ nhªn c¡c gi¡ trà lînhìn 0 nhä hìn 1 trong khi v¸ ph£i câ thº nhªn gi¡ trà ¥m d÷ìng b§t k¼
Trang 13Sè ch¶nh = exp(b) exp(a1X1) exp(a2X2) exp(akXk)
1.3.1 ×îc l÷ñng c¡c tham sè cõa mæ h¼nh hçi quy logistic
º x¡c ành ÷ñc mæ h¼nh ta c¦n ÷îc l÷ñng c¡c tham sè cõa mæ h¼nhthæng qua sè li»u thu ÷ñc trong m¨u quan s¡t Câ nhi·u ph÷ìng ph¡p
÷îc l÷ñng tham sè, ð ¥y chóng ta x²t ph÷ìng ph¡p ÷îc l÷ñng hñp lþcüc ¤i Gi£ sû m¨u câ n quan s¡t ëc lªp (xi, yi), i = 1, 2, , n, vîi yi
l gi¡ trà cõa bi¸n phö thuëc v xi l gi¡ trà cõa bi¸n ëc lªp t¤i quans¡t thù i Vi»c ÷îc l÷ñng c¡c tham sè cõa mæ h¼nh b¬ng ph÷ìng ph¡phñp lþ cüc ¤i ÷ñc thüc hi»n theo quy tr¼nh nh÷ sau:
a Ta câ P (Y = 1 |x) = π (x), do â P (Y = 0 |x) = 1 − π (x) Nh÷vªy Y nhªn gi¡ trà 1 vîi x¡c su§t b¬ng π(xi) v nhªn gi¡ trà 0 vîi x¡csu§t b¬ng 1 − π (xi) , i = 1, , n
Vîi méi c°p (xi, yi), i = 1, 2, , n °t
ξ(xi) = π(xi)yi[1 − π(xi)]1−yi
Trang 14b Vîi m¨u n quan s¡t ëc lªp (xi, yi), i = 1, 2, , n ta th nh lªp
1.3.2 Kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic
Vi»c kiºm ành sü phò hñp cõa mæ h¼nh, nh¬m tr£ líi c¥u häi: Mæh¼nh chùa bi¸n ëc lªp cho chóng ta thæng tin v· bi¸n phö thuëc nhi·uhìn mët c¡ch ¡ng kº (câ þ ngh¾a thèng k¶) so vîi mæ h¼nh khæng chùabi¸n ëc lªp hay khæng?
Kiºm ành t sè h m hñp lþ
º ¡nh gi¡ þ ngh¾a sü câ m°t cõa bi¸n ëc lªp trong mæ h¼nh, ta c¦nx²t sü thay êi ë l»ch cõa hai mæ h¼nh khi khæng câ bi¸n ëc lªp v
Trang 15khi câ bi¸n ëc lªp.
ành ngh¾a 3 ë l»ch cõa mæ h¼nh hçi quy logistic, kþ hi»u l D, câd¤ng
lþ b¢o háa (mæ h¼nh b¢o háa l mæ h¼nh câ sè h» sè b¬ng sè quan s¡t)
ành ngh¾a 4 Hi»u ë l»ch cõa hai mæ h¼nh khæng câ bi¸n ëc lªp v
câ bi¸n ëc lªp ÷ñc gåi l ti¶u chu©n t l» hñp lþ, kþ hi»u l G:
G =D (mæ h¼nh khæng câ bi¸n ëc lªp) D (mæ h¼nh câ bi¸n ëc lªp)
V¼ hai mæ h¼nh n y câ chung h m hñp lþ b¢o háa n¶n ta câ:
G = −2 ln
h m hñp l½ logistic khæng câ bi¸n ëc lªp
h m hñp l½ logistic câ bi¸n ëc lªp
bi¸n ëc lªp X thüc sü câ t¡c ëng tîi bi¸n phö thuëc Y hay khæng
X²t m¨u câ n quan s¡t, gi£i ph÷ìng tr¼nh hñp l½ khi mæ h¼nh khæng
câ bi¸n ëc lªp, tùc l β1 = 0, ta câ:
#
Trang 16n0n
- T½nh ti¶u chu©n t¿ l» hñp lþ G v gi¡ trà 2logarit h m hñp lþ cõa
mæ h¼nh câ β1 6= 0 , °t gi¡ trà §y b¬ng −2l
- Vîi χ2(1) l bi¸n ng¨u nhi¶n câ ph¥n phèi Khi - b¼nh ph÷ìng mëtbªc tü do,t½nh x¡c su§t þ ngh¾a α = P [χ2(1) > −2l]
- So s¡nh α vîi mùc þ ngh¾a α0 cho tr÷îc (th÷íng ÷ñc §n ành b¬ng0.001 ho°c b¬ng 0.05)
+ N¸u α ≤ α0 , ta b¡c bä H (vîi mùc þ ngh¾a α0 )
+ N¸u α > α0 , ta ch§p nhªn H (vîi mùc ë tin cªy 100(1 − α0)%)
Trang 17Kiºm ành theo ti¶u chu©n Wald
B¶n c¤nh ph÷ìng ph¡p kiºm ành t l» h m hñp lþ, ta câ thº sû döngph²p kiºm ành thèng k¶ Wald
ành ngh¾a 5 Ti¶u chu©n thèng k¶ Wald l t sè
W =
ˆ
β1SE( ˆβ1)Vîi ˆβ1 l gi¡ trà ÷îc l÷ñng cõa tham sè β1 theo ph÷ìng ph¡p ÷îc l÷ñnghñp l½ cüc ¤i, SE( ˆβ1) l sai sè chu©n cõa ÷îc l÷ñng β1
ành ngh¾a 6 Vîi gi£ thuy¸t β1 = 0 th¼ ti¶u chu©n thèng k¶ W câph¥n phèi ti»m cªn chu©n N(0.1)
Vîi ành l½ tr¶n ph²p kiºm ành theo ti¶u chu©n Wald vîi gi£ thuy¸tH: β1 = 0 v èi thuy¸t K: β1 6= 0 câ thº thüc hi»n theo c¡c b÷îc sau:
- T½nh ti¶u chu©n thèng k¶ Wald
- Vîi Z l bi¸n ng¨u nhi¶n câ ph¥n phèi chu©n N(0,1) t½nh x¡c su§t
þ ngh¾a α = P [|Z| > W ]
- So s¡nh α vîi gi¡ trà α0 cho tr÷îc:
+ N¸u α ≤ α0 ta b¡c bä H (vîi mùc þ ngh¾a α0)
+ N¸u α > α0 ta ch§p nhªn H ( vîi ë tin cªy 100(1 − α0)%)
1.4 Mæ h¼nh hçi quy Logistic bëi
X²t tªp p bi¸n ëc lªp X1, X2, , Xp Kþ hi»u vecto X = (X1, X2, , Xp).X¡c su§t i·u ki»n bi¸n phö thuëc Y theo c¡c gi¡ trà cõa bi¸n ëc lªp X
Trang 18ành ngh¾a7 Mæ h¼nh hçi quy Logistic bëi câ d¤ng:
π(x) =
eg(x)
1 + eg(x)
Trong mët sè tr÷íng hñp bi¸n ëc lªp l ríi r¤c ho°c l bi¸n ành t½nh
º ÷a nhúng bi¸n n y v o mæ h¼nh ta sû döng ph÷ìng ph¡p thi¸t k¸bi¸n (hay lªp bi¸n gi£)
Trong tr÷íng hñp têng qu¡t, khi bi¸n ëc lªp câ thº nhªn k gi¡ trà,thi¸t k¸ k − 1 bi¸n gi£ D1, D2, , D(k − 1), méi bi¸n nhªn gi¡ trà 0 ho°c
1 tòy thuëc v o gi¡ trà cö thº cõa bi¸n ëc lªp ban ¦u Ta câ c¡ch m¢hâa l¤i nh÷ trong b£ng sau:
B£ng thi¸t k¸ bi¸n gi£ èi vîi bi¸n nhªn nhi·u gi¡ trà
Trang 19D1 = 1 Khi t÷ìng ùng vîi kh£ n«ng thù nh§t
0 Khi t÷ìng ùng vîi kh£ n«ng thù nh§t
D2 = 1 Khi t÷ìng ùng vîi kh£ n«ng thù hai
0 Khi t÷ìng ùng vîi kh£ n«ng thù hai
Dk−1 = 1 Khi t÷ìng ùng vîi kh£ n«ng thù k − 1
0 Khi t÷ìng ùng vîi kh£ n«ng thù k − 1T÷ìng ùng vîi kh£ n«ng thù k th¼ Di = 0 vîi i = 1, , k − 1 Tath÷íng chån kh£ n«ng thù k t÷ìng ùng vîi nhâm chùng, l nhâm dòng
l m chu©n º so s¡nh vîi c¡c nhâm cán l¤i
Trong mët sè tr÷íng hñp, chóng ta câ thº x¥y düng bi¸n gi£ tø mëtbi¸n li¶n töc Khi x¥y düng bi¸n gi£ tø mët bi¸n li¶n töc ta c¦n chó þmët sè i·u sau:
- Kho£ng c¡ch giúa c¡c nhâm l b¬ng nhau,
- Cï c¡c nhâm l b¬ng nhau,
- C¥n nhc tîi chõ · cõa èi t÷ñng ph¥n nhâm
Gi£ sû bi¸n ëc lªp thù j l ành t½nh câ kj kh£ n«ng, khi â câ kj− 1bi¸n gi£ Dju vîi u = 1, kj − 1 Ta gåi h» sè cõa c¡c bi¸n gi£ n y trong
mæ h¼nh hçi quy l βju Ta câ h m Logit cõa mæ h¼nh hçi quy Logistict÷ìng ùng câ d¤ng:
Trang 201.4.1 ×îc l÷ñng mæ h¼nh hçi quy Logistic bëi
º ÷îc l÷ñng mæ h¼nh hçi quy Logistic bëi ta ph£i ÷îc l÷ñng vectì h»
sè β = (β0, β1, , βp) T÷ìng tü nh÷ trong mæ h¼nh hçi quy Logistic ìn,
ta sû döng ph÷ìng ph¡p ÷îc l÷ñng hñp l½ cüc ¤i Gi£ sû (xi, yi), xi =(xi1, , xin), i = 1, p l m¨u gçm n quan s¡t ëc lªp Quy tr¼nh ti¸n
h nh ÷îc l÷ñng vectì h» sè cõa mæ h¼nh ÷ñc thüc hi»n nh÷ sau:
a Lªp h m hñp l½ v logarit h m hñp l½ cõa m¨u n câ d¤ng:
c Gi£i h» ph÷ìng tr¼nh hñp l½ tr¶n ta câ nghi»m l ÷îc l÷ñng hñp l½ cüc
¤i cõa vectì h» sè β = (β0, β1, , βp), k½ hi»u l ˆβ = ( ˆβ0, ˆβ1, , ˆβp).L§y ¤o h m ri¶ng c§p hai logarit h m hñp l½ theo c¡c β0, β1, , βp tacâ:
Trang 21Vîi σ2(βj) l ph÷ìng sai cõa ˆβj, j = 1, p, σ(βj, βu) l hi»p ph÷ìng sai
cõa ˆβj v ˆβu vîi j, u = 1, p Tø c¡c cæng thùc tr¶n ta th§y ma trªn hi»p
ph÷ìng sai ˆP( ˆβ) l ÷îc l÷ñng cõa P(β) t¤i ˆβ ×îc l÷ñng n y câ d¤ng:
ˆX( ˆβ) =
hˆ
σ2( ˆβj)
i12
Ta s³ sû döng c¡c k½ hi»u n y khi kiºm ành sü phò hñp cõa c¡c h» sè
trong mæ h¼nh v x¡c ành kho£ng ÷îc l÷ñng cõa c¡c h» sè â
Trang 221.4.2 Kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic bëi
º kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic bëi, ta ti¸n
h nh vi»c kiºm ành gi£ thuy¸t H: β1 = β2 = · · · = βp = 0 v èi thuy¸tK: Mët trong sè c¡c tham sè β1, β2, , βp kh¡c 0
Gåi ˆlH, ˆlK l c¡c ÷îc l÷ñng cüc ¤i c¡c h m hñp lþ, theo (2.16) v (2.17)
ta câ ti¶u chu©n t sè hñp lþ G câ d¤ng:
G = −2 ln
ˆ
lHˆ
Trang 23- Vîi χ2
p l bi¸n ng¨u nhi¶n câ ph¥n phèi Khi- b¼nh ph÷ìng p bªc tü
do, t½nh x¡c su§t þ ngh¾a α = P [χ2
p > −2l]
- So s¡nh α vîi mùc þ ngh¾a α0 cho tr÷îc:
+ N¸u α ≤ α0 ta b¡c bä H (vîi mùc þ ngh¾a α0)
+ N¸u α > α0 ta ch§p nhªn H ( vîi ë tin cªy 100(1 − α0)%)
Kiºm ành theo ti¶u chu©n Wald
ành ngh¾a 8 Trong mæ h¼nh hçi quy Logistic bëi, ti¶u chu©n thèngk¶ Wald x¡c ành nh÷ sau:
W = ˆβ0
hXˆ( ˆβ)
i−1
ˆ
β = ˆβ0(X0V X) ˆβTrong â, ma trªn X:
-T½nh ti¶u chu©n thèng k¶ Wald
- Vîi Z l bi¸n ng¨u nhi¶n câ ph¥n phèi χ2
p+1 , t½nh x¡c su§t þ ngh¾a
α = P [Z > W ]
Trang 24- So s¡nh α vîi mùc þ ngh¾a α0 cho tr÷îc:
+ N¸u α ≤ α0 ta b¡c bä H (vîi mùc þ ngh¾a α0)
+ N¸u α > α0 ta ch§p nhªn H ( vîi ë tin cªy 100(1 − α0)%)
1.5 Þ ngh¾a h» sè cõa mæ h¼nh hçi quy Logistic
Sau khi ÷îc l÷ñng v kiºm ành sü phò hñp cõa mæ h¼nh hçi quylogistic, chóng ta i ¡nh gi¡ þ ngh¾a, t¦m quan trång cõa c¡c h» sètrong mæ h¼nh, tùc l chóng ta i tr£ líi c¥u häi: Vîi c¡c h» sè ¢ ÷ñc
÷îc l÷ñng th¼ bi¸n ëc lªp t÷ìng ùng câ t¡c ëng nh÷ th¸ n o tîi mæh¼nh nghi¶n cùu?
Tr÷îc khi i ¡nh gi¡ þ ngh¾a h» sè cõa mæ h¼nh hçi quy chóng tagi£ sû mæ h¼nh ¢ ÷ñc ÷îc l÷ñng v kiºm ành sü phò hñp ¦u ti¶n
ta x¡c ành h m cõa bi¸n phö thuëc cho bði mët h m tuy¸n t½nh cõabi¸n ëc lªp èi vîi mët sè mæ h¼nh g¦n vîi mæ h¼nh tuy¸n t½nh h m
n y ÷ñc gåi l h m li¶n k¸t èi vîi mæ h¼nh hçi quy tuy¸n t½nh h mli¶n k¸t công ch½nh l h m hçi quy y=ax+b Nh÷ vªy, khi bi¸n ëc lªpt«ng th¶m mët ìn và th¼ bi¸n phö thuëc trong mæ h¼nh tuy¸n t½nh t«ngth¶m a ìn và Trong mæ h¼nh hçi quy logistic h m li¶n k¸t l h m bi¸n
êi logit g(x) = lnπ(x)[1 − π(x)] = β0+ β1x Khi â ta câ h» sè dèccõa mæ h¼nh β1 = g(x + 1) − g(x)
Þ ngh¾a cõa méi h» sè trong mæ h¼nh logistic ÷ñc lþ gi£i tòy thuëckiºu cõa bi¸n ëc lªp t÷ìng ùng:
+ Mæ h¼nh câ bi¸n ëc lªp nhà ph¥n
Trong khuæn khê cõa luªn v«n n y ch¿ xem x²t tr÷íg hñp bi¸n ëc
Trang 25lªp X l÷ïng ph¥n nhªn hai gi¡ trà 0 v 1 Khi â ta câ b£ng gi¡ trà hçiquy cõa mæ h¼nh nh÷ sau:
B£ng gi¡ trà hçi quy Logistic vîi bi¸n ëc lªp nhà ph¥n
Trang 26Theo b£ng gi¡ trà hçi quy Logistic vîi bi¸n ëc lªp nhà ph¥n ta câ t sèch¶nh ψ câ d¤ng
+ Mæ h¼nh câ bi¸n ëc lªp nhªn nhi·u gi¡ trà
B£ng h» sè hçi quy logistic cho bi¸n ëc lªp nhªn nhi·u gi¡ trà
Trang 27+ Mæ h¼nh câ bi¸n ëc lªp li¶n töc.
Trong tr÷íng hñp bi¸n ëc lªp X l li¶n töc, th¼ h m logit g (x) =
β0 + β1x công l log t sè ch¶nh cõa mæ h¼nh Tø â ta câ h» sè dèc
β1 = g (x + 1) − g (x) vîi måi gi¡ trà cõa x Tùc l khi bi¸n ëc lªp thay
êi 1 ìn và th¼ t sè ch¶nh s³ thay êi exp (β1) ìn và
Log t sè ch¶nh khi thay êi c ìn và l g (x + c) − g (x) = cβ1, tø t
sè ch¶nh ψ (c) ψ (x + c, x) = ecβ 1 ta câ kho£ng ÷îc l÷ñng cõa t sè ch¶nhvîi ë tin cªy 100 (1 − α) % l
ceβˆju −Zα/2c ˆ SE( ˆ βju)
, ceβˆju +Zα/2c ˆ SE( ˆ βju)
Trang 28Ch֓ng 2
Mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n
Trong qu¡ tr¼nh i·u tra x¢ hëi håc, chóng ta th÷íng g°p c¡c sè li»u
câ c§u tróc thù bªc ho°c c§u tróc sè li»u lçng nhâm, nâi c¡ch kh¡c l sèli»u ÷ñc thu thªp ð c¡c mùc kh¡c nhau cõa ìn và quan s¡t.V½ dö choc¡c c§u tróc thù bªc trong x¢ hëi kh¡ l phong phó Ch¯ng h¤n, trongc¡c tr÷íng håc, sinh vi¶n ÷ñc lçng nhâm trong c¡c lîp v c¡c lîp ÷ñclçng nhâm trong c¡c tr÷íng Ho°c trong i·u tra v· nhu c¦u ch«m sâcsùc khäe t¤i nh , sè li»u thu thªp ÷ñc ð tøng nhâm th nh vi¶n tronggia ¼nh, song k¸t luªn câ thº ÷a ra cho c¡c khu vüc x¢, ph÷íng kh¡cnhau
Mæ h¼nh nhi·u mùc ¢ ÷ñc x¥y düng v sû döng rëng r¢i º nghi¶ncùu c¡c sè li»u câ c§u tróc lçng nhâm Mæ h¼nh nhi·u mùc ¢ cho th§ynhi·u ÷u iºm so vîi c¡c ph÷ìng ph¡p ph¥n t½ch truy·n thèng kh¡c,ch¯ng h¤n nâ khc phöc ÷ñc h¤n ch¸ cõa gi£ thi¸t v· t½nh ëc lªp giúac¡c quan s¡t v gi£ thi¸t ph÷ìng sai khæng êi Khi â gi£ thi¸t v· t½nh
ëc lªp giúa c¡c quan s¡t m c¡c ph÷ìng ph¡p thèng k¶ cê iºn ái häi
Trang 29câ thº bà vi ph¤m, nh÷ng k¸t qu£ cõa ph÷ìng ph¡p ph¥n t½ch nhi·u mùckhæng chàu £nh h÷ðng cõa sü vi ph¤m â Sau ¥y ta xem x²t mët sè
mæ h¼nh nhi·u mùc th÷íng ÷ñc sû döng
2.1 Mæ h¼nh tuy¸n t½nh nhi·u mùc
Ta bt ¦u tø mët mæ h¼nh quen thuëc- mæ h¼nh tuy¸n t½nh nhi·umùc Ta tªp trung v o mët mæ h¼nh cö thº m c¡c nh x¢ hëi håc th÷íng
sû döng D¤ng chung nh§t cõa mæ h¼nh tuy¸n t½nh nhi·u mùc tøng ÷ñc
mæ t£ bði Mason v c¡c çng sü (1983), Goldstein (1987, 1995), v Bryk
& Raudenbush (1992)
¦u ti¶n, ta xem x²t mæ h¼nh 2 mùc ìn gi£n vîi mët bi¸n gi£i th½chduy nh§t Thuªt ngú thæng th÷íng º kþ hi»u mùc th§p nh§t cõa thùbªc l mùc 1, mùc th§p ti¸p theo l mùc 2,v.v Mæ h¼nh hçi quy nhi·umùc ¦y õ gi£ sû r¬ng câ mët bë dú li»u câ thù bªc vîi bi¸n phö thuëc
o ÷ñc ð mùc th§p nh§t v mët sè bi¸n dü b¡o(bi¸n gi£i th½ch) o ÷ñc
ð t§t c£ c¡c mùc cõa dú li»u hi»n câ Cö thº, mæ h¼nh â câ thº ÷ñcxem x²t nh÷ mët h» thèng câ thù bªc c¡c cæng thùc hçi quy,
yij = β0 + β1xij+ uj + eij (2.1.1)
trong â, yij l bi¸n k¸t qu£ cho ìn và thù i cõa mùc 1 v ìn vàthù j cõa mùc 2, β0 l h» sè ch°n, xij l bi¸n gi£i th½ch, β1 l h» sèdèc, uj l £nh h÷ðng ng¨u nhi¶n cõa nhúng bi¸n êi ng¨u nhi¶n ð mùc
2 v eij l £nh h÷ðng ng¨u nhi¶n mùc 1 C¡c tham sè cho £nh h÷ðngng¨u nhi¶n thäa m¢n E[uj] = E[eij] = 0, var(uj) = σu2, var(eij) = σε2,cov(uj, eij) = 0 v cov(uj, uj0) = 0 vîi j 6= j0 Mèi t÷ìng quan nëi t¤i
Trang 30trong cöm ho°c trong nhâm sau khi kiºm so¡t t¡c ëng cõa bi¸n gi£ith½ch câ thº thu ÷ñc tø biºu thùc ρ = σ2
u/(σ2u + σε2) Ph÷ìng tr¼nh(2.1.1) câ thº ÷ñc xem x²t nh÷ mæ h¼nh £nh h÷ðng ng¨u nhi¶n cho
dú li»u i·u khiºn ho°c mæ h¼nh ÷íng cong t«ng tr÷ðng Trong c£ 2tr÷íng hñp, i v j t÷ìng ùng l ch¿ sè thíi iºm v c¡ thº, v l hi»pbi¸n thay êi theo thíi gian Mët mæ h¼nh t«ng tr÷ðng tuy¸n t½nh áihäi trong ph÷ìng tr¼nh (2.1.1) ph£i câ th nh ph¦n tuy¸n t½nh v mët
mæ h¼nh t«ng tr÷ðng bªc 2 ái häi bê sung v o ph÷ìng tr¼nh â th nhph¦n bªc 2
Ta ti¸p töc mð rëng mæ h¼nh 2 mùc ìn gi£n th nh mæ h¼nh 3 mùcvîi h» sè ng¨u nhi¶n,
yijk = β0 + β1xijk+ u1jkxijk+ v0k + u0jk + e0ijk (2.1.2)Trong â k ch¿ sè mùc 3, v0k v u0jk l h» sè ch°n ng¨u nhi¶n chomùc 3 v mùc 2, t÷ìng ùng vîi xijk l bi¸n gi£i th½ch ÷ñc quan s¡t ðmùc 1 v u1jk l £nh h÷ðng ng¨u nhi¶n cõa xijk ð mùc 2 C¡c tham
sè kh¡c trong mæ h¼nh thäa m¢n E[v0k] = E[u0jk] = E[e0ijk] = 0,var(v0k) = σv02 , var(u0jk) = σu02 , var(u1jk) = σu12 , var(e0ijk) = σε02 v cov(u0jk, u1jk) = σu01
Mæ h¼nh n y mët l¦n núa gi£ ành r¬ng c¡c £nh h÷ðng ng¨u nhi¶ntr¶n c¡c mùc kh¡c nhau v c¡c £nh h÷ðng ng¨u nhi¶n tr¶n c¡c cöm kh¡cnhau trong còng mët mùc l khæng t÷ìng quan C¡c mæ h¼nh phùc t¤phìn câ thº ÷ñc x¥y düng b¬ng c¡ch th¶m c¡c bi¸n quan s¡t v o ph÷ìngtr¼nh (2.1.2) v c¡c t÷ìng quan giúa c¡c mùc
Mæ h¼nh nhi·u mùc khæng ch¿ câ c¡c tham sè hçi quy quen bi¸t nh÷
β0 v β1 m cán câ c¡c tham sè ng¨u nhi¶n ch÷a bi¸t nh÷ u0jk, u1jk v
Trang 31v0k Khi xem x²t mæ h¼nh nhi·u mùc nh÷ l mët tr÷íng hñp °c bi»tcõa mæ h¼nh phùc hñp, c¡c nh thèng k¶ ÷îc l÷ñng c¡c tham sè cõa mæh¼nh thæng qua ph÷ìng ph¡p ÷îc l÷ñng b¼nh ph÷ìng b² nh§t, cüc tiºuhâa gi¡ trà (y −Xβ)0V−1(y − Xβ) Tuy nhi¶n do sü câ m°t cõa c¡c tham
sè ng¨u nhi¶n ch÷a bi¸t trong V, tr÷îc â ng÷íi ta ph£i dòng ph÷ìngph¡p hñp l½ cüc ¤i ho°c hñp l½ cüc ¤i h¤n ch¸ º ÷îc l÷ñng ph÷ìng sai
v hi»p ph÷ìng sai cõa u v e, vîi gi£ thi¸t chóng câ ph¥n phèi chu©n
2.2 Mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n
Mæ h¼nh hçi quy cho dú li»u nhà ph¥n bao gçm hçi quy Logistic v hçi quy x¡c su§t(probit) th÷íng ÷ñc c¡c nh x¢ hëi håc dòng l m cæng
cö thèng k¶ trong c¡c nghi¶n cùu Tr÷îc ti¶n chóng ta xem x²t mæ h¼nh
2 mùc vîi bi¸n phö thuëc nhà ph¥n v mët bi¸n gi£i th½ch Mæ h¼nh n yt÷ìng tü mæ h¼nh (2.1.1), ch¿ kh¡c ð ché bi¸n phö thuëc ch¿ nhªn hai gi¡trà 0 v 1 Gi£ sû chóng ta câ c¡c håc sinh (ìn và mùc 1) ÷ñc nhâm
v o trong c¡c tr÷íng (ìn và mùc 2)
X²t gi¡ trà cõa bi¸n phö thuëc nhà ph¥n yij ùng vîi håc sinh i trongtr÷íng j v gi¡ trà cõa bi¸n gi£i th½ch xij quan s¡t ð mùc håc sinh Ta k½hi»u x¡c su§t º bi¸n ¡p ùng nhªn gi¡ trà 1 b¬ng pij = P r(yij = 1) v
pij ÷ñc mæ h¼nh hâa bði h m li¶n k¸t logit Trong thüc t¸, yij th÷íng
÷ñc gi£ thi¸t câ ph¥n phèi Bernoulli Do â, mæ h¼nh hçi quy hai mùccho bi¸n phö thuëc nhà ph¥n ÷ñc vi¸t th nh
log[pij/(1 − pij)] = β0 + β1xij + uj (2.2.3)trong â uj l £nh h÷ðng ng¨u nhi¶n ð mùc 2 N¸u khæng câ uj, (2.2.3)
Trang 32s³ l mæ h¼nh hçi quy logistic thæng th÷íng Trong mæ h¼nh tr¶n, uj v
yij ÷ñc gi£ ành l ëc lªp vîi nhau Công nh÷ trong mæ h¼nh tuy¸nt½nh nhi·u mùc, uj ÷ñc gi£ thi¸t câ ph¥n phèi chu©n vîi k¼ vång 0 v ph÷ìng sai σ2
ij < 0 n¸u yij 6= 1 Mæ h¼nh nhi·u mùc cho t÷ìng ÷ìng vîi (2.2.3)
câ th¸ vi¸t nh÷ sau:
yij∗ = β0 + β1xij + uj + eij (2.2.6)
Cè ành £nh h÷ðng ng¨u nhi¶n uj ð mùc 2, ph÷ìng tr¼nh (2.2.6) câ thºsuy ra tø mæ h¼nh hçi quy Logistic nhi·u mùc (2.2.3) ho°c mæ h¼nhhçi quy probit nhi·u mùc tòy thuëc v o gi£ thi¸t eij trong ph÷ìng tr¼nh(2.2.6)câ ph¥n phèi logistic ti¶u chu©n hay ph¥n bè chu©n thæng th÷íng.Di¹n gi£i tr¶n minh håa cho mèi li¶n h» ch°t ch³ giúa mæ h¼nh nhi·umùc cho c¡c dú li»u ành l÷ñng li¶n töc v mæ h¼nh nhi·u mùc cho c¡c
dú li»u nhà ph¥n
Cè ành uj ho°c gi£ sû r¬ng uj ¢ quan s¡t ÷ñc Lóc â, h m mªt
ë câ i·u ki»n tr¶n cöm j cõa mæ h¼nh (3) ch½nh b¬ng h m mªt ë câ