• sqft_basement: Di»n t‰ch tƒng hƒm... V‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price v logprice+1 theo tłng ph¥n lo⁄i cıa bi‚n floors... ç thà thø 4 Residuals vs Leverage cho ph†p
Trang 13 Nguy„n D÷ìng Khang 2013430 L07/B Kÿ thu“t X¥y Düng
4 Ngæ Thà Thuý Dung 1912865 L10/A Kÿ thu“t X¥y Düng
Tp Hç Ch‰ Minh, Th¡ng 01/11/2021
Trang 4Möc löc
1.1 • b i 6
1.2 Cì sð lþ thuy‚t 6
1.3 Thüc hi»n 7
1.3.1 åc dœ li»u (Import data) 7
1.3.2 L m s⁄ch dœ li»u (Data cleaning) 7
1.3.3 L m rª dœ li»u: (Data visualization) 9
1.3.4 X¥y düng mæ h…nh hçi quy tuy‚n t‰nh ” ¡nh gi¡ c¡c nh¥n tŁ câ th” £nh h÷ðng ‚n gi¡ nh ð qu“n King 16
1.3.5 Thüc hi»n dü b¡o cho gi¡ nh qu“n King 20
2 Ho⁄t ºng 2 22 2.1 • b i 22
Trang 5Danh s¡ch b£ng
Trang 68 code R v k‚t qu£ khi t‰nh c¡c bi‚n price, sqft_above, sqft_living, sqft_basement
¢ chuy”n sang d⁄ng log(x+1)
11 code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng ph¥n lo⁄i
cıa bi‚n floors
12 code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1)
theo tłng ph¥n lo⁄i cıa bi‚n floors
13 code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng
ph¥n lo⁄i cıa bi‚n floors
14 code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1)
theo tłng ph¥n lo⁄i cıa bi‚n condition
15 code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng
ph¥n lo⁄i cıa bi‚n view
16 code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tłng
ph¥n lo⁄i cıa bi‚n view
17 code R v k‚t qu£ khi v‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n
sqft_above tr÷îc v sau khi chuy”n sang d⁄ng v log(x+1)
18 code R v k‚t qu£ khi v‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n
sqft_living tr÷îc v sau khi chuy”n sang d⁄ng v log(x+1)
19 code R v k‚t qu£ khi v‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n
sqft_basement tr÷îc v sau khi chuy”n sang d⁄ng v log(x+1)
20 code R v k‚t qu£ khi x¥y düng mæ h…nh hçi quy tuy‚n t‰nh lm_model_1
Trang 721 code R v k‚t qu£ khi v‡ ç thà ph¥n t‰ch th°ng d÷ ” ki”m tra c¡c gi£ ành cıa mæ h…nh
Trang 8‰nh trong bº dœ li»u:
• price: Gi¡ nh ÷æc b¡n ra
• floors: SŁ tƒng cıa ngæi nh ÷æc ph¥n lo⁄i tł 1 - 3.5
• condition: i•u ki»n ki‚n tróc cıa ngæi nh tł 1 - 5, 1: r§t t» v 5: r§t tŁt
• view: ¡nh gi¡ c£nh quan xung quanh nh theo møc º tł th§p ‚n cao: 0 - 4
• sqft_above: Di»n t‰ch ngæi nh
• sqft_living: Di»n t‰ch khuæn vi¶n nh
• sqft_basement: Di»n t‰ch tƒng hƒm
C¡c b÷îc thüc hi»n:
1 åc dœ li»u (Import data): "house_price.csv"
2 L m s⁄ch dœ li»u (Data cleaning): NA (dœ li»u khuy‚t)
3 L m rª dœ li»u: (Data visualization)
(a) Chuy”n Œi bi‚n (n‚u cƒn thi‚t)
Trang 91.3 Thüc hi»n
1.3.1 åc dœ li»u (Import data)
åc dœ li»u "house_price.csv"
H…nh 1: code R v k‚t qu£ khi åc dœ li»u v xem 6 dÆng ƒu ti¶n cıa dœ li»u
1.3.2 L m s⁄ch dœ li»u (Data cleaning)
T⁄o mºt dœ li»u mîi ch¿ bao gçm c¡c bi‚n ch‰nh m ta quan t¥m, l÷u vîi t¶n l new_DF
H…nh 2: code R v k‚t qu£ khi t⁄o mºt dœ li»u mîi ch¿ bao gçm c¡c bi‚n ch‰nh
Ki”m tra dœ li»u khuy‚t trong new_DF
Trang 10H…nh 3: code R v k‚t qu£ khi ki”m tra dœ li»u khuy‚t trong new_DF
Nh“n x†t: Düa v o k‚t qu£ thu ÷æc khi ki”m tra dœ li»u khuy‚t trong new_DF, ta nh“n th§y câ 20 dœ li»u khuy‚t t⁄i bi‚n price V“y n¶n ta cƒn xß lþ c¡c dœ li»u khuy‚t â
Ph÷ìng ph¡p xß l‰ ÷æc • xu§t l thay th‚ gi¡ trà trung b…nh ð c¡c quan s¡t cÆn l⁄i cıa bi‚n price t⁄i và tr‰ chøa dœ li»u khuy‚t
H…nh 4: code R khi thay th‚ gi¡ trà trung b…nh ð c¡c quan s¡t cÆn l⁄i cıa bi‚n price t⁄i và tr‰ chøa
dœ li»u khuy‚t
Ki”m tra l⁄i xem cÆn dœ li»u khuy‚t hay khæng
H…nh 5: code R v k‚t qu£ khi ki”m tra l⁄i dœ li»u khuy‚t hay khæng
Nh“n x†t: Ta nh“n th§y sau khi xß lþ, khæng cÆn dœ li»u khuy‚t
Trang 111.3.3 L m rª dœ li»u: (Data visualization)
T⁄o mºt data mîi t¶n l new_DF2 (gçm c¡c bi‚n nh÷ new_DF ¢ l m s⁄ch dœ li»u) v chuy”n Œi c¡c bi‚nprice, sqft_above, sqft_living, sqft_basement lƒn l÷æt th nh log(price+1), log(sqft_above+1),log(sqft_living+1) v log(sqft_basement+1)
H…nh 6: code R v k‚t qu£ khi chuy”n Œi c¡c bi‚n sang d⁄ng log(x+1)
Gi£i th‰ch lþ do chuy”n sang d⁄ng log(x+1):
+ C£i thi»n sü phò hæp cıa mæ h…nh: gi£ ành khi ta x¥y düng mæ h…nh hçi quy th… c¡c sai sŁhçi quy (phƒn d÷) ph£i câ ph¥n phŁi chu'n, do â trong tr÷íng hæp sai sŁ hçi quy (phƒn d÷) khæng
câ ph¥n phŁi chu'n th… vi»c l§y log cıa cıa mºt bi‚n gióp thay Œi t¿ l» v l m cho bi‚n â câ ph¥n phŁichu'n Ngo i ra, trong tr÷íng hæp phƒn d÷ (ph÷ìng sai thay Œi) do c¡c bi‚n ºc l“p g¥y ra, ta công câth” chuy”n Œi c¡c bi‚n â sang d⁄ng log
+ Di„n gi£i: ¥y l lþ do gióp ta câ th” di„n gi£i mŁi quan h» giœa 2 bi‚n thu“n ti»n hìn N‚u ta l§y logcıa bi‚n phö thuºc Y v bi‚n ºc l“p X, khi â h» sŁ hçi quy s‡ l h» sŁ co gi¢n v di„n gi£i s‡ nh÷ sau: Xt«ng 1% s‡ d¤n ‚n t«ng vi»c ta s‡ ký vång Y t«ng l¶n % (v• m°t trung b…nh cıa Y),
+ ×îc l÷æng mæ h…nh phi tuy‚n: vi»c l§y log cho ph†p ta ÷îc l÷æng c¡c mæ h…nh n y b‹ng hçi quy tuy‚n t‰nh
+ Ngo i ra, vi»c chuy”n sang d⁄ng log(x+1) thay v… log(x) bði do trong bi‚n sqft_basement câ nhi•ugi¡ trà = 0 (do mºt sŁ ngæi nh khæng câ tƒng hƒm) N‚u chuy”n sang d⁄ng log th… s‡ nh“n ÷æc c¡cgi¡ trà infty Do â ta s‡ chuy”n c¡c bi‚n sang log(x+1) thay v… log(x)
T‰nh c¡c gi¡ trà thŁng k¶ mæ t£ (trung b…nh, º l»ch chu'n, min, max, trung và) cho c¡c bi‚n price,sqft_above, sqft_living, sqft_basement Xu§t k‚t qu£ d÷îi d⁄ng b£ng
H…nh 7: code R v k‚t qu£ khi t‰nh c¡c bi‚n price, sqft_above, sqft_living, sqft_basement
T‰nh c¡c gi¡ trà thŁng k¶ mæ t£ (trung b…nh, º l»ch chu'n, min, max, trung và) cho c¡c bi‚n price,sqft_above, sqft_living, sqft_basement ¢ chuy”n sang d⁄ng log(x+1) Xu§t k‚t qu£ d÷îi d⁄ng b£ng
Trang 12H…nh 8: code R v k‚t qu£ khi t‰nh c¡c bi‚n price, sqft_above, sqft_living, sqft_basement ¢ chuy”n sang d⁄ng log(x+1)
V‡ bi”u ç histogram th” hi»n ph¥n phŁi cıa bi‚n price tr÷îc v sau khi chuy”n sang d⁄ng log(x+1)
H…nh 9: code R v k‚t qu£ khi v‡ bi”u ç histogram th” hi»n ph¥n phŁi cıa bi‚n price
Trang 13H…nh 10: code R v k‚t qu£ khi v‡ bi”u ç histogram th” hi»n ph¥n phŁi cıa bi‚n log(price+1)
Nh“n x†t: Düa tr¶n bi”u ç histogram cıa bi‚n price, ta nh“n th§y ph¥n phŁi cıa bi‚n price câ xu h÷îngl»ch ph£i, cho th§y phƒn lîn ngæi nh câ gi¡ ti•n gƒn nh÷ nhau, v ch¿ câ sŁ ‰t ngæi nh câ gi¡ tràcao hìn Trong khi vîi bi”u ç cıa bi‚n log(price + 1) câ h…nh d⁄ng ph¥n phŁi chu'n
V‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price v log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n floors
H…nh 11: code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng ph¥n lo⁄icıa bi‚n floors
Trang 14H…nh 12: code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n floors
V‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price v log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n
condition
H…nh 13: code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng ph¥n lo⁄i cıa bi‚n floors
Trang 15H…nh 14: code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n condition
V‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price v log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n view
H…nh 15: code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng ph¥n lo⁄i cıa bi‚n view
Trang 16H…nh 16: code R v k‚t qu£ khi v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n view
V‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n sqft_above tr÷îc v sau khi chuy”n sang d⁄ng v log(x+1)
H…nh 17: code R v
sqft_above tr֔c v
k‚t qu£ khi v‡ bi”uç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n sau khi chuy”n sang d⁄ng v log(x+1)
Trang 17Nh“n x†t: Düa tr¶n ç thà ph¥n t¡n cıa price v sqft_above, ta ch÷a nh“n th§y th§y rª mŁi quan h» tuy‚n t‰nh giœa 2 bi‚n Tuy nhi¶n vîi ç thà ph¥n t¡n cıa log(price + 1) v log(sqft_above +
1) ta nh“n th§y rª hìn v• mŁi quan h» tuy‚n t‰nh giœa 2 bi‚n n y (cö th” l quan h» çng bi‚n)
V‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n sqft_living tr÷îc v sau khi chuy”n sang d⁄ng v log(x+1)
1) ta nh“n th§y rª hìn v• mŁi quan h» tuy‚n t‰nh giœa 2 bi‚n n y (cö th” l quan h» çng bi‚n)
V‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n sqft_basement tr÷îc v sau khi chuy”n sang d⁄ng v log(x+1)
Trang 18H…nh 19: code R v k‚t qu£ khi v‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚nsqft_basement tr÷îc v sau khi chuy”n sang d⁄ng v log(x+1)
Nh“n x†t: Düa tr¶n ç thà ph¥n t¡n cıa price v sqft_basement, ta ch÷a nh“n th§y th§y rª mŁi quan h»tuy‚n t‰nh giœa 2 bi‚n Tuy nhi¶n vîi ç thà ph¥n t¡n cıa log(price + 1) v log(sqft_basement + 1) tanh“n th§y rª hìn v• mŁi quan h» tuy‚n t‰nh giœa 2 bi‚n n y (cö th” l quan h» çng bi‚n)
Tâm l⁄i, düa tr¶n c¡c ç thà tr¶n, ta nh“n th§y vi»c chuy”n Œi c¡c bi‚n sang d⁄ng log(x+1) s‡ hi»u qu£hìn trong vi»c ph¥n t‰ch mŁi quan h» tuy‚n t‰nh giœa c¡c bi‚n ºc l“p vîi bi‚n phö thuºc (gi¡ nh )
C¥u häi °t ra lóc n y l mŁi quan h» giœa c¡c bi‚n vîi gi¡ nh l ng¤u nhi¶n hay thüc sü câ mŁi quan h»tuy‚n t‰nh giœa c¡c bi‚n vîi gi¡ nh Mæ h…nh hçi quy tuy‚n t‰nh s‡ gióp ta ki”m tra i•u
n y thæng qua c¡c kho£ng tin c“y v c¡c ph†p ki”m ành Hìn nœa, nâ cÆn cho ph†p ta ÷îc l÷æng gi¡trà cıa bi‚n phö thuºc (gi¡ nh ) theo c¡c bi‚n ºc l“p (sŁ tƒng, i•u ki»n ngæi nh , di»n t‰ch nh , )
1.3.4 X¥y düng mæ h…nh hçi quy tuy‚n t‰nh ” ¡nh gi¡ c¡c nh¥n tŁ câ th” £nh h÷ðng ‚n gi¡ nh ð
qu“n King
Chóng ta muŁn t…m hi”u câ nhœng nh¥n tŁ n o v t¡c ºng nh÷ th‚ n o ‚n gi¡ nh ð qu“n King.X†t mæ h…nh hçi quy tuy‚n t‰nh bao gçm: Bi‚n phö thuºc: price
Bi‚n ºc l“p: floors, condition, view, sqft_above, sqft_living, sqft_basement
(l÷u þ c¡c bi‚n price, sqft_above, sqft_living, sqft_basement ¢ ÷æc chuy”n sang d⁄ng log(x+1))
Mæ h…nh ÷æc bi”u di„n nh÷ sau:
log(price + 1) = 0 + 1 f loors + 2 condition + 3 view + 4 log(sqf t_above + 1) + 5 log(sqf t_living + 1) + 6 log(sqf t_basement + 1)
Trang 19Ta thüc hi»n ÷îc l÷æng c¡c h» sŁ i, i = 0; :::; 6 düa tr¶n t»p tin new_DF2:
H…nh 20: code R v k‚t qu£ khi x¥y düng mæ h…nh hçi quy tuy‚n t‰nh lm_model_1
Nh“n x†t: Tł k‚t qu£ ph¥n t‰ch, ta thu ÷æc:
b0 = 7:168351; b1 = 0:102574; b2 = 0:075131; b3 = 0:125203
b4 = 0:544601; b5 = 0:172785; b6 = 0:042919Nh÷ v“y, ÷íng thflng hçi quy ÷îc l÷æng cho bði ph÷ìng tr…nh sau:
log(price + 1) = 7:168351 + 0:102574 f loors + 0:075131 condition + 0:125203 view + 0:544601log(sqf t_above + 1) + 0:172785 log(sqf t_living + 1) + 0:042919 log(sqf t_basement + 1)
Ki”m ành c¡c h» sŁ hçi quy:
Gi£ thuy‚t H0: H» sŁ hçi quy khæng câ þ ngh¾a thŁng k¶ ( i = 0)
Gi£ thuy‚t H1: H» sŁ hçi quy câ þ ngh¾a thŁng k¶ ( i 6= 0)
+ P r(> jtj) cıa c¡c h» sŁ øng vîi c¡c bi‚n •u b† hìn møc þ ngh¾a = 0:05 n¶n ta b¡c bä gi£ thuy‚t H0
Do â h» sŁ øng vîi c¡c bi‚n n y •u câ þ ngh¾a vîi mæ h…nh hçi quy ta x¥y düng
Ph¥n t‰ch sü t¡c ºng cıa c¡c nh¥n tŁ l¶n gi¡ nh :
Nh÷ v“y mæ h…nh hçi quy tuy‚n t‰nh v• £nh h÷ðng cıa c¡c nh¥n tŁ l¶n gi¡ nh ÷æc cho bði:
log(price + 1) = 7:168351 + 0:102574 f loors + 0:075131 condition + 0:125203 view + 0:544601log(sqf t_above + 1) + 0:172785 log(sqf t_living + 1) + 0:042919 log(sqf t_basement + 1)
hay ta câ th” suy ra:
price = e 7:168351 e 0:102574 floors e 0:075131 condition e 0:125203 view (sqf t_above + 1)0:544601(sqf t_living + 1)0:172785: (sqf t_basement + 1)0:042919 1
Tr÷îc h‚t, ta th§y r‹ng p value t÷ìng øng vîi thŁng k¶ F b† hìn 2:2e 16, câ þ ngh¾a r§t cao i•u
n y ch¿ ra r‹ng, ‰t nh§t mºt bi‚n dü b¡o trong mæ h…nh câ þ ngh¾a gi£i th‰ch r§t cao ‚n gi¡ nh
” x†t £nh h÷ðng cö th” cıa tłng bi‚n ºc l“p, ta x†t trång sŁ (h» sŁ i) v p value t÷ìng øng Ta th§yr‹ng p value t÷ìng øng vîi c¡c bi‚n •u b† hìn 2e 16 (ngo i trł bi‚n sqft_living câ
p value = 3:37e 09), i•u n y nâi l¶n r‹ng £nh h÷ðng cıa c¡c bi‚n n y câ þ ngh¾a r§t cao l¶n gi¡ nh price
M°t kh¡c, h» sŁ hçi quy i cıa mºt bi‚n dü b¡o công câ th” ÷æc xem nh÷ £nh h÷ðng trung b…nh l¶nbi‚n phö thuºc price khi t«ng mºt ìn và cıa bi‚n dü b¡o, gi£ sß r‹ng c¡c bi‚n dü b¡o kh¡c
Trang 20khæng Œi Cö th”, 1 = 0:102574 th… khi sŁ tƒng cıa mºt ngæi nh b¡n ra t«ng 1 tƒng ta câ th”
ký vång log(price + 1) t«ng l¶n 0.102574 v• m°t ìn và cıa log(price + 1) hay price + 1 t«ng l¶n e(0:102574) 1 = 10:8%
so price + 1 ban ƒu (gi£ sß r‹ng c¡c bi‚n dü b¡o kh¡c khæng Œi) Vîi 2= 0:075131 th… khi i•u ki»n ngæi nh t«ng th¶m
Ki”m tra c¡c gi£ ành cıa mæ h…nh
Nh›c l⁄i c¡c gi£ ành cıa mæ h…nh hçi quy: Yi = 0 + 1:X1 + ::: i:Xi + i, i = 1; :::n
+ T‰nh tuy‚n t‰nh cıa dœ li»u: mŁi quan h» giœa bi‚n dü b¡o X v bi‚n phö thuºc Y ÷æc gi£ sß l tuy‚n t‰nh
+ Sai sŁ câ ph¥n phŁi chu'n
+ Ph÷ìng sai cıa c¡c sai sŁ l h‹ng sŁ: i N(0; 2)
+ C¡c sai sŁ 1 ; :::; n th… ºc l“p vîi nhau
Ta thüc hi»n ph¥n t‰ch th°ng d÷ ” ki”m tra c¡c gi£ ành cıa mæ h…nh:
H…nh 21: code R v k‚t qu£ khi v‡ ç thà ph¥n t‰ch th°ng d÷ ” ki”m tra c¡c gi£ ành cıa mæ
h…nh
Trang 23ç thà thø 1 (Residuals vs Fitted) v‡ c¡c gi¡ trà dü b¡o vîi c¡c gi¡ trà th°ng d÷ (sai sŁ) t÷ìng øng,dòng ” ki”m tra t‰nh tuy‚n t‰nh cıa dœ li»u (gi£ ành 1) v t‰nh çng nh§t cıa c¡c ph÷ìng sai sai sŁ(gi£ ành 3) N‚u nh÷ gi£ ành v• t‰nh tuy‚n t‰nh cıa dœ li»u KH˘NG thäa, ta s‡ quan s¡t th§y r‹ngc¡c i”m th°ng d÷ (residuals) tr¶n ç thà s‡ ph¥n bŁ theo mºt h…nh m¤u (pattern) °c tr÷ng n o â (v‰
dö parabol) N‚u ÷íng m u ä tr¶n ç thà ph¥n t¡n l ÷íng thflng n‹m ngang m khæng ph£i
l ÷íng cong, th… gi£ ành t‰nh tuy‚n t‰nh cıa dœ li»u ÷æc thäa m¢n ” ki”m tra gi£ ành thø 3(ph÷ìng sai çng nh§t) th… c¡c i”m th°ng dü ph£i ph¥n t¡n •u nhau xung quanh ÷íng thflng y = 0
ç thà thø 2 (Normal Q-Q) cho ph†p ki”m tra gi£ ành v• ph¥n phŁi chu'n cıa c¡c sai sŁ N‚u c¡c i”mth°ng d÷ n‹m tr¶n còng 1 ÷íng thflng th… i•u ki»n v• ph¥n phŁi chu'n ÷æc thäa
ç thà thø 3 (Scale - Location) v‡ c«n b“c hai cıa c¡c gi¡ trà th°ng d÷ ÷æc chu'n hâa vîi c¡c gi¡ trà
dü b¡o, ÷æc dòng ” ki”m tra gi£ ành thø 3 (ph÷ìng sai cıa c¡c sai sŁ l h‹ng sŁ) N‚u nh÷ ÷íng m u ätr¶n ç thà l ÷íng thflng n‹m ngang v c¡c i”m th°ng d÷ ph¥n t¡n •u xung quanh ÷íng thflng n y th… gi£ành thø 3 ÷æc thäa N‚u nh÷ ÷íng m u ä câ º dŁc (ho°c cong) ho°c c¡c i”m th°ng d÷ ph¥n t¡n khæng
•u xung quanh ÷íng thflng n y, th… gi£ ành thø 3 bà vi ph⁄m
ç thà thø 4 (Residuals vs Leverage) cho ph†p x¡c ành nhœng i”m câ £nh h÷ðng cao (influen-tialobservations), n‚u chóng câ hi»n di»n trong bº dœ li»u Nhœng i”m câ £nh h÷ðng cao n y câ th”
l c¡c i”m outliers, l nhœng i”m câ th” g¥y nhi•u £nh h÷ðng nh§t khi ph¥n t‰ch dœ li»u N‚u nh÷ taquan s¡t th§y mºt ÷íng thflng m u ä øt n†t (Cook’s distance), v câ mºt sŁ i”m v÷æt qua ÷íng thflngkho£ng c¡ch n y, ngh¾a l c¡c i”m â l c¡c i”m câ £nh h÷ðng cao N‚u nh÷ ta ch¿ quan s¡t th§y ÷íngthflng kho£ng c¡ch Cook ð gâc cıa ç thà v khæng câ i”m n o v÷æt qua nâ, ngh¾a khæng câ i”m n othüc sü câ £nh h÷ðng cao
Nh“n x†t:
+ ç thà Normal Q-Q cho th§y gi£ ành sai sŁ câ ph¥n phŁi chu'n thäa m¢n
+ ç thà thø 1 (Residuals vs Fitted) cho th§y gi£ ành v• t‰nh tuy‚n t‰nh cıa dœ li»u ch÷a thüc sütho£ m¢n
+ ç thà thø 1 v thø 3 (Scale - Location) cho ta th§y r‹ng gi£ ành v• t‰nh çng nh§t cıa ph÷ìng sai t÷ìng Łi tho£ m¢n
+ ç thà thø 4 ch¿ ra câ c¡c quan tr›c thø 18877, 3915 v 13529 câ th” l c¡c i”m câ £nh h÷ðng cao trong bº dœ li»u
1.3.5 Thüc hi»n dü b¡o cho gi¡ nh qu“n King
Düa tr¶n mæ h…nh hçi quy ta x¥y düng, h¢y dü b¡o gi¡ mºt ngæi nh câ:
+ 2 tƒng
+ i•u ki»n ki‚n tróc ngæi nh : 3
+ ¡nh gi¡ quang c£nh ngæi nh : 0
+ Di»n t‰ch ngæi nh : 2170 m2
+ Di»n t‰ch khuæn vi¶n nh 2570 m2
+ Di»n t‰ch tƒng hƒm 400 m2