Khai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arima
Trang 1CHUYÊN NGÀNH: KINH T
, THÁNG 5 N M 2016
Trang 2ThS
, THÁNG 5 N M 2016
Trang 3tài do chúng tôi Tr c và Nguy n
M i s li u thu th p c và k t qu c a bài khóa lu c công b
b t c công trình nghiên c u nào khác
Chúng tôi xin ch u trách nhi m v nghiên c u c a mình
TP H Chí Minh, ngày 04 tháng 5
Sinh viên th c hi nNguy n Trung Phú
Trang 4khó có th tránh kh i nh ng thi u xót, kính mong quý th y cô góp ý nh em
có th hoàn thi n bài khóa lu n này t a
TP H Chí Minh, ngày 04 tháng 5
Sinh viên th c hi nNguy n Trung Phú
Trang 5LÝ THUY T VÀ MÔ HÌNH ARIMA 1
1.1.BÀI TOÁN D BÁO
Trang 6c phát tri n mô hình ARIMA1.4 PH N M M NG D NG EVIEWS
3.4 Nh n d ng mô hình
3.5 ng và ki nh v i mô hình ARIMA
3.6 Th c hi n d báo
K T LU N 46 TÀI LI U THAM KH O 47
PH L C 48
Trang 7DANH M C CÁC T VI T T T
T : Thành ph ng dài h n (Long term Trend Component)
S : Thành ph n mùa (Seasional Component)
C : Thành ph n chu k (Cyclical Component)
AIC : Tiêu chu n Akaike
BIC : Tiêu chu n Schwarz
Trang 8MAE : Trung bình sai s tuy i
MSE
Trang 12DANH M
Trang 13c nhi i quan tâm trong b i c nh phát tri n kinh t xã h i B i
ng ch i nhi u kinh nghi m và hi u bi t t các
t khai phá d li c áp d ng t các ph n mtrình chuyên d ng nh m d báo s ng c a th ng là m t g
c m t s n c thi hành mô hình ARIMA b ng Eviews 8.0
và áp d ng vào bài toán khai phá d li u chu i th i gian trong d báo tài chính,
ch ng khoán
3 N i dung nghiên c u
Trong khóa lu n này, chúng tôi t p trung nghiên c u c phát tri n c a
mô hình ARIMA và áp d ti n hành d báo tài chính, ch ng
i s h tr c a ph n m m Eviews 8.0
Trang 14ng c a th ng ch ng khoán) B c c bài khóa lu
LÝ THUY T VÀ MÔ HÌNH ARIMA
C TR NG C A V NGHIÊN C U
Trang 15: LÝ THUY T VÀ MÔ HÌNH ARIMA
c n lý thuy n v chu i th
s lý thuy t và các y u t
t ng ph n PACF, mô hình t h i quy AR(p), mô hình trung bình
t MA(q), sai phân I(d) Gi i thi c phát tri n c a mô hình ARIMA
- c v ph n m m Eviews 8.0 và m t s thao tác
n ph c v cho bài toán d báo tài chính
1.1 Bài toán d báo
Cùng v i s phát tri n không ng ng c a khoa h c k thu i
s ng, kinh t - xã h i trong nhi u th p k qua c n b không
i vi c ng d ng các s n ph m trí tu i s ng
i ngày càng quen thu c M t trong nh ng hành vi h u ích cho n n
c a t ng th ng d ng vào quá trình phân tích và nghiên c u th
ph i làm gì v n ti p t c ghi nh n, thu th p vì trong
ng c i ta ngày càng c n có nhi u thông tin v i t
tr giúp vi c ra quy nh và ngày càng có nhi u câu h i mang tính ch nh tính
Trang 16K thu t phát hi n tri th c và khai phá d li c nghiên c u, ng
d ng trong nhi c khác nhau c trên th gi i, t i Vi t Nam k thu t
o ra m t cu c cách m ng trong mô hình hóa các quan h cân b ng, ng
D báo là m t nhu c u không th thi u cho nh ng ho ng c i trong b i c nh bùng n thông tin trong n n kinh t h i nh p D báo s cung c p
nh c n thi t cho các ho nh, và có th nói r ng n u không có khoa h c
d báo thì nh ng d n i v ch ra s không có s thuy t
Trong công tác phân tích d báo, v quan tr u c t ra là vi c
Trang 17qu d báo s c liên quan nh
i th i gian s d a trên vi c phân tích chu i quan sát c a m t
bi n duy nh t theo bi n s c l p là th i gian Gi nh ch y u là bi n s d báo
s gi nguyên chi ng phát tri y ra trong quá kh và hi n t i
Khóa lu n t p trung nghiên c th c hi n phân tích d li u
liên k t, t h i quy ARIMA (AutoRegressive Integrate Moving Average) do G P
ARIMA là mô hình d ng theo th i gian, giá tr a bi n s
a các d li
quan sát và ki m tra các tham s c l tìm ra mô hình thích h p Mô hình
k t qu c a quá trình trên g m các tham s th hi n m li u,
Trang 181.2 D li u chu i th i gian
Chu i th i gian trong th ng kê, x lý tín hi u, kinh t ng và toán tài chính là
m t chu m d li ng kho ng kh c th i gian li n nhau theo
1.2.1 Khái ni m chu i th i gian th c
Chu i th i gian th c (chu i th i gian) là t p h p c a m t bi n s c quan sát theo trình t th n s theo th i gian có 2 lo i: s li u th i k và s
li u th m
Chu i th i gian c a bi c ký hi u là , v i Yt là giá tr c a bi n Y t i
Trên lý thuy t, chu i th i gian có th là liên t c, các bi n s kinh t - xã h i v n
ng liên t c theo th i gian, do v c xây d ng t ng quát cho bi n liên t c Tuy nhiên, trong th ng kê và th c t , không có s li u liên t c mà ch có
k t qu thông tin t i cu i các th i k nh ho c các th nh
Ví d 1 M ng v n c a Vietcombank chi nhánh Qu n 5 t
Các thành ph n c a d li u chu i th i gian [1,trang 81]
Các nhà th ng chia chu i theo th i gian thành 4 thành ph n:
Trang 19Thành ph ng dài h n (Long term Trend Component) - T
Thành ph n mùa (Seasional Component) - S
Thành ph n chu k (Cyclical Component) - C
Trang 21Hình 3 Thành ph n chu k
1.2.5 Thành ph n b ng
th i gian S i này không th d ng các s li u kinh nghi m trong quá kh , v m t b n ch t thành ph n này không có tính chu k
1.3 Mô hình ARIMA
Trong mô hình ARIMA, hàm t
(PACF) là nh ng không th thi u chu i th i gian bên
Trang 22trong m u:
0
k k
Do SACF là hàm tính trong m u, không hoàn toàn gi ng ACF c a t ng th , nên giá tr có th có sai l ch, tuy nhiên khi s mang nhi c tính c a t ng th
ki nh s b ng 0 c a nhi u giá tr hàm ACF, t n ACF(k) có
Trang 23( )
1
k
k k j k j j
kk k
k j j j
1
k
k j
k k j j
kk k
j
k j j
V n m c bi t là Eviews thì các giá tr SACF(k), SPACF(k), th ng kê Q(k) và P- ng c a ki c tính
l t c t 1 là th c a c a giá tr SACF(k), k th c a SPACF(k) v i
Trang 24ng g t thì có th nói 0 Các giá tr trong các
c t còn l i l t là giá tr c a SACF(k), SPACF(k), th ng kê Q và P-value
còn v i nh ng b c k = 3 tr v sau thì ACF và PACF có th cho là b
có th nói là chu i d ng i v i chu i th i gian không d u
th n m ra phía ngoài bên ph ng t i h n v i t t c các b c và SACF(k) gi m ch m
Trang 25ng h p t ng quát AR(p) chu i d ng khi 1Chu i AR(1) : = + +
Trang 26Nói cách khác, chu t là t ng h p t các nhi u tr ng, trong kinh
b i mô hình h c g i là nh ng cú s c kinh t
u ki n c n c a mô hình MA(q) d ng là < 1
Mô hình MA(1): = + +
Mô hình MA(2): = + + + [3, trang 474]
1.3.5 Sai phân I(d)
M t chu i th i gian n u có trung bình (E( ) = (Var( ) =
= E[( ) - ]) gi a hai th n ch ph thu c vào kho
tr v th i gian gi a hai th n này ch không ph thu c vào th m th c t
c coi là chu i d ng
Sai phân ch s chênh l ch gi a giá tr hi n t i và giá tr a
vi c l y sai phân là làm nh giá tr trung bình c a chu i d li u và chuy i chu i th i gian không d ng thành chu i d ng
Xét m ng tuy n tính có d ng = + t Sai phân b c nh t c a
Trang 27M t d ng xu t hi
b ng cách l y sai phân thích h p = - i v i d li u theo quý và =
- i v i d li u theo tháng [3, trang 462, 492]
1.3.6 Mô hình ARIMA
Mô hình ARMA là mô hình c a m t chu i d ng, v i hai thành ph n là t h i
c t h u h t các chu i th u không d ng, nên y u t
th n là tích h bi n chu i th i gian không d ng thành chu i
d ng
ARIMA là mô hình phân tích và mô ph ng m t chu i th i gian g m các quá
t c g i là chu i ARIMA, hay chu i t h i quy
Trang 28ch t bi ng c a chu i thông qua bi ng trong quá kh , và d báo cho chu i vào các th i kì sau.
có th g i mô hình là IARMA Xét chu i , n u chu i là tích h p b c d: I(d) thì sau khi l y sai phân d l n thì chu i s d ng Trong th c t v i chu i không
x y ra, do v ng ch l y sai phân b c nh t là có th c chu i d ng V i
Trang 291.3.7 c phát tri n mô hình ARIMA
Box-Jenkin là 1 th t nh các b c c a mô hình ARIMA Th t c bao g
ng ph i v i nh ng chu i th i gian không d ng thì ta
ph i chuy n nó thành chu i d ng, vi c chuy c th c hi n b ng cách
ti n hành sai phân gi a nh ng giá tr quan sát d l ng th c hi n hai l n sai phân thì ta s c chu i d ng
ng mô hình: nh các tham s , c a mô hình
Ki phù h p và d báo: vi phù h p c a mô hình thông qua ki nh chu i ph u tr ng hay không N u ph
Trang 30giá k t qu
S
li u
nh
b c p, d, q
ng mô hình
nh b c
I(d)
Trang 31ng mô hình, b c nào không phù h p thì h s ng s không có
h c Kinh t Vi t Nam nói riêng và các c công nghi p phát tri n nói chung Nó
là m t phiên bi n m i c a các công c phân tích chu i th i gian do Công ty Time Series Processor Software phát tri n cho các máy tính l n Eviews có phiên b n
c so n th o l ù Eviews do các nhà kinh t phát tri n các ng d ng c a nó n c kinh t ,
n ích c a nó không ch gi i h n trong kinh t trong phân tích chu i th i gian mà nó r t ti n l i khi phân tích các s li u chéo, các s li u khoa h c khác
M t s ng d ng ph bi n c a Eviews là tìm ra các quan h th ng kê, h i quy
Phân tích chi phí và d báo
Trang 32góc trên bên trái có bi ng gi ng
ph n m m khác trong Windows, góc trên bên ph i có ba nút , ,
T o ra m t Workfile
t o m t Workfile trong Eviews thì màn hình chính v a m ta ch n
File/New/Workfile ho c nh n t h p phím (Ctrl + N).
Trang 33Hình 5 Thao tác t o Workfile
Sau khi th c hi n thao tác trên thì c a s Workfile Create s c t o ra trong ph n mô t c u trúc c a d li u Workfile structure type ta ch n Dated regular frequency i v i d li u là th i v i d li n thì ta ch n
Balanced Panel, ch n Unstructured/Undated cho nh ng h p còn l i i
v i d li u th i gian, n u s li u c a b Frequency ch n Annual,
m b u và th m k t thúc Start date End date
Hình 6 L a ch n lo i d li u trong Workfile
Trang 35Hình 8 C a s Open trong Eviews
a s Excel Read xu t hi n g
c 1: Cell Range dùng ch n ph c d li u, n u mu n l y toàn
b d li u trong Sheet thì ch n Predefined range, ch n Custom range n u mu n
gi i h n d li u Ch n Next.
Hình 9 C a s Excel Read c 1
Trang 36c 2: Trong ô Name i tên c a các c t trong d
Trang 38T o m t bi n m i
t o m t bi n m i ta click ch n Genr r i nh p hàm c n chuy i Enter equation Ch ng h Loggiadongcua=log(giadongcua) bi n Loggiadongcua s c t o thành v i giá tr b ng log c a bi n giadongcua
M t s hàm và phép toán trong Eviews
Phép toán: Gi t s ph n m m th ng kê kinh t
c trang b m t s phép toán s h -,*,/ Bên c tính toán
m t chu i t nh ng chu i có s n b ng nh ng phép toán trên, ví d
Trang 39m chu i d li u, ch n View/Graph/ Line & Symbol N u bi ng n
nh quanh giá tr trung bình c a chu i thì có th cho là chu i d ng
Ki nh nghi
V i c p gi thuy t
: Chu i có nghi , là chu i không d ng
: Chu i không có nghi , là chu i d ng
486-487]
Trang 40nh các b c p, d, q c a mô hình thông qua bi
View/Correlogram n s tr c n xem
Ch n mô hình AR(p) n th PACF có giá tr cao t tr
gi u sau p và d ng hàm ACF gi m d n
Ch n mô hình MA(q) n th ACF có giá tr cao t tr
gi m nhi u sau q và d ng hàm PACF gi m d n Tóm l i:
màn hình chính ch n Quick/Estimate Equation và gõ mô hình vào c a
s Equation Estimate v i các b c nh trong 2.2.2.1
Trang 41Hình 15 ng mô hình trong c a s Equation Estimation
Hình 16 K t qu ng mô hình
Trang 42Tiêu chu n Akaike: AIC ln( 2) 2(p q) /n
Tiêu chu n Schwarz: BIC ln( 2) 2(p q) ln(n) / n
V i là sai s chu n c a mô hình
Mô hình nào có giá tr AIC và BIC nh c coi là phù h
phù h p c a các b n Ngoài ra, l a ch n mô hình có l n và d a vào
Trang 43e h
1
h
T i i
Sai s d báo:e T i Y T i Y T i (i 1, )h
ng trên càng nh thì càng chính xác, giá tr d báo càng g n v i
th c t [3, trang 520-521]
Trang 44Tóm t
c hi t v chu i th i gian, thành
ph n c a chu i th n xu th dài h n, thành ph n chu k , thành
ph n mùa v , thành ph n b ng Tìm hi lý thuy t và các y u t trong
sai phân I(d), mô hình t h i quy tích h p - t ARIMA
c v ph n m m Eviews 8.0 và m t s thao tác ph c v cho bài toán d báo
b ng mô hình ARIMA
Trang 452: TH C TR NG C A V NGHIÊN C U
n gi i thi u v d li u tài chính c a T ng CTCP Khoan và D ch v Khoan D u khí (Mã CK: PVD), ngu n g c, thu c tính và các
m c a chu i ch ng khoán PVD trong n 28/12/2015
3.1 D li u tài chính
D li u chúng ta c n quan tâm trong bài toán d báo b ng mô hình ARIMA là
d li u chu i th i gian Chu i th i gian c a bi c kí hi u là { }, v i là
, n
M t chu i d li u n u có c t th i gian c th ng v i nh ng giá tr quan sát thì
c g i là chu i th i gian th c (ph n 1.2.1) M a vi c phân tích chu i
th i gian th c là d a trên các giá tr c a bi n quan sát trong quá kh
D li u ch c bi m t chu i th i gian ng b i có nhi u thu c ghi t i cùng m t th Xét d li u ch ng khoán
c a T ng CTCP Khoan và D ch v Khoan D u khí là chu i th ng v i các thu
Open: Giá c phi u t i th m m c a trong ngày
High: Giá c phi u cao nh t trong ngày
Low: Giá c phi u th p nh t trong ngày
Close: Giá c phi c niêm y t t i th a sàn giao d chVolume: kh ng giao d ch c phi u (bán, mua) trong ngày
D li u ch ng khoán c a T ng CTCP Khoan và D ch v Khoan D u khí (Mã
c l y t :
Trang 46Nhìn chung chu i ch ng khoán PVD có chi ng gi n t
n 28/12/2015
Trang 47a cao nh t là 58.5 vào 13/07/2015 và th p nh t là 26.2 vào 18/12/2015 M c chênh l a gi u và cu i hai th m quan sát
m c nh c a d li u quanh giá tr trung bình càng th p, m bi n thiên c a
chu i không d ng
Tóm t
c hi d li u tài chính c a T ng CTCP Khoan và D ch v Khoan D u khí (Mã CK: PVD), ngu n g c, thu c tính và các
Trang 50Ki nh nghi
V i m =1% thì | | = 3.486551 l | | = 3.17888 nên chu i PVD có nghi hay là chu i không d ng
Trang 51Hình 24 Bi a sai phân b c 1
Ti p theo, khóa lu n s ti n hành ki nh nghi cho chu i sai phân
Hình 25 Ki nh nghi chu i sai phân b c 1
Ta th y | | = 7.656366 l | v i m
chu i d ng
Trang 52Hình 26 Bi quan a sai phân b c 1Khi l y sai phân b c chu i d ng: V i d =1 thì ACF gi m nhanh v
V y mô hình d tính là ARIMA(1,1,1)
3 ng và ki nh v i mô hình ARIMA
Ta ti ng cho mô hình ARIMA(1,1,1)
màn hình chính ch n Quick/Estimate Equation, gõ dgiadongcua c ar(1) ma(1) d(giadongcua) c ar(1) ma(1)
Trang 53Hình 27 ng mô hình ARIMA(1,1,1)
Hình 28 K t qu ng mô hình ARIMA(1,1,1)
Trang 54Ti p theo, ch n View/Residual Diagnostics/Correlogram - Q statistics
ki m tra chu i ph u tr ng hay không
Trang 55Hình 30 K t qu ng mô hình ARIMA(1,1,2)
Hình 31 K t qu c ng mô hình ARIMA(1,2,1)
Trang 56và BIC nh và R- Squared l d báo.
3.6 Th c hi n d báo
c tiên, chúng ta c ng quan sát
T i c a s Workfile ch n Proc/Structure/Resize Current Page
Trang 58Hình 35 D báo mô hình ARIMA(1,1,1)
u ch nh ngày d báo t : 28/12/2015 1/01/2016 t i Forecast sample
c k t qu d báo
Hình 36 K t qu d báo mô hình ARIMA(1,1,1)
Ta ti n hành l y s li a th c t c a 4 ngày t 29/12/2015
sai l ch d báo
Trang 59Ngày Giá th c t Giá d báo
Nh n xét: Qua k t qu d báo 4 ngày t t 29/12/2015 1/01/2016, có th
nh n th y giá d báo luôn l c t , k t qu d báo là g n chính xác, chênh l i nh so v i giá th c t c a mã ch ng khoán PVD Trong 4 th i
m d báo trên ch có ngày 30/12/2015 là có sai l ch nh nh
t Có th nh nh r ng mô hình ARIMA(1,1,1) là khá phù h d báo cho mã ch ng khoán PVD
Tóm t
i thi u v ng th c nghi m ph n m m Eviews 8.0, d
li u vào là giá ch ng khoán c a T ng CTCP khoan và d ch v khoan d u khí (mã CK: PVD) và ch a làm bi n d báo
ARIMA(1,1,1) c ch n là phù h p và k t qu d báo i chính xác so v i
th c t
Trang 60K T LU N
Qua quá trình th c hi n khóa lu n t t nghi m b c quy trình xây d ng mô hình ARIMA và áp d ng mô hình này vào bài toán th c t là dbáo tài chính
Nh ng k t qu chính mà khóa lu c, c th :
Nghiên c u m t s n i dung lý thuy n v chu i th i gian, v mô hình ARIMA và v ph n m áp d ng cho bài toán d báo tài chính, ch ng khoán
N m b t m t s n trên ph n m m Eviews và quy trình s d ng
ti n hành d báo tài chính b ng mô hình ARIMA
S d ti n hành xây d ng mô hình ARIMA và th c hi n d báo
Nh ng n i dung c c nghiên c phát tri n khóa lu n:
Xây d n, giá ch ng khoán ph thu c vào nhi u
bi n khác nhau
báo chính xác nh t