1. Trang chủ
  2. » Khoa Học Tự Nhiên

Khai thác dữ liệu quan hệ trong tài chính bằng mô hình arima (Khóa luận tốt nghiệp)

64 117 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 64
Dung lượng 6,73 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arimaKhai thác dữ liệu quan hệ trong tài chính bằng mô hình arima

Trang 1

CHUYÊN NGÀNH: KINH T

, THÁNG 5 N M 2016

Trang 2

ThS

, THÁNG 5 N M 2016

Trang 3

tài do chúng tôi Tr c và Nguy n

M i s li u thu th p c và k t qu c a bài khóa lu c công b

b t c công trình nghiên c u nào khác

Chúng tôi xin ch u trách nhi m v nghiên c u c a mình

TP H Chí Minh, ngày 04 tháng 5

Sinh viên th c hi nNguy n Trung Phú

Trang 4

khó có th tránh kh i nh ng thi u xót, kính mong quý th y cô góp ý nh em

có th hoàn thi n bài khóa lu n này t a

TP H Chí Minh, ngày 04 tháng 5

Sinh viên th c hi nNguy n Trung Phú

Trang 5

LÝ THUY T VÀ MÔ HÌNH ARIMA 1

1.1.BÀI TOÁN D BÁO

Trang 6

c phát tri n mô hình ARIMA1.4 PH N M M NG D NG EVIEWS

3.4 Nh n d ng mô hình

3.5 ng và ki nh v i mô hình ARIMA

3.6 Th c hi n d báo

K T LU N 46 TÀI LI U THAM KH O 47

PH L C 48

Trang 7

DANH M C CÁC T VI T T T

T : Thành ph ng dài h n (Long term Trend Component)

S : Thành ph n mùa (Seasional Component)

C : Thành ph n chu k (Cyclical Component)

AIC : Tiêu chu n Akaike

BIC : Tiêu chu n Schwarz

Trang 8

MAE : Trung bình sai s tuy i

MSE

Trang 12

DANH M

Trang 13

c nhi i quan tâm trong b i c nh phát tri n kinh t xã h i B i

ng ch i nhi u kinh nghi m và hi u bi t t các

t khai phá d li c áp d ng t các ph n mtrình chuyên d ng nh m d báo s ng c a th ng là m t g

c m t s n c thi hành mô hình ARIMA b ng Eviews 8.0

và áp d ng vào bài toán khai phá d li u chu i th i gian trong d báo tài chính,

ch ng khoán

3 N i dung nghiên c u

Trong khóa lu n này, chúng tôi t p trung nghiên c u c phát tri n c a

mô hình ARIMA và áp d ti n hành d báo tài chính, ch ng

i s h tr c a ph n m m Eviews 8.0

Trang 14

ng c a th ng ch ng khoán) B c c bài khóa lu

LÝ THUY T VÀ MÔ HÌNH ARIMA

C TR NG C A V NGHIÊN C U

Trang 15

: LÝ THUY T VÀ MÔ HÌNH ARIMA

c n lý thuy n v chu i th

s lý thuy t và các y u t

t ng ph n PACF, mô hình t h i quy AR(p), mô hình trung bình

t MA(q), sai phân I(d) Gi i thi c phát tri n c a mô hình ARIMA

- c v ph n m m Eviews 8.0 và m t s thao tác

n ph c v cho bài toán d báo tài chính

1.1 Bài toán d báo

Cùng v i s phát tri n không ng ng c a khoa h c k thu i

s ng, kinh t - xã h i trong nhi u th p k qua c n b không

i vi c ng d ng các s n ph m trí tu i s ng

i ngày càng quen thu c M t trong nh ng hành vi h u ích cho n n

c a t ng th ng d ng vào quá trình phân tích và nghiên c u th

ph i làm gì v n ti p t c ghi nh n, thu th p vì trong

ng c i ta ngày càng c n có nhi u thông tin v i t

tr giúp vi c ra quy nh và ngày càng có nhi u câu h i mang tính ch nh tính

Trang 16

K thu t phát hi n tri th c và khai phá d li c nghiên c u, ng

d ng trong nhi c khác nhau c trên th gi i, t i Vi t Nam k thu t

o ra m t cu c cách m ng trong mô hình hóa các quan h cân b ng, ng

D báo là m t nhu c u không th thi u cho nh ng ho ng c i trong b i c nh bùng n thông tin trong n n kinh t h i nh p D báo s cung c p

nh c n thi t cho các ho nh, và có th nói r ng n u không có khoa h c

d báo thì nh ng d n i v ch ra s không có s thuy t

Trong công tác phân tích d báo, v quan tr u c t ra là vi c

Trang 17

qu d báo s c liên quan nh

i th i gian s d a trên vi c phân tích chu i quan sát c a m t

bi n duy nh t theo bi n s c l p là th i gian Gi nh ch y u là bi n s d báo

s gi nguyên chi ng phát tri y ra trong quá kh và hi n t i

Khóa lu n t p trung nghiên c th c hi n phân tích d li u

liên k t, t h i quy ARIMA (AutoRegressive Integrate Moving Average) do G P

ARIMA là mô hình d ng theo th i gian, giá tr a bi n s

a các d li

quan sát và ki m tra các tham s c l tìm ra mô hình thích h p Mô hình

k t qu c a quá trình trên g m các tham s th hi n m li u,

Trang 18

1.2 D li u chu i th i gian

Chu i th i gian trong th ng kê, x lý tín hi u, kinh t ng và toán tài chính là

m t chu m d li ng kho ng kh c th i gian li n nhau theo

1.2.1 Khái ni m chu i th i gian th c

Chu i th i gian th c (chu i th i gian) là t p h p c a m t bi n s c quan sát theo trình t th n s theo th i gian có 2 lo i: s li u th i k và s

li u th m

Chu i th i gian c a bi c ký hi u là , v i Yt là giá tr c a bi n Y t i

Trên lý thuy t, chu i th i gian có th là liên t c, các bi n s kinh t - xã h i v n

ng liên t c theo th i gian, do v c xây d ng t ng quát cho bi n liên t c Tuy nhiên, trong th ng kê và th c t , không có s li u liên t c mà ch có

k t qu thông tin t i cu i các th i k nh ho c các th nh

Ví d 1 M ng v n c a Vietcombank chi nhánh Qu n 5 t

Các thành ph n c a d li u chu i th i gian [1,trang 81]

Các nhà th ng chia chu i theo th i gian thành 4 thành ph n:

Trang 19

Thành ph ng dài h n (Long term Trend Component) - T

Thành ph n mùa (Seasional Component) - S

Thành ph n chu k (Cyclical Component) - C

Trang 21

Hình 3 Thành ph n chu k

1.2.5 Thành ph n b ng

th i gian S i này không th d ng các s li u kinh nghi m trong quá kh , v m t b n ch t thành ph n này không có tính chu k

1.3 Mô hình ARIMA

Trong mô hình ARIMA, hàm t

(PACF) là nh ng không th thi u chu i th i gian bên

Trang 22

trong m u:

0

k k

Do SACF là hàm tính trong m u, không hoàn toàn gi ng ACF c a t ng th , nên giá tr có th có sai l ch, tuy nhiên khi s mang nhi c tính c a t ng th

ki nh s b ng 0 c a nhi u giá tr hàm ACF, t n ACF(k) có

Trang 23

( )

1

k

k k j k j j

kk k

k j j j

1

k

k j

k k j j

kk k

j

k j j

V n m c bi t là Eviews thì các giá tr SACF(k), SPACF(k), th ng kê Q(k) và P- ng c a ki c tính

l t c t 1 là th c a c a giá tr SACF(k), k th c a SPACF(k) v i

Trang 24

ng g t thì có th nói 0 Các giá tr trong các

c t còn l i l t là giá tr c a SACF(k), SPACF(k), th ng kê Q và P-value

còn v i nh ng b c k = 3 tr v sau thì ACF và PACF có th cho là b

có th nói là chu i d ng i v i chu i th i gian không d u

th n m ra phía ngoài bên ph ng t i h n v i t t c các b c và SACF(k) gi m ch m

Trang 25

ng h p t ng quát AR(p) chu i d ng khi 1Chu i AR(1) : = + +

Trang 26

Nói cách khác, chu t là t ng h p t các nhi u tr ng, trong kinh

b i mô hình h c g i là nh ng cú s c kinh t

u ki n c n c a mô hình MA(q) d ng là < 1

Mô hình MA(1): = + +

Mô hình MA(2): = + + + [3, trang 474]

1.3.5 Sai phân I(d)

M t chu i th i gian n u có trung bình (E( ) = (Var( ) =

= E[( ) - ]) gi a hai th n ch ph thu c vào kho

tr v th i gian gi a hai th n này ch không ph thu c vào th m th c t

c coi là chu i d ng

Sai phân ch s chênh l ch gi a giá tr hi n t i và giá tr a

vi c l y sai phân là làm nh giá tr trung bình c a chu i d li u và chuy i chu i th i gian không d ng thành chu i d ng

Xét m ng tuy n tính có d ng = + t Sai phân b c nh t c a

Trang 27

M t d ng xu t hi

b ng cách l y sai phân thích h p = - i v i d li u theo quý và =

- i v i d li u theo tháng [3, trang 462, 492]

1.3.6 Mô hình ARIMA

Mô hình ARMA là mô hình c a m t chu i d ng, v i hai thành ph n là t h i

c t h u h t các chu i th u không d ng, nên y u t

th n là tích h bi n chu i th i gian không d ng thành chu i

d ng

ARIMA là mô hình phân tích và mô ph ng m t chu i th i gian g m các quá

t c g i là chu i ARIMA, hay chu i t h i quy

Trang 28

ch t bi ng c a chu i thông qua bi ng trong quá kh , và d báo cho chu i vào các th i kì sau.

có th g i mô hình là IARMA Xét chu i , n u chu i là tích h p b c d: I(d) thì sau khi l y sai phân d l n thì chu i s d ng Trong th c t v i chu i không

x y ra, do v ng ch l y sai phân b c nh t là có th c chu i d ng V i

Trang 29

1.3.7 c phát tri n mô hình ARIMA

Box-Jenkin là 1 th t nh các b c c a mô hình ARIMA Th t c bao g

ng ph i v i nh ng chu i th i gian không d ng thì ta

ph i chuy n nó thành chu i d ng, vi c chuy c th c hi n b ng cách

ti n hành sai phân gi a nh ng giá tr quan sát d l ng th c hi n hai l n sai phân thì ta s c chu i d ng

ng mô hình: nh các tham s , c a mô hình

Ki phù h p và d báo: vi phù h p c a mô hình thông qua ki nh chu i ph u tr ng hay không N u ph

Trang 30

giá k t qu

S

li u

nh

b c p, d, q

ng mô hình

nh b c

I(d)

Trang 31

ng mô hình, b c nào không phù h p thì h s ng s không có

h c Kinh t Vi t Nam nói riêng và các c công nghi p phát tri n nói chung Nó

là m t phiên bi n m i c a các công c phân tích chu i th i gian do Công ty Time Series Processor Software phát tri n cho các máy tính l n Eviews có phiên b n

c so n th o l ù Eviews do các nhà kinh t phát tri n các ng d ng c a nó n c kinh t ,

n ích c a nó không ch gi i h n trong kinh t trong phân tích chu i th i gian mà nó r t ti n l i khi phân tích các s li u chéo, các s li u khoa h c khác

M t s ng d ng ph bi n c a Eviews là tìm ra các quan h th ng kê, h i quy

Phân tích chi phí và d báo

Trang 32

góc trên bên trái có bi ng gi ng

ph n m m khác trong Windows, góc trên bên ph i có ba nút , ,

T o ra m t Workfile

t o m t Workfile trong Eviews thì màn hình chính v a m ta ch n

File/New/Workfile ho c nh n t h p phím (Ctrl + N).

Trang 33

Hình 5 Thao tác t o Workfile

Sau khi th c hi n thao tác trên thì c a s Workfile Create s c t o ra trong ph n mô t c u trúc c a d li u Workfile structure type ta ch n Dated regular frequency i v i d li u là th i v i d li n thì ta ch n

Balanced Panel, ch n Unstructured/Undated cho nh ng h p còn l i i

v i d li u th i gian, n u s li u c a b Frequency ch n Annual,

m b u và th m k t thúc Start date End date

Hình 6 L a ch n lo i d li u trong Workfile

Trang 35

Hình 8 C a s Open trong Eviews

a s Excel Read xu t hi n g

c 1: Cell Range dùng ch n ph c d li u, n u mu n l y toàn

b d li u trong Sheet thì ch n Predefined range, ch n Custom range n u mu n

gi i h n d li u Ch n Next.

Hình 9 C a s Excel Read c 1

Trang 36

c 2: Trong ô Name i tên c a các c t trong d

Trang 38

T o m t bi n m i

t o m t bi n m i ta click ch n Genr r i nh p hàm c n chuy i Enter equation Ch ng h Loggiadongcua=log(giadongcua) bi n Loggiadongcua s c t o thành v i giá tr b ng log c a bi n giadongcua

M t s hàm và phép toán trong Eviews

Phép toán: Gi t s ph n m m th ng kê kinh t

c trang b m t s phép toán s h -,*,/ Bên c tính toán

m t chu i t nh ng chu i có s n b ng nh ng phép toán trên, ví d

Trang 39

m chu i d li u, ch n View/Graph/ Line & Symbol N u bi ng n

nh quanh giá tr trung bình c a chu i thì có th cho là chu i d ng

Ki nh nghi

V i c p gi thuy t

: Chu i có nghi , là chu i không d ng

: Chu i không có nghi , là chu i d ng

486-487]

Trang 40

nh các b c p, d, q c a mô hình thông qua bi

View/Correlogram n s tr c n xem

Ch n mô hình AR(p) n th PACF có giá tr cao t tr

gi u sau p và d ng hàm ACF gi m d n

Ch n mô hình MA(q) n th ACF có giá tr cao t tr

gi m nhi u sau q và d ng hàm PACF gi m d n Tóm l i:

màn hình chính ch n Quick/Estimate Equation và gõ mô hình vào c a

s Equation Estimate v i các b c nh trong 2.2.2.1

Trang 41

Hình 15 ng mô hình trong c a s Equation Estimation

Hình 16 K t qu ng mô hình

Trang 42

Tiêu chu n Akaike: AIC ln( 2) 2(p q) /n

Tiêu chu n Schwarz: BIC ln( 2) 2(p q) ln(n) / n

V i là sai s chu n c a mô hình

Mô hình nào có giá tr AIC và BIC nh c coi là phù h

phù h p c a các b n Ngoài ra, l a ch n mô hình có l n và d a vào

Trang 43

e h

1

h

T i i

Sai s d báo:e T i Y T i Y T i (i 1, )h

ng trên càng nh thì càng chính xác, giá tr d báo càng g n v i

th c t [3, trang 520-521]

Trang 44

Tóm t

c hi t v chu i th i gian, thành

ph n c a chu i th n xu th dài h n, thành ph n chu k , thành

ph n mùa v , thành ph n b ng Tìm hi lý thuy t và các y u t trong

sai phân I(d), mô hình t h i quy tích h p - t ARIMA

c v ph n m m Eviews 8.0 và m t s thao tác ph c v cho bài toán d báo

b ng mô hình ARIMA

Trang 45

2: TH C TR NG C A V NGHIÊN C U

n gi i thi u v d li u tài chính c a T ng CTCP Khoan và D ch v Khoan D u khí (Mã CK: PVD), ngu n g c, thu c tính và các

m c a chu i ch ng khoán PVD trong n 28/12/2015

3.1 D li u tài chính

D li u chúng ta c n quan tâm trong bài toán d báo b ng mô hình ARIMA là

d li u chu i th i gian Chu i th i gian c a bi c kí hi u là { }, v i là

, n

M t chu i d li u n u có c t th i gian c th ng v i nh ng giá tr quan sát thì

c g i là chu i th i gian th c (ph n 1.2.1) M a vi c phân tích chu i

th i gian th c là d a trên các giá tr c a bi n quan sát trong quá kh

D li u ch c bi m t chu i th i gian ng b i có nhi u thu c ghi t i cùng m t th Xét d li u ch ng khoán

c a T ng CTCP Khoan và D ch v Khoan D u khí là chu i th ng v i các thu

Open: Giá c phi u t i th m m c a trong ngày

High: Giá c phi u cao nh t trong ngày

Low: Giá c phi u th p nh t trong ngày

Close: Giá c phi c niêm y t t i th a sàn giao d chVolume: kh ng giao d ch c phi u (bán, mua) trong ngày

D li u ch ng khoán c a T ng CTCP Khoan và D ch v Khoan D u khí (Mã

c l y t :

Trang 46

Nhìn chung chu i ch ng khoán PVD có chi ng gi n t

n 28/12/2015

Trang 47

a cao nh t là 58.5 vào 13/07/2015 và th p nh t là 26.2 vào 18/12/2015 M c chênh l a gi u và cu i hai th m quan sát

m c nh c a d li u quanh giá tr trung bình càng th p, m bi n thiên c a

chu i không d ng

Tóm t

c hi d li u tài chính c a T ng CTCP Khoan và D ch v Khoan D u khí (Mã CK: PVD), ngu n g c, thu c tính và các

Trang 50

Ki nh nghi

V i m =1% thì | | = 3.486551 l | | = 3.17888 nên chu i PVD có nghi hay là chu i không d ng

Trang 51

Hình 24 Bi a sai phân b c 1

Ti p theo, khóa lu n s ti n hành ki nh nghi cho chu i sai phân

Hình 25 Ki nh nghi chu i sai phân b c 1

Ta th y | | = 7.656366 l | v i m

chu i d ng

Trang 52

Hình 26 Bi quan a sai phân b c 1Khi l y sai phân b c chu i d ng: V i d =1 thì ACF gi m nhanh v

V y mô hình d tính là ARIMA(1,1,1)

3 ng và ki nh v i mô hình ARIMA

Ta ti ng cho mô hình ARIMA(1,1,1)

màn hình chính ch n Quick/Estimate Equation, gõ dgiadongcua c ar(1) ma(1) d(giadongcua) c ar(1) ma(1)

Trang 53

Hình 27 ng mô hình ARIMA(1,1,1)

Hình 28 K t qu ng mô hình ARIMA(1,1,1)

Trang 54

Ti p theo, ch n View/Residual Diagnostics/Correlogram - Q statistics

ki m tra chu i ph u tr ng hay không

Trang 55

Hình 30 K t qu ng mô hình ARIMA(1,1,2)

Hình 31 K t qu c ng mô hình ARIMA(1,2,1)

Trang 56

và BIC nh và R- Squared l d báo.

3.6 Th c hi n d báo

c tiên, chúng ta c ng quan sát

T i c a s Workfile ch n Proc/Structure/Resize Current Page

Trang 58

Hình 35 D báo mô hình ARIMA(1,1,1)

u ch nh ngày d báo t : 28/12/2015 1/01/2016 t i Forecast sample

c k t qu d báo

Hình 36 K t qu d báo mô hình ARIMA(1,1,1)

Ta ti n hành l y s li a th c t c a 4 ngày t 29/12/2015

sai l ch d báo

Trang 59

Ngày Giá th c t Giá d báo

Nh n xét: Qua k t qu d báo 4 ngày t t 29/12/2015 1/01/2016, có th

nh n th y giá d báo luôn l c t , k t qu d báo là g n chính xác, chênh l i nh so v i giá th c t c a mã ch ng khoán PVD Trong 4 th i

m d báo trên ch có ngày 30/12/2015 là có sai l ch nh nh

t Có th nh nh r ng mô hình ARIMA(1,1,1) là khá phù h d báo cho mã ch ng khoán PVD

Tóm t

i thi u v ng th c nghi m ph n m m Eviews 8.0, d

li u vào là giá ch ng khoán c a T ng CTCP khoan và d ch v khoan d u khí (mã CK: PVD) và ch a làm bi n d báo

ARIMA(1,1,1) c ch n là phù h p và k t qu d báo i chính xác so v i

th c t

Trang 60

K T LU N

Qua quá trình th c hi n khóa lu n t t nghi m b c quy trình xây d ng mô hình ARIMA và áp d ng mô hình này vào bài toán th c t là dbáo tài chính

Nh ng k t qu chính mà khóa lu c, c th :

Nghiên c u m t s n i dung lý thuy n v chu i th i gian, v mô hình ARIMA và v ph n m áp d ng cho bài toán d báo tài chính, ch ng khoán

N m b t m t s n trên ph n m m Eviews và quy trình s d ng

ti n hành d báo tài chính b ng mô hình ARIMA

S d ti n hành xây d ng mô hình ARIMA và th c hi n d báo

Nh ng n i dung c c nghiên c phát tri n khóa lu n:

Xây d n, giá ch ng khoán ph thu c vào nhi u

bi n khác nhau

báo chính xác nh t

Ngày đăng: 05/03/2018, 12:03

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w