1. Trang chủ
  2. » Khoa Học Tự Nhiên

Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA

64 413 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 64
Dung lượng 2,23 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài luận văn Toán ứng dụng chuyên ngành Kinh tế định lượng gồm 64 trang, bản đẹp, dễ dàng chỉnh sửa và tách trang làm tài liệu tham khảo. MỤC LỤC LỜI CAM ĐOAN…………………………………………………………………...i LỜI CẢM ƠN………………………………………………………………............ii MỤC LỤC…………………………………………………………………………iii DANH MỤC CÁC TỪ VIẾT TẮT………………………………………………..v DANH MỤC CÁC BẢNG………………………………………………………..vii DANH MỤC CÁC HÌNH………………………………………………………..viii DANH MỤC CÁC SƠ ĐỒ………………………………………………………...x LỜI MỞ ĐẦU……………………………………………………………………...xi CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH ARIMA.........................1 1.1. BÀI TOÁN DỰ BÁO ............................................................................................1 1.2. DỮ LIỆU CHUỖI THỜI GIAN ...............................................................................4 1.2.1. Khái niệm chuỗi thời gian thực ................................................................4 1.2.2. Thành phần xu hướng dài hạn...................................................................5 1.2.3. Thành phần mùa ........................................................................................6 1.2.4. Thành phần chu kỳ ....................................................................................6 1.2.5. Thành phần bất thường.............................................................................7 1.3. MÔ HÌNH ARIMA..............................................................................................7 1.3.1. Hàm tự tương quan ACF ............................................................................7 1.3.2. Hàm tự tương quan từng phần PACF.........................................................9 1.3.3. Mô hình AR(p) .........................................................................................10 1.3.4. Mô hình MA(q) ........................................................................................11 1.3.5. Sai phân I(d) .............................................................................................12 1.3.6. Mô hình ARIMA ......................................................................................13 1.3.7. Bước phát triển mô hình ARIMA ............................................................15 1.4. PHẦN MỀM ỨNG DỤNG EVIEWS .......................................................................17 1.4.1. Giới thiệu Eviews .....................................................................................17 1.4.2.1. Xác định mô hình...............................................................................25 1.4.2.2. Ước lượng mô hình ............................................................................26 1.4.2.3. Kiểm định đánh giá sự phù hợp và dự báo ........................................28 CHƯƠNG 2: THỰC TRẠNG CỦA VẤN ĐỀ NGHIÊN CỨU ....................31 3.1. DỮ LIỆU TÀI CHÍNH..........................................................................................31 3.2. ĐẶC ĐIỂM CỦA CHUỖI DỮ LIỆU........................................................................32 CHƯƠNG 3: THỰC NGHIỆM........................................................................34 3.1. Môi trường thực nghiệm..............................................................................34 3.3. Kiểm tra tính dừng của chuỗi chứng khoán PVD .......................................34 3.4. Nhận dạng mô hình .....................................................................................36 3.5. Ước lượng và kiểm định với mô hình ARIMA...........................................38 3.6. Thực hiện dự báo.........................................................................................42 KẾT LUẬN.........................................................................................................46 TÀI LIỆU THAM KHẢO.................................................................................47 PHỤ LỤC............................................................................................................48 LỜI MỞ ĐẦU 1. Lý do chọn đề tài Với tình hình kinh tế đang phát triển trên thế giới và tình trạng nền kinh tế trong nước gặp nhiều khó khăn, thử thách do tiến tới quá trình hội nhập trên trường quốc tế và khu vực. Các kênh đầu tư như thị trường chứng khoán và thị trường bất động sản đều chứa đựng những rủi ro rất lớn. Như trong thời gian từ cuối năm 2008 đến nay hầu như chỉ số chứng khoán giảm liên tục, đầu tư vào thị trường bất động sản cũng khiến các nhà đầu tư thua lỗ rất nhiều. Do đó bài toán dự báo tài chính ngày càng được nhiều người quan tâm trong bối cảnh phát triển kinh tế xã hội. Bởi đầu tư vào thị trường chứng khoán đòi hỏi nhiều kinh nghiệm và hiểu biết từ các nhà đầu tư. Các kĩ thuật khai phá dữ liệu được áp dụng từ các phần mềm và chương trình chuyên dụng nhằm dự báo sự dao động của thị trường là một gợi ý có cơ sở dựa trên nền tảng dữ liệu trước đó sẽ giúp các nhà đầu tư có thể ra quyết định trong giao dịch. 2. Mục đích nghiên cứu Mô hình ARIMA là một trong những ứng dụng được xây dựng với chức năng nhận dạng mô hình, ước lượng tham số, kiểm định dữ liệu và đưa ra kết quả dựa trên các tham số ước lượng đã được lựa chọn một cách tối ưu. Tìm hiểu các bước phát triển mô hình ARIMA (phương pháp BoxJenkin), nắm được một số thao tác cơ bản, các bước thi hành mô hình ARIMA bằng Eviews 8.0 và áp dụng vào bài toán khai phá dữ liệu chuỗi thời gian trong dự báo tài chính, chứng khoán. 3. Nội dung nghiên cứu Trong khóa luận này, chúng tôi tập trung nghiên cứu các bước phát triển của mô hình ARIMA và áp dụng mô hình này để tiến hành dự báo tài chính, chứng khoán dưới sự hỗ trợ của phần mềm Eviews 8.0.

Trang 1

TRẦN VĂN QUỐC NGUYỄN TRUNG PHÚ

KHAI THÁC DỮ LIỆU QUAN HỆ TRONG TÀI

CHÍNH BẰNG MÔ HÌNH ARIMA

KHÓA LUẬN TỐT NGHIỆP

NGÀNH: TOÁN ỨNG DỤNG CHUYÊN NGÀNH: KINH TẾ ĐỊNH LƯỢNG

HỆ: ĐẠI HỌC

TP HỒ CHÍ MINH, THÁNG 5 NĂM 2016

Trang 2

TRẦN VĂN QUỐC NGUYỄN TRUNG PHÚ

KHAI THÁC DỮ LIỆU QUAN HỆ TRONG TÀI

CHÍNH BẰNG MÔ HÌNH ARIMA

KHÓA LUẬN TỐT NGHIỆP

GIẢNG VIÊN PHỤ TRÁCH: ThS Trương Phúc Tuấn Anh

TP HỒ CHÍ MINH, THÁNG 5 NĂM 2016

Trang 3

LỜI CAM ĐOAN

Chúng tôi xin cam đoan đây là đề tài do chúng tôi Trần Văn Quốc và Nguyễn Trung Phú thực hiện dưới sự hướng dẫn của Thầy Th.S Trương Phúc Tuấn Anh

Mọi số liệu thu thập được và kết quả của bài khóa luận chưa từng được công bố

ở bất cứ công trình nghiên cứu nào khác

Chúng tôi xin chịu trách nhiệm về nghiên cứu của mình

TP Hồ Chí Minh, ngày 04 tháng 5 năm 2016

Sinh viên thực hiện Nguyễn Trung Phú

Trần Văn Quốc

Trang 4

LỜI CẢM ƠN

Lời đầu tiên, em xin được bày tỏ lời cảm ơn sâu sắc nhất đến tất cả các thầy cô trong khoa Toán - ứng dụng trường Đại học Sài Gòn, đặc biệt là Thầy – Th.S Trương Phúc Tuấn Anh và Thầy Lê Thái Sơn – những người đã tận tình hướng dẫn chúng em trong suốt quá trình thực hiện khoá luận tốt nghiệp

Em cũng xin gửi lời cảm ơn chân thành đến quý thầy cô đã tâm huyết giảng dạy cho chúng em trong suốt những năm học vừa qua để chúng em có được cơ hội thực hiện bài khoá luận này, với những kiến thức bổ ích ấy sẽ là hành trang giúp em vững bước trong tương lai

Cuối cùng em xin được cảm ơn các anh chị khoá trước, các bạn trong lớp DTU1121, là những người luôn động viên, giúp đỡ chúng em vượt qua những khó khăn trong quá trình tìm tòi và học hỏi để hoàn thành bài khoá luận này

Với kiến thức còn hạn chế cũng như kinh nghiệm còn chưa nhiều, bài khóa luận khó có thể tránh khỏi những thiếu xót, kính mong quý thầy cô góp ý nhận xét để em

có thể hoàn thiện bài khóa luận này tốt hơn nữa

TP Hồ Chí Minh, ngày 04 tháng 5 năm 2016

Sinh viên thực hiện Nguyễn Trung Phú Trần Văn Quốc

Trang 5

MỤC LỤC

LỜI CAM ĐOAN……… i

LỜI CẢM ƠN……… ii

MỤC LỤC………iii

DANH MỤC CÁC TỪ VIẾT TẮT……… v

DANH MỤC CÁC BẢNG……… vii

DANH MỤC CÁC HÌNH……… viii

DANH MỤC CÁC SƠ ĐỒ……… x

LỜI MỞ ĐẦU……… xi

CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH ARIMA 1

1.1.BÀI TOÁN DỰ BÁO 1

1.2.DỮ LIỆU CHUỖI THỜI GIAN 4

1.2.1 Khái niệm chuỗi thời gian thực 4

1.2.2 Thành phần xu hướng dài hạn 5

1.2.3 Thành phần mùa 6

1.2.4 Thành phần chu kỳ 6

1.2.5 Thành phần bất thường 7

1.3.MÔ HÌNH ARIMA 7

1.3.1 Hàm tự tương quan ACF 7

1.3.2 Hàm tự tương quan từng phần PACF 9

1.3.3 Mô hình AR(p) 10

1.3.4 Mô hình MA(q) 11

1.3.5 Sai phân I(d) 12

1.3.6 Mô hình ARIMA 13

Trang 6

1.3.7 Bước phát triển mô hình ARIMA 15

1.4.PHẦN MỀM ỨNG DỤNG EVIEWS 17

1.4.1 Giới thiệu Eviews 17

1.4.2.1 Xác định mô hình 25

1.4.2.2 Ước lượng mô hình 26

1.4.2.3 Kiểm định đánh giá sự phù hợp và dự báo 28

CHƯƠNG 2: THỰC TRẠNG CỦA VẤN ĐỀ NGHIÊN CỨU 31

3.1.DỮ LIỆU TÀI CHÍNH 31

3.2.ĐẶC ĐIỂM CỦA CHUỖI DỮ LIỆU 32

CHƯƠNG 3: THỰC NGHIỆM 34

3.1 Môi trường thực nghiệm 34

3.3 Kiểm tra tính dừng của chuỗi chứng khoán PVD 34

3.4 Nhận dạng mô hình 36

3.5 Ước lượng và kiểm định với mô hình ARIMA 38

3.6 Thực hiện dự báo 42

KẾT LUẬN 46

TÀI LIỆU THAM KHẢO 47

PHỤ LỤC 48

Trang 7

DANH MỤC CÁC TỪ VIẾT TẮT

Trang 8

MAE : Trung bình sai số tuyệt đối

Trang 9

DANH MỤC CÁC BẢNG

Trang 11

27 Hình 27 Ước lượng mô hình ARIMA(1,1,1) 39

Trang 12

DANH MỤC CÁC SƠ ĐỒ

Trang 13

LỜI MỞ ĐẦU

1 Lý do chọn đề tài

Với tình hình kinh tế đang phát triển trên thế giới và tình trạng nền kinh tế trong nước gặp nhiều khó khăn, thử thách do tiến tới quá trình hội nhập trên trường quốc tế và khu vực Các kênh đầu tư như thị trường chứng khoán và thị trường bất động sản đều chứa đựng những rủi ro rất lớn Như trong thời gian từ cuối năm 2008 đến nay hầu như chỉ số chứng khoán giảm liên tục, đầu tư vào thị trường bất động sản cũng khiến các nhà đầu tư thua lỗ rất nhiều Do đó bài toán dự báo tài chính ngày càng được nhiều người quan tâm trong bối cảnh phát triển kinh tế xã hội Bởi đầu tư vào thị trường chứng khoán đòi hỏi nhiều kinh nghiệm và hiểu biết từ các nhà đầu tư Các kĩ thuật khai phá dữ liệu được áp dụng từ các phần mềm và chương trình chuyên dụng nhằm dự báo sự dao động của thị trường là một gợi ý có cơ sở dựa trên nền tảng dữ liệu trước đó sẽ giúp các nhà đầu tư có thể ra quyết định trong giao dịch

2 Mục đích nghiên cứu

Mô hình ARIMA là một trong những ứng dụng được xây dựng với chức năng nhận dạng mô hình, ước lượng tham số, kiểm định dữ liệu và đưa ra kết quả dựa trên các tham số ước lượng đã được lựa chọn một cách tối ưu

Tìm hiểu các bước phát triển mô hình ARIMA (phương pháp Box-Jenkin), nắm được một số thao tác cơ bản, các bước thi hành mô hình ARIMA bằng Eviews 8.0

và áp dụng vào bài toán khai phá dữ liệu chuỗi thời gian trong dự báo tài chính, chứng khoán

3 Nội dung nghiên cứu

Trong khóa luận này, chúng tôi tập trung nghiên cứu các bước phát triển của

mô hình ARIMA và áp dụng mô hình này để tiến hành dự báo tài chính, chứng khoán dưới sự hỗ trợ của phần mềm Eviews 8.0

Trang 14

4 Phương pháp nghiên cứu

Các phương pháp nghiên cứu được sử dụng trong đề tài:

x Phương pháp nghiên cứu định lượng

Chương 1 CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH ARIMA

Chương 2 THỰC TRẠNG CỦA VẤN ĐỀ NGHIÊN CỨU

Chương 3 THƯC NGHIỆM

Trang 15

CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH ARIMA

Trong chương này, khóa luận đề cập đến lý thuyết cơ bản về chuỗi thời gian, cơ

sở lý thuyết và các yếu tố trong mô hình ARIMA như hàm tự tương quan ACF, hàm

tự tương quan từng phần PACF, mô hình tự hồi quy AR(p), mô hình trung bình trượt MA(q), sai phân I(d) Giới thiệu các bước phát triển của mô hình ARIMA (phương pháp Box - Jenkin), sơ lược về phần mềm Eviews 8.0 và một số thao tác

cơ bản phục vụ cho bài toán dự báo tài chính

1.1 Bài toán dự báo

Cùng với sự phát triển không ngừng của khoa học kỹ thuật làm cho đời sống, kinh tế - xã hội trong nhiều thập kỉ qua của chúng ta cũng tiến bộ không

ít Điều này đồng nghĩa với việc ứng dụng các sản phẩm trí tuệ vào đời sống con người ngày càng quen thuộc Một trong những hành vi hữu ích cho nền kinh tế - xã hội nước nhà qua nhiều năm nay chính là thu thập và lưu trữ số liệu của từng thời điểm để ứng dụng vào quá trình phân tích và nghiên cứu thị trường Từ đó ta có thể phỏng đoán các định mức của các thời kỳ trong thời gian tới sẽ ngày càng hoàn thiện hơn Vì con người cho rằng quá trình đó ẩn chứa những giá trị nhất định nào đó Tuy nhiên trong phân tích thống kê, người

ta chỉ sử dụng một lượng nhỏ trong kho dữ liệu đó, số còn lại chúng ta chưa biết phải làm gì với chúng nhưng chúng ta vẫn tiếp tục ghi nhận, thu thập vì trong một giai đoạn nào đó chúng vẫn có ích khi ta cần đến Mặt khác, trong môi trường cạnh tranh, người ta ngày càng cần có nhiều thông tin với tốc độ nhanh để trợ giúp việc ra quyết định và ngày càng có nhiều câu hỏi mang tính chất định tính cần phải trả lời dựa trên một khối lượng dữ liệu khổng lồ đã có Với những lý do như vậy, các phương pháp quản trị và khai thác cơ sở dữ liệu truyền thống ngày càng không đáp ứng được thực tế Từ đó đã phát triển một khuynh hướng kỹ thuật mới đó là kỹ thuật phát hiện tri thức và khai phá dữ liệu (KDD – Knowledge Discovery and Data Mining)

Trang 16

Kỹ thuật phát hiện tri thức và khai phá dữ liệu đã và đang được nghiên cứu, ứng dụng trong nhiều lĩnh vực khác nhau ở các nước trên thế giới, tại Việt Nam kỹ thuật này tương đối còn mới mẻ tuy nhiên cũng đang được nghiên cứu và dần đưa vào ứng dụng

Kỹ thuật dự báo đã hình thành từ thế kỉ thứ 19, tuy nhiên dự báo có ảnh hưởng mạnh mẽ khi công nghệ thông tin phát triển vì bản chất mô phỏng của các phương pháp dự báo rất cần thiết sự hỗ trợ của máy tính

Đặc biệt vào đầu những năm 1980 , phân tích chuỗi thời gian phát triển hết sức sôi động Sự phát triển này liên quan chặt chẽ đến cách thức mà kinh tế lượng thực hành đã thực hiện các phương pháp mới này được các nhà kinh tế lượng, các nhà kinh tế vĩ mô, các chuyên gia về tài chính, các nhà chứng khoán, đặc biệt quan tâm Chúng đã tạo ra một cuộc cách mạng trong mô hình hóa các quan hệ cân bằng, các mô hình động

Dự báo là một nhu cầu không thể thiếu cho những hoạt động của con người trong bối cảnh bùng nổ thông tin trong nền kinh tế hội nhập Dự báo sẽ cung cấp những cơ sở cần thiết cho các hoạch định, và có thể nói rằng nếu không có khoa học

dự báo thì những dự định tương lai của con người vạch ra sẽ không có sự thuyết phục đáng kể

Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc nắm bắt tối đa thông tin về lĩnh vực dự báo Thông tin ở đây có thể hiểu một cách

cụ thể gồm : (1) các số liệu quá khứ của lĩnh vực dự báo, (2) diễn biến tình hình hiện trạng cũng như động thái phát triển của lĩnh vực dự báo và (3) đánh giá một cách đầy đủ nhất các nhân tố ảnh hưởng cả về định lượng lẫn định tính

Căn cứ vào nội dung phương pháp và mục đích của dự báo, người ta chia dự báo thành hai loại: Phương pháp định tính và phương pháp định lượng Phương pháp định tính thường phụ thuộc rất nhiều vào kinh nghiệm của một hay nhiều chuyên gia trong lĩnh vực liên quan Phương pháp này thường được áp dụng, kết

Trang 17

quả dự báo sẽ được các chuyên gian trong lĩnh vực liên quan nhận xét, đánh giá và đưa ra kết luận cuối

Phương pháp định lượng sử dụng những dữ liệu quá khứ theo thời gian, dựa trên dữ liệu lịch sử để phát hiện chiều hướng vận động của đối tượng phù hợp với một mô hình toán học nào đó và đồng thời sử dụng mô hình đó làm mô hình ước lượng Tiếp cận định lượng dựa trên giả định rằng giá trị tương lai của biến số dự báo sẽ phụ thuộc vào xu thế vận động của đối tượng đó trong quá khứ Phương pháp

dự báo theo chuỗi thời gian là một phương pháp định lượng

Phương pháp chuỗi thời gian sẽ dựa trên việc phân tích chuỗi quan sát của một biến duy nhất theo biến số độc lập là thời gian Giả định chủ yếu là biến số dự báo

sẽ giữ nguyên chiều hướng phát triển đã xảy ra trong quá khứ và hiện tại

Khóa luận tập trung nghiên cứu mô hình ARIMA để thực hiện phân tích dữ liệu chứng khoán hướng tới việc dự báo chứng khoán Mô hình trung bình trượt, đồng liên kết, tự hồi quy ARIMA (AutoRegressive Integrate Moving Average) do G P E.Box và G M Jenkins đề xuất năm 1976 đã mở ra một trang mới trong các công

cụ dự báo, dựa trên mô hình tự hồi quy AR và mô hình trung bình động MA ARIMA là mô hình dự báo định lượng theo thời gian, giá trị tương lai của biến số

dự báo sẽ phụ thuộc vào xu thế vận động của đối tượng đó trong quá khứ Mô hình ARIMA phân tích tính tương quan giữa các dữ liệu quan sát để đưa ra mô hình dự báo thông qua các giai đoạn nhận dạng mô hình, ước lượng các tham số từ dữ liệu quan sát và kiểm tra các tham số ước lượng để tìm ra mô hình thích hợp Mô hình kết quả của quá trình trên gồm các tham số thể hiện mức độ tương quan trên dữ liệu,

và được chọn để dự báo giá trị tương lai Giới hạn độ tin cậy của dự báo được tính dựa trên phương sai của sai số dự báo

Trang 18

1.2 Dữ liệu chuỗi thời gian

Chuỗi thời gian trong thống kê, xử lý tín hiệu, kinh tế lượng và toán tài chính là một chuỗi các điểm dữ liệu, được đo theo từng khoảng khắc thời gian liền nhau theo

một tần suất thời gian thống nhất

Phân tích chuỗi thời gian sẽ nghiên cứu hành vi, khuôn mẫu trong quá khứ của một biến số và sử dụng những thông tin này để dự báo những thay đổi trong tương lai, bao gồm các phương pháp để phân tích dữ liệu chuỗi thời gian, để từ đó trích

xuất ra được các thuộc tính thống kê có ý nghĩa và các đặc điểm của dữ liệu

Dự đoán chuỗi thời gian là việc sử dụng mô hình để dự đoán các sự kiện thời gian dựa vào các sự kiện đã biết trong quá khứ để từ đó dự đoán các điểm dữ liệu

trước khi nó xảy ra

1.2.1 Khái niệm chuỗi thời gian thực

Chuỗi thời gian thực (chuỗi thời gian) là tập hợp của một biến số được quan sát theo trình tự thời gian nào đó Biến số theo thời gian có 2 loại: số liệu thời kỳ và số liệu thời điểm

thời điểm t, giai đoạn ta đang xét là thời điểm 1 đến thời điểm n nên t = 1,2,…, n Trên lý thuyết, chuỗi thời gian có thể là liên tục, các biến số kinh tế - xã hội vận động liên tục theo thời gian, do vậy các mô hình được xây dựng tổng quát cho biến liên tục Tuy nhiên, trong thống kê và thực tế, không có số liệu liên tục mà chỉ có kết quả thông tin tại cuối các thời kỳ xác định hoặc các thời điểm xác định

Ví dụ 1 Mức huy động vốn của Vietcombank – chi nhánh Quận 5 từ quý I năm

2010 đến quý IV năm 2015

Các thành phần của dữ liệu chuỗi thời gian [1,trang 81]

Các nhà thống kê thường chia chuỗi theo thời gian thành 4 thành phần:

Trang 19

x Thành phần xu hướng dài hạn (Long –term Trend Component) - T

x Thành phần mùa (Seasional Component) - S

x Thành phần chu kỳ (Cyclical Component) - C

x Thành phần bất thường (Irregular Component) – I

1.2.2 Thành phần xu hướng dài hạn

Là thành phần thể hiện khuynh hướng biến động của một biến nào đó trong dài hạn, chuỗi tăng hay giảm, biến là tăng trưởng hay suy thoái trong khoảng thời gian dài.[3, trang 436]

Ví dụ 2 Tốc độ tăng trưởng của về sản lượng của một sản phẩm qua các năm

1950-1960 ( đơn vị tính là triệu)

Tốc độ tăng dân số của Việt Nam có xu hướng giảm

Hình 1 Xu hướng tăng của sản lượng giai đoạn 1950 - 1960

Trang 20

1.2.3 Thành phần mùa

Thể hiện sự tác động của các thời điểm, thời kỳ nhất định trong năm, dùng

để đánh giá biến động rất ngắn của một biến như hàng tháng, hàng quý.[3, trang 436]

Ví dụ 3 Nhu cầu tiêu thụ áo mưa sẽ tăng mạnh vào mùa mưa và giảm vào

mùa khô

Lượng tiêu thụ bánh kẹo sẽ tăng lên vào dịp lễ, tết

Lượng tiêu thụ chất đốt sẽ tăng vào mùa đông và giảm vào mùa hè

Hình 2 Thành phần mùa

1.2.4 Thành phần chu kỳ

Thể hiện sự biến động của một biến nào đó trong ngắn hạn hoặc dài hạn Để đánh giá thành phần này các giá trị của chuỗi thời gian phải được quan sát nhiều năm [3, trang 436]

Ví dụ 4 Lượng dòng chảy đến hồ Trị An từ 1959 đến 1985

Trang 21

Hình 3 Thành phần chu kỳ

1.2.5 Thành phần bất thường

Thành phần này dùng để chỉ sự thay đổi bất thường của các giá trị trong chuỗi thời gian Sự thay đổi này không thể dự đoán bằng các số liệu kinh nghiệm trong quá khứ, về mặt bản chất thành phần này không có tính chu kỳ

1.3 Mô hình ARIMA

Trong mô hình ARIMA, hàm tự tương quan (ACF), hàm tự tương quan riêng (PACF) là những đại lượng không thể thiếu khi đánh giá về chuỗi thời gian bên cạnh đó còn có hai đại lượng khác là trung bình và phương sai

1.3.1 Hàm tự tương quan ACF

Hàm tự tương quan (Autocorrelation Function) dùng để đo mức độ tự tương

Trang 22

ܻ௧ା௞ là chuỗi thời gian ở thời điểm t+k

Ɋlà giá trị trung bình của chuỗi

ߪଶ là phương sai

Cov(ܻ௧ǡ ܻ௧ା௞) là hiệp phương sai của ܻ௧ và ܻ௧ା௞

có các hàm tự tương quan ACF trực tiếp Chuỗi số liệu quan sát chỉ là một mẫu của chuỗi thời gian tổng quát, do đó áp dụng các công thức tính hàm tự tương quan trong mẫu:

0

k k

JUJ

Để kiểm định sự bằng 0 của nhiều giá trị hàm ACF, từ ACF(1) đến ACF(k) có thể sử dụng kiểm định Q, cụ thể như sau:

Trang 23

1.3.2 Hàm tự tương quan từng phần PACF

Hàm tự tương quan từng phần (Partial Autocorrelation Function) dùng để đo

1 1, 1 1 1, 1

Tập hợp tất cả giá trị của hàm tự tương quan ACF(k) và hàm tự tương quan từng phần PACF(k) theo các bậc k=1,2,…được thể hiện dưới dạng đồ thị được gọi

là lược đồ tương quan, dựa vào lược đồ tương quan ta có thể đánh giá được tính dừng của chuỗi thời gian, cụ thể như sau:

Trong phần mềm Eviews, lượt đồ tương quan của chuỗi được cho theo thứ tự lần lượt cột 1 là đồ thị của của giá trị SACF(k), kế đến là đồ thị của SPACF(k) với

Trang 24

SACF(k) vượt qua ngoài đường gạch đứt thì có thể nói ߩ௞ ് 0 Các giá trị trong các cột còn lại lần lượt là giá trị của SACF(k), SPACF(k), thống kê Q và P-value

Nếu lượt đồ có giá trị ACF(k) và PACF(k) được coi là khác 0 (nghĩa là vượt qua ngoài giá trị tới hạn) với k=1,2 Tức là ACF và PACF có ý nghĩa với 2 bậc này, còn với những bậc k = 3 trở về sau thì ACF và PACF có thể cho là bằng 0, qua đó

có thể nói là chuỗi dừng Còn đối với chuỗi thời gian không dừng thì ACF(k) đều khác 0, đồ thị nằm ra phía ngoài bên phải đường tới hạn với tất cả các bậc và SACF(k) giảm chậm

1.3.3 Mô hình AR(p)

Chuỗi thời gian được gọi là nhiễu trắng (white noise) nếu chuỗi có trung bình bằng 0, phương sai không đổi và đồng phương sai bằng 0 với mọi khoảng cách thời gian Kí hiệu chuỗi nhiễu trắng là ݑ௧, thì ݑ௧ thỏa mãn:

t ;Var t 2; t; t k 0 ,

Chuỗi tự hồi quy bậc p, kí hiệu là AR(p) là chuỗi có giá trị phụ thuộc vào các giá trị trong quá khứ đến p thời kỳ hay nói cách khác là hồi quy dựa trên những số liệu trong quá khứ, phương trình có dạng:

ܻ௧ = ׎଴ + ׎ଵܻ௧ିଵ + ׎ଶܻ௧ିଶ +…+ ׎௣ܻ௧ି௣ + ݑ௧Trong đó,

ܻ௧ là dữ liệu ở thời điểm hiện tại

ܻ௧ିଵ , ܻ௧ିଶǡ ܻ௧ି௣ là dữ liệu trong quá khứ

׎଴,׎ଵ, ׎ଶǡ ǥ ׎௣ là các tham số phân tích hồi quy

ݑ௧ là nhiễu trắng

Trang 25

Trong trường hợp tổng quát AR(p) chuỗi dừng khi σ௣௝ୀଵ׎௝ ൏ 1

Trang 26

Nói cách khác, chuỗi trung bình trượt là tổng hợp từ các nhiễu trắng, trong kinh

tế các nhiễu được coi như những biến động nằm ngoài tính quy luật được xây dựng bởi mô hình hồi quy, hay được gọi là những cú sốc kinh tế

Điều kiện cần của mô hình MA(q) dừng là σ௤௝ୀଵߠ௝ < 1

Thông thường bậc của mô hình MA(q) thường là q = 2

Mô hình MA(1): ܻ௧ = ߤ + ݑ௧ + ߠଵݑ௧ିଵ

Mô hình MA(2): ܻ௧ = ߤ + ݑ௧ + ߠଵݑ௧ିଵ + ߠଶݑ௧ିଶ [3, trang 474]

1.3.5 Sai phân I(d)

Một chuỗi thời gian nếu có trung bình (E(ܻ௧) = ߤ), phương sai (Var(ܻ௧) =

ߛ௞ = E[(ܻ௧ െ ߤ)ሺܻ௧ି௞ - ߤሻ]) giữa hai thời đoạn chỉ phụ thuộc vào khoảng cách và độ trễ về thời gian giữa hai thời đoạn này chứ không phụ thuộc vào thời điểm thực tế

mà đồng phương sai được tính thì được coi là chuỗi dừng

Sai phân chỉ sự chênh lệch giữa giá trị hiện tại và giá trị trước đó, mục đích của việc lấy sai phân là làm ổn định giá trị trung bình của chuỗi dữ liệu và chuyển đổi chuỗi thời gian không dừng thành chuỗi dừng

Xét một xu hướng tuyến tính có dạng ܻ௧ = ߙ + ߚt Sai phân bậc nhất của ܻ௧được định nghĩa là οܻ௧ = ܻ௧ - ܻ௧ିଵ Ta thấy

οܻ௧ = ߙ + ߚt – ߙ – ߚ(t -1) = ߚ

Là hằng số và do đó nó có tính dừng Ta nhận thấy xu hướng tuyến tính có thể

định nghĩa là sai phân bậc nhất của sai phân bậc nhất Do đó,

οଶܻ௧ = (ܻ௧ - ܻ௧ିଵ) – (ܻ௧ିଵ - ܻ௧ିଶ) = ܻ௧ - ʹܻ௧ିଵ + ܻ௧ିଶ

Tổng quát sai phân bậc d: οௗܻ௧= ο(οௗିଵܻ௧)

Trang 27

Một dạng khác mà trong đó tính không dừng thường xuất hiện đó là tính mùa Tính không dừng trong các chuỗi theo tháng và theo quý thường có thể được loại bỏ bằng cách lấy sai phân thích hợp οସ = ܻ௧ - ܻ௧ିସ đối với dữ liệu theo quý và οଵଶ = ܻ௧

- ܻ௧ିଵଶ đối với dữ liệu theo tháng [3, trang 462, 492]

1.3.6 Mô hình ARIMA

Mô hình ARMA là mô hình của một chuỗi dừng, với hai thành phần là tự hồi quy AR và trung bình trượt MA Hai chuỗi này đã được đề cập ở phần trước

Khi đó chuỗi tự hồi quy trung bình trượt bậc p, q, kí hiệu là ARMA(p,q), nếu

nó được tính đồng thời qua các trễ của nó và các nhiễu, có dạng:

ܻ௧ = ׎଴ + ׎ଵܻ௧ିଵ + ׎ଶܻ௧ିଶ +…+ ׎௣ܻ௧ି௣ + ߤ + ݑ௧ + ߠଵݑ௧ିଵ + ߠଶݑ௧ିଶ +…+ ߠ௣ݑ௧ି௣Trong đó,

ܻ௧ là dữ liệu ở thời điểm hiện tại

ܻ௧ିଵ , ܻ௧ିଶǡ ܻ௧ି௣ là dữ liệu trong quá khứ

׎଴,ǥ ǡ ׎௣ǡ ߠଵ,…,ߠ௣là các tham số phân tích hồi quy

ݑ௧ là nhiễu trắng

Ɋ là kỳ vọng của ܻ௧

Nhưng trong thực tế hầu hết các chuỗi thời gian đều không dừng, nên yếu tố thứ ba được xét đến là tích hợp I(d) để biến chuỗi thời gian không dừng thành chuỗi dừng

ARIMA là mô hình phân tích và mô phỏng một chuỗi thời gian gồm các quá trình : tự hồi quy (AR), tích hợp (I), và trung bình trượt (MA) Một chuỗi được mô

tả qua mô hình ARIMA cũng được gọi là chuỗi ARIMA, hay chuỗi tự hồi quy – tích hợp – trung bình trượt Mô hình ARIMA xây dựng nhằm mục đích hiểu rõ bản

Trang 28

chất biến động của chuỗi thông qua biến động trong quá khứ, và dự báo cho chuỗi vào các thời kì sau

ARIMA chỉ là cách ghép để đọc cho thuận tiện của ba yếu tố đó, trên thực tế yếu tố tích hợp luôn cần được phân tích trước, rồi đến yếu tố AR và MA, do đó còn

dừng thì thường d chỉ bằng 1, khả năng bằng 2 ít hơn, và trên 2 thì gần như không xảy ra, do vậy thường chỉ lấy sai phân bậc nhất là có thể được chuỗi dừng Với chuỗi dừng này, sử dụng mô hình ARMA để phân tích tiếp

Thông thường việc xác định các bậc p, q của chuỗi tự hồi quy, trung bình trượt

có thể dựa vào lược đồ tương quan Trong thực tế, hàm tự tương quan ACF và hàm

tự tương quan từng phần PACF giảm đột biến khá nhanh Trong trường hợp này, chúng ta nên phân biệt hàm nào giảm đột biến nhanh hơn, hàm còn lại được xem là giảm đều Do đôi lúc sẽ có trường hợp giảm đột biến đồng thời khi quan sát biểu đồ hàm tự tương quan ACF và hàm tự tương quan từng phần PACF, để khắc phục trường hợp này, ta dự tính vài dạng hàm khác nhau cho chuỗi thời gian dừng, sau đó

ta sẽ đánh giá mô hình nào tốt nhất thì dùng để dự báo

Trang 29

1.3.7 Bước phát triển mô hình ARIMA

Phương pháp Box-Jenkin là 1 thủ tục để xác định các bậc của mô hình

ARIMA Thủ tục bao gồm các bước như sau:

x Bước 1: Xác định mô hình

x Bước 2: Ước lượng mô hình

x Bước 3: Kiểm định đánh giá sự phù hợp và dự báo

Xác định mô hình: Đối với chuỗi thời gian dừng, mô hình có thể trình bày

theo dạng AR, MA hay ARMA Ta dự tính các bậc p, q của mô hình ARMA qua việc nghiên cứu chiều hướng biến đổi của hàm tự tương quan ACF hay hàm tự tương quan từng phần PACF Còn đối với những chuỗi thời gian không dừng thì ta phải chuyển nó thành chuỗi dừng, việc chuyển đổi này được thực hiện bằng cách tiến hành sai phân giữa những giá trị quan sát d lần, thông thường thực hiện hai lần sai phân thì ta sẽ được chuỗi dừng

Ước lượng mô hình: là xác định các tham số ׎଴,ǥ ǡ ׎௣ǡ ߠଵ,…,ߠ௣ của mô hình

dự tính; có thể sử dụng phương pháp bình phương nhỏ nhất hoặc bình phương nhỏ

nhất hai bước hoặc ước lượng hợp lý tối đa

Kiểm định đánh giá sự phù hợp và dự báo: việc đánh giá sự phù hợp của mô

hình thông qua kiểm định chuỗi phần dư có là nhiễu trắng hay không Nếu phần dư

là nhiễu trắng thì có thể dùng mô hình để dự báo Nếu phần dư không là nhiễu trắng thì quay lại bước 1 xác định lại các bậc Xét mô hình ARMA(1,1): ܻ௧ = ׎଴ + ׎ଵܻ௧ିଵ+ ݑ௧ + ߠଵݑ௧ିଵ , ước lượng mô hình với dữ liệu đã có, ta thu được các hệ số

׎෢ǡ ׎଴ ෢ǡ ߠଵ ෢ǡ đồng thời thu được chuỗi phần dư ݁ଵ ௧(t = 1,…, n), khi đó giá trị dự báo cho thời kỳ n+1 là: Y n 1 = ׎෢ + ׎଴ ෢ܻଵ ௡ + ߠ෢݁ଵ ௡

Dưới đây là sơ đồ các bước của phương pháp Box-Jenkin

Trang 30

Sơ đồ 1 Phương pháp Box-Jenkin Tại bước 1 xác định mô hình thì bậc của tích hợp d được tiến hành trước cho đến khi được chuỗi dừng, tiếp tục xác định p và q cho đến khi được phần dư là nhiễu trắng Có thể tóm tắt các bước quan trọng của phương pháp Box-Jenkin như sau

Sơ đồ 2 Phương pháp Box-Jenkin tóm tắt Trong các bước, xác định bậc của sai phân thường rất đơn giản thường là một đến hai lần sai phân Tuy nhiên việc xác định bậc p và q không dễ dàng, mà cần lặp lại nhiều lần để tìm được bậc phù hợp Thông thường p và q được lấy bởi các giá trị

0, 1, 2, 3 nên số lần lặp lại để tìm được chuỗi phù hợp cũng không nhiều Có một

Phân tích dự báo

Đánh giá kết quả

Số

liệu

Xác định bậc p, d,

q

Ước lượng

mô hình

Phân tích và

dự báo

Xác định bậc ARMA(p,q)

Ước lượng mô hình Xác định bậc

I(d)

Trang 31

cách là ước lượng mô hình, bậc nào không phù hợp thì hệ số tương ứng sẽ không có

ý nghĩa thống kê, do đó có thể loại bỏ, rồi ước lượng lại Ngoài ra, việc xác định p,

q có thể thực hiện qua nhận dạng lược đồ tương quan [3, trang 510-511]

1.4 Phần mềm ứng dụng Eviews

1.4.1 Giới thiệu Eviews

Eviews là một phần mềm rất mạnh được giảng dạy ở hầu hết các trường Đại học Kinh tế ở Việt Nam nói riêng và các nước công nghiệp phát triển nói chung Nó

là một phiên biển mới của các công cụ phân tích chuỗi thời gian do Công ty Time Series Processor Software phát triển cho các máy tính lớn Eviews có phiên bản trung gian Micro TSP được soạn thảo lần đầu năm 1981 Dù Eviews do các nhà kinh tế phát triển và đa phần các ứng dụng của nó nằm trong lĩnh vực kinh tế, nhưng tiện ích của nó không chỉ giới hạn trong kinh tế, cũng không chỉ trong phân tích chuỗi thời gian mà nó rất tiện lợi khi phân tích các số liệu chéo, các số liệu khoa học khác

Một số ứng dụng phổ biến của Eviews là tìm ra các quan hệ thống kê, hồi quy

và dự báo giá trị tương lai từ các số liệu hiện có Bên cạnh đó Eviews cũng rất tiện ích trong các lĩnh vực như:

x Phân tích chi phí và dự báo

x Phân tích tài chính

x Dự báo doanh số

x Phân tích và đánh giá số liệu khoa học

x Mô phỏng và dự báo vĩ mô

Đối với những người đã sử dụng Windows thì việc sử dụng Eviews cũng rất dễ dàng bởi vì nó được viết trên môi trường Windows, còn với những người chưa biết Windows thì cũng không có nhiều khó khăn để sử dụng vì Eviews sử dụng hệ thống bảng chọn và các hộp thoại nên rất thân thiện với người dùng Có nhiều cách nhập

dữ liệu cho Eviews như nhập bằng tay, file text nhưng phổ biến nhất là nhập từ file

Trang 32

excel Từ đó, Eviews giúp trình bày các biểu đồ, kết quả trực quan, sinh động, có thể in trực tiếp hoặc chuyển qua các loại văn bản định dạng khác Eviews giúp người dùng dễ dàng ước lượng mô hình (đặc biệt là đối với dữ liệu chuỗi thời gian)

và kiểm định các mô hình kinh tế lượng [2, trang 17]

Một số thao tác cơ bản trong Eviews 8.0 như:

x Khởi động và thoát Eviews

Để khởi động Eviews 8.0, ta nháy đúp vào biểu tượng Eviews trên màn hình Desktop

Khi khởi động Eviews 8.0 thì màn hình chính có dạng:

Hình 4 Màn hình chính Eviews 8.0 Đây là màn hình chính trong Eviews, ở góc trên bên trái có biểu tượng giống

, lần lượt dùng để thu nhỏ, co giãn và đóng cửa sổ của Eviews

x Tạo ra một Workfile

Để tạo một Workfile trong Eviews thì ở màn hình chính vừa mở ta chọn

File/New/Workfile hoặc nhấn tổ hợp phím (Ctrl + N)

... ܻ௧ିସ liệu theo quý οଵଶ = ܻ௧

- ܻ௧ିଵଶ liệu theo tháng [3, trang 462, 492]

1.3.6 Mơ hình ARIMA

Mơ hình ARMA mơ hình chuỗi dừng,... chuỗi dừng

ARIMA mơ hình phân tích mơ chuỗi thời gian gồm trình : tự hồi quy (AR), tích hợp (I), trung bình trượt (MA) Một chuỗi mơ

tả qua mơ hình ARIMA gọi chuỗi ARIMA, hay chuỗi... Bước phát triển mơ hình ARIMA

Phương pháp Box-Jenkin thủ tục để xác định bậc mơ hình

ARIMA Thủ tục bao gồm bước sau:

x Bước 1: Xác định mơ hình

x

Ngày đăng: 12/04/2017, 14:17

HÌNH ẢNH LIÊN QUAN

Hình 1. Xu hướng tăng của sản lượng giai đoạn 1950 - 1960 - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 1. Xu hướng tăng của sản lượng giai đoạn 1950 - 1960 (Trang 19)
Sơ đồ 2. Phương pháp Box-Jenkin tóm tắt - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Sơ đồ 2. Phương pháp Box-Jenkin tóm tắt (Trang 30)
Sơ đồ 1. Phương pháp Box-Jenkin - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Sơ đồ 1. Phương pháp Box-Jenkin (Trang 30)
Hình 6. Lựa chọn loại dữ liệu trong Workfile - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 6. Lựa chọn loại dữ liệu trong Workfile (Trang 33)
Hình 8. Cửa sổ Open trong Eviews  Khi đó cửa sổ Excel Read xuất hiện gồm 3 bước như sau: - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 8. Cửa sổ Open trong Eviews Khi đó cửa sổ Excel Read xuất hiện gồm 3 bước như sau: (Trang 35)
Hình 9. Cửa sổ Excel Read ở bước 1 - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 9. Cửa sổ Excel Read ở bước 1 (Trang 35)
Hình 11. Cửa sổ Excel Read ở bước 3 - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 11. Cửa sổ Excel Read ở bước 3 (Trang 36)
Hình 14. Biểu đồ tương quan giá đóng cửa - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 14. Biểu đồ tương quan giá đóng cửa (Trang 39)
Hình 15. Ước lượng mô hình trong cửa sổ Equation Estimation - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 15. Ước lượng mô hình trong cửa sổ Equation Estimation (Trang 41)
Hình 17. Cửa sổ dự báo giá đóng cửa - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 17. Cửa sổ dự báo giá đóng cửa (Trang 43)
Hình 24. Biểu đồ giá đóng cửa sai phân bậc 1 - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 24. Biểu đồ giá đóng cửa sai phân bậc 1 (Trang 51)
Hình 26. Biểu đồ tương quan giá đóng cửa sai phân bậc 1 - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 26. Biểu đồ tương quan giá đóng cửa sai phân bậc 1 (Trang 52)
Hình 32. Kết quả ước lượng mô hình ARIMA(1,2,3) - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 32. Kết quả ước lượng mô hình ARIMA(1,2,3) (Trang 56)
Hình 35. Dự báo mô hình ARIMA(1,1,1) - Khai thác dữ liệu quan hệ trong tài chính bằng mô hình ARIMA
Hình 35. Dự báo mô hình ARIMA(1,1,1) (Trang 58)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w