1. Trang chủ
  2. » Luận Văn - Báo Cáo

Một số mô hình toán học phân tích và dự báo giá cổ phiếu

58 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Một số mô hình toán học phân tích và dự báo giá cổ phiếu
Tác giả Trương Thị Mỹ Vân
Người hướng dẫn TS. Lê Văn Dũng
Trường học Đại học Đà Nẵng
Chuyên ngành Khoa học
Thể loại khóa luận tốt nghiệp
Năm xuất bản 2015
Thành phố Đà Nẵng
Định dạng
Số trang 58
Dung lượng 1,84 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • 1. TÍNH CẤP THIẾT CỦA ĐỀ TÀI (7)
  • 2. MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU (8)
  • 3. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU (8)
  • 4. PHƯƠNG PHÁP NGHIÊN CỨU (8)
  • 5. BỐ CỤC KHÓA LUẬN (9)
  • CHƯƠNG 1: KIẾN THỨC CƠ SỞ (10)
    • I. Giới thiệu về số liệu chuỗi thời gian (10)
      • 1. Khái niệm chuỗi thời gian (10)
      • 2. Một số đặc trƣng của chuỗi thời gian (10)
    • II. Mô hình hồi quy tuyến tính với chuỗi thời gian (11)
      • 1. Cơ sở lý luận (11)
      • 2. Tính chất mẫu lớn của ƣớc lƣợng OLS (0)
      • 3. Vấn đề tự tương quan trong mô hình hồi quy chuỗi thời gian (19)
      • 4. Dự báo (25)
    • III. Mô hình ARIMA ( Mô hình trung bình trƣợt, tích hợp, tự hồi quy ) (26)
      • 2. Xem xét tính dừng của chuỗi quan sát (30)
      • 3. Nhiễu trắng (31)
      • 4. Hàm tự tương quan (32)
      • 5. Phương pháp Box-Jenkins (35)
  • CHƯƠNG 2: ỨNG DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH CHUỖI THỜI GIAN VÀ ARIMA VÀO DỰ BÁO GIÁ CỔ PHIẾU VINAMILK (39)
    • I. Giới thiệu về số liệu (39)
    • II. Ứng dụng (39)
      • 1. Áp dụng vào mô hình hồi quy tuyến tính chuỗi thời gian (39)
      • 2. Áp dụng vào mô hình ARIMA (45)
  • TÀI LIỆU THAM KHẢO (58)

Nội dung

TÍNH CẤP THIẾT CỦA ĐỀ TÀI

Thị trường chứng khoán, cả trên thế giới và tại Việt Nam, thu hút nhiều nhà đầu tư nhờ vào khả năng sinh lợi cao, nhưng cũng tiềm ẩn nhiều rủi ro Việc dự báo xu hướng biến động của chỉ số giá chứng khoán trở nên quan trọng để các tổ chức và cá nhân có chiến lược đầu tư phù hợp Bài viết này trình bày phương pháp xây dựng mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA nhằm dự đoán giá cổ phiếu Vinamilk trên thị trường chứng khoán Việt Nam.

Sau hơn mười năm thực hiện đường lối đổi mới, nền kinh tế Việt Nam đã đạt được nhiều thành tựu quan trọng Để đến năm 2020 trở thành một nước công nghiệp hiện đại với cơ sở vật chất và kỹ thuật tiên tiến, cần có nguồn vốn lớn và tốc độ tăng trưởng GDP bình quân đạt 9-10%/năm Do đó, vào tháng 7/2000, Việt Nam đã thành lập trung tâm giao dịch chứng khoán tại Thành Phố Hồ Chí Minh Tuy nhiên, thị trường chứng khoán hiện nay vẫn đang trong giai đoạn thử nghiệm, do đó việc phân tích xu hướng biến động và dự báo giá cổ phiếu là rất cần thiết.

Sau một thời gian nghiên cứu tài liệu về chứng khoán và các mô hình phân tích biến động giá, tôi đã quyết định chọn đề tài "Một số mô hình phân tích sự biến động của giá chứng khoán trên thị trường" Sự hiểu biết tích lũy trong quá trình học tập sẽ giúp tôi khám phá sâu hơn về chủ đề này.

HÌNH TOÁN HỌC PHÂN TÍCH VÀ DỰ BÁO GIÁ CỔ PHIẾU

MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU

- Hệ thống kiến thức cơ sở về lý thuyết chuỗi thời gian, mô hình hồi quy tuyến tính chuỗi thời gian, mô hình ARIMA

Bài viết này tập trung vào việc áp dụng hai mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA để dự báo giá cổ phiếu Vinamilk trong ngắn hạn, sử dụng phần mềm Eview Việc nghiên cứu và áp dụng những mô hình này giúp nâng cao độ chính xác trong việc dự đoán biến động giá cổ phiếu, từ đó hỗ trợ các nhà đầu tư đưa ra quyết định thông minh hơn trong giao dịch.

- Nghiên cứu, tìm hiểu, giới thiệu mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA

Nghiên cứu mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA bao gồm việc tìm hiểu các khái niệm cơ bản, phương pháp ước lượng, kiểm định hệ số hồi quy và kỹ thuật dự báo.

- Nghiên cứu, áp dụng vào dự báo giá cổ phiếu Vinamilk trong ngắn hạn.

ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU

- Số liệu VNM đƣợc lấy từ ngày 9-1-2015 đến ngày 4-3-2015

- Nguồn cập nhật số liệu là trang web cophieu68.com Đây là trang web chuyên cung cấp số liệu về thị trường chứng khoán Việt Nam

Giáo trình kinh tế lƣợng.

PHƯƠNG PHÁP NGHIÊN CỨU

- Nghiên cứu tổng hợp lý thuyết: nghiên cứu cơ sở khoa học của đề tài

- Nghiên cứu giáo trình và tài liệu tham khảo có liên quan đến đề tài

- Trao đổi với giáo viên hướng dẫn

- Phương pháp sử dụng mô hình hồi quy tuyến tính chuỗi thời gian

- Phương pháp sử dụng mô hình ARIMA.

BỐ CỤC KHÓA LUẬN

Khóa luận gồm 55 trang, với các nội dung :

Chương 1- Kiến thức cơ sở (25 trang)

Chương 2- Ứng dụng mô hình hồi quy tuyến tính chuỗi thời gian và

ARIMA vào dự báo giá cổ phiếu vinamilk (15 trang)

Với 16 tài liệu tham khảo: 6 tiếng việt, 5 tiếng anh và 5website.

KIẾN THỨC CƠ SỞ

Giới thiệu về số liệu chuỗi thời gian

Trong kinh tế xã hội, chúng ta thường phân tích các biến số theo thời gian như GDP hàng năm và tỷ lệ thất nghiệp hàng năm Ngoài ra, còn có các biến số khác như mức lạm phát hàng tháng, chỉ số VN-INDEX hàng ngày, và giá vàng trên thị trường thế giới được cập nhật liên tục, thường là sau mỗi hai phút trên các trang web phổ biến.

Các biến số trên đều là các biến số chuỗi thời gian, hay còn gọi đơn giản là chuỗi thời gian

Chuỗi thời gian có thể được định nghĩa là một dãy biến ngẫu nhiên (X_t) với chỉ số thời gian t, và thường được gọi là quá trình ngẫu nhiên Trong khóa luận này, chúng tôi chỉ tập trung vào chuỗi thời gian (X_t) với chỉ số t là tập số nguyên.

1 Khái niệm chuỗi thời gian

Chuỗi các quan sát đƣợc thu thập trên cùng một đối tƣợng tại các mốc thời gian cách đều nhau đƣợc gọi là chuỗi thời gian

Vì bản chất thứ tự của chuỗi số nên với số liệu chuỗi thời gian chúng ta còn quan tâm đến hiện tƣợng sau:

- Tự tương quan (autocorrelation): Chuỗi X t được gọi là có tự tương quan bậc p nếu: Corr ( X t , X t  p ) 0

- Tự tương quan với số liệu chuỗi thời gian đôi khi còn được gọi là tương quan chuỗi (serial correlation)

2 Một số đặc trƣng của chuỗi thời gian

Số liệu chuỗi thời gian thường có tính tự tương quan, nghĩa là các quan sát không độc lập và có thể liên quan đến nhau Điều này khác với số liệu chéo, nơi các quan sát thường được coi là độc lập Tính tự tương quan trong chuỗi thời gian thể hiện qua mối quan hệ giữa các giá trị tại các thời điểm khác nhau, với hệ số tương quan Corr(Yt, Yt-s) thường khác 0.

Dữ liệu chuỗi thời gian và yếu tố mùa vụ đóng vai trò quan trọng trong phân tích kinh tế xã hội, vì chúng thường bị ảnh hưởng bởi các yếu tố thời vụ Các yếu tố mùa vụ thường xuất hiện trong các số liệu có tần suất nhỏ hơn một năm, chẳng hạn như số liệu theo quý hoặc hàng tháng.

Chuỗi thời gian thường chứa yếu tố xu thế, thể hiện sự tăng trưởng hoặc giảm sút kéo dài Ví dụ, GDP của một nền kinh tế thường có xu hướng gia tăng nhờ vào sự cải thiện công nghệ, nâng cao chất lượng nguồn nhân lực và gia tăng đầu tư vào vốn và lao động.

Mô hình hồi quy tuyến tính với chuỗi thời gian

Xét mô hình hồi quy tuyến tính với số liệu chuỗi thời gian nhƣ sau:

1.1 Các giả thiết của mô hình

Trong đó 1 , 2 …là các tham số, u t là sai số ngẫu nhiên thể hiện cho tác động của các biến khác lên biến Y

Ký hiệu Y t thể hiện giá trị của biến số tại thời điểm t chứ không phải là các giá trị trễ của các biến số khác

Phát biểu giả thiết cho mô hình (*) nhƣ sau:

- Giả thiết 1: Sai số ngẫu nhiên không tự tương quan : s t u u

- Giả thiết 2: Kỳ vọng có điều kiện của sai số ngẫu nhiên bằng 0

Biến ngoại sinh chặt (strictly exogenous variable): biến độc lập đƣợc gọi là biến ngoại sinh chặt nếu ( )  t

- Giả thiết 3: Phương sai sai số là bằng nhau tại mọi thời điểm:

- Giả thiết 4: Giữa các biến độc lập không có quan hệ đa cộng tuyến hoàn hảo

- Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật chuẩn u t N   0 ,  2

1.2 Tính chất của các ƣớc lƣợng và bài toán suy diễn thống kê

Mô hình hồi quy tuyến tính Y t = β1 + β2 X2 t + + βk Xkt + ut cho phép sử dụng phương pháp ước lượng OLS Các ước lượng này có những tính chất quan trọng được thể hiện qua các định lý, trong đó có Định lý Gauss-Markov.

Khi các giả thiết 1 đến 4 được thỏa mãn, ước lượng OLS sẽ là các ước lượng tuyến tính, không chệch và tốt nhất trong lớp các ước lượng tuyến tính không chệch Định lý 2 chỉ ra rằng, trong trường hợp này, phương sai của các hệ số ước lượng góc và sai số chuẩn của chúng có thể được tính theo các công thức cụ thể.

 là ƣớc lƣợng không chệch của  2 và đƣợc tính bởi công thức: k n e i i

2 Định lý 3: Khi các giả thiết 1 đến giả thiết 5 thỏa mãn thì các hệ số ƣớc lƣợng có phân bố chuẩn : j

 j var đƣợc tính bởi công thức (*)

1.3 Mô hình hồi quy sử sụng ngôn ngữ ma trận

1.3.1 Ước lượng OLS và ma trận hiệp phương sai của hệ số ước lượng

Hàm hồi quy mẫu tương ứng với mô hình (1.3) viết được dưới dạng :

Với véc tơ phần dƣ :

Do đó ta cũng có :

Do đó phương pháp OLS đưa về việc giải bài toán cực trị : tìm véc tơ   sao cho cực tiểu biểu thức:

Nhƣ vậy véc tơ ƣớc lƣợng   cần thỏa mãn điều kiện cần bậc nhất :

Do tồn tại ma trận nghịch đảo  X ' X   1 nên nhân hai vế của biểu thức trên với ma trận nghịch đảo này ta có:

Công thức (1.5) biểu thị ước lượng OLS cho các hệ số hồi quy Để phân tích ma trận phương sai-hiệp phương sai của các hệ số ước lượng, ta cần biến đổi công thức (1.5) theo cách phù hợp.

Do đó sử dụng điều kiện (1.4) ta có thể biểu diễn ma trận hiệp phương sai giữa các hệ số ƣớc lƣợng bởi:

Chẳng hạn khi k=2 ta tính được ma trận phương sai-hiệp phương sai như sau:

Gọi ( Y t , X 2 t , , X kt ) với t=1,2, ,n là mẫu ngẫu nhiên của mô hình (*) Khi đó ta có thể biểu diễn lại nhƣ sau:

Hệ phương trình này có thể biểu diễn dưới dạng ma trận như sau: u X

Trong đó Y, X,  và u là các ma trận có kích thước lần lượt là : (n×1), (n×k), (k×1) và (n×1) nhƣ sau :

Các giả thiết của phương pháp OLS :

Giả thiết 1: Việc ƣớc lƣợng đƣợc dựa trên cơ sở mẫu ngẫu nhiên (X,Y) Giả thiết 2: E  u X   0 n  1 với 0 n  1 là véc tơ gồm n thành phần bằng 0

Giả thiết 3: E  uu ' X    2 I , trong đó I là ma trận đơn vị cỡ n×n, dấu ‘ trên đầu mỗi ma trận là ký hiệu của ma trận chuyển vị

Nhƣ vậy giả thiết 3 cho rằng :

Giả thiết này thực chất là giả thiết về phương sai sai số không đổi, kết hợp giả thiết về mẫu ngẫu nhiên

Giả thiết 4 khẳng định rằng ma trận nghịch đảo \( (X'X)^{-1} \) tồn tại, điều này có nghĩa là không có quan hệ đa cộng tuyến hoàn hảo giữa các biến độc lập và không có biến nào trong tập số liệu là hằng số.

Nếu các véc tơ cột (hoặc dòng) của một ma trận vuông phụ thuộc tuyến tính, thì ma trận đó sẽ không khả nghịch, tức là không có ma trận nghịch đảo tồn tại.

Trong ma trận X, cột đầu tiên là véc tơ với tất cả các thành phần bằng 1 Nếu có một biến độc lập nào đó là hằng số, ma trận (X'X) sẽ không có ma trận nghịch đảo Tuy nhiên, giả thiết này thường không xảy ra và thường được bỏ qua, vì trong các tệp số liệu, các biến số thường không phải là hằng số.

1.3.2 Chứng minh định lý Gauss-Markov

Với mỗi giá trị của ma trận X thì từ biểu diễn trên có thể thấy ngay rằng

 là hàm tuyến tính của Y, do đó nó là ƣớc lƣợng tuyến tính

Thay biểu diễn (1.3) vào (1.6) ta có:

Lấy kỳ vọng 2 vế của biểu thức trên và với giả thiết 2 thỏa mãn ta có:

Nhƣ vậy   là ƣớc lƣợng không chệch của 

Ký hiệu  ~ là ƣớc lƣợng tuyến tính bất kỳ cho, nghĩa là có thể viết được dưới dạng: ̃=[( ) ] (1.8)

Trong đó C là ma trận gồm các hằng số nào đó

Thay biểu diễn (1.3) vào (1.8) ta có: ̃=[( ) ]( ) ( ) (1.9)

Lấy kỳ vọng hai vế của (1.9), với điều kiện giả thiết 2 thỏa mãn ta có:

Do đó để  ~ là ƣớc lƣợng không chệch cho  thì ta phải có:

Khi đó (1.9) có thể biểu diễn nhƣ sau: ̃= +[( ) ]

Khi đó ma trận hiệp phương sai của  ~ bằng:

Khai triển biểu thức trên, với giả thiết về phương sai sai số không đổi ta có:

Thay CX=0 (và do đó X ' C '  0) vào biểu thức trên, ta có:

Thành phần đầu tiên trên đường chéo chính của ma trận CC' được tính bằng tổng bình phương các phần tử c_ij, với c_ij là phần tử tại dòng i và cột j của ma trận C Do đó, các thành phần trên đường chéo chính của ma trận CC' luôn không âm Từ điều này và biểu thức (1.11), ta có thể rút ra kết luận quan trọng.

~ | var   với mọi j=1,2, , k Đây là điều cần chứng minh

2 Tính chất mẫu lớn của ƣớc lƣợng OLS

Mô hình hồi quy chuỗi thời gian sử dụng thông tin về quan hệ giữa các biến số trong quá khứ để dự đoán quan hệ trong tương lai, với kỳ vọng rằng mối quan hệ này sẽ ổn định theo thời gian Một khái niệm quan trọng liên quan đến sự ổn định này là chuỗi dừng, được định nghĩa như sau:

- Chuỗi dừng: Một chuỗi X t với E( X 2 t ) hữu hạn đƣợc gọi là chuỗi dừng (stationary series) nếu thỏa mãn ba điều kiện sau đây:

(ii)Phương sai không đổi:var( X t )= 2

(iii)Hiệp phương sai không phụ thuộc vào thời điểm tính toán: Cov( )

Như vậy chuỗi dừng là chuỗi có kỳ vọng, phương sai và hiệp phương sai là không đổi theo thời gian

- Chuỗi không dừng: Là chuỗi không thỏa mãn một trong ba điều kiện trên đƣợc gọi là chuỗi không dừng (non-stationary)

Chuỗi phụ thuộc yếu là một chuỗi dừng x_t, trong đó hệ số tương quan giữa x_t và x_{t+h} giảm dần về 0 với tốc độ nhanh khi h tiến ra vô cực.

2.2 Các giả thiết thay thế

Trong đó các biến X jt có thể là biến trễ của biến phụ thuộc hoặc biến trễ của biến độc lập, chẳng hạn X 2 t  Y t  1

Ta có các giả thiết cho mô hình (*) nhƣ sau:

- Giả thiết 1: Các chuỗi số  Y t , X 2 t , , X kt  là các chuỗi dừng và phụ thuộc yếu

- Giả thiết 2: Sai số ngẫu nhiên không tự tương quan: corr  u t , u s | X , , X k   0 ,  t  s

- Giả thiết 3: Tại mỗi t, ta có E  u t | X 2 t , , X kt   0

- Giả thiết 4: Phương sai sai số là bằng nhau tại mọi thời điểm:

- Giả thiết 5: Giữa các biến độc lập không có quan hệ đa cộng tuyến hoàn hảo

2.3 Tính chất mẫu lớn của các ƣớc lƣợng Định lý 1: Khi các giả thiết 1 và 2 thỏa mãn thì các hệ số ƣớc lƣợng thu được từ phương pháp OLS là các ước lượng vững, nghĩa là:

Với mọi   0 bé tùy ý ta luôn có:

  là ước lượng  j với mẫu kích thước n Định lý 2: Khi các giả thiết 1 đến giả thiết 5 thỏa mãn thì các ƣớc lƣợng

OLS là tiệm cận hiệu quả trong lớp các ƣớc lƣợng tuyến tính và vững, nghĩa là:

 var ~ lim var lim với j  1 , 2 , , k

Trong nghiên cứu này, chúng tôi xem xét các ước lượng OLS (Ordinary Least Squares) và ước lượng tuyến tính vững, ký hiệu là   j và  ~ j Định lý 3 chỉ ra rằng khi các giả thiết từ 1 đến 5 được thỏa mãn và kích thước mẫu đủ lớn, thì các ước lượng j sẽ đạt được độ chính xác cao.

Kết quả thu được từ phương pháp OLS có phân phối gần chuẩn, dẫn đến các thống kê t và F cũng có phân phối gần với quy luật Student và Fisher tương ứng.

3 Vấn đề tự tương quan trong mô hình hồi quy chuỗi thời gian

3.1 Hậu quả của tự tương quan trong mô hình hồi quy chuỗi thời gian 3.1.1 Hiện tượng tự tương quan

Khi mô hình Y t = β1 + β2 X2 t + + βk Xkt + ut xuất hiện hiện tượng tự tương quan, điều này có nghĩa là các sai số ngẫu nhiên ut tại các thời điểm khác nhau có mối tương quan với nhau.

+ Tự tương quan bậc 1: Sai số ngẫu nhiên u t được gọi là có tự tương quan bậc 1 nếu có thể biểu diễn được dưới dạng: u t = 1 u t 1  t

Trong đó  t là nhiễu trắng

Khi ρ1 < 0, mô hình thể hiện sự tự tương quan bậc 1 âm, cho thấy có mối quan hệ tuyến tính ngược chiều giữa ut và ut-1; tức là, nếu ut-1 có giá trị nhỏ, thì ut có khả năng cao sẽ có giá trị lớn và ngược lại.

Khi hệ số tự tương quan bậc 1 ( 1) lớn hơn 0, mô hình thể hiện sự tự tương quan dương Điều này có nghĩa là giữa biến ngẫu nhiên u t và u t  1 tồn tại mối quan hệ tuyến tính cùng chiều; nếu giá trị của u t  1 cao, thì khả năng cao là u t cũng sẽ có giá trị lớn.

Mô hình ARIMA ( Mô hình trung bình trƣợt, tích hợp, tự hồi quy )

Mô hình phân tích dữ liệu chuỗi thời gian dựa vào giá trị trong quá khứ của một biến số để dự đoán giá trị tương lai của nó Cụ thể, giá trị tại thời điểm t được xác định bởi hàm f(Xt-1, Xt-2, , X0, t) Mục tiêu của phân tích này là làm rõ các mối quan hệ giữa các giá trị trong chuỗi thời gian.

X t đã được quan sát để dự đoán giá trị trong tương lai, đặc biệt hữu ích cho việc dự báo ngắn hạn.

1.1.Mô hình tự hồi quy p-AR(p)

Trong mô hình tự hồi quy quá trình phụ thuộc vào tổng trọng số của các giá trị quá khứ và số hạng nhiễu ngẫu nhiên : t p t p t t t X X X W

Chuỗi thời gian ( X t ; t  Z ) đƣợc gọi là quá trình tự hồi quy cấp p, kí hiệu là AR(p), nếu ( X t ) là quá trình ngẫu nhiên thỏa mãn phương trình: t p t p t t X X X W

Trong đó  1 ,  2 , ,  p là các hằng số ( p ≠ 0), ( W t ) là nhiễu trắng với tham số  2 và W t không tương quan với X s với mọi s q, cho thấy nó cung cấp thông tin về cấp phụ thuộc của chuỗi Ngược lại, trong quá trình ARMA hay AR, hàm tự tương quan k ít mang lại thông tin về cấp độ phụ thuộc Do đó, cần thiết phải phát triển một hàm mới tương tự như hàm tự tương quan của MA(q) cho quá trình AR(p), được gọi là hàm tự tương quan riêng (PACF) Đối với quá trình dừng (Xt) có kỳ vọng bằng 0, khi h > 1, ký hiệu Xth.

 là ƣớc lƣợng hồi quy tuyến tính tốt nhất của X t  h đối với dãy  X t  h  1 ; X t  h  2 ; ; X t  1  theo nghĩa E X( t h X t h ) 2

   đạt giá trị nhỏ nhất Ta có thể viết X t h

X t là ƣớc lƣợng hồi quy tuyến tính tốt nhất của X t đối với dãy

 X t  1 ; X t  2 ; ; X t  h  1 .Do ( X t ) là chuỗi dừng nên ta có :

X    Định nghĩa: Hàm tự tương quan riêng (PACF) của chuỗi dừng ( X t ) đƣợc xác định bởi  ( 1 )  Corr ( X t  1 , X t )   ( 1 ) và ( ) ( , )

  và X t - X  t không tương quan với

Bài toán dự báo tập trung vào quá trình dừng (X_t; t ∈ Z) với giả thuyết E(X_t) = 0 để đảm bảo tính tổng quát Nội dung chính của bài toán là việc quan sát các giá trị của quá trình tại các thời điểm 1, 2, , n, được biểu diễn dưới dạng X_1, X_2, , X_n.

Để dự báo giá trị của quá trình X tại thời điểm n + h trong tương lai, ta sử dụng dự báo tuyến tính X n + h (với h ≥ 1) dựa trên các giá trị X 1, X 2, , X n Dự báo này được thể hiện qua tổ hợp tuyến tính S = S(a 1, a 2, , a n) = a 1 X 1 + + a n X n.

Dự báo S được gọi là tốt nhất nếu sai số bình phương trung bình

Dự báo quá trình AR(p):

Gỉa sử ta có ( X t ) là quá trình tự hồi quy AR(p) : t p t p t t t X X X W

Trước hết ta xét h  1 Ta có :

Đặt S t+1 = α1Xt + α2Xt-1 + + αpXt-p+1, chúng ta có thể chứng minh rằng S t+1 là dự báo tốt nhất trong các tổ hợp tuyến tính của Xt, Xt-1, , Xt-p+1 Nếu Y là một tổ hợp tuyến tính khác của Xt, Xt-1, , Xt-p+1, thì kết quả này vẫn giữ nguyên giá trị.

Tương tự trường hợp của h  1, ta cũng chứng minh được:

S         là dự báo tuyến tính tốt nhất Bằng quy nạp ta dễ thấy dự báo tuyến tính tốt nhất của X t  h là một tổ hợp tuyến tính của p giá trị X t , X t  1 , , X t  p  1 :

Để dự báo cho quá trình dừng AR(p), chỉ cần xem xét giá trị hiện tại và p-1 giá trị quá khứ Định lý này áp dụng cho quá trình dừng (Xt; t ∈ ℤ) và cho biết dự báo tuyến tính tốt nhất của h.

X    Định lý: Cho quá trình dừng ( X t ; t  ).Dự báo tuyến tính tốt nhất của h

Trong đó a 1 , a 2 , , a n thỏa mãn hệ phương trình sau:

Dự báo 1 bước liên quan đến việc sử dụng các giá trị X 1, X 2, , X n để dự đoán giá trị của chuỗi thời gian tại thời điểm n + 1, tức là dự báo giá trị của X n + 1 Mục tiêu là xác định giá trị dự báo cho X n + 1.

X n    n n   n n     nn Áp dụng định lý trên ta có: n k

Dạng ma trận của (**) là :  n  n  n

Trong đó:  n    ( k  j )  n  n ,  n    n 1  nn  ' ,  n    ( 1 )  ( n )  Nếu  n khả nghịch thì nghiệm của (**) là  n   n  1  n

Sai số bình phương trung bình của dự báo 1 bước là: n n n n n n E X X

Chú ý rằng nếu ( X t ) là quá trình dừng ARMA thì  n khả nghịch Định lý: ( The Durbin-Levinson Algorithm) Nghiệm của phương trình n n n 

 Định lý: Hàm tự tương quan riêng của quá trình dừng ( X t ) được xác định bởi  n  nn Áp dụng định lý trên ta có nếu ( X t ) là quá trình AR(p): t p t p t t X X X W

Nhận dạng mô hình ARIMA(p,d,q) bao gồm việc xác định các giá trị tối ưu cho các tham số p, d và q Trong đó, d đại diện cho bậc sai phân của chuỗi thời gian, p là bậc tự hồi quy, và q là bậc trung bình trượt.

Việc xác định p và q sẽ phụ thuộc vào các đồ thị SPACF=f(t) và

SACF=f(t).Với SACF là hàm tự tương quan mẫu và SPACF là hàm tự tương quan mẫu riêng phần (Sample Partial Autocorrelation):

+ Chọn giá trị của p nếu đồ thị SPACF có giá trị cao tại độ trễ 1,2,…,p và giảm nhiều sau p và dạng hàm SAC giảm dần

+ Chọn giá trị của q nếu đồ thị SACF có giá trị cao tại độ trễ 1,2,…,q và giảm nhiều sau q và dạng hàm SPAC giảm dần

5.2 Ƣớc lƣợng các tham số của mô hình

5.2.1 Ước lượng hàm hiệp phương sai và hàm tự tương quan

Giả sử ta có mẫu số liệu của quá trình dừng ( X t ) là x 1 , x 2 , , x n ta có ƣớc lƣợng hàm  (.) và  (.) lần lƣợt là:

5.2.2 Ước lượng hàm tự tương quan riêng

Cho X 1 , X 2 , , X n là các giá trị quan sát của quá trình dừng ( X t ) tại các thời điểm 1,2, ,n Gọi  1

X h là ƣớc lƣợng hồi quy tuyến tính tốt nhất của X h  1 đối với dãy X 1 , X 2 , , X h theo nghĩa ( 1 ) 2

E đạt giá trị nhỏ nhất Giả sử : h hh h h h X X X

Trong đó với h2 ta có: k h h hh k h hk    1 ,     1 , 

5.2.3 Ƣớc lƣợng tham số quá trình tự hồi quy AR(p)

Xét quá trình dừng tự hồi quy AR(p) : X n   1 X n  1   2 X n  2    p X n  p  W n thỏa mãn điều kiện W không tương quan với X  , X  … Có hai phương pháp ƣớc lƣợng các tham số  1 ,  2 , ,  p và  2  var   W n là:

- Phương pháp ước lượng bình phương tối thiểu

Kí hiệu U X n  1 X n  p  ,   1  p  ' Ta có dạng ma trận của quá trình dừng AR(p) là: n n U W

Giả sử ta có mẫu số liệu của X n là x 1 , x 2 , , x n và đặt u n  ( x n  1 x n  p ) ta có: n n n u w x   Ước lượng bình phương tối thiểu của t tham số  và các giá trị

(   đạt giá trị nhỏ nhất tại ( 1 p )

Ta có dạng ma trận của Q (  ) là Q (  )   X  U   ' X  U   Định lý: Ƣớc lƣợng bình quân tối thiểu của tham số    1 , 2 , , n  và

- Phương pháp Yule-Walker: Ta có thể ước lượng  1 ,  2 , ,  p qua hệ phương trình Yule-Walker sau:

 Ước lượng ( ) bởi phương trình :

Sau khi ước lượng các tham số của mô hình ARIMA được xác định, bước tiếp theo là kiểm định để xác nhận tính thích hợp của mô hình Các phương pháp kiểm định này bao gồm việc sử dụng các tiêu chí thống kê và phân tích độ chính xác của mô hình.

Để xác định xem phần dư e t có phải là nhiễu trắng hay không, nếu e t được xác nhận là nhiễu trắng thì mô hình có thể được chấp nhận Ngược lại, nếu không phải, chúng ta cần bắt đầu lại từ đầu Các kiểm định có thể được sử dụng bao gồm kiểm định BP (Box-Priere), kiểm định Ljung-Box với thống kê Q, hoặc kiểm định LM.

-Nếu tồn tại nhiều hơn một mô hình đúng, mô hình có AIC (Akaike Information Criterion ) nhỏ nhất sẽ đƣợc lựa chọn

5.4 Dự báo bằng mô hình ARIMA

ỨNG DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH CHUỖI THỜI GIAN VÀ ARIMA VÀO DỰ BÁO GIÁ CỔ PHIẾU VINAMILK

Giới thiệu về số liệu

- Nguồn cập nhật số liệu là trang web cophieu68.com Đây là trang web chuyên cung cấp số liệu về thị trường chứng khoán Việt Nam

Dữ liệu của VNM được thu thập từ ngày 19 tháng 1 năm 2015 đến ngày 3 tháng 4 năm 2015, nhằm mục đích phản ánh tác động của nền kinh tế vĩ mô lên giá chứng khoán trong khoảng thời gian này.

VNM đại diện cho giá cổ phiếu của Vinamilk, doanh nghiệp hàng đầu Việt Nam trong lĩnh vực sản xuất sữa và các sản phẩm từ sữa, hiện chiếm khoảng 75% thị phần toàn quốc.

Công ty cổ phần Sữa Việt Nam được thành lập theo quyết định số 155/2003 QĐ-BCN ngày 01/10/2003 của Bộ Công nghiệp, chuyển đổi từ Doanh nghiệp Nhà nước Công ty Sữa Việt Nam trực thuộc Bộ Công nghiệp thành công ty cổ phần.

-Tháng 04/2004: Công ty sáp nhập nhà máy sữa Sài Gòn (SAIGONMILK), nâng tổng vốn điều lệ của Công ty lên 1.590 tỷ đồng

-Tháng 06/2005: Công ty mua lại phần vốn góp của đối tác trong Công ty Sữa Bình Định và sáp nhập vào Vinamilk

Cổ phiếu của Vinamilk đã chính thức được niêm yết và giao dịch tại Sở Giao dịch Chứng khoán TP.HCM vào ngày 19 tháng 1 năm 2006, với tổng khối lượng niêm yết lên tới 159 triệu cổ phiếu.

Ứng dụng

1 Áp dụng vào mô hình hồi quy tuyến tính chuỗi thời gian

Ta có mô hình hồi quy nhƣ sau: Y t =  1  2 X 2 t  3 X 3 t  u t

Với là chỉ số VNINDEX, là chỉ số thời gian t, là chỉ số giá đóng cửa của cổ phiếu VNM.

Chạy eview hồi quy Y t theo X 2 t và X 3 t ta thu đƣợc bảng sau:

Mô hình hồi quy mẫu : Y  t   1   2 X 2 t   3 X 3 t  e t

Phân tích ý nghĩa thống kê của các hệ số hồi quy:

H 0:  j  0 : j không có ý nghĩa thống kê

 có p_value bằng 0.0001 < 0.05, do đó bác bỏ H 0 , thừa nhận

H 1 nên  1 có ý nghĩa thống kê

 có p_value bằng 0.0000 < 0.05, do đó bác bỏ H 0 , thừa nhận

H 1 nên 2có ý nghĩa thống kê

+  3 : vì   3 có p_value bằng 0.0000 < 0.05, do đó bác bỏ H 0 , thừa nhận

H 1 nên  3 có ý nghĩa thống kê

Phân tích ý nghĩa kinh tế của các hệ số hồi quy:

Hệ số  2 cho thấy mối quan hệ giữa chỉ số VN-INDEX và giá cổ phiếu, cụ thể là khi VN-INDEX tăng 1 đơn vị, giá cổ phiếu sẽ tăng  2 đơn vị, giả định thời gian tại thời điểm t không thay đổi.

Hệ số  3 cho thấy rằng khi chỉ số thời gian tăng thêm 1 đơn vị, giá cổ phiếu sẽ tăng  3 đơn vị, giả sử chỉ số VN-INDEX tại thời điểm t giữ nguyên.

Phân tích ý nghĩa của hàm hồi quy:

Hàm hồi quy tổng thể : Y t =  1  2 X 2 t  3 X 3 t  u t (1)

H 0: R 2  0: mô hình (1) không phù hợp

Ta thấy : p_value bằng 0.0000 < 0.05 do đó bác bỏ H 0 , vậy mô hình hồi quy là phù hợp

Hệ số R² = 0.886139 cho thấy các biến độc lập như chỉ số VN-INDEX, giá cổ phiếu tại thời điểm t-1 và chỉ số thời gian tại thời điểm t giải thích 88.6139% sự biến động của mô hình, trong khi 11.3861% còn lại do các yếu tố khác ngoài mô hình ảnh hưởng.

Phát hiện hiện tượng tự tương quan:

Kiểm định hiện tượng tự tương quan bậc 1:

Xét biểu diễn của sai số ngẫu nhiên dưới dạng AR(1) như sau: t t t u u  1 1  (*)

Trong mô hình hồi quy chuỗi thời gian, giả sử rằng nhiễu trắng  t và điều kiện | 1 | 0.05 nên chấp nhận C = 0

Dự báo khoảng ngày 4-4-2015 là :

Số liệu thực tế ngày 4-4-2015 là: 106

Kết quả dự báo từ hai phương pháp cho thấy chúng xấp xỉ với giá trị thực tế và khoảng tin cậy 95% bao gồm giá trị thực Phương pháp hồi quy tuyến tính chuỗi thời gian cho kết quả dự báo xa hơn so với thực tế, chứng minh độ tin cậy cao của mô hình ARIMA Tuy nhiên, trong một số phiên giao dịch, các yếu tố ngoại lai như tâm lý nhà đầu tư và thông tin chính sách có thể làm tăng sai số dự báo Do đó, kết quả của mô hình ARIMA chủ yếu mang tính chất tham khảo, nhưng vẫn được xem là một công cụ hiệu quả cho dự báo ngắn hạn.

KẾT LUẬN VÀ KIẾN NGHỊ

Trong quá trình nghiên cứu và thực hiện khóa luận tốt nghiệp, tôi đã hiểu rõ quy trình xây dựng mô hình chuỗi thời gian và mô hình ARIMA cho dữ liệu tài chính Khóa luận đã đạt được những kết quả đáng ghi nhận, có thể tóm tắt như sau:

1.Tổng hợp các kiến thức cơ sở về chuỗi thời gian, mô hình hồi quy tuyến tính chuỗi thời gian, mô hình ARIMA

2.Áp dụng mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA vào dự báo giá cổ phiếu bằng cách sử dụng phần mềm Eview

Để dự báo ngắn hạn giá cổ phiếu mã CK VNM, bài viết này trình bày quy trình sử dụng phần mềm Eviews nhằm thực hiện mô hình hồi quy chuỗi thời gian và mô hình ARIMA.

Xây dựng mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA đa biến là cần thiết để dự báo chỉ số giá chứng khoán, vì giá chứng khoán phụ thuộc vào nhiều biến khác nhau Việc áp dụng các mô hình này giúp phân tích và dự đoán xu hướng biến động của thị trường tài chính một cách chính xác hơn.

2.Giải quyết yếu tố xu thế cho chuỗi dữ liệu

Do thời gian thực hiện hạn chế và kiến thức còn thiếu, khóa luận này vẫn còn nhiều thiếu sót Rất mong nhận được ý kiến đóng góp từ quý thầy cô và bạn đọc để cải thiện nội dung.

Ngày đăng: 26/06/2021, 13:31

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Nguyễn Viết Phú và Nguyễn Duy Tiến (2007), cơ sở lý thuyết xác suất, NXB ĐHQG Hà Nội Sách, tạp chí
Tiêu đề: cơ sở lý thuyết xác suất
Tác giả: Nguyễn Viết Phú, Nguyễn Duy Tiến
Nhà XB: NXB ĐHQG Hà Nội
Năm: 2007
[2] Bài giảng kinh tế lượng của Ths Đàm Đình Mạnh Sách, tạp chí
Tiêu đề: Bài giảng kinh tế lượng
Tác giả: Ths Đàm Đình Mạnh
[3] Đặng Hùng Thắng (2006), quá trình ngẫu nhiên và tính toán ngẫu nhiên, NXB ĐHQG Hà Nội Sách, tạp chí
Tiêu đề: quá trình ngẫu nhiên và tính toán ngẫu nhiên
Tác giả: Đặng Hùng Thắng
Nhà XB: NXB ĐHQG Hà Nội
Năm: 2006
[4] Phùng Thanh Bình, Hướng dẫn sử dụng Eview trong phân tích dữ liệu và hồi quy Sách, tạp chí
Tiêu đề: Hướng dẫn sử dụng Eview trong phân tích dữ liệu và hồi quy
Tác giả: Phùng Thanh Bình
[5] Nguyễn Quang Dong (2006), Kinh Tế Lượng (chương trình nâng cao), NXB Khoa Học và Kỹ thuật, Hà Nội, chương 3-4-5 Sách, tạp chí
Tiêu đề: Kinh Tế Lượng (chương trình nâng cao)
Tác giả: Nguyễn Quang Dong
Nhà XB: NXB Khoa Học và Kỹ thuật
Năm: 2006
[6] Nguyễn Thống (2000), Kinh Tế Lượng Ứng Dụng, NXB Đại Học Quốc Gia Tp. Hồ Chí Minh.Tiếng Anh Sách, tạp chí
Tiêu đề: Kinh Tế Lượng Ứng Dụng
Tác giả: Nguyễn Thống
Nhà XB: NXB Đại Học Quốc Gia Tp. Hồ Chí Minh
Năm: 2000
[7] John E.Hanke &amp; Dean W.Wichern, (2005), Business Forecasting, 8 th Edition, Chapter 9 Sách, tạp chí
Tiêu đề: Business Forecasting
Tác giả: John E. Hanke, Dean W. Wichern
Năm: 2005
[8] Humway, Robert H., Stoffer, David S.(2011), Time Series Analysis and its Applica-tions With R Examples, Springer New York Dordrecht Heidelberg London Sách, tạp chí
Tiêu đề: Time Series Analysis and its Applications With R Examples
Tác giả: Robert H. Humway, David S. Stoffer
Nhà XB: Springer New York
Năm: 2011
[9] Robert Yaffee and Monnie McGee. Time series Analysis and forecasting Sách, tạp chí
Tiêu đề: Time series Analysis and forecasting
Tác giả: Robert Yaffee, Monnie McGee
[10] Box G E P &amp; Jenkins G M. Time series analysis : Forecasting and control. San Francisco, CA: Holden-day, 1970 Sách, tạp chí
Tiêu đề: Time series analysis : Forecasting and control
Tác giả: Box G E P, Jenkins G M
Nhà XB: Holden-day
Năm: 1970
[11] Roy Bathchelor. Box-Jenkins Analysis. Cass Business School, City of London.Website Sách, tạp chí
Tiêu đề: Box-Jenkins Analysis
Tác giả: Roy Bathchelor
Nhà XB: Cass Business School, City of London

HÌNH ẢNH LIÊN QUAN

Gọi ( Yt ,X 2t ,...,X k t) với t=1,2,..,n là mẫu ngẫu nhiên của mô hình (*). Khi đó ta có thể biểu diễn lại nhƣ sau:  - Một số mô hình toán học phân tích và dự báo giá cổ phiếu
i ( Yt ,X 2t ,...,X k t) với t=1,2,..,n là mẫu ngẫu nhiên của mô hình (*). Khi đó ta có thể biểu diễn lại nhƣ sau: (Trang 14)
III. Mô hình ARIMA (Mô hình trung bình trƣợt, tích hợp, tự hồi qu y) 1. Cơ sở lý luận  - Một số mô hình toán học phân tích và dự báo giá cổ phiếu
h ình ARIMA (Mô hình trung bình trƣợt, tích hợp, tự hồi qu y) 1. Cơ sở lý luận (Trang 26)
Chạy eview hồi quy Yt theo X2t và X 3t ta thu đƣợc bảng sau: - Một số mô hình toán học phân tích và dự báo giá cổ phiếu
h ạy eview hồi quy Yt theo X2t và X 3t ta thu đƣợc bảng sau: (Trang 40)
Bƣớc1: Ƣớc lƣợng mô hình (*) thu đƣợc các phần dƣ et - Một số mô hình toán học phân tích và dự báo giá cổ phiếu
c1 Ƣớc lƣợng mô hình (*) thu đƣợc các phần dƣ et (Trang 42)
Vậy với mức ý nghĩa = 0.05, mô hình có tự tƣơng quan bậc 1. - Một số mô hình toán học phân tích và dự báo giá cổ phiếu
y với mức ý nghĩa = 0.05, mô hình có tự tƣơng quan bậc 1 (Trang 43)
Các đại lƣợng đánh giá chất lƣợng dự báo của mô hình là: RMSE=1.008134, MAE= 0.754523, MAPE= 0.721864%  - Một số mô hình toán học phân tích và dự báo giá cổ phiếu
c đại lƣợng đánh giá chất lƣợng dự báo của mô hình là: RMSE=1.008134, MAE= 0.754523, MAPE= 0.721864% (Trang 45)
Do Cở mô hình (4) có: P_g t= 0.4200 &gt; 0.05 nên chấp nhận C= 0. - Một số mô hình toán học phân tích và dự báo giá cổ phiếu
o Cở mô hình (4) có: P_g t= 0.4200 &gt; 0.05 nên chấp nhận C= 0 (Trang 54)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w