Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ .... Từ các công trình ban đầu về chuỗi thời gian mờ được xuất hiện năm 1993, hiện nay mô hình này đang được sử dụng để
Trang 1
ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN
-
NGUYỄN THỊ KIM LOAN MÔ HÌNH CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO CHUỖI THỜI GIAN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 Giáo viên hướng dẫn: TS NGUYỄN CÔNG ĐIỀU THÁI NGUYÊN – 2015 MỤC LỤC MỞ ĐẦU 1
CHƯƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN
5 1 Chuỗi thời gian và quá trình ngẫu nhiên 5
1.1 Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
5 1.2 Quá trình ngẫu nhiên dừng 6
1.3 Hàm tự tương quan 7
1.4 Toán tử tiến, toán tử lùi 8
2 Quá trình ARMA 9
2.1 Quá trình tự hồi quy 9
2.2 Quá trình trung bình trượt 11
2.3 Quá trình tự hồi quy trung bình trượt
13 3 Ước lượng tham số mô hình ARMA
15 4 Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính
16 CHƯƠNG 2 LÝ THUYẾT TẬP MỜ VÀ CHUỖI THỜI GIAN MỜ
23 1 Lý thuyết tập mờ 23
1.1 Tập mờ 23
1.2 Các phép toán trên tập mờ 25
2 Các quan hệ và suy luận xấp xỉ, suy diễn mờ 30
2.1 Quan hệ mờ 30
Trang 2
2.2 Suy luận xấp xỉ và suy diễn mờ 31
3 Hệ mờ 33
3.1 Bộ mờ hoá 33
3.2 Hệ luật mờ 34
3.3 Động cơ suy diễn 35
3.4 Bộ giải mờ 36
3.5 Ví dụ minh hoạ 37
CHƯƠNG 3 MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI GIAN MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN 39
1 Một số khái niệm
39 1.1 Định nghĩa tập mờ và chuỗi thời gian mờ 39
1.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ 40
2 Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ 41
2.1 Mô hình thuật toán của Song và Chissom 41
2.2 Mô hình thuật toán của Chen 42
2.3 Thuật toán của Singh 43
2.4 Mô hình Heuristic cho chuỗi thời gian mờ 45
3 Ứng dụng trong dự báo chứng khoán
48 3.1 Bài toán chỉ số chứng khoán Đài Loan 48
3.2 Xây dựng chương trình
60 KẾT LUẬN 64
TÀI LIỆU THAM KHẢO 65
1
MỞ ĐẦU
Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân tích trong kinh tế, xã hội cũng như trong nghiên cứu khoa học Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều tác giả đã đề xuất các công cụ để phân tích chuỗi thời gian
Trong những năm trước, công cụ chủ yếu để phân tích chuỗi thời gian là
sử dụng các công cụ thống kê như hồi qui, phân tích Furie và một vài công cụ khác Nhưng hiệu quả nhất có lẽ là mô hình ARIMA của Box-Jenkins Mô hình này đã cho một kết quả khá tốt trong phân tích dữ liệu Tuy nhiên sự phức tạp của thuật toán đã gây khó khăn khi ứng dụng trong phân tích chuỗi số liệu, nhất
là khi chuỗi số liệu có những thay đổi phản ánh sự phi tuyến của mô hình
Để vượt qua được những khó khăn trên, gần đây nhiều tác giả đã sử dụng
mô hình chuỗi thời gian mờ Khái niệm tập mờ được Zadeh đưa ra từ năm 1965
và ngày càng tìm được ứng dụng trong nhiều lĩnh vực khác nhau nhất là trong điều khiển và trí tuệ nhân tạo Trong lĩnh vực phân tích chuỗi thời gian, Song và Chissom đã đưa khái niệm chuỗi thời gian mờ phụ thuộc vào thời gian và không phụ thuộc vào thời gian để dự báo Chen đã cải tiến và đưa ra phương pháp mới đơn giản và hữu hiệu hơn so với phương pháp của Song và Chissom Trong phương pháp của mình, thay vì sử dụng các phép tính tổ hợp Max- Min phức tạp, Chen đã tính toán bằng các phép tính số học đơn giản để thiết lập mối quan hệ
mờ Phương pháp của Chen cho hiệu quả cao hơn về mặt sai số dự báo và độ phức tạp của thuật toán
Từ các công trình ban đầu về chuỗi thời gian mờ được xuất hiện năm 1993, hiện nay mô hình này đang được sử dụng để dự báo rất nhiều lĩnh vực trong kinh
tế hay xã hội như trong lĩnh vực giáo dục để dự báo số sinh viên nhập trường,
Trang 3hay trong lĩnh vực dự báo thất nghiệp, trong lĩnh vực dân số, chứng khoán và
trong nhiều lĩnh vực khác như tiêu thụ điện, hay dự báo nhiệt độ của thời tiết…
Tuy nhiên xét về độ chính xác của dự báo, một số thuật toán trên còn cho
kết quả chưa cao Để nâng cao độ chính xác của dự báo, một số thuật toán cho
moo hình chuỗi thời gian mờ liên tiếp được đưa ra Chen sử dụng mô hình bậc
cao của chuỗi thời gian mờ để tính toán Sah và Degtiarev thay vì dự báo chuỗi
thời gian đã sử dụng chuỗi thời gian là hiệu số bậc nhất để nâng cao độ chính
xác Đây cũng là một phương pháp hay được sử dụng trong mô hình Box-Jenkins
để loại bỏ tính không dừng của chuỗi thời gian Huarng đã sử dụng các thông tin
có trước trong tính chất của chuỗi thời gian như mức độ tăng giảm để đưa ra mô
hình heuristic chuỗi thời gian mờ
Trong thời gian gần đây, đề tài này vẫn luôn được một số tác giả nghiên
cứu Các hướng hiện nay vẫn là tập trung nâng cao độ chính xác dự báo của mô
hình chuỗi thời gian mờ Bài báo của I-Hong Kuo và các tác giả (2008) đưa ra
phương pháp tăng độ chính xác của dự báo bằng tối ưu các phần tử đám đông
(Particle swarm optimaization) Ching Hsue Cheng và các đồng tác giả (2008)
mở rông nghiên cứu bằng các phương pháp kỳ vọng (Exspectation method) và
Phương pháp lựa chọn mức (Grade Selection Method) thông qua các ma trận
chuyển dịch có trọng Ngoài ra hiện nay có xu hướng sử dụng kết hợp các phương
pháp khác nhau với chuỗi thời gian mờ như phương pháp mạng Nơ ron như
Cagdas H Aladag (2008) hay Medey Khascay (2008) Ngay cả một nhà nghiên
cứu sâu trong lĩnh vực này là Huarng cũng đã mở rộng theo hướng này từ năm
2006 Thuật toán di truyền cũng tìm được ứng dụng trong hướng nghiên cứu này
Năm 2007 có bài báo của Li-Wei Lee sử dụng mối quan hệ mờ và thuật toán di
truyền để dự báo nhiệt độ và chỉ số tài chính của Đài Loan Ngoài ra một số tác
giả khác tìm những thuật toán khác đơn giản để dự báo như bài báo của Singh
(2007) hay thuật toán dựa vào trend của chuỗi thời gian (Baldwin 2000)
Nghiên cứu dự báo chuỗi thời gian luôn là một bài toán gây được sự chú
ý của các nhà toán học, kinh tế, xã hội học, Các quan sát trong thực tế thường được thu thập dưới dạng chuỗi số liệu Từ những chuỗi số liệu này người ta có thể rút ra được những quy luật của một quá trình được mô tả thông qua chuỗi số liệu Nhưng ứng dụng quan trọng nhất là dự báo khả năng xảy ra khi cho một chuỗi số liệu Những thí dụ dẫn ra trong các bài báo đều đưa ra khả năng dự báo trong kinh tế như dự báo chỉ số chứng khoán, mức tăng dân số, dự báo nhu cầu
sử dụng điện, dự báo số lượng sinh viên nhập học của một trường đại học Các thí dụ này đều có thể dẫn ra trong mỗi ngành kinh tế kỹ thuật
Như đã trình bày ở phần trên, có khá nhiều phương pháp dự báo chuỗi thời gian Thông thường để dự báo, người ta sử dụng một công cụ khá mạnh của thống
kê là mô hình ARIMA Mô hình này thích ứng hầu hết cho chuỗi thời gian dừng
và tuyến tính Trong mỗi bộ chương trình xử lý số liệu đều có một phần để dự báo chuỗi thời gian Nhưng đối với các chuỗi số liệu phi tuyến, nhất là trong số liệu kinh tế, sử dụng mô hình ARIMA kém hiệu quả Chính vì vậy phải có những phương pháp khác nhau để xử lý chuỗi số liệu phi tuyến Đã có nhiều người sử dụng công cụ mạng nơ ron để xử lý tính chất phi tuyên của chuỗi số liệu Đây là một hướng đi đã được nhiều người tiếp cận và đã có những sách chuyên khảo về vấn đề này thí dụ như cuốn của Mandic và Chambers “ Recurrent neural network and prediction” in vào năm 2001 Một hướng đi khác là sử dụng khái niệm mờ
để đưa ra thuật ngữ “ Chuỗi thời gian mờ” Phương pháp sử dụng chuỗi thời gian
mờ đã được đưa ra từ năm 1994 và đến nay vẫn đang được tiếp tục nghiên cứu
để làm tăng độ chính xác của dự báo
Trong đề tài này em trình bày phương pháp dự báo chỉ số chứng khoán bằng công cụ chuỗi thời gian mờ đã được một số tác giả phát triển Tư tưởng chính của phương pháp là sử dụng một số khái niệm của Huarng và Chen, Hsu
để phát triển thuật toán mới Dựa trên thuật toán đề ra, em đã tính toán một bài
Trang 44
toán thực tế dựa trên dữ liệu lấy từ thị trường chứng khoán Đài Loan để kiểm
chứng Kết quả thu được rất khả quan Độ chính xác của dự báo được nâng lên
khá nhiều so với các thuật toán trước đây đề ra
Nội dung chính của luận văn nghiên cứu những khái niệm, tính chất và
những thuật toán khác nhau trong mô hình chuỗi thời gian mờ để dự báo cho một
số chuỗi số trong kinh tế xã hội, được trình bày trong 3 chương:
Chương 1: trình bày các kiến thức cơ bản về chuỗi thời gian
Chương 2: trình bày Lý thuyết tập mờ và chuỗi thời gian mờ
Chương 3: trình bày một số thuật toán cơ bản trong chuỗi thời gian mờ và
một số thuật toán cải tiến
Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS Nguyễn
Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy Tác
giả xin chân thành cảm ơn các thầy giáo Viện công nghệ thông tin, khoa Công
nghệ thông tin Đại học Thái Nguyên đã tham gia giảng dạy giúp đỡ em trong
suốt qúa trình học tập nâng cao trình độ kiến thức Tuy nhiên vì điều kiện thời
gian và khả năng có hạn nên luận văn không thể tránh khỏi những thiếu sót Tác
giả rất mong các thầy cô giáo và bạn đóng góp ý kiến để đề tài được hoàn thiện
hơn
CHƯƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN
5
Trong phần này, chúng ta sẽ tìm hiểu về một lớp mô hình chuỗi thời gian hết sức thông dụng trong thực tế Đó là mô hình quy trình trượt ARMA(Autoregressive Moving Average) Ta sẽ nghiên cứu các đặc trưng của quá trình ARMA, xem xét tổng quan về phương pháp ước lượng tham số của lớp
mô hình này và cũng thấy rõ được hạn chế của nó khi áp dụng vào chuỗi thời gian tài chính Ngoài ra, mô hình ARMA còn đóng vai trò quan trong như là cơ sở để xây dựng mô hình ARCH sau này
1 Chuỗi thời gian và quá trình ngẫu nhiên
Trước khi đi vào chi tiết tìm hiểu về mô hình ARMA, ta sẽ nhắc lại một
số khái niệm liên quan đến chuỗi thời gian và quá trình ngẫu nhiên Dù là ta đi vào chi tiết mô hình gì đi chăng nữa thì các khái niệm cơ bản này vẫn sẽ theo chúng ta trong suốt quá trình nghiên cứu về chuỗi thời gian
1.1 Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x 1 , x 2 ,……… x n} được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm
đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán
học phù hợp với tập dữ liệu cho trước X:={x 1 , x 2 ,……… x n}nào đó Để có thể nói
về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát xt là một
giá trị thể hiện của biến ngẫu nhiên X t với t T Ở đây T được gọi là tập chỉ số Khi đó ta có thể coi tập dữ liệu X:={x 1 , x 2 ,……… x n} là thể hiện của quá trình
Trang 5ngẫu nhiên Xt, t T Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên
như sau
Định nghĩa 1.1(Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên X t , t T được
định nghĩa trên một không gian xác suất( , , )
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm,
ví dụ như là tập {1,2 } hay tập (- ,+ ) Tất nhiên cũng có những quá trình ngẫu
nhiên có T không phải là một tập con của R nhưng trong giới hạn của luận văn
này ta chỉ xét cho trường hợp T R Và thường thì ta xem T là các tập các số
nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên Một điểm
chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để
đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện 1.2 Quá
trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phương sai)
Giả sử X t , t Z là một quá trình ngẫu nhiên có var(X t )< với mỗi t
Z Khi đó hàm tự hiệp phương sai của X t được định nghĩa theo công thức sau:
x(r,s): cov(Xr, Xs) E[(Xr EXr)(Xs EXs)], với r, s Z
Nếu X t , t Z là một quá trình dừng, và nếu như a t R, i Z thoả mãn điều kiện a i thì hệ thức Y t : a iXt-i ,t Z sẽ định nghĩa một quá dừng
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, đừng theo
nghĩa rộng hay dừng bậc hai Tuy nhiên ở đây ta chỉ xem xét tính dừng theo nghĩa
đã định nghĩa ở trên
Khi chuỗi thời gian X t , t Z là dừng thì
Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp
phương sai bằng cách chỉ thông qua hàm một biến Khi đó, với quá trình dừng
X t , t Z ta có:
yx(h) x(h,0) Cov(Xt h,Xt), t,h Z Hàm số y x (.) được gọi là hàm tự hiệp phương sai của Xt, còn x(h)là giá trị của nó tại “trễ” h Đối với một quá trình dừng thì ta thường ký hiệu hàm tự hiệp phương sai bởi (.) thay vì x(.)
Với một quá trình dừng thì hàm hiệp phương sai có các tính chất
(0) 0, (h) (0), h Z
Trang 6Hàm tự tương quan của quá trình ngẫu nhiên X t , t Z được định
nghĩa tại trễ h như sau:
(h): = (h)/ (0):=corr(Xt+h,Xt), t, h Z
Chú ý:
Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={x t, t =
1,2,…n}của một chuỗi thời gian đừng nên về nguyên tắc ta không thể biết chính
xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước lượng nó
ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể hiện X
Hàm tự hiệp phương sai mẫu của một thể hiện X được định nghĩa bởi công thức
Khi đó thì hàm tương tự tương quan mẫu cũng định nghĩa thông qua hàm
tự hiệp phương sai mẫu như sau:
Toán tử lìu B là toán tử tuyến tính va khả nghịch Nghịch đảo của nó
B-1:=F được gọi là toán tử tiến, định nghĩa bởi công thức:
trình là dừng Khi đó, giả sử ta có quá trình dừng X t , t Z và một dãy {ai
,i Z tuyệt đối khả tổng, tức là i a , thì định lý 1.1, quá trình
Y t : a i X t i ,t Z cũng là quá trình dừng Ta ký hiệu a i B i là ánh xạ đặt
tương ứng quá trình dừng X t , t Z với quá trình dừng Y t , t Z Các chuỗi
theo B khi đó sẽ có những tính chất cho phép ta xử lý nó tương tự như đối với chuỗi nguyên thông thường Đặc biệt ta có thể thực hiện phép cộng, phép nhân
Trang 7hay phép lấy nghịch đảo Điều này có vai trò quan trọng trong các phép biến đổi
của đa thức tự hồi quy, đa thức trung bình trượt và các phép biến đổi xử lý chuỗi
thời gian khác
2 Quá trình ARMA
2.1 Quá trình tự hồi quy
Định nghĩa 1.5 (Quá trình ồn trắng)
Quá trình ngẫu nhiên t t Z được gọi là một ồn trắng, ký hiệu
WN(0, 2 ), khi nó thoả mãn các điều kiện sau:
E t s = 0 (t s)
E t2 2
Định nghĩa 1.6 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên X t , t Z là một quá trình tự hồi
quy cấp P, viết là X t AR(p), là một quá trình dừng {X t , t Z} thoả mãn
Xt a1Xt 1 a2Xt 2 apXt-p t,ap 0
với { } là một ồn trắng
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
Xt a1Xt 1 a2Xt 2 apXt-p t,ap 0, Hay ở dạng
toán tử a(z): 1 a1 2 apzp
z a2 z
ở đây a(z) được gọi là đa thức hồi quy
Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị( z 1)thì Xt
được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình nhân quả
Các đặc trưng của quá trình tự hồi quy cấp p:
(1)
… … … … … a1 (p-2)… (p-3) 1 (1) a2 (2) (p-1) (p-2) (1) 1 =
aa pp 1 ((pp) 1)
Trang 812
Hệ phương trình gọi là hệ phương trình Jule – Walker, song tuyến đối với a
và
Nghĩa là nếu cho ta sẽ tính được a và ngược lại cho a ta cũng sẽ tính được
Trong hệ phương trình Jule – Walker, nếu ta đặt pi = ai, i =1,…p thì
hệ phương trình Jule – Walker tương đương với
( j) p1 ( j p), j 1, , p Đại lượng pp ở trên được gọi là tự tương quan riêng cấp p của quá trình
{Xt , nó đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi
quy cũng như việc ước lượng tham số mô hình tự hồi quy sau này
Trong việc thực tế, khi cho chuỗi quan sát X:= x1, t = 1,2…,n thì ta dùng
công thức của tương quan mẫu để tính các r(i), là các giá trị xấp xỉ của (i) Khi
đã có các tự tương quan mẫu ta thay vào hệ phương trình Jule – Walker và giải
nó để tìm các tham số a1 Từ đây ta cũng xác định được tương
quan riêng p1 …., pp
2.2 Quá trình trung bình trƣợt
Định nghĩa1.7 (Quá trình trung bình trƣợt)
Một quá trình trung bình trượt cấp q, ký hiệu X t MA(q), là một quá
Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá trình
MA mà không đòi hỏi thêm điều kiện gì đối với các hệ số b1 Và với giả thiết t là ồn trắng thì theo định lý 1.1 ta có b(z) (z)
X t j X t j t ; j
j 1 j
Và có thể xác định i bằng cách chia 1(theo luỹ thừa tăng) cho
b(z),( 0 1)
Trang 9Khi quá trình X có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có nghiệm
có môđun lớn hơn 1 thì ta nói X
t là một quá trình khả nghịch Và từ nay về sau, nếu không nói gì thêm thì khi nói về các quá trình AR và MA chúng ta hiểu đó
là các quá trình nhân quả và khả nghịch
Các đặc trưng của quá trình trung bình trượt:
Từ công thức hiệp sai của quá trình trung bình trượt ta suy ra công thức của
tự tương quan như sau:
Trong đó t là ồn trắng, ặ) và b(.) lần lượt là đa thức tự hồi quy và đa
thức trung bình trượt có bậc tương ứng là p và q:
ăz): 1 a1z apz p b(z): 1 b1z bqz q
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau ăB)Xt b(B) t
Định nghĩa 1.9 (Quá trình nhân khả nghịch)
Trang 1016
Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch
nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung
ii) a(z) và b(z) không có nghiệm có môđun không
vượt quá 1 Chú ý:
Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa thức toán
tử, ta có thể biểu diễn một quá trình
Xt i 0 i t i, 0 1;i 1 i .
Và có thể tính các hệ số t bằng cách chia theo lũy thừa tăng a(z) cho b(z)
Các đặc trưng của quá trình ARMA:
3 Ước lượng tham số mô hình ARMA
Giả sử ta cần ước lượng các tham số của mô hình ARMA(p,q)
Xt a1Xt 1 apXt p t b1 t 1 bq t q,a1,a2, ,ap,b1,b2, ,bq R,ap 0,b
trong đó t đóng vai trò là sai số
Đối với mô hình ARMA cũng có nhiều phương pháp ước lượng tham số hiệu quả và được nêu ra chi tiết trong P.Brockwell, R David, 2001 Dưới đây, ta
sẽ xem xét phương pháp bình phương cực tiểu theo kiểu thuật toán Hannan – Rissanen Ý tưởng của thuật toán này là sử dụng hồi quy tuyến tính để ước lượng các tham số Nếu q>0 ta còn phải ước lượng các giá trị chưa biết t
Thuật toán Hannan – Rissanen
Bước 1:
q
Trang 11Dùng ước lượng Yule Walker để ước lượng các tham số mô hình AR(m),
HR .
n m q
4 Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính
Mô hình ARMA thu được thành công lớn khi áp dụng cho các chuỗi thời gian xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhưng thất bại khi
áp dụng cho các chuỗi thời gian kinh tế và tài chính Nguyên nhân chính là giả thiết về mặt toán học phương sai của các chuỗi thời gian tài chính không thay đổi theo thời gian là không phù hợp Và vì vậy mô hình ARMA có thể dự báo được
kỳ vọng nhưng thất bại khi dự báo phương sai của chuỗi thời gian tài chính Sau đây ta sẽ xem xét một ví dụ cụ thể để thấy rõ sự không phù hợp của mô hình ARMA đối với chuỗi thời gian tài chính
Xét chuỗi số chuỗi số liệu NYSE chứa giá trị của chỉ số chứng khoán giao dịch hằng ngày trên thị trường NewYork từ tháng ngày 02/01/1990 đến ngày 31/12/2001 Chuỗi gồm 3028 số liệu được lưu dưới tên file là NYSE.txt Tuy nhiên thay vì trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên của chuỗi gốc rồi lấy lại sai phân của nó để được một chuỗi mới mà trong lĩnh vực kinh tế tài chính ta gọi là chuỗi tăng trưởng
Từ số liệu ở trên, chuỗi giá và chuỗi tăng trưởng được minh họa bằng đồ thị sau
Trang 1220
Hình 1.1 Chuỗi giá
Hình 1.2 Chuỗi tăng trưởng
Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng
Ngược lại, chuỗi tăng trưởng có đồ thị rất giống với một quá trình dừng Khi nhìn
vào đồ thị của chuỗi tăng trưởng ta cũng thấy có xuất hiện những cụm biến động,
có vùng biến đổi về phương sai của chuỗi thời gian Tiếp theo ta sẽ khai thác đặc
trưng tương quan riêng mẫu của chuỗi tăng trưởng ở trên Kết quả được minh
Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng
Ta thấy rằng tương quan riêng của chuỗi tăng trưởng biến đổi trong một khoảng tương đối hẹp khá giống với tự tương quan riêng của một quá trình dừng Tuy nhiên ta lại không thấy được dấu hiệu triệt tiêu của tự tương quan riêng mặc
dù ta đã lấy đến trễ 100 Điều này cho thấy cho chuỗi tăng trưởng chắc chắn không thể là một quá trình tự hồi quy Ta cũng biết rằng, về mặt lý thuyết có thể xấp xỉ mô hình AR nhiều tham số bằng mô hình ARMA với ít tham số hơn Điều này cũng cho thấy mô hình ARMA nhiều khả năng không phù hợp với chuỗi tăng trưởng của chúng ta
Bây giờ ta lấy bình phương chuỗi tăng trưởng, kết quả cho bởi đồ thị dưới đây
Hình 1.5 Bình phương chuỗi tăng trưởng
Nhìn vào đồ thị ta có thể ta có thể thấy được việc tạo thành các cụm biến động trong đó các thời kỳ và biến động mạnh xen kẽ nhau Ta tính tiếp các đặc trưng mẫu của bình phương chuỗi tăng trưởng Kết quả được thể hiện bằng các đồ thị sau
Trang 13
Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng
Hình 1.7 Tự tương quan riêng của bình phương chuỗi tăng trưởng
Mặc dù chuỗi tăng trưởng ít tương quan nhưng bình phương của nó lại thể
hiện sự tương quan mạnh Những dấu hiệu đó cho ta thấy rằng mô hình ARMA
không thực sự phù hợp với chuỗi thời gian qua sát này
Bây giờ giả sử bằng cách nào đó ta tìm được mô hình ARMA gần nhất với
chuỗi quan sát và đó là mô hình ARMA(1,1) Mục đích ở đây là chúng ta sẽ thấy
rõ ràng sau khi ước lượng, nhiễu thu được sẽ không phải là một ồn trắng như ta
mong muốn nữa Thật vậy, kết quả ước lượng theo mô hình
Hình 1.10 Tự tương quan riêng của nhiễu
Ban đầu, do tính ít tương quan của nhiễu ước lượng được nên ta thấy nó giống với một quá trình ồn trắng Tuy nhiên khi lấy bình phương nhiễu ta lại thấy khác
Trang 14Hình 1.13 Tự tương quan riêng bình phương nhiễu
Rõ ràng là nhiễu có hiện tượng tạo cụm biến động giống như chuỗi tăng
trưởng ban đầu Còn khi nhìn vào đồ thị tự tương quan của bình phương nhiễu ta
thấy nó thể hiện sự tương quan mạnh nên ta có thể kết luận rằng nhiễu không
phải là một ồn trắng như mong muốn Và như vậy mô hình ARMA sẽ không phù
hợp với chuỗi số liệu này
25
Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài chính nhưng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau Box-Jenkins Chính Box-Jenkins là những người đầu tiên đưa ra các kỹ thuật lấy sai phân để khử khuynh tất định nhằm tăng khả năng dừng của một chuỗi thời gian Với những vận dụng sáng tạo khái niệm khuynh này, những người nghiên cứu đi sau Box-jenkins đã cho ra đời hai lớp mô hình rất quan trọng đối với chuỗi thời gian tài chính Đó là mô hình cộng tích, Cointegration (Granger,1981) và mô hình tự hồi quy biến động bất thường của chuỗi thời gian tài chính Mô hình ARCH là cống hiến mang tính khai phá của Engle, nó có thể giải thích sự bất thường của phương sai mà chỉ sử dụng những thông tin quá khứ của bản thân nhiễu Mô hình GARCH (Generalized Autoregressive Conditional Heteroschedasticity) đầu tiên được giới thiệu bởi Tim Bollerslev năm 1986 đã làm cho lớp mô hình này có nhiều ứng dụng thực tế hơn trong lĩnh vực kinh tế tài chính
và phát triển mạnh mẽ đó là hệ mờ Đây là hệ thống làm việc với môi trường không hoàn toàn xác định, với các tham số, các chỉ tiêu kinh tế kỹ thuật, các dự báo về môi trường sản xuất kinh doanh chưa hoặc khó xác định một cách thật rõ ràng, chặt chẽ Khái niệm logic mờ được giáo sư Lofti A.Zadeh đưa ra lần đầu
Trang 15tiên vào năm 1965 tại Mỹ Từ đó lý thuyết mờ đã được phát triển và ứng dụng
rộng rãi
Trong chương này chúng ta tập trung trình bày một số kiến thức cơ bản về
hệ mờ có liên quan tới mô hình mà chúng ta sẽ nghiên cứu
1 Lý thuyết tập mờ
1.1 Tập mờ
Định nghĩa: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên Ω
được xác định bởi hàm thuộc( membership function):
A: Ω [0,1]
0 A(x) 1
A(x) : Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A
(để cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm A(x))
Khoảng xác định của hàm A(x) là đoạn [0,1], trong đó giá trị 0 chỉ mức độ không
thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn
Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” được định nghĩa
như sau: A(x) = e a(x 1)2
Hình 2.1 Hàm liên thuộc của tập mờ “x gần 1”
Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác
Bell(x, a, b, c) = 1
Hình 2.2 Một số dạng hàm liên thuộc của tập mờ
1.2 Các phép toán trên tập mờ 1.2.1 Phép bù của tập mờ
Định nghĩa 1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn các điều
kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function)
Trang 1628
Định nghĩa 2: (Phần bù của một tập mờ): Cho n là hàm phủ định, phần bù
Ac của tập mờ A là một tập mờ với hàm thuộc được xác định bởi:
Ac(x) = n(A(x)), với mỗi x
1.2.2 Phép giao hai tập mờ
Định nghĩa 3( T - chuẩn): Hàm T: [0,1]2 [0,1] là phép bội (T - chuẩn) khi
và chỉ khi thoả mãn các điều kiện sau:
1.T(1, x) = x, với mọi 0 x 1
2.T có tính giao hoán : T(x,y) = T(y,x), với mọi 0 x, y 1
3 T không giảm: T(x,y)=T(u,v), với mọi x u, y v
4 T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0 x,y, z 1
Định nghĩa 4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tương ứng Cho T là một TChuẩn
Phép giao của hai tập mờ A,B là một tập mờ (ký hiệu (A TB)) trên với hàm
thuộc cho bởi biểu thức:
(A TB)(x) = T(A(x), B(x)), với mỗi x
Ví dụ:
- Với T(x,y)=min(x,y)ta có: (A TB)(x) = min(A(x),B(x))
- Với T(x,y) = x,y ta có (A TB)(x) = A(x).B(x) (tích đại số)
Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm
T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây:
29
- Hình a: Hàm thuộc của hai tập mờ A và B
- Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y)
- Hình c: Giao của hai tập mờ theo T(x,y)=x.y
3 S không giảm: S(x,y)= S(u,v), với mọi x u, y v
4 S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0
x, y, z 1
Định nghĩa 6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tương ứng Cho S là một T - đối chuẩn Phép hợp của hai tập mờ A, B là một tập mờ ( kí hiệu A SB)) trên với
hàm thuộc cho bởi biểu thức:
(A SB)(x)=S(A(x),B(x)), với mỗi x
Trang 17Ví dụ:
- Với S(x,y) = max(x,y): (A SB)(x)= max(A(x), B(x))
- Với S(x,y) = x + y – x.y: (A SB)(x)= A(x) + B(x) – A(x) .B(x)
- Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm
S(x,y)=max(x,y) và S(x,y)=x+y – x.y theo các đồ thị hình 2.4 sau đây:
- Hình a: Hàm thuộc của hai tập mờ A, B
- Hình b: Hợp của hai tập mờ theo S(x,y) = max(x,y)
- Hình c: Hợp của hai tập mờ theo S(x,y) = x + y – x.y
Hình 2.4 Phép hợp của hai tập mờ
1.2.4 Luật De Morgan
Cho T là T - chuẩn, S là T - đối chuẩn và n là phép phủ định mạnh
Khi đó bộ ba(T, S,n) là bộ ba De Morgan nếu:
lS(x,y) = S(T(x,y),n(x)) Bảng 1.2 dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng nhất
Trang 1832
Bảng 2.2 Một số phép kéo theo mờ thông dụng
2 Các quan hệ và suy luận xấp xỉ, suy diễn mờ
2.1 Quan hệ mờ
33
2.1.1 Khái niệm về quan hệ rõ
Định nghĩa 7: Cho X , Y , R X Y là một quan hệ ( quan hệ nhị nguyên rõ), khi đó
- Đối xứng nếu: R(x,y) = R(y,x) với x, y X
- Bắc cầu nếu: (xRy) (yRz) (xRz) với x,y,z X
Định nghĩa 8: R là quan hệ tương đương nếu R là quan hệ nhị nguyên
trên X có tính chất phản xạ, đối xứng và bắc cầu
2.1.2 Các quan hệ mờ
Các quan hệ mờ là cơ sở dùng để tính toán và suy diễn ( suy luận xấp xỉ)
mờ Đây là một trong những vấn đề quan trọng trong các ứng dụng mờ đem lại hiệu quả lớn trong thực tế, mô phỏng được một phần suy nghĩ của con người Chính vì vậy, mà các phương pháp mờ được nghiên cứu và phát triển mạnh mẽ Tuy nhiên chính logic mờ mở rộng được nghiên cứu và phát triển mạnh mẽ Tuy nhiên chính logĩ mờ mở rộng từ logic đa trị, do đó nảy sinh ra rất nhiều các quan
hệ mờ, nhiều cách định nghĩa các toán tử T-chuẩn, T-đối chuẩn, cũng như các phương pháp mờ hoá, khử mờ khác nhau,…Sự đa dạng này đòi hỏi người ứng dụng phải tìm hiểu để lựa chọn phương pháp thích hợp nhất cho ứng dụng của mình
Trang 19Định nghĩa 9: Cho U ; V ; R là một tập mờ trên U V gọi là một
quan hệ mờ( quan hệ hai ngôi)
0 R (x,y) = R(x,y) 1
Tổng quát: R U1 U2 …… Un là quan hệ n ngôi
0 R(u1, u2,……un) = R(u1, u2,… un) 1
2.1.3 Các phép toán của quan hệ mờ
Định nghĩa 10: Cho R là quan hệ mờ trên X Y, S là quan hệ mờ trên Y Z,
lập phép hợp thành SoR là quan hệ mờ trên X Z
Có R(x,y) với (x,y) X Y, S(y,z) với (y,z) Y Z Định nghĩa phép hợp thành:
Phép hợp thành max – min xác định bởi:
(S R)(x,z) = Sup (min(R(x,y),S(y,z))) (x,z) X Z y Y
Phép hợp thành max – prod xác định bởi:
(S R)(x,z) = Sup (min(R(x,y) S(y,z))) (x,z) X Z y Y
Phép hợp thành max – T ( với T là T - chuẩn) xác định bởi:
(S TR)(x,z) = Sup (T(R(x,y) , S(y,z))) (x,z) X Z y Y
2.2 Suy luận xấp xỉ và suy diễn mờ
Suy luận xấp xỉ hay còn gọi là suy luận mờ - đó là quá trình suy ra những
kết luận dưới dạng các mệnh đề trong điều kiện các quy tắc , các luật, các dữ liệu
đầu vào cho trước cũng không hoàn toàn xác định
Trong giải tích toán học chúng ta sử dụng mô hình sau để lập luận:
Định lý: “Nếu một hàm số là khả vi thì nó liên tục”
Sự kiện: Hàm khả vi Kết luận: Hàm là liên tục
Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens Căn cứ vào mô hình này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao cho nó có thể suy rộng cho logic mờ
Gọi là không gian tất cả các hàm số, ví dụ ={g:R R} A là các tập các hàm khả vi, B là tập các hàm liên tục Xét hai mệnh đề sau: P=’g A’ và Q
=’g B’ Khi đó ta có:
Luật (tri thức): P Q
Sự kiện: P đúng (True)
Kết luận: Q đúng (True)
Xét bài toán suy luận trong hệ mờ
Hệ mờ n biến vào x1, … xn và một biến ra y
Cho Un, i= n n là các không gian nền của các biến vào , V là không gian nền của biến ra
Hệ được xác định bởi m luật mờ”
R1: Nếu x1 là A11và x2 và ….xn là A1n thì y là B1
R2: Nếu x1 là A21 và x2 là A22 và…xn là A2n thì y là B2
Trang 20Trong đó biến mờ ji, i 1,n,j 1,m xác định trên không gian nền U, biến
mờ Bj, ( ( j 1,n) xác định trên không gian nền V
Để giải bài toán này chúng ta phải thực hiện qua các bước sau:
1 Xác định các tập mờ của các biến đầu vào
2 Xác định độ liên thuộc tại các tập mờ tương ứng
3 Xác định các quan hệ mờ R (A.B) (u,v)
4 Xác định phép hợp thành
Tính B’ theo công thức: B’ = A’ R(A,B)(u,v)
3 Hệ mờ
Kiến trúc cơ bản của một hệ mờ gồm 4 thành phần chính: Bộ mờ hoá, hệ
luật mờ, động cơ suy diễn mờ và bộ giải mờ như hình 2.5 dưới đây
37
Hình 2.5 Cấu hình cơ bản của hệ mờ
Không làm mất tính tổng quát, ở đây ta chỉ xét hệ mờ nhiều đầu vào, một
đầu ra ánh xạ tập compact S Rn vào R Các thành phần của hệ mờ được miêu
tả như sau
3.1 Bộ mờ hoá
Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác định
trong S được cho bởi hàm thuộc : S [0,1] Bộ phận này có chức năng chính dùng để chuyển một giá trị rõ x X thành một giá trị mờ trong S U (U là không
gian nền) Có hai phương pháp mờ hoá như sau:
Singleton fuzzifiter: Tập mờ A với x1 và hàm liên thuộc
được định nghĩa như sau
) Dauzzifier (
Động cơ suy diễn mờ ( Fuzzy Interence Engine )
Đầu vào rõ
Trang 21nhận giá trị lớn nhất là 1 tạo x = xi và giảm dần từ 1 đến 0 với các giá
trị dịch chuyển x x1
3.2 Hệ luật mờ
Gồm nhiều mệnh đề dạng:
IF<tập các điều kiện được thoả mãn>THEN<tập các hệ quả>
Giả sử hệ luật gồm M luật Rj (j= 1,M ) dạng
Rj: IF x1 is Aiand x2 is A2and xn is An j THEN y is B j
Trong đó xi (i =1,n ) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ mờ
- các biến ngôn ngữ, Ai là các tập mờ trong các tập đầu vào X và B j là các tập
mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất nhớ”,
“nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”,)đặc trưng bởi các hàm thuộc
A j và B j Khi đó R j là một quan hệ mờ từ các tập mờ đầu vào X = X 1 i
X 2 X n tới các tập mờ đầu ra Y
3.3 Động cơ suy diễn
Đây là một bộ phận logic đưa ra quyết định sử dụng hệ mờ để thực hiện
ánh xạ từ các tập mờ trong không gian đầu vào X thành tập mờ trong không gian
đầu ra Y
Khi Rj là một quan hệ mờ, thì Rj có thể là một tập con của tích Decart X
Y =
(x, y): x X, y Y ,với x (x1,x2, , x n )T Vì vậy, quan hệ
Rj là một hàm ánh xạ từ tập mờ trong X tới tập mờ trong
Với * là một toán tử T - chuẩn được định nghĩa trong bảng 2.1 Do tính
kết hợp, ta có thể định nghĩa: T 2 (x,y) = T(x,y)
T 3 (x,y,z) = T(x,T 2 (y,z)) với 0 x, y, z 1
Trang 2240
Bj (y) sup x U A( x )* R j ( x , y)
3.4 Bộ giải mờ
Đây là một ánh xạ từ các từ các tập mờ trong R thành các giá trị rõ ràng
trong R Có nhiều phép giải mờ, với mỗi ứng dụng sẽ có một phương thức giải
mờ khác nhau tuỳ thuộc yêu cầu ứng dụng Dưới đây sẽ liệt kê một số phương
thức giải mờ thông dụng
Phương pháp độ cao:
yh( x ) i 1M y B ' Bj ' j j )
Phương pháp tâm của các tập (Center – of – Sets):
phương pháp này mỗi luật được thay thế bởi tập singleton tâm cj
ycos ( x ) iM iM 1 c1 T jTnin 1 Aji(jx(ix) i )
i 1 Ai
3.5 Ví dụ minh hoạ
Xét hệ mờ với hai luật mờ và các hàm liên thuộc của các tập mờ đầu vào, đầu ra như biểu diễn tại hình 1.6 Mỗi luật mờ có hai đầu vào hình a1, a2, b1,b2
và một đầu ra hình a3, b3 Giả sử chúng ta thử nghiệm với hai giá trị đầu vào là
x1 = 0.15 và x2 = 0.5, sử dụng dạng T-chuẩn MIN(T(x,y) = x.y)tính được tổng
hợp của các tập mờ phía IF và phía THEN hình (d) Sử dụng T- đối chuẩn cho tất cả các đầu ra như hình (e)
- Phương pháp độ cao: