Từ các công trình ban đầu về chuỗi thời gian mờ được xuất hiện năm 1993, hiện nay mô hình này đang được sử dụng để dự báo trong rất nhiều lĩnh vực của kinh tế hay xã hội như giáo dục để
Trang 1ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN CÔNG ĐIỀU
THÁI NGUYÊN - 2010
Trang 2MỤC LỤC
Trang Trang phụ bìa
Lời cam đoan
MỤC LỤC i
DANH MỤC BẢNG BIỂU, HÌNH VẼ iii
MỞ ĐẦU 1
CHƯƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN 3
1.1 Chuỗi thời gian và quá trình ngẫu nhiên 3
1.1.1 Khái niệm chuỗi thời gian và quá trình ngẫu nhiên 3
1.1.2 Quá trình ngẫu nhiên dừng 4
1.1.3 Hàm tự tương quan 5
1.1.4 Toán tử tiến, toán tử lùi 5
1.2 Quá trình ARMA 6
1.2.1 Quá trình tự hồi quy 6
1.2.2 Quá trình trung bình trượt 8
1.2.3 Quá trình tự hồi quy trung bình trượt 9
1.3 Ước lượng tham số mô hình ARMA 11
1.4 Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính 12
CHƯƠNG 2 LÝ THUYẾT TẬP MỜ 17
2.1 Lý thuyết tập mờ 17
2.1.1 Tập mờ 17
2.1.2 Các phép toán trên tập mờ 19
2.2 Các quan hệ và suy luận xấp xỉ, suy diễn mờ 22
Trang 32.2.1 Quan hệ mờ 22
2.2.2 Suy luận xấp xỉ và suy diễn mờ 23
2.3 Hệ mờ 25
2.3.1 Bộ mờ hoá 25
2.3.2 Hệ luật mờ 26
2.3.3 Động cơ suy diễn 26
2.3.4 Bộ giải mờ 27
2.3.5 Ví dụ minh họa 28
CHƯƠNG 3 30
MÔ HÌNH CHUỖI THỜI GIAN MỜ BẬC CAO VÀ ỨNG DỤNG 30
3.1 Chuỗi thời gian mờ 30
3.1.1 Khái niệm 30
3.1.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ 30
3.2 Một số thuật toán trong mô hình chuỗi thời gian mờ 31
3.2.1 Một số thuật toán bậc một (thuật toán cơ sở) 31
3.2.2 Một số thuật toán bậc cao 33
3.3 Ứng dụng trong dự báo 40
3.3.1 Ứng dụng thuật toán bậc cao mới 40
3.3.2 Ứng dụng thuật toán bậc cao của Singh 55
3.3.3 Ứng dụng cải biên thuật toán bậc cao của Singh 62
KẾT LUẬN 72
TÀI LIỆU THAM KHẢO 73
PHỤ LỤC 75
Trang 4DANH MỤC BẢNG BIỂU, HÌNH VẼ
Hình 1.1 Chuỗi giá 12
Hình 1.2 Chuỗi tăng trưởng 12
Hình 1.3 Tự tương quan của chuỗi tăng trưởng 13
Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng 13
Hình 1.5 Bình phương chuỗi tăng trưởng 14
Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng 14
Hình 1.7 Tự tương quan riêng của bình phương chuỗi tăng trưởng 14
Hình 1.8 Nhiễu 15
Hình 1.9 Tự tương quan của nhiễu 15
Hình 1.10 Tự tương quan riêng của nhiễu 15
Hình 1.11 Bình phương nhiễu 16
Hình 1.12 Tự tương quan bình phương nhiễu 16
Hình 1.13 Tự tương quan riêng bình phương nhiễu 16
Hình 2.1 Hàm liên thuộc của tập mờ “x gần 1” 18
Hình 2.2 Một số dạng hàm liên thuộc của tập mờ 18
Bảng 2.1: Các cặp T - chuẩn và T - đối chuẩn 21
Bảng 2.2 Một số phép kéo theo mờ thông dụng 22
Hình 2.3 Minh hoạ các phương pháp giải mờ 29
Bảng 3.1 Giá trị chỉ số chứng khoán Đài Loan 40
Bảng 3.2 Phân bố giá trị trong từng khoảng 41
Bảng 3.3 Phân khoảng 41
Bảng 3.4 Nhóm mối quan hệ mờ 42
Bảng 3.5 Mối quan hệ mờ và nhóm quan hệ mờ bậc cao 44
Bảng 3.6 Kết quả dự báo của các phương pháp khác nhau 45
Bảng 3.7 Chuỗi thời gian mờ và kết quả dự báo dự báo 45
Bảng 3.8 Giá trị nhiệt độ Hà Nội 46
Bảng 3.9 Phân bố giá trị trong từng khoảng 47
Trang 5Bảng 3.10 Phân khoảng 47
Bảng 3.11 Nhóm mối quan hệ mờ 48
Bảng 3.12 Mối quan hệ mờ và nhóm quan hệ mờ bậc cao – kết quả dự báo 54
Hình 3.1 Đồ thị so sánh kết quả dự báo và giá trị thực 55
Bảng 3.13 Phân khoảng 56
Bảng 3.14 Các giá trị mờ hóa 57
Bảng 3.15 Kết quả dự báo 58
Hình 3.2 Đồ thị so sánh kết quả dự báo và giá trị thực 58
Bảng 3.16 Phân khoảng 59
Bảng 3.17 Các quan hệ mờ 60
Bảng 3.18 Kết quả dự báo 61
Bảng 3.19 Phân bố giá trị trong từng khoảng 63
Bảng 3.20 Phân khoảng 63
Bảng 3.21 Các giá trị mờ hóa 64
Bảng 3.22 Kết quả dự báo 65
Bảng 3.23 Phân bố giá trị trong từng khoảng 67
Bảng 3.24 Phân khoảng 68
Bảng 3.25 Các giá trị mờ hóa 69
Bảng 3.26 Kết quả dự báo 70
Hình PL.1 Giao diện chương trình 75
Hình PL.2 Test chương trình 75
Hình PL.3 Dự báo chỉ số chứng khoán theo thuật toán nguyên thủy của Singh 76
Hình PL.4 Dự báo nhiệt độ theo thuật toán nguyên thủy của Singh 76
Hình PL.5 Dự báo chỉ số chứng khoán theo thuật toán Singh cải biên 77
Hình PL.6 Dự báo nhiệt độ theo thuật toán Singh cải biên 77
Trang 6MỞ ĐẦU
Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân tích số liệu trong kinh tế, xã hội cũng như trong nghiên cứu khoa học Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều tác giả đã đề xuất các công cụ phân tích chuỗi thời gian để trích xuất ra những thông tin quan trọng từ trong các dãy số liệu
Trước đây, phương pháp chủ yếu để phân tích chuỗi thời gian là sử dụng các công
cụ của thống kê như hồi qui, phân tích Fourie và một vài công cụ khác Nhưng hiệu quả nhất và được sử dụng chủ yếu để dự báo chỗi thời gian là phương pháp được Box
và Jenkins xây dựng từ những năm 70 của thế kỷ trước Đó là mô hình ARMA Tuy nhiên mô hình ARMA chỉ thích ứng hầu hết cho chuỗi thời gian dừng và tuyến tính, chính vì vậy những chuỗi thời gian biến thiên nhanh hoặc chuỗi số liệu lịch sử ngắn cho kết quả chưa chính xác Chuỗi thời gian trong kinh tế do đặc điểm phát triển kinh
tế phụ thuộc rất nhiều vào các yếu tố khác nhau nên có nhiều biến thiên và mang tính phi tuyến Chính vì vậy mô hình ARMA không thể xử lý tốt trong lĩnh vực kinh tế
Để vượt qua được những khó khăn trên, gần đây nhiều tác giả đã sử dụng mô hình chuỗi thời gian mờ Khái niệm tập mờ được Zadeh đưa ra từ năm 1965 và ngày càng tìm được ứng dụng trong nhiều lĩnh vực khác nhau nhất là trong điều khiển và trí tuệ nhân tạo Chuỗi thời gian mờ và mô hình chuỗi thời gian mờ bậc nhất được Song và Chissom phát triển từ năm 1993, Song và Chissom đã đưa ra khái niệm chuỗi thời gian
mờ không phụ thuộc vào thời gian (chuỗi thời gian dừng) và phụ thuộc vào thời gian (không dừng) để dự báo Chen đã cải tiến và đưa ra phương pháp mới đơn giản và hữu hiệu hơn so với phương pháp của Song và Chissom Trong phương pháp của mình, thay vì sử dụng các phép tính tổ hợp Max-Min phức tạp, Chen đã tính toán bằng các phép tính số học đơn giản để thiết lập các mối quan hệ mờ Phương pháp của Chen cho hiệu quả cao hơn về mặt sai số dự báo và giảm độ phức tạp của thuật toán
Từ các công trình ban đầu về chuỗi thời gian mờ được xuất hiện năm 1993, hiện nay mô hình này đang được sử dụng để dự báo trong rất nhiều lĩnh vực của kinh tế hay
xã hội như giáo dục để dự báo số sinh viên nhập trường hay trong lĩnh vực dự báo thất nghiệp, dân số, chứng khoán và trong đời sống như dự báo mức tiêu thụ điện, hay dự báo nhiệt độ của thời tiết… Tuy nhiên xét về độ chính xác của dự báo, các thuật toán trên cho kết quả chưa cao Trong những năm gần đây, một số tác giả đã sử dụng nhiều
kỹ thuật khác nhau để tìm mô hình hữu hiệu cho chuỗi thời gian mờ Những kỹ thuật trong lý thuyết tính toán mềm, khai phá dữ liệu, mạng nơ ron và các giải thuật tiến hoá
Trang 7đều được đưa vào sử dụng Một số tác giả sử dụng phương pháp phân cụm như công trình của Chen et al trong tập thô hay sử dụng khái niệm tối ưu đám đông như trong các công trình để xây dựng các thuật toán trong mô hình chuỗi thời gian mờ Ngoài ra, một số tác giả khác đã sử dụng thêm thông tin khác trong chứng khoán để dự báo chính xác hơn các chỉ số chứng khoán Một trong các hướng được phát triển là sử dụng mối quan hệ mờ bậc cao trong mô hình chuỗi thời gian mờ Chen tiếp tục là người đi đầu khi xây dựng được thuật toán để xử lý mối quan hệ mờ bậc cao Sau đó hướng này được một số tác giả khác tiếp cận và ứng dụng trong các công trình của mình Riêng Singh đã xây dựng mô hình chuỗi thời gian mờ bậc cao bằng cách mở rộng thuật toán đơn giản của mình xây dựng trong các công trình trước đây
Như đã trình bầy ở trên, mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo Tuy nhiên kết quả dự báo của các phương pháp đề xuất còn chưa cao
Do đó việc tìm tòi các mô hình có độ chính xác cao hơn và thuật toán đơn giản hơn đang là một ưu tiên Với mục tiêu tìm hiểu về việc sử dụng mô hình chuỗi thời gian trong dự báo, đặc biệt là việc sử dụng mô hình chuỗi thời gian mờ bậc cao, em đã lựa chọn đề tài “Ứng dụng mô hình chuỗi thời gian mờ bậc cao trong dự báo” làm đề tài
cho luận văn tốt nghiệp của mình
Nội dung chính của luận văn là tìm hiểu, nghiên cứu những khái niệm, tính chất
và một số thuật toán trong mô hình chuỗi thời gian mờ bậc cao để ứng dụng dự báo chỉ
số chứng khoán Đài Loan và dự báo nhiệt độ tại Hà Nội được trình bày trong 3 chương như sau:
Chương 1: Các kiến thức cơ bản về chuỗi thời gian
Chương 2: Lý thuyết tập mờ
Chương 3: Mô hình chuỗi thời gian mờ bậc cao và ứng dụng
Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS Nguyễn Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy Tác giả xin chân thành cảm ơn các thầy, cô giáo Viện Công nghệ thông tin, Khoa Công nghệ thông tin - Đại học Thái Nguyên đã tham gia giảng dạy, giúp đỡ em trong suốt qúa trình học tập nâng cao trình độ kiến thức Tuy nhiên vì điều kiện thời gian và khả năng
có hạn nên luận văn không thể tránh khỏi những thiếu sót Tác giả kính mong các thầy
cô giáo và bạn đóng góp ý kiến để đề tài được hoàn thiện hơn
Trang 8CHƯƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN
Chương 1 giới thiệu các kiến thức cơ bản về chuỗi thời gian và trọng tâm là trình bầy về một lớp mô hình chuỗi thời gian hết sức thông dụng trong thực tế Đó là
mô hình quy trình trượt ARMA (Autoregressive Moving Average) Bao gồm các nội dung: đặc trưng của quá trình ARMA, phương pháp ước lượng tham số của lớp mô hình này và hạn chế của nó khi áp dụng với chuỗi thời gian tài chính
1.1 Chuỗi thời gian và quá trình ngẫu nhiên
1.1.1 Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x 1 , x 2 ,…… x n} được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan
sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet
về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học
phù hợp với tập dữ liệu cho trước X:={x 1 , x 2 ,……… x n} nào đó Để có thể nói về bản
chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát xt là một giá trị thể hiện
của biến ngẫu nhiên X t với tT Ở đây T được gọi là tập chỉ số Khi đó ta có thể coi tập
dữ liệu X:={x 1 , x 2 ,……… x n} là thể hiện của quá trình ngẫu nhiên Xt, tT Và vì vậy,
ta có thể định nghĩa một quá trình ngẫu nhiên như sau:
Định nghĩa 1.1(Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên X t , tT được định nghĩa trên một không gian xác suất(, ,)
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ như
là tập {1,2 } hay tập (-,+) Cũng có những quá trình ngẫu nhiên có T không phải là một tập con của R nhưng trong giới hạn của luận văn nàychỉ xét cho trường hợp TR Và thường thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z
Trang 9thay vì T ở trên Một điểm chú ý nữa là trong luận văn này sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện
1.1.2 Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phương sai)
Giả sử X t , t Z là một quá trình ngẫu nhiên có var(X t )< với mỗi t Z Khi
đó hàm tự hiệp phương sai của X t được định nghĩa theo công thức sau:
)],sX)(
rX[(
),cov(
:),
t
,X: t-i sẽ định nghĩa một quá dừng
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng theo
nghĩa rộng hay dừng bậc hai Tuy nhiên trong giới hạn luận văn chỉ xem xét tính dừng theo định nghĩa ở trên
Khi chuỗi thời gian X t , t Z là dừng thì
,,),0,(),
x h x
y ( ) ( ,0) ( , ),,
Hàm số y x(.) được gọi là hàm tự hiệp phương sai của Xt, còn x(h)là giá trị của nó tại “trễ” h Đối với một quá trình dừng thì ta thường ký hiệu hàm tự hiệp phương sai bởi (.) thay vì x(.)
Với một quá trình dừng thì hàm hiệp phương sai có các tính chất
(0) 0, (h)(0), hZ
Và nó còn là một hàm chẵn nghĩa là:
Trang 10Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={x t , t = 1,2,…n}
của một chuỗi thời gian dừng nên về nguyên tắc ta không thể biết chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước lượng nó ta đưa vào khái
niệm hàm tự hiệp phương sai mẫu của thể hiện X
Hàm tự hiệp phương sai mẫu của một thể hiện X được định nghĩa bởi công thức:
n h x
h j x x h
n
j x j n
n h
x n x
1.1.4 Toán tử tiến, toán tử lùi
Toán tử lùi B kết hợp với một quá trình ngẫu nhiên X t , t Z là quá trình
ngẫu nhiên Y t , t Z sao cho
1 :
t BX X Y
Toán tử lùi B là toán tử tuyến tính và khả nghịch Nghịch đảo của nó
B-1:=F được gọi là toán tử tiến, định nghĩa bởi công thức:
FX t :=Xt+1 Các toán tử B, F thoả mãn hệ thức
BnXt = Xt-n, FnXt :=Xt+n
Và
i-t
X0t
i B i a
Trang 11Chú ý:
Một cách tổng quát, người ta có thể định nghĩa các chuỗi theo toán tử tiến F hay toán tử lùi B và muốn thế cần hạn chế trong trường hợp các quá trình là dừng Khi đó, giả sử ta có quá trình dừng X t , t Z và một dãy {ai ,iZ tuyệt đối khả tổng, tức là
là ánh xạ đặt tương ứng quá trình dừng X t , t Z với quá
trình dừng Y t , t Z Các chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý
nó tương tự như đối với chuỗi nguyên thông thường Đặc biệt ta có thể thực hiện phép cộng, phép nhân hay phép lấy nghịch đảo Điều này có vai trò quan trọng trong các phép biến đổi của đa thức tự hồi quy, đa thức trung bình trượt và các phép biến đổi xử
lý chuỗi thời gian khác
Ets = 0 (t s)
Et2 2
Et 0, t
Định nghĩa 1.6 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên X t , t Z là một quá trình tự hồi quy cấp P, viết là X t AR(p), là một quá trình dừng {X t , tZ} thoả mãn
Trang 12Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị(z 1 )thì
Xt được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình nhân quả
Các đặc trưng của quá trình tự hồi quy cấp p:
1
2
| ) ( )
1 2 1
) 1 (
) 2 (
) 1 (
Jule – Walker tương đương với
p j
p j
j) p ( ), 1, ,( 1
Đại lượng pp ở trên được gọi là tự tương quan riêng cấp p của quá trình {Xt, nó đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi quy cũng như việc ước lượng tham số mô hình tự hồi quy sau này
Trong việc thực tế, khi cho chuỗi quan sát X:=x1, t = 1,2…,n thì ta dùng công
thức của tương quan mẫu để tính các r(i), là các giá trị xấp xỉ của (i) Khi đã có các tự
tương quan mẫu ta thay vào hệ phương trình Jule – Walker và giải nó để tìm các tham
số a1 Từ đây ta cũng xác định được tương quan riêng p1 ….,pp
Trang 131.2.2 Quá trình trung bình trượt
Định nghĩa1.7 (Quá trình trung bình trượt)
Một quá trình trung bình trượt cấp q, ký hiệu X tMA(q), là một quá trình X t ,
t Z thoả mãn biểu thức
0,
, ,21,
11
t b t
Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá trình MA
mà không đòi hỏi thêm điều kiện gì đối với các hệ số b1 Và với giả thiết t là ồn trắng thì theo định lý 1.1 ta có
j t j
Các đặc trưng của quá trình trung bình trượt:
Trước hết, dễ dàng thấy rằng
0
EXt ,
Trang 14Và
2, 2
1 0,
1.2.3 Quá trình tự hồi quy trung bình trượt
Định nghĩa 1.8 (quá trình tự hồi quy trung bình trƣợt)
Một quá trình X t , t Z được gọi là quá trình tự hồi quy trung bình trượt cấp p,q, kí hiệu X t ARMA(p,q) là một quá trình X t , t Z thỏa mãn
0 , 0 ,
, , 2 , 1 , ,
2 , 1 ,
1 1
1 1
a R q b b p a a a q t
q
t b t p t X p a t
X a
Trang 15Định nghĩa 1.9 (Quá trình nhân khả nghịch)
Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung ii) a(z) và b(z) không có nghiệm có môđun không vượt quá 1
Lần lượt cho h = 0,1, p trong các chương trình trên và chú ý đến tính chẵn của hàm
(h) ta có hệ phương trình tuyến tính đối với (0), , (p) hay với(1), (p)
h
1
), ( )
0 , 0 ) (
k
k k
X
Trang 161.3 Ước lượng tham số mô hình ARMA
Giả sử ta cần ước lượng các tham số của mô hình ARMA(p,q)
trong đó t đóng vai trò là sai số
Đối với mô hình ARMA cũng có nhiều phương pháp ước lượng tham số hiệu quả và được nêu ra chi tiết trong P.Brockwell, R David, 2001 Một trong số đó là phương pháp bình phương cực tiểu theo kiểu thuật toán Hannan – Rissanen Ý tưởng của thuật toán này là sử dụng hồi quy tuyến tính để ước lượng các tham số Nếu q>0 ta còn phải ước lượng các giá trị chưa biết t
Thuật toán Hannan – Rissanen
S HR
Trang 171.4 Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính
Mô hình ARMA thu được thành công lớn khi áp dụng cho các chuỗi thời gian xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhưng thất bại khi áp dụng cho các chuỗi thời gian kinh tế tài chính Nguyên nhân chính là giả thiết về mặt toán học phương sai của các chuỗi thời gian tài chính không thay đổi theo thời gian là không phù hợp Và vì vậy mô hình ARMA có thể dự báo được kỳ vọng nhưng thất bại khi dự báo phương sai của chuỗi thời gian tài chính Sau đây ta sẽ xem xét một ví dụ cụ thể
để thấy rõ sự không phù hợp của mô hình ARMA đối với chuỗi thời gian tài chính
Xét chuỗi số chuỗi số liệu NYSE chứa giá trị của chỉ số chứng khoán giao dịch hằng ngày trên thị trường NewYork từ tháng ngày 02/01/1990 đến ngày 31/12/2001 Chuỗi gồm 3028 số liệu được lưu dưới tên file là NYSE.txt Tuy nhiên thay vì trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên của chuỗi gốc rồi lấy lại sai phân của nó để được một chuỗi mới mà trong lĩnh vực kinh tế tài chính ta gọi là chuỗi tăng trưởng Từ số liệu ở trên, chuỗi giá và chuỗi tăng trưởng được minh họa như sau:
Hình 1.1 Chuỗi giá
Hình 1.2 Chuỗi tăng trưởng
Trang 18Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng Ngược lại, chuỗi tăng trưởng có đồ thị rất giống với một quá trình dừng Khi nhìn vào đồ thị của chuỗi tăng trưởng ta cũng thấy có xuất hiện những cụm biến động, có vùng biến đổi về phương sai của chuỗi thời gian Tiếp theo ta sẽ khai thác đặc trưng tương quan riêng mẫu của chuỗi tăng trưởng ở trên
Kết quả được minh họa bằng đồ thị sau:
Hình 1.3 Tự tương quan của chuỗi tăng trưởng
Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng
Ta thấy rằng tương quan riêng của chuỗi tăng trưởng biến đổi trong một khoảng tương đối hẹp khá giống với tự tương quan riêng của một quá trình dừng Tuy nhiên ta lại không thấy được dấu hiệu triệt tiêu của tự tương quan riêng mặc dù ta đã lấy đến trễ
100 Điều này cho thấy cho chuỗi tăng trưởng chắc chắn không thể là một quá trình tự hồi quy Ta cũng biết rằng, về mặt lý thuyết có thể xấp xỉ mô hình AR nhiều tham số bằng mô hình ARMA với ít tham số hơn Điều này cũng cho thấy mô hình ARMA nhiều khả năng không phù hợp với chuỗi tăng trưởng của chúng ta
Bây giờ ta lấy bình phương chuỗi tăng trưởng, kết quả cho bởi đồ thị dưới đây
Trang 19Hình 1.5 Bình phương chuỗi tăng trưởng
Nhìn vào đồ thị ta có thể ta có thể thấy được việc tạo thành các cụm biến động trong đó các thời kỳ và biến động mạnh xen kẽ nhau Ta tính tiếp các đặc trưng mẫu của bình phương chuỗi tăng trưởng Kết quả được thể hiện bằng các đồ thị sau
Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng
Hình 1.7 Tự tương quan riêng của bình phương chuỗi tăng trưởng
Mặc dù chuỗi tăng trưởng ít tương quan nhưng bình phương của nó lại thể hiện
sự tương quan mạnh Những dấu hiệu đó cho ta thấy rằng mô hình ARMA không thực
sự phù hợp với chuỗi thời gian qua sát này
Bây giờ giả sử bằng cách nào đó ta tìm được mô hình ARMA gần nhất với chuỗi quan sát và đó là mô hình ARMA(1,1) Mục đích ở đây là chúng ta sẽ thấy rõ ràng sau khi ước lượng, nhiễu thu được sẽ không phải là một ồn trắng như ta mong muốn nữa Thật vậy, kết quả ước lượng theo mô hình ARMA(1,1) là
Trang 20Nhiễu khi đó được tính toán và biểu diễn bởi đồ thị sau
Hình 1.8 Nhiễu
Khi đó tự tương quan và tự tương quan riêng của nhiễu cho bởi đồ thị dưới đây
Hình 1.9 Tự tương quan của nhiễu
Hình 1.10 Tự tương quan riêng của nhiễu
Ban đầu, do tính ít tương quan của nhiễu ước lượng được nên ta thấy nó giống với một quá trình ồn trắng Tuy nhiên khi lấy bình phương nhiễu ta lại thấy khác
Trang 21Hình 1.11 Bình phương nhiễu
Hình 1.12 Tự tương quan bình phương nhiễu
Hình 1.13 Tự tương quan riêng bình phương nhiễu
Rõ ràng là nhiễu có hiện tượng tạo cụm biến động giống như chuỗi tăng trưởng ban đầu Còn khi nhìn vào đồ thị tự tương quan của bình phương nhiễu ta thấy nó thể hiện sự tương quan mạnh nên ta có thể kết luận rằng nhiễu không phải là một ồn trắng như mong muốn Và như vậy mô hình ARMA sẽ không phù hợp với chuỗi số liệu này
Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài chính nhưng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau Box-Jenkins
Trang 22CHƯƠNG 2 LÝ THUYẾT TẬP MỜ
Trong các bộ môn toán cơ bản, suy luận logic nguyên thuỷ hay logic rõ với hai giá trị đúng/sai hay 1/0 đã rất quen thuộc Tuy nhiên, các suy luận này không đáp ứng được hầu hết các bài toán phức tạp nảy sinh trong thực tế như những bài toán trong lĩnh vực điều khiển tối ưu, nhận dạng hệ thống,… mà các dữ liệu không đầy đủ, không được định nghĩa một cách rõ ràng Trong những năm cuối thập kỷ
20, một ngành khoa học mới đã được hình thành và phát triển mạnh mẽ đó là hệ
mờ Đây là hệ thống làm việc với môi trường không hoàn toàn xác định, với các tham số, các chỉ tiêu kinh tế kỹ thuật, các dự báo về môi trường sản xuất kinh doanh chưa hoặc khó xác định một cách thật rõ ràng, chặt chẽ Khái niệm logic mờ được giáo sư Lofti A.Zadeh đưa ra lần đầu tiên vào năm 1965 tại Mỹ Từ đó lý thuyết mờ đã được phát triển và ứng dụng rộng rãi
Chương này tập trung trình bày một số kiến thức cơ bản về hệ mờ có liên quan tới mô hình chuỗi thời gian mờ sẽ được đề cập tới ở chương sau
2.1 Lý thuyết tập mờ
2.1.1 Tập mờ
định bởi hàm thuộc (membership function):
Trang 23Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” đƣợc định nghĩa nhƣ
sau: A(x) = ea x( 1)2
Hình 2.1 Hàm liên thuộc của tập mờ “x gần 1”
Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác
Triangle(x, a, b, c) = max(min( ,1, ),0)
b c
x c a b
a x
x d a b
a x
Trang 242.1.2 Các phép toán trên tập mờ
2.1.2.1 Phần bù của tập mờ
Định nghĩa 1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn các điều
kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function)
Định nghĩa 2: (Phần bù của một tập mờ): Cho n là hàm phủ định, phần bù Ac
của tập mờ A là một tập mờ với hàm thuộc được xác định bởi:
Ac(x) = n(A(x)), với mỗi x
2.1.2.2 Phép giao hai tập mờ
Định nghĩa 3 (T - chuẩn): Hàm T: [0,1]2 [0,1] là một T - chuẩn (phép hội)
khi và chỉ khi thoả mãn các điều kiện sau:
1 T(1, x) = x, với mọi 0 x 1
2 T có tính giao hoán : T(x,y) = T(y,x), với mọi 0 x, y 1
3 T không giảm: T(x,y)=T(u,v), với mọi x u, y v
4 T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0 x,y, z 1
Ví dụ: T1(x,y)=min(x,y) là một T-chuẩn, thật vậy:
- T1(1,x)=min(1,x)=x, với mọi 0 x 1
- T1 có tính giao hoán: min(x,y)=min(y,x), với mọi 0 x, y 1
- T1 không giảm: min(x,y)<=min(u,v), với mọi x u, y v
- T1 có tính kết hợp: min(x,min(y,z))=min(min(x,y),z)= min(x,y,z), với mọi 0 x, y, z 1
Định nghĩa 4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng không
gian nền với hàm thuộc A(x), B(x) tương ứng Cho T là một T-Chuẩn Phép giao
của hai tập mờ A,B là một tập mờ (ký hiệu (ATB)) trên với hàm thuộc cho bởi biểu thức:
(ATB)(x) = T(A(x), B(x)), với mỗi x
Ví dụ:
- Với T(x,y) = x.y ta có (ATB)(x) = A(x).B(x) (tích đại số)
Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm T(x,y)=min(x,y)
và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây:
Trang 25- Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y)
2.1.2.3 Phép hợp hai tập mờ
Định nghĩa 5 (T - đối chuẩn): Hàm S:[0,1]2
được gọi là một T - đối chuẩn
(phép tuyển) nếu thoả mãn các điều kiện sau:
1 S(0,x) = x, với mọi 0 x 1
2 S có tính giao hoán : S(x,y)= S(y,x) với mọi 0 x, y 1
3 S không giảm: S(x,y) = S(u,v), với mọi x u, y v
4 S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0 x, y, z1
Định nghĩa 6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng không
gian nền với hàm thuộc A(x), B(x) tương ứng Cho S là một T - đối chuẩn Phép
hợp của hai tập mờ A, B là một tập mờ (kí hiệu (ASB)) trên với hàm thuộc cho
bởi biểu thức: (ASB)(x)=S(A(x),B(x)), với mỗi x
Ví dụ:
- Với S(x,y) = max(x,y): (ASB)(x)= max(A(x), B(x))
- Với S(x,y) = x + y – x.y: (ASB)(x)= A(x) + B(x) – A(x).B(x)
- Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm
S(x,y)=max(x,y) và S(x,y)=x+y – x.y theo các đồ thị hình 2.4 sau đây:
Trang 26.)
y x y
x H
.)1(1
.)2()
y x y
x y x H
),
lS(x,y) = S(T(x,y),n(x))
Bảng 2.2 dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng nhất
Trang 275 Standard Strict xy = if x y
other
10
if other y
1
y x other if
x y
Bảng 2.2 Một số phép kéo theo mờ thông dụng
2.2 Các quan hệ và suy luận xấp xỉ, suy diễn mờ
2.2.1 Quan hệ mờ
2.2.1.1 Khái niệm về quan hệ rõ
Định nghĩa 7: Cho X , Y, R X Y là một quan hệ (quan hệ nhị nguyên rõ), khi đó
Khi X= Y thì R X Y là quan hệ trên X Quan hệ R trên X được gọi là:
- Phản xạ nếu: R(x,x) = 1 với x X
- Đối xứng nếu: R(x,y) = R(y,x) với x, y X
- Bắc cầu nếu: (xRy)(yRz) (xRz) với x,y,z X
Định nghĩa 8: R là quan hệ tương đương nếu R là quan hệ nhị nguyên trên X
Trang 28lớn trong thực tế, mô phỏng được một phần suy nghĩ của con người Chính vì vậy, mà các phương pháp mờ được nghiên cứu và phát triển mạnh mẽ Một trong số đó là logic
mờ mở Tuy nhiên logic mờ mở rộng từ logic đa trị, do đó nảy sinh ra rất nhiều các
quan hệ mờ, nhiều cách định nghĩa các toán tử T-chuẩn, T-đối chuẩn, cũng như các
phương pháp mờ hoá, khử mờ khác nhau,…Sự đa dạng này đòi hỏi người ứng dụng phải tìm hiểu để lựa chọn phương pháp thích hợp nhất cho ứng dụng của mình
Định nghĩa 9: Cho U ; V là hai không gian nền; R là một tập mờ trên
U V gọi là một quan hệ mờ (quan hệ hai ngôi)
0 R (x,y) = R(x,y) 1
Tổng quát: RU1U2…… Un là quan hệ n ngôi
0 R(u1, u2,……un) = R(u1, u2,… un) 1
2.2.1.3 Các phép toán của quan hệ mờ
Định nghĩa 10: Cho R là quan hệ mờ trên XY, S là quan hệ mờ trên YZ, lập
phép hợp thành SoR là quan hệ mờ trên XZ
Có R(x,y) với (x,y) XY, S(y,z) với (y,z)YZ Định nghĩa phép hợp thành: Phép hợp thành max – min xác định bởi:
(S R)(x,z) =
Y y
Sup
(T(R(x,y), S(y,z))) (x,z)XZ
Ví dụ: 3.1 (Hệ mờ, mạng nơron và ứng dụng, tr31 – làm thế nào để tính được
S R max-min và S R max-prod)
2.2.2 Suy luận xấp xỉ và suy diễn mờ
Suy luận xấp xỉ hay còn gọi là suy luận mờ - đó là quá trình suy ra những kết
luận dưới dạng các mệnh đề trong điều kiện các quy tắc, các luật, các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định
Trong giải tích toán học chúng ta sử dụng mô hình sau để lập luận:
Định lý: “Nếu một hàm số là khả vi thì nó liên tục”
Trang 29Sự kiện: Hàm khả vi Kết luận: Hàm là liên tục Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens Căn cứ vào mô hình này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao cho nó có thể suy rộng cho logic mờ
Gọi là không gian tất cả các hàm số, ví dụ ={g:RR} A là các tập các hàm khả vi, B là tập các hàm liên tục Xét hai mệnh đề sau: P=’gA’ và Q =’gB’ Khi đó ta có:
Xét bài toán suy luận trong hệ mờ
Hệ mờ n biến vào x1, … xn và một biến ra y
Cho Un, i= 1 n là các không gian nền của các biến vào, V là không gian nền của biến ra
Trong đó biến mờ ji, i1,n,j1,m xác định trên không gian nền U, biến mờ
Bj,(j 1,n) xác định trên không gian nền V
Để giải bài toán này chúng ta phải thực hiện qua các bước sau:
1 Xác định các tập mờ của các biến đầu vào
2 Xác định độ liên thuộc tại các tập mờ tương ứng
3 Xác định các quan hệ mờ R (A.B) (u,v)
4 Xác định phép hợp thành
Trang 302.3 Hệ mờ
Kiến trúc cơ bản của một hệ mờ gồm 4 thành phần chính: Bộ mờ hoá, hệ luật
mờ, động cơ suy diễn mờ và bộ giải mờ như hình 2.3 dưới đây:
Hình 2.5 Cấu hình cơ bản của hệ mờ
Không làm mất tính tổng quát, ở đây ta chỉ xét hệ mờ nhiều đầu vào, một đầu ra
ánh xạ tập compact S Rn vào R Các thành phần của hệ mờ được miêu tả như sau
2.3.1 Bộ mờ hoá
Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác định trong S
được cho bởi hàm thuộc : S [0,1] Bộ phận này có chức năng chính dùng để
chuyển một giá trị rõ x X thành một giá trị mờ trong S U (U là không gian nền)
Có hai phương pháp mờ hoá như sau:
Singleton fuzzifiter: Tập mờ A với x1 và hàm liên thuộc được định nghĩa như sau
No – Singleton fuzziffier: Với các hàm liên thuộc nhận giá trị lớn nhất là 1 tạo x = xi và giảm dần từ 1 đến 0 với các giá trị dịch chuyển x x1
Động cơ suy diễn mờ
(Fuzzy Interence Engine)
Đầu vào rõ
Trang 312.3.2 Hệ luật mờ
Gồm nhiều mệnh đề dạng:
IF<tập các điều kiện được thoả mãn>THEN<tập các hệ quả>
Giả sử hệ luật gồm M luật Rj (j= 1,M ) dạng
Rj: IF x1 is A i and x2 is A2and x n is A THEN y is B n j j
Trong đó xi (i =1,n ) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ mờ - các
biến ngôn ngữ, Aj
i là các tập mờ trong các tập đầu vào X và B jlà các tập mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất nhớ”, “nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”,)đặc trƣng bởi các hàm thuộc
j A i
j B
R là
một quan hệ mờ từ các tập mờ đầu vào X = X 1 X 2 X n tới các tập mờ đầu ra Y
2.3.3 Động cơ suy diễn
Đây là một bộ phận logic đƣa ra quyết định sử dụng hệ mờ để thực hiện ánh xạ
từ các tập mờ trong không gian đầu vào X thành tập mờ trong không gian đầu ra Y
Khi Rj là một quan hệ mờ, thì Rj có thể là một tập con của tích Decart X Y =
Trang 32Quan hệ Rj được định nghĩa thông qua hàm phụ thuộc sau:
(),(()
A n
j R
x A U x
y j
Đây là một ánh xạ từ các từ các tập mờ trong R thành các giá trị rõ ràng trong
R Có nhiều phép giải mờ, với mỗi ứng dụng sẽ có một phương thức giải mờ khác nhau tuỳ thuộc yêu cầu ứng dụng Dưới đây sẽ liệt kê một số phương thức giải mờ thông dụng
Phương pháp độ cao:
' 1
' 1
B i
x
y j B i
A n
j j y j B
M i
j j y j B
j y x
mh y
1
2/)('1
2/)(')
Trang 33)(
Phương pháp tâm của các tập (Center – of – Sets): phương pháp này mỗi
luật được thay thế bởi tập singleton tâm cj
M
i A i j x i
n i T j c x
y
)(cos
ra hình a3, b3 Giả sử chúng ta thử nghiệm với hai giá trị đầu vào là x1 = 0.15 và x2 =
0.5, sử dụng dạng T-chuẩn MIN(T(x,y) = x.y)tính được tổng hợp của các tập mờ phía
IF và phía THEN hình (d) Sử dụng T- đối chuẩn cho tất cả các đầu ra như hình (e)
1.08.0
11.05.08
2.0
1.024.0
8.0
22.0
11.02
4.0
)5.08.0(
- Phương pháp trọng tâm:
6333.01
.08.0
9.01.06.08
Trang 34Hình 2.3 Minh hoạ các phương pháp giải mờ
Chương 2 tập trung trình bày một số kiến thức cơ bản về hệ mờ như tập mờ, các phép toán trên tập mờ, quan hệ mờ, suy diễn mờ, bộ mờ hoá, bộ giải mờ, Đó là các kiến thức liên quan liên quan tới mô hình chuỗi thời gian mờ sẽ được đề cập tới ở chương 3 dưới đây
Trang 35CHƯƠNG 3
MÔ HÌNH CHUỖI THỜI GIAN MỜ BẬC CAO VÀ ỨNG DỤNG
3.1 Chuỗi thời gian mờ
3.1.1 Khái niệm
Giả sử U là không gian nền, không gian nền này xác định một tập hợp các đối tượng cần nghiên cứu Nếu A là một tập con rõ của U thì ta có thể xác định chính xác một hàm đặc trưng:
A được gọi là hàm thuộc (Membership function) Còn với bất kỳ một phần tử
u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A
Giả sử Y (t) là chuỗi thời gian (t = 0, 1, 2,…)
U là tập nền chứa khoảng giá trị của chuỗi thời gian từ nhỏ nhất đến lớn nhất Xác định hàm thuộc A : U [0.1] của tập mờ A, còn tập A trên không gian nền U được viết như sau:
A .
u
) (u
A u
) (u
2 2
1
3.1.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ
Định nghĩa 1 : Y(t) (t = 0,1,2, ) là một tập con của R 1
Y(t) là tập nền trên đó xác định các tập mờ f i (t) F(t) là tập chứa các tập f i (t) (i = 1,2, ) Khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t)
Định nghĩa 2: Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t)
Trang 36định trên tập mờ R(t-1, t) là mối quan hệ mờ Ta cũng có thể ký hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1) F(t)
Nếu đặt F(t-1) = A i và F(t) = A j thì ta ký hiệu mối quan hệ logic mờ giữa chúng nhƣ
sau: A i A j.
Định nghĩa 3: Nhóm các mối quan hệ mờ
Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải Thí dụ nếu ta có các mối quan
hệ: A i A k ; A i A m thì ta có thể gộp chúng thành nhóm các mối quan hệ logic mờ sau: A i A k ,A m
Định nghĩa 4: Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t
Nếu R(t-1, t) không phụ thuộc vào t thì F(t) đƣợc gọi là chuỗi thời gian mờ dừng, còn
ngƣợc lại ta có chuỗi thời gian mờ không dừng
Định nghĩa 5: Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m) m>0 và là
chuỗi thời gian mờ dừng Khi đó mối quan hệ mờ có thể viết đƣợc F(t-1), F(t-2),…,
F(t-m) F(t) và gọi đó là mô hình dự báo bậc m của chuỗi thời gian mờ
Định nghĩa 6: Nhóm quan hệ mờ bậc cao
Để đơn giản, ta chỉ xét mối quan hệ mờ bậc 2 A i1 ,A i2 A j Giả sử đối với tập
A i1 có nhóm quan hệ mờ A i1 A k ,A m và A i2 có nhóm quan hệ mờ A i2 A p ,A q Khi đó
đối với mối quan hệ mờ bậc cao ta cũng xác định đƣợc nhóm quan hệ mờ bậc cao nhƣ
sau: [A i1 ,A i2 ] A k ,A m A p ,A q
Định nghĩa 7 Hàm h j phụ thuộc vào một tham số x đƣợc xác định :
hj (x,A p1 , A p2 , , ) = A p1 , A p2 , , A pk j là một chỉ số nào đó mà với x >0 thì các chỉ số p 1 , p 2 , … p k j
và với x< 0 thì p 1 , p 2 , … p k j
3.2 Một số thuật toán trong mô hình chuỗi thời gian mờ
3.2.1 Một số thuật toán bậc một (thuật toán cơ sở)
3.2.1.1 Thuật toán của Song & Chissom [8]
Bước1: Xác định tập nền U trên đó các tập mờ đƣợc xác định
Bước 2: Chia các tập nền U thành một số các đoạn bằng nhau
Bước 3: Xác định các biến ngôn ngữ để diễn tả các tập mờ trên các khoảng đã
chia của tập nền
Trang 37Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian
Bước 5: Chọn tham số w >1 thích hợp và tính Rw
(t,t-1) và dự báo theo công thức sau: F(t) = F(t - 1)*Rw(t, t - 1)
Trong đó F(t) là giá trị dự báo mờ tại thời điểm t còn F(t-1) là giá trị dự báo
mờ tại thời điểm t -1 Mối quan hệ mờ được tính như sau:
R w (t, t - 1) = F T (t – 2) × F(t - 1)F T (t - 3) × F(t - 2)…F T (t - w) × F(t – w + 1)
Trong đó T là toán tử chuyển vị, dấu “x” là toán tử tích Cartesian còn w được
gọi là “tham số cơ sở” mô tả số lượng thời gian trước thời điểm t
Bước 6: Giải mờ giá trị dự báo mờ
3.2.1.2 Thuật toán của Chen [9]
Chen đã có một số cải tiến thay vì để tính mối quan hệ mờ bằng các phép tính max chỉ cần sử dụng các phép tính số học đơn giản Thuật toán của Chen bao gồm một
min-số bước sau:
1 Xác định tập U bao gồm khoảng giá trị của chuỗi thời gian Khoảng này xác định từ giá trị nhỏ nhất đến giá trị lớn nhất có thể của chuỗi thời gian
2 Chia khoảng giá trị và xác định các tập mờ trên tập U
3 Mờ hoá các dữ liệu chuỗi thời gian
4 Thiết lập các mối quan hệ mờ và nhóm các quan hệ mờ
5 Sử dụng các quy tắc xác định các giá trị dự báo trên nhóm các quan hệ mờ
6 Giải mờ các kết quả dự báo
3.2.1.3 Thuật toán Heuristic của Huarng [11]
Huarng đã sử dụng mô hình của Chen và đưa vào các thông tin có sẵn của chuỗi thời gian để cải tiến độ chính xác và giảm bớt các tính toán phức tạp của dự báo Nhờ
sử dụng những thông tin có trong chuỗi thời gian nên mô hình của Huarng được gọi là
mô hình Heuristic
Các bước thực hiện của mô hình Huarng cũng triển khai theo các bước trên Điều khác biệt là sử dụng một hàm h để xác định mối quan hệ logic mờ dưới đây là mô tả các bước thực hiện của mô hình Heuristic chuỗi thời gian mờ
Bước 1: Xác định tập nền Tập nền U được xác định như sau: lấy giá trị lớn
nhất fmax và nhỏ nhất fmin của chuỗi thời gian U = [fmax, fmin] Đôi khi có thể mở rộng khoảng này thêm một giá trị nào đó để dễ tính toán Chia đoạn U thành m khoảng con
Trang 38Bước 2: Xác định tập mờ Ai và mờ hoá giá trị Mỗi tập Ai gán cho một biến ngôn ngữ và xác định trên các đoạn đã xác định u1, u2, …, um Khi đó các tập mờ A có thể biểu diễn như sau:
m
m Ai Ai
Ai i
u
u u
u u
u
2 2
Bước 3: Thiết lập mối quan hệ mờ và nhóm các mối quan hệ mờ Như định
nghĩa ở trên, đối với chuỗi thời gian mờ ta có thể xác định được mối quan hệ mờ tại mỗi thời điểm t và qua đó ta xác định được nhóm các mối quan hệ mờ
Bước 4: Sử dụng hàm h để thiết lập các nhóm mối quan hệ logic mờ Heuristic:
A i → h j (x, A p1 , A p2 ,…,) = A p1 , A p2 , …, A pk
Bước 5: Dự báo Từ các nhóm quan hệ logic mờ Heuristic Các giá trị chủ yếu
lấy từ điểm giữa hay trung bình các điểm giữa các khoảng cách trong nhóm quan hệ
mờ heuristic
3.2.2 Một số thuật toán bậc cao
3.2.2.1 Thuật toán bậc cao của Chen [10]
Chen đề xuất mô hình chuỗi thời gian mờ bậc cao như sau:
1 Xác định tập U bao gồm khoảng giá trị của chuỗi thời gian Khoảng này xác định từ giá trị nhỏ nhất đến giá trị lớn nhất có thể của chuỗi thời gian
2 Chia khoảng giá trị và xác định các tập mờ trên tập U
3 Mờ hoá các dữ liệu chuỗi thời gian
4 Thiết lập các mối quan hệ mờ, thí dụ như mối quan hệ mờ bậc 2 như sau: giá
trị tại thời điểm t-2 và t-1 của chuỗi thời gian mờ tương ứng là A i1 và A i2 còn
giá trị tại thời điểm t là A j. Khi đó ta xác định mối quan hệ mờ A i1 ,A i2 A j.
5 Dự báo và giải mờ Trong bước này giải mờ các kết quả và dự báo được thực hiện như sau:
- Nếu bậc k =2 có mối quan hệ logic là A i1 ,A i2 A j và giá trị hàm thuộc của A j
đạt giá trị maximum tại đoạn u i và điểm giữa của u i là m i thì dự báo của chuỗi
thời gian tại thời điểm i là m i
- Nếu với k=2 ta có các mối quan hệ
Trang 39khăn vì phải dự báo cho nhiều tập mờ A jk k=1,2, p Trong trường hợp này, tiếp
tục nâng bậc k lên đến bạc m mà có môi quan hệ mờ duy nhất như trường hợp
trên Trong trường hợp này ta có: A im ,A i(m-1) , A i1 A j1
Khi đó ta sẽ xử lý như trường hợp trên, có nghĩa là tìm đoạn u i mà trong đó giá
trị hàm thuộc của A j1 đạt maximum và điểm giữa của u i là m i thì dự báo của
chuỗi thời gian tại thời điểm i là m i
- Nếu vế phải của mối quan hệ mờ là trống như trường hợp sau: A i1 ,A i2 , A ip
và đoạn u im , u i(m-1) , u i1 tương ứng với các giá trị hàm thuộc của các
tập mờ trên đạt giá trị maximal và m im , m i(m-1) , m i1 là các giá trị trung điểm của các khoảng Khi đó giá trị dự báo của chuỗi thời gian tại thời điểm t được tính theo công thức sau:
3.2.2.2 Đề xuất bậc cao cho chuỗi thời gian mờ Heuristic [2]
Đề xuất thuật toán mới cho chuỗi thời gian mờ Heuristic được đưa ra trong [4] bao gồm các bước sau:
1 Xác định tập nền Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U =[fmin-f1, fmax+f2] trong đó f1,f2 là những giá trị dương nào đó
2 Chia đoạn U thành m khoảng con bằng nhau u 1 , u 2 , u m
3 Tính toán phân bố các giá trị chuỗi thời gian của từng khoảng và chia lại các khoảng sao cho giá trị chuỗi thời gian rơi vào từng khoảng là trung bình
4 Xây dựng các tập mờ A i tương ứng với các khoảng con như trong trong bước 2
và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia và mờ hoá các giá trị chuỗi thời gian
5 Xây dựng mối quan hệ mờ và xác định nhóm các quan hệ mờ
6 Dự báo và giải mờ dựa vào các hàm heuristic theo nhóm quan hệ mờ bậc cao
theo các luật dựa vào hàm heuristic h theo Định nghĩa 7
Để dự báo giá trị chuỗi thời gian, ta cần xác định hiệu số bậc nhất và bậc 2 cho chuỗi thời gian Giả sử các giá trị của chuỗi thời gian tại các thời điểm tương ứng t, t-
1, t-2 là f(t), f(t-1), f(t-2) Khi đó các hiệu số bậc nhât và bậc hai được xác định:
∆ i = f(t) – f(t-1); ∆ i 2 = (f(t) – f(t-1)) – (f(t-1) – f(t-2))
k
m k m
2
Trang 40Tương tự khí xét đến một hàm số, nếu hiệu số bậc nhất là dương thì hàm đó là hàm tăng, còn hiệu bậc nhất âm thì hàm đó là hàm giảm Đưa cả khái niệm hiệu số bậc hai vào và xét tính chất âm dương của nó để thêm thông tin về hàm (giảm) tăng từ từ
và tăng (giảm) nhanh phụ thuộc vào hiệu số bậc 2 âm hay dương
Ngoài ra còn xét đến điểm lấy giá trị trong khoảng phân chia Phụ thuộc vào độ tăng giảm của chuỗi thời gian, các điểm được lấy để tính toán trong khoảng không phải là điểm giữa khoảng nữa mà trong thuật toán dưới đây, ta sẽ lấy các điểm 0.25 (điểm dưới), 0.5 (điểm giữa) và 0.75 (điểm trên) của khoảng
3.2.2.3 Thuật toán bậc cao mới [4]
Thuật toán mới cải tiến từ hai thuật toán đã được sử dụng ở trên Trước hết đó
là thuật toán bậc cao của Chen và sau đó sử dụng về cơ bản các bước trong thuật toán heurestic (sử dụng hàm heuristic h) để tính toán dự báo
Để sử dụng thuật toán heuristic cho mô hình chuỗi thời gian mờ bậc cao, phải xử
lý thêm nhóm quan hệ mờ Như vậy ta phải dựa vào khái niệm trong Định nghĩa 5 để xây dựng nhóm quan hệ mờ bậc cao Do đó áp dụng khái niệm này, thuật toán cải biên được đưa ra như sau:
1 Xác định tập nền Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và
nhỏ nhất f min của chuỗi thời gian và U =[f min -f 1 , f max +f 2 ] trong đó f 1 ,f 2 là những
giá trị dương nào đó Chia đoạn U thành m khoảng con bằng nhau u 1 , u 2 , u m
2 Tính toán phân bố các giá trị chuỗi thời gian của từng khoảng và chia lại các khoảng sao cho giá trị chuỗi thời gian rơi vào từng khoảng là trung bình
3 Xây dựng các tập mờ A i tương ứng với các khoảng con như trong trong bước 2
và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia và mờ hoá các giá trị chuỗi thời gian
4 Xây dựng mối quan hệ mờ và xác định nhóm các quan hệ mờ Từ đó xây dựng
nhóm quan hệ mờ bậc cao theo Định nghĩa 6
5 Giải mờ và dự báo theo thuật toán heuristic bậc cao
Dự báo và giải mờ dựa vào các hàm heuristic theo nhóm quan hệ mờ bậc cao
theo các luật dựa vào hàm heuristic h theo Định nghĩa 7
Để đưa ra luật giải mờ heristic, ta cần thêm thông tin thông qua việc xác định hiệu số bậc nhất và bậc 2 cho chuỗi thời gian Giả sử các giá trị của chuỗi thời gian tại
các thời điểm tương ứng t, t-1, t-2 là f(t), f(t-1), f(t-2) Khi đó các hiệu số bậc nhất và
bậc 2 được xác định:
)) 2 ( ) 1 ( ( )) 1 ( ) ( ( );
1 ( )