Dự báo đợc dựa trên một số ít các hệ số của mỗi một lớp tần số ấy.. Giới thiệu về wavelet Wavelet là một hàm toán học, phân tích dữ liệu theo dãy các tần số khác nhau.Chúng có những lợi
Trang 1MỤC LỤC
Trang
Më ®Çu 2
Ch¬ng 1 §¹i c¬ng vÒ chuçi thêi gian vµ qu¸ tr×nh tù håi quy AR 4
1.1 Qu¸ tr×nh ngÉu nhiªn vµ chuçi thêi gian 4
1.2 Qu¸ tr×nh dõng vµ Chuçi thêi gian dõng 7
1.3 Qu¸ tr×nh nh©n qu¶ tù håi quy AR(p) 10
Ch¬ng 2 Wavelet 13
2.1 Giíi thiÖu vÒ wavelet 13
2.2 Wavelet rêi r¹c 13
Ch¬ng 3 Dù b¸o chuçi thêi gian b»ng wavelet 16
3.1 Giíi thiÖu 16
3.2 C¸c wavelet vµ dù b¸o 16
3.3 Dù b¸o tù håi quy ®a ph©n bËc AR 21
3.4 Sù héi tô 26
KÕt luËn 29
Tµi liÖu tham kh¶o 30
Trang 2Mở đầu
Trong những năm gần đây lý thuyết Wavelet xâm nhập mạnh mẽ vào cácngành khoa học đặc biệt là ngành Toán ứng dụng với các mô hình dự báo chuỗi thờigian Việc làm này trở thành những yếu tố cần thiết trong mọi hoạt động của con ngời
và ngày càng đợc ứng dụng sâu rộng trong các lĩnh vực kinh tế, viễn thông, y học vàcác lĩnh vực xã hội khác
Việc nghiên cứu dự báo chuỗi thời gian bằng wavelet đang là vấn đề thời sự,
có ý nghĩa khoa học và thực tiễn rộng lớn Chính vì vậy chúng tôi chọn đề tài nghiêncứu: “Dự báo chuỗi thời gian bằng wavelet”
Luận văn đợc trình bày trong 3 chơng:
Chơng 1 Đại cơng về chuỗi thời gian và quá trình tự hồi quy AR
Chơng này trình bày những khái niệm cơ bản và các công cụ toán học cần thiết
để nghiên cứu về quá trình ngẫu nhiên, chuỗi thời gian và quá trình nhân quả tự hồiquy AR(p)
Chơng 2 Wavelet
Trình bày các khái niệm cơ bản về wavelet rời rạc
Chơng 3 Dự báo chuỗi thời gian bằng Wavelet
Đây là nội dung chính của luận văn Trong chơng này chúng tôi trình bày mộtphơng pháp dự báo chuỗi thời gian bằng wavelet Phơng pháp này dựa trên một phântích đa phân giải của tín hiệu, khi dùng phần d của biến đổi wavelet thì có lợi thế là
nó bất biến qua phép dịch chuyển Tín hiệu sẽ đợc phân tích thành một loạt các lớptần số Dự báo đợc dựa trên một số ít các hệ số của mỗi một lớp tần số ấy ở dạng
đơn giản nhất nó là một dự báo tuyến tính dựa trên một biến đổi wavelet của tín hiệu.Kết quả đạt đợc là chỉ ra sự hội tụ của phơng pháp theo hớng dự báo tối u trong trờnghợp tự hồi quy
Trang 3Luận văn đợc hoàn thành tại trờng Đại học Vinh dới sự hớng dẫn tận tình, chu
đáo của Tiến sỹ Nguyễn Trung Hòa Tác giả xin bày tỏ lòng biết ơn sâu sắc tới Thầy
Nhân đây, tác giả xin gửi lời cảm ơn chân thành tới các thầy cô giáo trongkhoa Toán của trờng Đại học Vinh, đặc biệt là PGS.TS Nguyễn Văn Quảng, PGS.TSTrầnXuân Sinh, PGS.TS Phan Đức Th nh, TS Lê Hồng Sơn, quý thầy cô khoa Sauà
Đại học trờng Đại học Vinh, các bạn học viên cao học Toán khoá 15 đã tạo điều kiệngiúp đỡ và góp ý để tác giả hoàn thành luận văn
Vinh, tháng 12 năm 2009
Tác giả
Chơng 1
Trang 4Đại cơng về chuỗi thời gian và quá trình tự hồi quy ar
1.1 Quá trình ngẫu nhiên và chuỗi thời gian
Bớc đầu tiên của việc phân tích một chuỗi thời gian là chọn một mô hình toánhọc hay một lớp mô hình toán học thích hợp với tập dữ liệu X Để có thể nói về bảnchất của những quan sát cha diễn ra, ta giả thuyết mỗi quan sát x t là một giá trị thểhiện của một biến ngẫu nhiên X nào đó Khi đó chuỗi thời gian t {X t T t, ∈ 0} là một
họ các biến ngẫu nhiên {X t T t, ∈ 0} Nh thế, có thể xem dữ liệu X ={x x1, , ,2 x n} là
một thể hiện của một quá trình ngẫu nhiên {X t T t, ∈ ⊇T0}
Nếu xem một giá trị quan sát x là thể hiện của biến ngẫu nhiên nào đó, thì t
chuỗi thời gian chính là dãy các thể hiện (hay một phần của thể hiện) của dãy cácbiến ngẫu nhiên
Nếu thời gian quan sát là liên tục ta có chuỗi thời gian liên tục Nếu thời gianquan sát rời rạc ta có chuỗi thời gian rời rạc
1.1.1 Định nghĩa
Quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {X t T t, ∈ } xác định trên
không gian xác suất (Ω, , PF ).
1.1.2 Định nghĩa
Giả sử ( ), X t t T∈ là quá trình ngẫu nhiên.
Nếu T =Ă hoặc T =Ă thì ( )+ X t gọi là quá trình với thời gian liên tục
Nếu T =Â hoặc T =Â thì ( )+ X t gọi là quá trình với thời gian rời rạc.
1.1.3 Định nghĩa
Trang 5Quá trình ( ), X t t T∈ gọi là quá trình cấp 2 nếu 2
Sự hội tụ trong L2(Ω, ,F P) đợc gọi là hội tụ bình phơng trung bình tức là X n
hội tụ về X nếu lim ( n )2 0
Giả sử X là một quá trình cấp 2 t
Hàm trung bình của ( ) X t đợc định nghĩa là
( ) ( ( ))
m t =E X t . Hàm tự hiệp phơng sai của ( ) X t đợc định nghĩa là
( , ) ( ( ), ( ))
r s t =Cov X s X t =EX s X t( ) ( )−m s m t( ) ( )
Trang 6(ii) Tồn tại n m,lim Cov X X( n, m) VarX
Chứng minh
Giả sử tồn tại l.i.mx→∞ X n =X .
Khi đó theo bất đẳng thức Schwarz ta có
{x t T t; ∈ } gồm các thể hiện của dãy biến ngẫu nhiên { }X t t T∈ .
1.2 Quá trình dừng và Chuỗi thời gian dừng
1.2.1 Định nghĩa
Trang 7Giả sử ( ), X t t∈Ă là quá trình cấp 2 ( ) X t đợc gọi là một quá trình dừng
nếu ( ) m t =Const (không phụ thuộc vào t ) và hàm tự tơng quan ( , ) r s t chỉ phụ thuộc vào s t− .
Nh vậy ( ), X t t T∈ là một quá trình dừng khi và chỉ khi:
a) ( ) m t = =m const .
b) Tồn tại hàm ( ) K t sao cho ( , ) r s t =K s t( − ∀ ∈), s t, Ă
1.2.2 Định nghĩa
Quá trình ( ), X t t∈Ă đợc gọi là quá trình dừng mạnh (hay dừng theo nghĩa
hẹp) nếu với mọi h∈Ă và với mọi t1 < < <t2 t n phân phối đồng thời của
Trang 9Một chuỗi thời gian dừng ngặt, có mômen cấp hai hữu hạn là một chuỗi thời gian dừng.
chuỗi thời gian dừng
Tuy nhiên điều ngợc lại không đúng Thật vậy xét { }X là dãy các biến ngẫu t
nhiên độc lập và X có phân phối mũ với kỳ vọng 1 nếu t lẻ, có phân phối chuẩn với t
kỳ vọng 1 phơng sai 1 nếu t chẵn Thì { }X là quá trình dừng vì t γX(0) 1= và
Trang 10X đợc gọi là một quá trình nhân quả tự hồi quy cấp p viết là X t : AR(p)
nếu X là một quá trình dừng thỏa mãn: t
X t −a X1 t−1−a X2 t−2 − − a X p t−p =εt,a p ≠0 (1.1)
hay:
( ) t t
a B X =ε ,
Trang 11trong đó εt là ồn trắng, nghĩa là εt là một biến ngẫu nhiên có kỳ vọng không:
Chú ý: X đợc biểu diễn một cách duy nhất nh sau: t
Trang 122 1
a a
LL
(1.12)
Những phơng trình trong (1.12) là song tuyến đối với a và ρ; nếu cho ρ thì
tính đợc a và ngợc lại nếu cho a thì tính đợc ρ
Trang 13Chơng 2 wavelet
2.1 Giới thiệu về wavelet
Wavelet là một hàm toán học, phân tích dữ liệu theo dãy các tần số khác nhau.Chúng có những lợi thế trong việc phân tích và dự báo chuỗi thời gian
Các bớc phân tích wavelet là thông qua một hàm wavelet nguyên mẫu ( )ψ t
gọi là wavelet mẹ Sự phân tích chuỗi thời gian đợc thực hiện với một dãy biến đổi
tần số cao của wavelet nguyên mẫu, trong khi tần số phân tích đợc thực hiện với một
mở rộng dãy biến đổi tần số thấp của cùng một wavelet Bởi vì những tín hiệu ban
đầu có thể đợc đại diện dới dạng khai triển của một wavelet mở rộng (bằng cách sửdụng hệ số trong sự kết hợp tuyến tính của hàm wavelet) những thao tác dữ liệu cóthể đợc thực hiện bằng cách sử dụng tơng ứng hệ số wavelet
1( )
j
t k s t
s s
τ
, (2.1)
trong đó ,j k là các số nguyên, tơng ứng đợc gọi là chỉ số phân bậc và chỉ số dịch
chuyển và s (0 s0 >1) là bớc giãn cố định, ( )ψ t đợc gọi là wavelet mẹ Hệ số dịchchuyển τ0 phụ thuộc vào bớc giãn
Ngời ta thờng chọn s0 =2 để lấy mẫu theo trục tần số tơng ứng với việc lấymẫu động Đây là một sự lựa chọn rất tự nhiên đối với các máy tính và âm nhạc Với
hệ số dịch chuyển τ =0 1 thì chúng ta có việc lấy mẫu động theo trục thời gian nh sau
Trang 14
Khi các wavelet rời rạc đợc sử dụng để biến đổi một tín hiệu liên tục thì kết
quả sẽ là một chuỗi các hệ số wavelet và nó đợc gọi là phân tích theo chuỗi wavelet
,
, j k
j k
f ψ
∑ là chuẩn của các hệ số wavelet
Khi phơng trình trên đợc thõa mãn thì họ các hàm cơ sở ψ j k, ( )t đợc xem nh là
một hệ thống với các biên của hệ thống là ,A B và khi A B= thì hệ thống là chặt chẽ
và các wavelet rời rạc trở thành một cơ sở trực chuẩn
2.2.3 Các wavelet rời rạc trực giao
Các wavelet rời rạc có thể đợc làm cho trực giao với các phép co giãn và dịchchuyển riêng của nó bằng sự lựa chọn đặc biệt wavelet mẹ Có nghĩa là:
Trang 15∫ nếu trong các trường hợp còn lại. và (2.3)
2.2.4 Biến đổi ngợc của wavelet rời rạc
Một tín hiệu bất kỳ có thể đợc lấy lại bằng một tổ hợp tuyến tính của các hàmcơ sở wavelet trực giao với các hệ số là các hệ số của biến đổi wavelet:
Chơng 3
Dự báo chuỗi thời gian bằng wavelet
Trang 163.1 Giới thiệu
Trong chơng này chúng tôi trình bày một phơng pháp dự báo chuỗi thời gianbằng wavelet Phơng pháp này dựa trên một phân tích đa phân giải của tín hiệu, khidùng phần d của biến đổi wavelet thì có lợi thế là nó bất biến qua phép dịch chuyển.Tín hiệu sẽ đợc phân tích thành một loạt các lớp tần số Dự báo đợc dựa trên một số ítcác hệ số của mỗi một lớp tần số ấy ở dạng đơn giản nhất nó là một dự báo tuyếntính dựa trên một biến đổi wavelet của tín hiệu Kết quả đạt đợc là chỉ ra sự hội tụ củaphơng pháp theo hớng dự báo tối u trong trờng hợp tự hồi quy
3.2 Các wavelet và dự báo
Biến đổi wavelet liên tục của một hàm liên tục tạo nên một lực lợng không
đếm đợc các lớp đầu ra Tuy nhiên dữ liệu vào thờng đợc lấy mẫu rời rạc, và do đómột “dyadic” hay một mối liên hệ kép giữa các bậc phân giải vừa là khả thi vừa làthực tế Hai vấn đề vừa nêu trên dẫn tới biến đổi wavelet rời rạc
Đầu ra của một biến đổi wavelet rời rạc có thể lấy nhiều dạng khác nhau Mộtcách truyền thống, một tam giác (hay một tứ diện trong trờng hợp ảnh hai chiều) th-ờng đợc sử dụng để biểu diễn tất cả những cái chúng ta cần phải xem xét trong dãycác mức phân giải Một lợi thế của dạng “cơ số 10” (decimated) là thông tin đợc giữlại vừa đủ để khôi phục chính xác dữ liệu đầu vào Có thể xem chi tiết về biến đổiwavelet ở Chui (1992), Debauchie (1992), Mallat và Falzon (1998), Vidakovic(1999) Do đó dạng decimated là lý tởng cho việc nén dữ liệu Dạng decimated của
đầu ra có một hạn chế là ta sẽ không thể quan sát hoặc minh họa thông tin liên hệ tạimột thời điểm ở các mức khác nhau Tuy nhiên, với một chút khó khăn hơn, hạn chếnày có thể khắc phục đợc Nếu chúng ta bỏ đi môt ít các giá trị đầu tiên của chuỗithời gian đầu vào thì wavelet đầu ra sẽ đợc thay đổi Tính decimated và dữ liệu sẽkhông đồng nhất nh trớc Ta có thể nhận đợc chung quanh vấn đề này ở nhu cầu chi
Trang 17phí cho việc lu trữ lớn hơn, bởi phơng tiện phần d hoặc biến đổi wavelet phi cơ số 10(non-decimated).
Chúng ta sẽ xét một biến đổi phần d dựa trên một chuỗi thời gian đầu vào có
độ dài N sẽ có một lớp phân giải có độ dài N đối với mỗi mức phân giải Trong
những tình huống đó, dễ dàng liên kết thông tin tại mỗi mức phân giải với cùng mộtthời điểm Ta có bất biến chuyển dịch Cuối cùng, yêu cầu bộ nhớ bổ sung là khôngquá mức
Một biến đổi wavelet phân tích một tín hiệu X =( , ,X1 X N) thành một tổng
diễn cho "các chi tiết của X " ở mức 2 −j Nh vậy các đầu ra của thuật toán là J +1
dải con có kích thớc N Với sự chỉ số hóa nh vậy, thì ở đây j=1 tơng ứng với mứctốt nhất (tần số cao nhất)
Thuật toán Haar sử dụng bộ lọc đơn giản ( , )1 1
2 2
h= Hãy xem xét việc tạo ra
bậc phân giải đầu tiên của wavelet Chúng ta lấy nó từ những dữ liệu vào bằng cáchghép những cái sau với h Nghĩa là:
c j+1,t =0.5(c j t, 2− j +c j t, ) (3.2)
v à
w j+1,t =c j t, −c j+1,t (3.3)
Để phù hợp với công thức (3.1) ta quy ớc X t =c0,t.
Trang 18Từ các hệ thức (3.1), (3.2), (3.3) và quy ớc X t =c0,t ta có thuật toán để tính các
0, 3 0, 2 0, 1 0, 2
0, 7 0, 6 0, 1 0, 3
Trang 19• Thực hiện đơn giản Độ phức tạp tính toán là ( )O N cho mỗi mức, và trong
thực tế số lợng các mức là một hằng số
Trang 20• Vì ta không dịch chuyển tín hiệu, các hệ số wavelet tại mức j bất kỳ của tín
hiệu ( , ,X1 X đúng bằng với t hệ số wavelet đầu tiên tại mức j của tín hiệu t)
1
( , ,X X N)(N t> ).
Ưu điểm thứ hai nói trên l m cho nó rất thuận lợi trong thực hành Chẳng hạnà ,nếu các dữ liệu đợc cập nhật thờng xuyên (tức là có đợc những giá trị mới) thì khôngphải tính toán lại wavelet của cả tín hiệu
Hình 1 dới đây cho thấy rằng với J =4 những điểm ảnh nào của tín hiệu đầu
v o đà ợc sử dụng để tính toán hệ số wavelet cuối cùng trong các mức khác nhau (bốnmức wavelet + mảng trơn)
Hình 1: Hình này cho thấy rằng những điểm ảnh nào của tín hiệu đầu vào đợc sử
dụng để tính toán hệ số wavelet cuối cùng trong các mức khác nhau.
Từ hình 1 ta thấy mỗi một hệ số wavelet tại thời điểm t đợc tính toán từ các mẫu tín hiệu tại các thời điểm nhỏ hơn hoặc bằng t
Tớn hiệu X
Biến đổi Wavelet
Mức 1 Mức 2 Mức 3 Mức 4 Mảng trơn
Trang 213.3 Dự báo đa phân bậc tự hồi quy AR
Trong phần n y, chúng tôi sử dụng phân tích ở (3.1) của tín hiệu cho việc dựàbáo Thay vì sử dụng các vectơ của các quan sát X =( , ,X1 X N) trớc đó để dự đoán
1
N
X + , chúng ta sẽ sử dụng biến đổi wavelet Chúng ta tập trung v o loại dự báo tựàhồi quy, nhng tổng quát hóa cho một kiểu dự báo bất kỳ trong thực tế cũng khôngphải l khó khăn à
Trớc hết cần phải biết có bao nhiêu v các hệ số wavelet nào sẽ đμ ợc sử dụngcho mỗi lớp Mấu chốt ở đây là một sự biểu diễn th a của thông tin chứa trong sự−phân tích Dựa vào lý thuyết và các phỏng đoán thì điều đó sẽ trở nên rõ r ng,μwavelet và các hệ số hàm phân bậc sẽ đ ợc sử dụng cho dự báo tại thời điểm − N +1
có dạng w j N, −2 ( 1)j k− vμ c J N, −2 ( 1)J k− với k nguyên dơng, đợc miêu tả nh trong hình−
2 Chú ý rằng với mỗi N nhóm con các hệ số n y l một phần của một biến đổi trựcμ μgiao
Hình 2: Các hệ số wavelet đợc sử dụng để dự báo giá trị tiếp theo.
Tớn hiệu X
Biến đổi Wavelet
Mức 1 Mức 2 Mức 3 Mức 4 Mảng trơn
Trang 223.3.1 Tín hiệu dừng
Giả sử X là một tín hiệu dừng, X =( , ,X1 X N) Để giảm thiểu sai số bình
ph ơng trung bình của nó, dự báo một b− ớc của một quá trình AR(p) lμ
( 1) 1
có cùng một sai số tiệm cận Để sử dụng sự phân tích, chúng ta sẽ thay đổi dự báothành dự báo đa phân bậc tự hồi quy:
năm mức trong đó có bốn mức wavelet(J =4) và một mảng trơn thì công thức dựbáo (3.4) đợc viết một cách tờng minh nh sau:
Trang 23Trong trờng hợp n y, chỉ có mà ời hệ số đợc sử dụng, đó là: w , 1,N w1,N−2, w 2,N, w2,N−4
, w 3,N, w3,N−8, w 4,N, w4,N−16, c4,N , c4,N−16 điều đó đợc minh họa cụ thể trong hình 3dới đây:
Hình 3: Hình này cho thấy các hệ số wavelet nào đợc sử dụng để dự báo tại thời
điểm N +1 trong trờng hợp A j =2 và một biến đổi wavelet với năm mức trong đó có
bốn mức wavelet( J =4) và một mảng trơn.
Từ đó có thể dễ dàng đa ra một dự báo dài hạn, hoặc bằng cách tăng số lợngcác mức trong biến đổi wavelet, hoặc bằng cách tăng cấp tự hồi quy trong mức cuốicùng, nhng với một số rất ít các tham số bổ sung
Xa hơn nữa, để liên kết phơng pháp này với dự báo dựa trên một mô hình ARthông thờng, chú ý rằng nếu trên mỗi lớp các hệ số trễ theo một AR(A ), việc bổ j
sung các dự báo theo từng mức sẽ dẫn đến cùng một công thức dự báo (3.4)
Mô hình dự báo tự hồi quy đa phân bậc này là một mô hình thực sự tuyến tính.Tuy nhiên chúng ta có thể dễ dàng mở rộng mô hình này cho mô hình bất kỳ, tuyến
Tớn hiệu X
Biến đổi
Wavelet
Mức 1 Mức 2 Mức 3 Mức 4 Mảng trơn
Trang 24tính hoặc phi tuyến tính mà sử dụng các hệ số w j N, v à c J N, để dự báo tín hiệu tơng
lai Chẳng hạn, trong mục tiếp theo một mạng nơron với các hệ số ấy làm đầu v o vμ μvới X N+1 là kết quả đầu ra sẽ đợc thảo luận.
Để ớc l ợng các − −
1 1
J j j
Q + A
=
=∑ mà cha biết các tham số đợc nhóm trong mộtvectơ α , chúng ta giải một ph ơng trình chuẩn tắc − A A/ α = A S/ theo phơng phápbình phơng tối thiểu, với:
đại lợng có phân phối chuẩn hóa v μ σà l một ớc l ợng của sai số tiêu chuẩn củaμ − −nhiễu Một lựa chọn σà đợc cho bởi căn bậc hai của (Aα −S) (/ Aα −S) / (M Q− )
3.3.2 Tín hiệu với khuynh trơn từng khúc
Dự báo ở mục trớc rất tốt đối với một tín hiệu có trung bình không Khi mộtkhuynh xuất hiện, có một vài phơng pháp loại bỏ khuynh trớc khi tiến hành phân tích.Theo phân tích đa phân bậc, chúng ta có thể khai thác lợi thế là phân tích đa phân bậc
có thể tự động tách khuynh ra khỏi tín hiệu Vì vậy chúng tôi đề xuất để dự báo cho