Cách tiếp cận phân tíchtheo miền tần số của chuỗi thời gian còn được gọi là phân tích phổ chuỗithời gian.. Mục đích chính của phân tích phổ có khi còn được gọi là ước lượngphổ là xác địn
Trang 1ĐẠI HỌC QUỐC GIA TP.HCMTRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Võ Minh Tâm
PHÂN TÍCH PHỔ
CHUỖI THỜI GIAN
LUẬN VĂN THẠC SĨ TOÁN HỌC
TP HỒ CHÍ MINH - NĂM 2013
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 2ĐẠI HỌC QUỐC GIA TP.HCMTRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Võ Minh Tâm
PHÂN TÍCH PHỔ
CHUỖI THỜI GIAN
Chuyên ngành: Lý thuyết Xác suất và Thống kê Toán học
Mã số chuyên ngành: 60 46 15
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học:
PGS TS Nguyễn Bác Văn
TP HỒ CHÍ MINH - NĂM 2013
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 3Lời cảm ơn
Luận văn này được hoàn thành tại trường Đại học Khoa học Tự Đại học Quốc gia Thành phố Hồ Chí Minh dưới sự hướng dẫn khoa họccủa Thầy giáo PGS TS Nguyễn Bác văn Tác giả xin bày tỏ lòng biết
nhiên-ơn chân thành và sâu sắc của mình đối với Thầy, người đã dành nhiều thờigian quý báu, sự quan tâm giúp đỡ, hướng dẫn tận tình cho tác giả hoànthành luận văn này
Nhân dịp này tác giả cũng xin chân thành gửi lời cảm ơn tới Thầygiáo PGS TS Tô Anh Dũng, Thầy giáo PGS TS Trần Lộc Hùng,Thầy giáo TS Dương Tôn Đảm cùng các Thầy giáo, Cô giáo trong KhoaToán-Tin học đã tham gia giảng dạy, giúp đỡ tác giả trong suốt quá trìnhhọc tập và nâng cao trình độ kiến thức
Cuối cùng tác giả xin cảm ơn gia đình, đồng nghiệp Khoa Toán Trường Đại học Đồng Tháp và các bạn học viên cao học Lý thuyết Xácsuất và Thống kê Toán học K21 đã ủng hộ, động viên và tạo điều kiện tốtnhất cho tác giả trong suốt quá trình học tập và nghiên cứu
học-Mặc dù có nhiều cố gắng, song luận văn không thể tránh được nhữngthiếu sót, tác giả mong nhận được những ý kiến đóng góp quý báu từ cácThầy giáo, Cô giáo và các bạn để đề tài được hoàn thiện hơn
Xin chân thành cảm ơn!
Trang 4Mục lục
1.1 Một số khái niệm căn bản 4
1.1.1 Quá trình ngẫu nhiên và chuỗi thời gian 4
1.1.2 Quá trình dừng 5
1.1.3 Quá trình tự hồi quy và trung bình trượt 8
1.1.4 Mô hình cho chuỗi thời gian không dừng 11
1.1.5 Tích phân theo quá trình ngẫu nhiên 13
1.2 Giải tích Fourier 15
1.2.1 Dãy hàm trực giao - Hệ số Fourier 15
1.2.2 Biểu diễn phức của chuỗi lượng giác 20
1.2.3 Biến đổi Fourier 21
Chương 2 PHÂN TÍCH PHỔ CHUỖI THỜI GIAN 23 2.1 Giới thiệu 23
2.2 Chu kỳ đồ 26
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 52.3 Biểu diễn phổ và phân phối phổ 33
2.4 Mật độ phổ 38
2.4.1 Mật độ phổ mẫu 38
2.4.2 Mật độ phổ lý thuyết 40
2.4.3 Bộ lọc tuyến tính bất biến theo thời gian 43
2.5 Mật độ phổ cho quá trình ARMA 46
Chương 3 ƯỚC LƯỢNG PHỔ CHUỖI THỜI GIAN 55 3.1 Tính chất thống kê của mật độ phổ mẫu 55
3.2 Làm trơn mật độ phổ 63
3.3 Độ chệch và phương sai 66
3.4 Băng thông (Bandwidth) 68
3.5 Khoảng tin cậy cho phổ 69
3.6 Rò rỉ (Leakage) và vuốt thon (Tapering) 72
3.6.1 Rò rỉ 72
3.6.2 Vuốt thon 75
3.7 Ước lượng phổ tự hồi quy 78
3.8 Một số phương pháp ước lượng phổ khác 85
Chương 4 ỨNG DỤNG: PHÂN TÍCH PHỔ CHUỖI GIÁ 90 4.1 Ví dụ về chuỗi giá vàng 90
4.2 Ví dụ về chuỗi giá xăng 100
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 7Danh mục hình vẽ
2.1 Đường cosin với n = 96 và hai tần số và pha 24
2.2 Tổ hợp tuyến tính của hai đường cosin 24
2.3 Chu kỳ đồ của chuỗi thời gian trong Hình 2.2 28
2.4 Chuỗi thời gian với chu kỳ “ẩn” 29
2.5 Chu kỳ đồ của chuỗi thời gian trong Hình 2.4 29
2.6 Độ sáng của ngôi sao thay đổi qua 600 đêm liên tiếp 30
2.7 Chu kỳ đồ của chuỗi thời gian trong Hình 2.6 30
2.8 Chu kỳ đồ của chuỗi thời gian trong Hình 2.6 với 0 < f < 1/2 32 2.9 Minh họa tính tương đồng (alias) 32
2.10 Chuỗi thời gian với với cỡ mẫu 96 trong Ví dụ 2.3.1 37
2.11 Hàm phân phối phổ F (f ), 0 ≤ f ≤ 1/2 của chuỗi thời gian trong Ví dụ 2.3.1 37
2.12 Mật độ phổ của quá trình MA(1) với θ = 0.9 48
2.13 Mật độ phổ của quá trình MA(1) với θ = −0.9 48
2.14 Mật độ phổ của quá trình MA(2) với θ1 = 1 và θ2 = −0.6 49 2.15 Mật độ phổ của quá trình AR(1) với φ = 0.9 50
2.16 Mật độ phổ của quá trình AR(1) với φ = −0.6 50
2.17 Mật độ phổ của quá trình AR(2) với φ1 = 1.5 và φ2 = −0.75 51 2.18 Mật độ phổ của quá trình AR(2) với φ1 = 0.1 và φ2 = 0.4 52 2.19 Mật độ phổ của quá trình ARMA(1,1) với φ = 0.5 và θ = 0.8 52 2.20 Mật độ phổ của quá trình MA theo mùa với θ = 0.4, Θ = 0.9, s = 12 54
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 82.21 Mật độ phổ của quá trình AR theo mùa với φ = 0.5, Φ =
0.9, s = 12 54
3.1 Mật độ phổ mẫu quá trình AR(1) mô phỏng 56
3.2 Trung bình của mật độ phổ mẫu cho quá trình MA(1) mô phỏng với θ = 0.9 và n = 48 60
3.3 Độ lệch chuẩn của mật độ phổ mẫu cho quá trình MA(1) mô phỏng với θ = 0.9 và n = 48 60
3.4 Biểu đồ QQ của phân phối phổ tại f = 15/48 61
3.5 Trung bình của mật độ phổ mẫu cho quá trình AR(2) mô phỏng với φ1 = 1.5, φ2 = −0.75 và n = 96 61
3.6 Độ lệch chuẩn của mật độ phổ mẫu cho quá trình AR(2) mô phỏng với φ1 = 1.5, φ2 = −0.75 và n = 96 62
3.7 Biểu đồ QQ của phân phối phổ tại f = 40/48 62
3.8 Phổ trơn sử dụng cửa sổ Daniell với m = 5 64
3.9 Phổ trơn sử dụng cửa sổ Daniell với m = 15 65
3.10 Cửa sổ phổ Daniell được biến đổi và tích chập của nó 65
3.11 Giới hạn tin cậy từ mật độ phổ trơn 71
3.12 Logarit của phổ trơn từ Hình 3.9 72
3.13 Chu kỳ đồ của chuỗi thời gian {Yt} với đỉnh tại f = 0.088 và f = 14/96 73
3.14 Nhân Dirichlet và nhân Dirichlet sau vuốt thon 75
3.15 Chuông cosin và vuốt thon 10% chuông cosin tách với n = 100 77 3.16 Ước lượng tự hồi quy của mật độ phổ 78
3.17 Phổ của độ sáng ngôi sao biến đổi với vuốt thon 0%, 10%, 20% và 50% 79
3.18 Các mật độ phổ được ước lượng 80
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 93.19 Ước lượng phổ AR: Ước lượng (nét chấm), thực (nét liền) 81
3.20 Ước lượng phổ cho mô hình phổ lõm AR(2) 82
3.21 Ước lượng phổ AR: Ước lượng (nét chấm), thực (nét liền) 82 3.22 Ước lượng phổ cho quá trình ARMA(1,1) 83
3.23 Ước lượng phổ AR cho quá trình ARMA(1,1) 83
3.24 Ước lượng phổ cho quá trình theo mùa 84
3.25 Ước lượng phổ AR cho quá trình theo mùa 84
3.26 Phổ theo mùa được ước lượng với cửa sổ chập 85
4.1 Giá vàng SJC mua vào 93
4.2 Đồ thị dãy tự tương quan và dãy tự tương quan riêng của chuỗi giá vàng 94
4.3 Sai phân logarit của chuỗi giá vàng 94
4.4 Đồ thị dãy tự tương quan chuỗi sai phân logarit giá vàng 95 4.5 Biểu đồ phân phối của sai phân logarit giá vàng 95
4.6 Biểu đồ Q-Q chuẩn của sai phân logarit giá vàng 96
4.7 Chu kỳ đồ của chuỗi sai phân logarit giá vàng với tần số Fourier 96
4.8 Mật độ phổ mẫu của chuỗi sai phân logarit giá vàng 97
4.9 Phổ trơn sử dụng cửa sổ Daniel với m = 13, m = 27, m = 53 của chuỗi sai phân logarit giá vàng 98
4.10 Ước lượng phổ AR của chuỗi sai phân logarit giá vàng 98
4.11 Các mật độ phổ được ước lượng của chuỗi sai phân logarit giá vàng 99
4.12 Phổ của chuỗi sai phân logarit giá vàng 99
4.13 Giá xăng Mogas 92 100
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 104.14 Đồ thị dãy tự tương quan và dãy tự tương quan riêng củachuỗi giá xăng 1014.15 Sai phân logarit của chuỗi giá xăng 1024.16 Chu kỳ đồ của chuỗi sai phân logarit giá xăng với tần số
Fourier 1024.17 Mật độ phổ mẫu của chuỗi sai phân logarit giá xăng 1034.18 Phổ trơn sử dụng cửa sổ Daniel với m = 5, m = 11, m = 21
của chuỗi sai phân logarit giá xăng 1034.19 Phổ trơn sử dụng cửa sổ Daniel với m = 21 của chuỗi sai
phân logarit giá xăng 1044.20 Phổ trơn sử dụng tích chập 2 lần cửa sổ Daniel với m = 21
của chuỗi sai phân logarit giá xăng 104
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 11Mở đầu
Đối với lĩnh vực phân tích chuỗi thời gian, thông thường người ta nghiêncứu qua hai cách tiếp cận, đó là cách tiếp cận phân tích theo miền thờigian và cách tiếp cận phân tích theo miền tần số Cách tiếp cận phân tíchtheo miền tần số của chuỗi thời gian còn được gọi là phân tích phổ chuỗithời gian Trong khi cách tiếp cận miền thời gian có thể được xem như hồiquy của hiện tại về quá khứ, thì phân tích phổ có thể được xem như là hồiquy của hiện tại trên chu kỳ cosin và sin
Mục đích chính của phân tích phổ (có khi còn được gọi là ước lượngphổ) là xác định mật độ phổ của chuỗi thời gian Mật độ phổ là một hàmđóng vai trò cơ bản trong việc phân tích chuỗi thời gian dừng Nó đượcđịnh lượng bởi phân phối năng lượng tổng cộng và là một hàm của tần số.Ước lượng của mật độ phổ dựa trên tập hợp các mẫu dữ liệu quan trắc
từ chuỗi thời gian này Một giả định cần thiết cho chuỗi thời gian này làdừng, theo nghĩa “dừng yếu”, tức là hàm trung bình và hàm hiệp phươngsai không thay đổi theo thời gian Phân tích phổ cung cấp thông tin về cấutrúc của chuỗi thời gian, khi đó nó có thể được sử dụng để nhận ra nhữngtần số chiếm ưu thế trong chuỗi thời gian
Phân tích phổ có một lịch sử lâu dài và được bắt đầu trong thời kỳ cổđại (xem [17]) Khám phá quan trọng đầu tiên, đó là lý thuyết Fourier-mộttrong những tiến bộ quan trọng nhất trong lịch sử Toán học, đã đặt cơ
sở cho sự phát triển phân tích phổ sau này được thực hiện trong nhữngnăm đầu của thế kỷ XVIII Theo lý thuyết này, một hàm tùy ý đều có thểđược biểu diễn bởi tổng vô hạn các hàm cosin và sin Sau đó đến lý thuyếtphổ Sturm-Liouville các phương trình sai phân, tiếp theo là biểu diễn phổtrong Vật lý cổ điển và Cơ học lượng tử tương ứng được phát triển bởiNorbert Wiener và John von Neuman Lý thuyết thống kê của phântích phổ thực tế bắt đầu phát triển năm 1949 khi Tukey giới thiệu một
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 12số phương pháp số cho việc tính toán phổ từ dữ liệu thực nghiệm Một
số cột mốc quan trọng đối với việc phát triển lĩnh vực này là cải tiến lạicủa biến đổi Fourier nhanh (fast Fourier transform) trong năm 1965, đó làmột thuật toán hiệu quả cho tính toán biến đổi Fourier rời rạc (discreteFourier transform) Ngay sau đó, đến công trình của John Burg, ông đã
đề xuất một cách tiếp cận mới một cách cơ bản để phân tích phổ dựa trênnguyên lý entropy(1) cực đại Trong ba thập niên qua, công trình của ôngđược tiếp nối bởi nhiều nhà nghiên cứu Họ đã phát triển nhiều thủ tụcmới để phân tích phổ và áp dụng chúng vào trong các quá trình vật lý từnhững lĩnh vực khoa học khác nhau
Ngày nay, phân tích phổ là một phương pháp đóng vai trò quan trọngtrong các lĩnh vực khoa học ứng dụng, chẳng hạn như radar, xử lý ngônngữ, y học, sinh học, xử lý tín hiệu, sonar (thiết bị phát hiện tàu ngầm),địa chấn, phân tích rung động, lý thuyết điều khiển và kinh tế Để hiểu
rõ hơn về phương pháp phân tích phổ cũng như những ứng dụng của nóvào phân tích chuỗi thời gian, chúng tôi quyết định lựa chọn đề tài “Phântích phổ chuỗi thời gian” để nghiên cứu
Nhiệm vụ chính của luận văn là hệ thống và làm sáng tỏ những kháiniệm, tính chất về phân tích phổ chuỗi thời gian thông qua việc sử dụngphần mềm thống kê R(2) để tính toán và vẽ đồ thị với các ví dụ cụ thể.Đồng thời, chúng tôi sẽ ứng dụng phổ chuỗi thời gian vào việc phân tích
dữ liệu chuỗi giá trong kinh tế (chuỗi giá vàng và chuỗi giá xăng)
Nội dung luận văn được chia làm bốn chương:
Chương 1 Kiến thức chuẩn bị
Chương này trình bày một số khái niệm và các tính chất căn bản vềchuỗi thời gian, quá trình dừng, một số mô hình cho chuỗi thời gian dừng
và không dừng, tích phân theo quá trình ngẫu nhiên và một số vấn đề vềgiải tích Fourier
(1) entropy: là một đơn vị đo nhiệt năng phát tán hay hấp thụ khi một hệ thống vật lý chuyển trạng thái tại một nhiệt độ tuyệt đối xác định.
(2) Xem giới thiệu trong Phụ lục 1 và code R sử dụng trong luận văn ở Phụ lục 2.
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 13Chương 2 Phân tích phổ chuỗi thời gian.
Chương này trình bày một số khái niệm và tính chất mở đầu về phântích phổ: chu kỳ đồ, biểu diễn phổ và phân phối phổ, mật độ phổ và tínhtoán cụ thể mật độ phổ cho quá trình ARMA
Chương 3 Ước lượng phổ chuỗi thời gian
Trong chương này, chủ yếu chúng tôi sẽ trình bày về phương pháp ướclượng phổ Bao gồm, ước lượng không tham số (làm trơn mật độ phổ mẫu)
và ước lượng có tham số (ước lượng phổ tự hồi quy) Bên cạnh đó, chúngtôi cũng đề cập đến tính chất mật độ phổ mẫu và những khái niệm liênquan như: độ chệch và phương sai, băng thông, rò rỉ và vuốt thon
Chương 4 Ứng dụng: phân tích phổ chuỗi giá
Từ những vấn đề phân tích trong các Chương 2 và 3, chúng tôi tiếnhành ứng dụng phổ chuỗi thời gian vào phân tích dữ liệu thực tế (chuỗigiá vàng và chuỗi giá xăng)
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 14Chương 1 KIẾN THỨC CHUẨN BỊ
1.1 Một số khái niệm căn bản
1.1.1 Quá trình ngẫu nhiên và chuỗi thời gian
Định nghĩa 1.1.1 Quá trình ngẫu nhiên là một họ các biến ngẫu nhiênphụ thuộc thời gian, {Yt, t ∈ T }, được xác định trên một không gian xácsuất (Ω, F , P).(1)
T là một tập các thời điểm, và thường là {0, ±1, ±2, }, {1, 2, },[0, ∞), (−∞, +∞),
Định nghĩa 1.1.2 Chuỗi thời gian là một quá trình ngẫu nhiên mà chỉ
số thời gian là một tập hợp hữu hạn hoặc vô hạn đếm được các giá trị Kýhiệu, {Yt, t ∈ Z}
Một phần quan trọng của việc phân tích một chuỗi thời gian là việc lựachọn một mô hình xác suất phù hợp (hoặc lớp các mô hình) cho dữ liệu.Những quan trắc trong tương lai có thể không đoán trước được tính chấtcủa nó Ta giả sử rằng mỗi quan trắc yt nào đó là một giá trị nhận được
từ một biến ngẫu nhiên Yt nhất định
Định nghĩa 1.1.3 Mô hình chuỗi thời gian cho những dữ liệu quan trắc{yt} là một phân phối đồng thời được xác định rõ (hay có thể chỉ là kỳvọng và hiệp phương sai) của một chuỗi thời gian {Yt}
Những ví dụ về mô hình chuỗi thời gian được trình bày rõ trong [7],[11], [13], [2]
(1)
Ω là không gian mẫu, F là σ-đại số và P là độ đo xác suất trên cùng không gian Ω.
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 151.1.2 Quá trình dừng
Để tạo ra những suy luận thống kê về cấu trúc của một quá trình ngẫunhiên trên cơ sở những quan trắc được ghi lại của quá trình đó, ta thườngphải đưa ra một số giả định để cấu trúc được đơn giản hơn Giả định quantrọng nhất là tính dừng Ý tưởng cơ bản của tính dừng là các luật xác suấtđiều chỉnh dáng điệu của quá trình không thay đổi theo thời gian
Định nghĩa 1.1.4 Cho {Yt} là một chuỗi thời gian với E(Y2
t ) < ∞ Hàmtrung bình của {Yt} là
µt = E(Yt)
Hàm hiệp phương sai của Yt là
γt,s = Cov(Yt, Ys) = E[(Yt − µt)(Ys − µs)]
với mọi số nguyên t và s
Định nghĩa 1.1.5 Cho {Yt} là một chuỗi thời gian với E(Y2
t ) < ∞ {Yt}
là quá trình dừng nếu(i) µt không phụ thuộc vào t, và(ii) γt,t−k không phụ thuộc vào t với mỗi bước trễ k
Chú ý 1.1.1 Quá trình dừng được xác định trong Định nghĩa 1.1.5 cònđược gọi là quá trình dừng yếu hay quá trình dừng cấp 2
Chuỗi thời gian {Yt} được gọi là quá trình dừng ngặt nếu (Y1, , Yn) và
Y1+k, , Yn+k có cùng hàm phân phối đồng thời với mọi số nguyên k và
n > 0 Nếu {Yt} là quá trình dừng ngặt thỏa mãn E(Y2
t ) < ∞ thì {Yt} làquá trình dừng yếu
Khi nói đến tính dừng của chuỗi thời gian, chúng ta luôn hiểu nghĩa làdừng yếu trong Định nghĩa 1.1.5, nếu không có giải thích gì thêm
Chú ý 1.1.2 Với quá trình dừng {Yt}, ta có thể đơn giản hóa kí hiệu
γt,k và viết được γk = Cov(Yt, Yt−k) Hàm γk còn được gọi là hàm tự hiệpphương sai của {Yt} tại bước trễ k
Sau đây là một số ví dụ về quá trình dừng:
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 16Tầm quan trọng của nhiễu trắng thật sự không phải bản thân nó là một
mô hình thú vị, nhưng từ thực tế nhiều mô hình có ích cần nghiên cứu lạiđược xây dựng từ nhiễu trắng
Sóng Cosin ngẫu nhiên
Ví dụ 1.1.2 Xét chuỗi thời gian được xác định như sau:
Yt = cos
2π t
E(Yt) = E
cos
2π t
12 + Φ
dΦ
= 12π
sin
2π t
12 + 2π
− sin
2π t12
= 0
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 17Do đó, µt = 0, với mọi t Ta cũng có được
γt,s = E
cos
2π t
12 + Φ
cos
h2π
s
12 + Φ
idΦ
= 12
1
Z
0
cos
2π t − s
12
+ cos
2π t + s
Phân tích điều hòa
Ví dụ 1.1.3 Một trong những bài toán cơ bản của phân tích chuỗi thờigian là biểu diễn chuỗi thời gian như là một tổng điều hòa của các hàmcosin và sin Bây giờ ta xem xét quá trình sau:
σ2j Khi đó, {Yt} là quá trình dừng với kỳ vọng 0 và hàm hiệp phương sai
[E(Aj) cos(ωjt) + E(Bj) sin(ωjt)] = 0
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 18Sử dụng tính độc lập của A1, A2, , Am, B1, B2, , Bm và một số đồng nhấtthức lượng giác, ta có
1.1.3 Quá trình tự hồi quy và trung bình trượt
Cho {et} là quá trình nhiễu trắng (0, σ2
e), θ, θ1, , θq, φ, φ1, , φp,
Θ, Θ1, , ΘQ, Φ, Φ1, , ΦP(2) là các hằng số và q, p, Q, P là các số nguyêndương Khi đó, ta sẽ giới thiệu một số quá trình trung bình trượt và tự hồiquy (đây những mô hình cho quá trình dừng) thường được sử dụng trongviệc phân tích chuỗi thời gian dưới đây
(2) Việc giả thiết các ký hiệu này trong các định nghĩa quá trình trung bình trượt và tự hồi quy nhằm thuận lợi trong việc sử dụng tính toán bằng phần mềm R.
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 19Quá trình trung bình trượt
Quá trình trung bình trượt cấp q, MA(q), được xác định bởi phươngtrình
Yt = et − θ1et−1 − θ2tt−2 − · · · − θqet−q (1.1.2)Chẳng hạn, quá trình trung bình trượt cấp 1, MA(1) và cấp 2, MA(2) lầnlượt xác định bởi các phương trình sau:
Yt = et − θet−1, (1.1.3)
Yt = et − θ1et−1 − θ2tt−2 (1.1.4)
Quá trình tự hồi quy
Quá trình tự hồi quy cấp p, AR(p), được xác định bởi phương trình
Yt = φ1Yt−1 + φ2Yt−2 + · · · + φpYt−p+ et (1.1.5)Chẳng hạn, quá trình tự hồi quy cấp 1, AR(1) và cấp 2, AR(2) lần lượtxác định bởi các phương trình sau:
Yt = φYt−1 + et, (1.1.6)
Yt = φ1Yt−1 + φ2Yt−2 + et (1.1.7)
Quá trình trung bình trượt tự hồi quy
Quá trình trung bình trượt tự hồi quy cấp p và q, ARMA(p, q), đượcxác định bởi phương trình
Yt = φ1Yt−1+φ2Yt−2+· · ·+φpYt−p+et−θ1et−1−θ2tt−2−· · ·−θqet−q (1.1.8)Chẳng hạn, quá trình trung bình trượt tự hồi quy cấp (1,1), ARMA(1,1)
có phương trình
Yt = φ1Yt−1 + et − θ1et−1 (1.1.9)Quá trình trung bình trượt theo mùa
Quá trình trung bình trượt theo mùa nhân tính (multiplicative),MA(q)×(Q)s, với chu kỳ mùa là s được xác định bởi phương trình
Trang 20trong đó, B là toán tử lùi được xác định
trong đó {Xt} là một chuỗi thời gian
Chẳng hạn, quá trình trung bình trượt theo mùa nhân tính,MA(1)×(1)12, với chu kỳ mùa 12 có phương trình
Yt = (1 − θB)(1 − ΘB12)et (1.1.12)
hay
Yt = et − θet−1 − Θet−12 + θΘet−13.Quá trình tự hồi quy theo mùa
Quá trình tự hồi quy theo mùa nhân tính, AR(p)×(P )s, với chu kỳ mùa
là s được xác định bởi phương trình
Yt − φYt−1 − ΦYt−12 + φΦYt−13 = et
Chú ý 1.1.3 Trên đây, chúng ta chỉ giới thiệu một số quá trình hồi quytrung bình trượt thường được sử dụng trong các mô hình cho chuỗi thờigian dừng Tuy nhiên, chúng ta chỉ xác định phương trình của những quátrình này nhằm thuận lợi trong việc sử dụng để tính mật độ phổ trongChương 2 Các đặc trưng cũng như tính chất của những quá trình nàychúng ta có thể tham khảo trong [11] và [13]
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 211.1.4 Mô hình cho chuỗi thời gian không dừng
Bất kỳ chuỗi thời gian không có kỳ vọng là hằng số theo thời gian làchuỗi thời gian không dừng Trên thực tế, việc xác định một chuỗi thờigian là dừng hay không dừng là không dễ, do chúng ta chỉ có thông tincủa quá trình thông qua một chuỗi quan sát Để khắc phục những khókhăn này, Box và Jenkin ([8]) đã nhận xét rằng, quá trình đã lấy sai phân
Wt = (1 − B)dYt (lấy sai phân cấp d) có nhiều khả năng dừng hơn bảnthân quá trình {Yt} Chẳng hạn, với d = 1, Wt = (1 − B)Yt = Yt − Yt−1
và d = 2, Wt = (1 − B)2Yt = Yt − Yt−1 − (Yt−1 − Yt−2) Do đó, Box vàJenkin đã đề nghị xét quá trình Wt = Yt − Yt−1 và giả thiết {Wt} là quátrình dừng, dù rằng quá trình nguyên thủy Yt có thể không dừng Thôngthường, d được chọn không lớn hơn 3, nếu d = 3 mà vẫn chưa có một quátrình dừng thì kết luận là quá trình nguyên thủy {Yt} không phù hợp với
mô hình ARMA Sau đây, chúng ta sẽ xem xét một số biến đổi đối vớichuỗi thời gian không dừng thành chuỗi thời gian dừng
Trang 22Ta gọi phương trình này là dạng phương trình sai phân của mô hình.Biến đổi logarit
Sai phân là một phép biến đổi rất hữu hiệu để có được một quá trìnhdừng Tuy nhiên, trong một số trường hợp các phép biến đổi logarit cũng
tỏ ra hiệu quả Đặc biệt, với chuỗi thời gian nhận giá trị dương {Yt}, giảsử
E[Yt] = µt với pV ar(Yt) = µtσKhi đó
E[log(Yt)] ≈ log(µt) V ar(log(Yt)t) ≈ σ2Các kết quả này suy ra từ việc lấy kỳ vọng và phương sai hai vế của phépkhai triển Taylor của hàm log(Yt) tại µt
log(Yt) ≈ log(µt) + Yt − µt
µt .Phép biến đổi logarit sẽ tạo ra một chuỗi với phương sai xấp xỉ hằng sốtheo thời gian Giả sử Yt có xu hướng thay đổi tỷ lệ phần trăm tương đối
ổn định từ một chu kỳ thời gian đến chu kỳ kế tiếp Chẳng hạn, giả thiếtrằng
Yt = (1 + Xt)Yt−1 , tức là Xt = Yt − Yt−1
Yt−1 = 100Xt%với 100Xt là phần trăm thay đổi (có thể âm) từ Yt đến Yt−1 Khi đó
log(Yt) − log(Yt−1) = log
sẽ tương đối ổn định và có thể mô hình hóa theo một quá trình dừng Chú
ý rằng, ta lấy logarit trước và sau đó tính toán sai phân cấp một (thứ tựnày không thành vấn đề) Trong các tài liệu về tài chính, sai phân của cáclogarit thường được gọi là tiền lãi (returns).(3)
(3) Ví dụ về các phép biến đổi trên được tìm thấy trong [11].
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 231.1.5 Tích phân theo quá trình ngẫu nhiên
Chúng ta sẽ xây dựng căn bản khái niệm tích phân theo quá trình ngẫunhiên dựa trên việc xây dựng tích phân Riemann-Stiltjes đã biết Việc xâydựng chi tiết cũng như chứng minh một số tính chất trong mục này, chúng
Ta sẽ phát triển khái niệm tích phân theo quá trình ngẫu nhiên
Cho {U (f ), f ∈ [a, b]} là một quá trình ngẫu nhiên với kỳ vọng 0 và có
số gia độc lập, tức là
E{[U (f2) − U (f1)][U (f4) − U (f3)]} = 0 với a ≤ f1 < f2 ≤ f3 < f4 ≤ b
Ngoài ra, cho G(f ) = E[U2(f )] với f ∈ [a, b] và giả sử G(0) = 0 Khi đó, G
là một hàm đơn điệu không giảm, tức là G(f1) ≤ G(f2) với f1 < f2 Thật
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 24= E{[U (f2) − U (f1)]2} + 2E{[U(f2) − U (f1)]U (f1) − U (0)]}
vì E{[U (f2) − U (f1)]2} ≥ 0 và E{[U(f2) − U (f1)]U (f1) − U (0)]} = 0 nênG(f1) ≤ G(f2)
Bây giờ, chúng ta định nghĩa tích phân
b
Z
a
g(f )dU (f )
tương tự như tích phân Riemann-Stieltjes (1.1.15)
Cho a = f0 < f1 < < fn = b là một phân hoạch bất kỳ trên đoạn[a, b] Cho ∆n = max[fj − fj−1], fj∗ ∈ [fj−1, fj] Xét tổng sau:
Khi đó, tích phân (1.1.17) được gọi là tích phân theo quá trình ngẫu nhiên
U (f ), hay còn gọi là tích phân ngẫu nhiên
Sau đây, ta phát biểu một số tính chất căn bản của tích phân ngẫunhiên, bỏ qua chứng minh
(4) Sự hội tụ trong (1.1.16) là dạng hội tụ theo bình phương trung bình.
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 25xỉ bởi một đa thức Tương tự như vậy, để thuận lợi, ta xây dựng một tậpvéctơ được gọi là cơ sở sao cho tất cả các véctơ khác có thể biểu thị qua tổhợp tuyến tính của các phần tử của cơ sở Thông thường các véctơ cơ sởđược xây dựng là trực giao Trong phân tích chuỗi thời gian, chuỗi thườngđược chúng ta quan tâm đặc biệt là chuỗi lượng giác (chẳng hạn, chuỗithời gian trong Ví dụ 1.1.3).
1.2.1 Dãy hàm trực giao - Hệ số Fourier
Giả sử chúng ta có một hàm được xác định trên n điểm Chúng ta
sẽ nghiên cứu tính chất của tập các hàm {cos(2πjt/n), sin(2πjt/n) : t =
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 261, , n} với j = 0, 1, , l(n), trong đó l(n) là số nguyên nhỏ hơn hoặc bằngn/2 Chú ý rằng, khi j = 0 thì giá trị của cosin bằng 1 Giá trị của sinbằng 0 khi j = 0 hoặc j = n/2 nếu n chẵn Vì vậy, ta chỉ quan tâm đếntập chứa đúng n hàm, không hàm nào trong số đó bằng 0 Chúng ta sẽchứng minh những hàm này, được xác định trên tập số nguyên 1, 2, , n,
là trực giao và chúng ta sẽ lấy tổng bình phương mỗi hàm Và như vậy,
n hàm xác định như trên tạo thành một cơ sở trực giao trong không gianvéctơ n-chiều
Chứng minh Trước tiên, ta chứng minh được
Trang 27Thật vậy, áp dụng công thức Euler
cos(x) = e
ix+ e−ix2cùng với công thức cho cấp số nhân hữu hạn
n
X
t=1
sin(2πk + j
n
X
t=1
cos(2πk + j
n t) + cos(2π
k − j
n t)
(1.2.3)
Nếu j = k = 0 hoặc j = k = n/2 (n chẵn) thì các số hạng cosin trong vếphải (1.2.3) luôn bằng 1, và ta được
Trang 28Nếu j = k 6= 0 hoặc j = k 6= n/2 (n chẵn) thì từ (1.2.3) ta được
n
X
t=1
cos(2πk − j
n t) − cos(2π
k + j
n t)
(1.2.4)
Lý luận tương tự như đối với tổng Sjk, ta cũng được
j = 0, 1, , l(n), l(n) 6= n/2 xác định trên các điểm t = 1, , n là một cơ
sở trực giao, điều này dẫn đến Mệnh đề 1.2.2, kết quả này chỉ ra được sựtồn tại của cách biểu diễn (1.1.1) trong Ví dụ 1.1.3 Mệnh đề 1.2.2 quantrọng về sau
n
P
t=1
g(t) cos(ωjt), j = 1, 2, , l(n − 1),1
n
X
t=1
g(t) sin(ωjt), j = 1, 2, , l(n − 1)
aj và bj được gọi là hệ số Fourier
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 29Chú ý 1.2.2 1 Ta có
a0 = 1n
g(t) = a0 + a1cos(πt)(t = 1, 2),
tìm ngay được hai hệ số a0, a1.Với n = 3, l(n) = 1 < 3/2, chỉ dùng {cos(2πjt/3)}, (j = 0, 1) và{sin(2πjt/3)}, (j = 1), lúc đó (1.2.5) được viết
Giải hệ này sẽ cho a0, a1, b1
Chứng minh Một cách để có được biểu diễn (1.2.5) là tìm aj và bj sao cho
bé nhất (Phương pháp hồi quy bình phương bé nhất)
Lấy vi phân đối với am và bm và cho các đạo hàm bằng 0, ta được
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 30và ta suy ra được các hệ số của (1.2.5) Vì vậy chúng ta thấy rằng các hệ
số là hệ số hồi quy có được bởi phương pháp hồi quy véctơ g(t) trên cácvéctơ cos(ωjt) và sin(ωjt) Ta gọi véctơ g(t) là bộ {g(1), , g(n)} và tương
tự, véctơ cos(ωjt), sin(ωjt) Do sự trực giao của các hàm cosin và sin, nêncác hệ số hồi quy bội chính là các hệ số hồi quy đơn 1.2.2 Biểu diễn phức của chuỗi lượng giác
Chúng ta có thể biểu diễn chuỗi lượng giác trong dạng phức để đượcmột chuỗi dạng gọn hơn và sẽ hữu dụng trong một số ứng dụng nhất định.Vì
akcos(kx) + bksin(kx) = ak eiθ + e−iθ
Trang 311.2.3 Biến đổi Fourier
Định nghĩa 1.2.1 Cho {ck, k = 0, ±1, ±2, } là một dãy khả tổng tuyệtđối, tức là
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 32Định nghĩa 1.2.2 Cho {Yt, t = 1, , n} là một dãy hữu hạn Khi đó hàmsố
Chúng ta có thể xem chi tiết một số kết quả khác về công thức biến đổiFourier và biến đổi ngược của nó đối với một số miền thời gian trong [13],tr.134
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 33Chương 2
PHÂN TÍCH PHỔ CHUỖI THỜI
GIAN
Trong lịch sử, phân tích phổ chuỗi thời gian bắt đầu với việc nghiên cứu
“chu kỳ ẩn” trong dữ liệu chuỗi thời gian Biểu diễn phổ của chuỗi thời giandừng {Yt} về cơ bản là phân tích {Yt} thành tổng các thành phần đườngcosin với hệ số ngẫu nhiên không tương quan Khi phân tích các tính chấttần số của chuỗi thời gian, ta nói rằng ta đang làm việc trên miền tần số
Sự phân tích quá trình dừng theo cách biểu diễn phổ thường được gọi làphân tích miền tần số hay phân tích phổ của chuỗi thời gian Nó tươngđương với phân tích miền thời gian trên cơ sở hàm tự hiệp phương sai,nhưng cung cấp một cách nhìn khác về chuỗi thời gian Phân tích phổ cónhiều ứng dụng hữu ích trong các lĩnh vực âm thanh, kỹ thuật thông tinliên lạc, khoa học địa lý, vật lý, y học và sinh học
2.1 Giới thiệu
Định nghĩa 2.1.1 Đường cosin là một chuỗi thời gian được xác định bởiphương trình
Yt = R cos(2πf t + Φ) (2.1.1)trong đó, R(> 0) là biên độ dao động, f là tần số và Φ là pha của đườngcong Vì đường cong lặp lại chính nó trong 1/f đơn vị thời gian, nên 1/fđược gọi là chu kì của sóng cosin
Ví dụ 2.1.1 Hình 2.1 hiển thị hai đường cosin cos1 = cos(2πt4/96) vàcos2 = cos(2πt14/96 + 0.6π) với thời gian rời rạc t chạy từ 1 đến 96 Chúng
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 34ta chỉ thấy những điểm rời rạc (“o” và “×” lần lượt là ký hiệu của giá trịcủa cos1 và cos2), tuy nhiên ta thêm vào đường nối những điểm đó để thấy
Hình 2.1: Đường cosin với n = 96 và hai tần số và pha
Hình 2.2 biểu diễn đồ thị của tổ hợp tuyến tính của cos1 và cos2 đượcxác định
Yt = 2 cos
2πt 496
+ 3 cos
2πt14
Hình 2.2: Tổ hợp tuyến tính của hai đường cosin
Sự thay đổi ngẫu nhiên của biên độ dao động và pha tạo nên tính ngẫunhiên trong chuỗi thời gian (2.1.1) Tuy nhiên, đối với hai tham số R và Φ
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 35thì biểu thức R cos(2πf t + Φ) không là dạng tuyến tính, do đó việc xấp xỉ(2.1.1) trở nên không thuận lợi Bây giờ, chúng ta sử dụng phương phápđồng nhất thức lượng giác(1) nhằm tham số hóa lại (2.1.1) như sau:
Xét trường hợp tổng quát của (2.1.3), một tổ hợp tuyến tính của mđường cosin với biên độ, tần số và pha tùy ý được xác định
(1) cos(α ± β) = cos α cos β ∓ sin α sin β.
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 36Chú ý 2.1.1 Cũng theo Mệnh đề 1.2.2, ta phát biểu được rằng:
Một chuỗi thời gian với chiều dài n bất kỳ, cho dù là tất định hay ngẫunhiên và có hoặc không có bất kỳ chu kỳ thật sự nào, cũng có thể phùhợp với mô hình trong (2.1.4) bằng việc chọn m = n/2 nếu n chẵn và
m = (n − 1)/2 nếu n lẻ
Sau đó ước lượng n tham số để phù hợp với chuỗi có chiều dài n
2.2 Chu kỳ đồ
Sau đây ta có định nghĩa chu kỳ đồ đối với tần số Fourier
Định nghĩa 2.2.1 Đối với cỡ mẫu là số lẻ, n = 2k + 1, chu kỳ đồ I tạitần số fj = j/n với j = 1, 2, , k, được xác định bởi
I (fj) = n
2( bA
2
j + bBj2) (2.2.1)trong đó bAj và bBj được xác định trong công thức (2.1.5) và (2.1.6)
Nếu cỡ mẫu là số chẵn, n = 2k, thì công thức (2.2.1) cho chu kỳ đồ với
j = 1, 2, , k − 1 Dĩ nhiên, tại tần số cuối fk = k/n = 1/2, áp dụng côngthức (2.1.7) ta được
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 37Bảng 2.1 Bảng phân tích phương sai với n lẻ
Một cách hiểu khác là dựa vào những số hạng trong phân tích phươngsai Từ (2.1.4), (2.1.5) và (2.1.6) ta được
khi n lẻ Từ đó, ta có bảng phân tích phương sai Bảng 2.1 Kết quả tương
tự được giữ khi n chẵn nhưng số hạng cuối cùng I(1/2) trong tổng với mộtbậc tự do
Liệu chu kỳ đồ có làm việc tốt khi chúng ta không biết sự tồn tại củađường cosin trong chuỗi? Và điều gì sẽ xảy ra nếu chuỗi được thêm vào
“tiếng ồn”? Để minh họa, ta xét ví dụ sau:
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 38Hình 2.3: Chu kỳ đồ của chuỗi thời gian trong Hình 2.2
Ví dụ 2.2.1 Xét một một chuỗi thời gian được ta tạo ra bằng cách sử dụng
sự ngẫu nhiên để chọn các tần số, biên độ dao động và pha với việc thêm vàonhiễu trắng Hai tần số được lựa chọn ngẫu nhiên mà không cần thay thế
từ trong số 1/96, 2/96, , 47/96 ( với t = 1, , 96; n = 96 = 2 × 48; k = 48;
j = 1, , 47 = k − 1; các tần số Fourier là 1/96, 2/96, , 47/96) Các hệ
số A1, A2, B1, B2 được chọn ngẫu nhiên từ phân phối chuẩn với kỳ vọng 0
và độ lệch tiêu chuẩn là 2 đối với A1, A2 và là 3 đối với B1, B2 Cuối cùng,chuỗi nhiễu trắng chuẩn {et} với kỳ vọng 0 và độ lệch tiêu chuẩn 1 đượcchọn một cách độc lập với A1, A2, B1, B2 Mô hình được xác định là(2)
Yt = A1cos(2πf1t) + B1sin(2πf1t) + A2cos(2πf2t) + B2sin(2πf2t) + et
(2) Mô hình này thường được mô tả như là một tín hiệu cộng với mô hình nhiễu Các tín hiệu có thể được xác định (với các thông số chưa biết) hoặc ngẫu nhiên.
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 39Hình 2.5: Chu kỳ đồ của chuỗi thời gian trong Hình 2.4
Ví dụ 2.2.2 Đây là một ví dụ về chu kỳ đồ cho một lớp chuỗi thời gian
từ Whittaker và Robinson (1942)(3) Hình 2.6 hiển thị biểu đồ chuỗi thờigian về độ sáng của một ngôi sao đặc biệt lúc nửa đêm trên 600 đêm liêntiếp
Hình 2.7 biểu thị chu kỳ đồ cho chuỗi thời gian trong Hình 2.6 Có haiđỉnh rất nổi bật trong chu kỳ đồ Khi kiểm tra với giá trị số thực tế, tathấy rằng đỉnh cao hơn xảy ra tại tần số f = 21/600 = 0.035 Tần số nàytương ứng với 28.57, hoặc gần 29 ngày Trong (2.1.4), cos(2πfjt) = 1 khi
fjt = 1 hay t = 1/fj; với fj = 21/600 ta có t = 600/21 = 28.57 Đỉnh
(3) Một phân tích sâu rộng của lớp chuỗi thời gian này xuất hiện xuyên suốt trong [5].
luan van tot nghiep download luanvanfull moi nhat z z @gmail.com Luan van thac si
Trang 40Hình 2.6: Độ sáng của ngôi sao thay đổi qua 600 đêm liên tiếp
cao thứ hai xảy ra tại f = 25/600 ≈ 0.04167, tương ứng khoảng thời gian600/25 = 24 ngày Một số giá trị chu kỳ đồ khác 0 khá nhỏ gần đỉnh lớn
Hình 2.7: Chu kỳ đồ của chuỗi thời gian trong Hình 2.6
Mặc dù tần số Fourier đặc biệt, nhưng ta có thể mở rộng định nghĩachu kỳ đồ đến tất cả các tần số trong khoảng 0 tới 1/2 thông qua côngthức (2.1.6) và (2.2.1) Ta có định nghĩa sau:
Định nghĩa 2.2.2 Cho chuỗi thời gian {Yt, t = 1, , n}, chu kỳ đồ củatần số f bất kỳ với 0 ≤ f ≤ 1/2 được xác định bởi