MỞ ĐẦU Gần đây đã có sự quan tâm trở lại đối với các thuật toán nhận dạng không gian trạng thái cho chuỗi thời gian dựa trên một qui trình hai bước mà theo nguyên tắc, có thể được mô tả
Trang 1MỤC LỤC
MỞ ĐẦU 3
Chương 1 NHỮNG KIẾN THỨC CHUẨN BỊ 6
1.1 Ma trận 6
1.1.1 Định nghĩa ma trận 6
1.1.2 Các phép toán trên ma trận 6
1.2 Không gian Hilbert 8
1.2.1 Định nghĩa 8
1.2.2 Giới hạn của dãy điểm 8
1.2.3 Định nghĩa: 8
1.3 Khái niệm về chuỗi thời gian và quá trình ngẫu nhiên 9
1.3.1 Định nghĩa 9
1.3.2 Định nghĩa 9
1.4 Quá trình dừng và phân tích hệ số tự tương quan 10
1.4.1 Khái niệm về quá trình dừng 10
1.4.2 Hàm tự hiệp phương sai của một quá trình dừng 12
1.4.3 Hệ số tương quan và tự tương quan mẫu 12
1.4.4 Hệ số tự tương quan riêng 14
Chương 2 PHÂN TÍCH TƯƠNG QUAN CHÍNH TẮC VÀ XẤP XỈ MỞ RỘNG HIỆP PHƯƠNG SAI CỦA CHUỖI THỜI GIAN DỪNG 16
2.1 Bài toán nhận dạng dãy hiệp phương sai 16
2.2 Tính dương, tính không dưng và khai triển xấp xỉ của ma trận hiệp phương sai Hankel 19
2.2.1 Giả thiết về bậc của dãy hiệp phương sai 19
2.2.2 Định nghĩa bậc dương của dãy hiệp phương sai 22
2.2.3 Giả định về bậc dương p của dãy hiệp phương sai 22
2.2.4 Sự khác biệt giữa bậc đại số và bậc dương 23
Trang 22.3 Lý thuyết về thể hiện ngẫu nhiên trong không gian Hilbert của hàm mẫu28
2.3.1 Không gian Hillbert của các hàm mẫu 29
2.3.2 Về phương pháp nhận dạng không gian con 33
2.3.3 Giả thuyết về tính dương 35
2.4 Các tương quan chính tắc và sự thể hiện tính ngẫu nhiên cân bằng 38
2.4.1 Mệnh đề 39
2.4.2 Mệnh đề 40
2.4.3 Mệnh đề 41
2.4.4 Định lý 44
2.4.5 Mệnh đề 47
2.5 Thể hiện ngẫu nhiên từ dữ liệu hiệp phương sai hữu hạn 48
2.5.1 Định lý 50
2.5.2 Các hình thức bất biến của bộ lọc Kalman 53
2.5.3 Mệnh đề 57
2.5.4 Định lý 59
KẾT LUẬN 61
TÀI LIỆU THAM KHẢO 62
Trang 3MỞ ĐẦU
Gần đây đã có sự quan tâm trở lại đối với các thuật toán nhận dạng không gian trạng thái cho chuỗi thời gian dựa trên một qui trình hai bước mà theo nguyên tắc, có thể được mô tả như ước lượng của một mô hình hiệp phương sai từ dữ liệu quan sát được tạo ra bởi thể hiệnngẫu nhiên Phương pháp này đem lại lợi thế lớn cho việc chuyển đổi pha ước lượng tham số phi tuyến rất cần thiết trong việc xác định mô hình Arma truyền thống vào thể hiệnriêng, liên quan đến sử dụng phương pháp kỹ thuật số có sẵn để giải hai bài toán ma trận ước lượng hiệp phương sai và phương trình Riccati Trong bài này, chúng ta có thể dùng vào quá trình đa biến và đồng thời chỉ ra rằng các thuật toán cũng có thể làm việc với những dữ liệu chứa các thành phần tất định hoàn toàn (van Overschee và De Moor, 1993) Tuy nhiên, hạn chế được nhấn mạnh trong bài báo này đó là các phương pháp này không làm việc với các dữ liệu tùy ý Đây là loại thủ tục đầu tiên được tán thành bởi Faure (1969), xem Faurre và Chataigner (1971) và Faurre và Marmorat (1969) Nghiên cứu gần đây, dựa trên phân tích mối tương quan chính tắc (Akaike năm 1975) (hoặc một
số phân tích giá trị kì dị khác), thuật toán Ho-Kalman (Kalman và các cộng sự, 1969), Aoki(1990), Larimore (1990), van Overschee và De Moor (1993) Các nghiên cứu mới nhất về thuật toán phân tích tương quan chính tắc được thực hiện trực tiếp trên dữ liệu quan sát mà không cần tính toán các ước lượng hiệp phương sai (van Overschee và De Moor, 1993) Kinh nghiệm cho thấy rằng thời gian tính toán cần thiết để có được ước lượng tham số mẫu cuối cùng khả quan hơn so với phương pháp truyền thống dự báo lỗi lặp của mô hình Arma truyền thống
Những phương pháp này giới thiệu một số vấn đề toán học không tầm thường liên quan đến tính dương Lý do là bởi trọng tâm vấn đề này tương đương với vấn đề mở rộng hữu tỷ hiệp phương sai được nhiều người biết đến
Trang 4Do đó, việc xác định các đối số thông thường trên cơ sở tìm thừa số của một
ma trận Hankel sẽ không thực hiện được với các dữ liệu chung chung Lưu ý rằng để tính toán mô hình không gian trạng thái các tín hiệu ước lượng hiệp phương sai thì cần phải giải được phương trình Riccati Mà để giải phương được trình này thì điều kiện cần là phải bảo đảm tính dương Trọng tâm của các quá trình mô tả ở trên là vấn đề xác định một dãy hiệp phương sai
Nhiệm vụ chính của đề tài này là chúng tôi tìm hiểu phân tích tương quan chính tắc, mở rộng gần đúng hiệp phương sai và nhận dạng chuỗi thời gian dừng
Nội dung của luận văn bao gồm 2 chương:
Chương 1 Các kiến thức chuẩn bị
Trong chương này, chúng tôi trình bày về khái niệm chuỗi thời gian và quá trình ngẫu nhiên, các công thức tính hàm tự hiệp phương sai; hàm tự tương quan; hàm tự tương quan mẫu; hàm tự tương quan riêng mẫu, về toán tử lùi, toán tử tiến, biến ngẫu nhiên và hàm phân phối, ma trận, không gian Hilbert
Chương 2 Phân tích tương quan chính tắc, xấp xỉ mở rộng hiệp phương sai chuỗi thời gian dừng
Đây là nội dung chính của luận văn, gồm 4 phần Phần 2.1 chúng tôi giới thiệu về Tính dương, không âm và khai triển xấp xỉ của ma trận hiệp phương sai Hankel Phần 2.2 trình bày về Lý thuyết về thể hiện tính ngẫu nhiên trong không gian Hilbert của một hàm mẫu Phần 2.3 là các tương quan chính tắc và
sự thể hiện tính ngẫu nhiên cân bằng Phần 2.4 trình bày về thể hiện của tính ngẫu nhiên từ dữ liệu hiệp phương sai hữu hạn
Luận văn này được hoàn thành tại Đại học Vinh dưới sự hướng dẫn khoa học của Thầy giáo TS Nguyễn Trung Hòa Tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc của mình đối với Thầy Người đã dành cho tác giả nhiều thời gian quý báu, sự quan tâm giúp đỡ, hướng dẫn tận tình cho tác giả hoàn thành
Trang 5giáo PGS.TS Nguyễn Văn Quảng, Thầy giáo PGS.TS Trần Xuân Sinh, Thầy giáo PGS.TS Phan Đức Thành cùng các Thầy giáo, Cô giáo trong khoa Toán, khoa Sau đại học đã tham gia giảng dạy giúp đỡ tác giả trong suốt quá trình học tập nâng cao trình độ kiến thức Cuối cùng tác giả xin cảm ơn gia đình và đồng nghiệp cùng tất cả bạn bè đã ủng hộ, động viên và tạo điều kiện tốt nhất cho tác giả trong suốt quá trình học tập và nghiên cứu
Mặc dù có nhiều cố gắng, song luận văn không thể tránh được những thiếu sót, tác giả rất mong nhận được những ý kiến đóng góp quý báu từ các Thầy giáo, Cô giáo và các bạn để đề tài được hoàn thiện hơn
Vinh, tháng 12 năm 2011
Tác giả
Trang 6
Chương 1 NHỮNG KIẾN THỨC CHUẨN BỊ 1.1 Ma trận
1.1.1 Định nghĩa ma trận
Một ma trận A cỡ m n trên trường K (K – là trường thực , hoặc phức ) là một bảng chữ nhật gồm m n phần tử trong K được viết thành m dòng và n cột như sau: A a ij m n
trong đó a ijK là phần tử ở vị trí dòng i, cột j của A
Các ma trận thường được ký hiệu bởi A, B, C và tập hợp tất cả các ma trận cỡ m×n trên trường K được ký hiệu bởi M m x n (K)
Nếu a = -1 thì ta ký hiệu (-1).A bởi -A và gọi là ma trận đối của A
ChoAM n K Khi đó, nếu A T = A thì ta nói A là ma trận đối xứng; nếu
Trang 7ChoAM mn K ; , K Ta có: (ab).A = a.(bA); (aA) T = a.(A T)
Cho A B, M mn( )K Ta gọi tổng của A và B, ký hiệu là A + B là một ma
trận C c ij M mn K được xác định bởi:cij aij bij Hiệu của hai ma trận A
và B là của A + (-B) được ký hiệu bởi A – B
Cho A, B, C M m,n (K), , K Khi đó:
Tổng hai ma trận có tính giao hoán: A + B = B + A
Tổng các ma trận có tính kết hợp: A + (B + C) = (A + B) + C
Tồn tại ma trận 0 mxn sao cho: A + 0 = 0 + A = A
Tồn tại ma trận đối của A sao cho: A + (- A) = (- A) + A = 0
Phép nhân vô hướng có tính phân phối đối với phép cộng các ma trận: α(A+B) = αA + αB ;(α +β)A = αA+ βA
Chuyển vị của tổng bằng tổng các chuyển vị:(A + B) T = A T + B T
Cho hai ma trận A = (a ịj) M n (K), B = (b ịj)M n (K) Khi đó tích của hai
Trang 81.2 Không gian Hilbert
1.2.1 Định nghĩa
Không gian tuyến tính thực E được gọi là không gian tiền Hilber nếu
trên đó có xác định một tích vô hướng, nghĩa là với mỗi cặp a b, E E , ta đều
có tương ứng một số thực, ký hiệu là a b sao cho: ,
1.2.2 Giới hạn của dãy điểm
Ta nói dãy điểm x n = x1,x2,…,x n trong không gian tiên Hilbert E có giới hạn là a, và viết: limx n = a, nếu dãy số x na có giới hạn bằng 0 Dãy có
giới hạn gọi là dãy hội tụ Dãy không hội tụ gọi là dãy phân kỳ Dễ thấy giới
hạn của một dãy hội tụ là duy nhất
1.2.3 Định nghĩa:
Không gian tiền Hilbert đầy đủ được gọi là không gian Hilbert
Trang 91.3 Khái niệm về chuỗi thời gian và quá trình ngẫu nhiên
1.3.1 Định nghĩa
Quá trình ngẫu nhiên X là các biến ngẫu nhiên phụ thuộc tham số t
tT (trong đó T và được giải thích như là thời gian) Đó là hiện tượng
mang tính thống kê phát triển theo thời gian, tuân theo những quy luật của lý thuyết xác suất
1.3.2 Định nghĩa
Giả sử T là tập hợp tất cả các số nguyên thuộc một khoảng nào đó
a b, , a b ;X t t Tlà một dãy các đại lượng ngẫu nhiên
được sắp xếp theo thứ tự trên T Chuỗi thời gian là một dãyx t t T (hữu hạn hoặc vô hạn) các giá trị của dãyX t
Nếu thời gian là một đoạn T a b; thì chuỗi thời gian được gọi là
liên tục Nếu thời gian là một tập hợp rời rạc T thì chuỗi thời gian được gọi là rời rạc
Khái niệm chuỗi thời gian có quan hệ trực tiếp đến khái niệm quá trình ngẫu nhiên và các chuỗi thời gian mà ta đang xét chính là thể hiện của một quá trình ngẫu nhiên
Có thể xem chuỗi thời gian là một dãy các điểm trong không gian vô hạn chiều các đại lượng ngẫu nhiên, trên đó đã xác định một độ đo xác suất Chính
vì thế có thể đưa hàng loạt các khái niệm của quá trình ngẫu nhiên vào chuỗi thời gian một cách cụ thể hơn
Để phân biệt ta sẽ sử dụng thuật ngữ quá trình X để chỉ một dãy các đại t lượng ngẫu nhiên mà một thể hiện của nó là chuỗi thời gian x Và cũng có thể t
hiểu rằng, một chuỗi thời gian là một dãy rời rạc các thể hiện của một quá trình, được chỉ số hóa bởi các số nguyên liên tiếp trong những khoảng thời gian cách đều nhau
Trang 10Nếu tập hợp các thời điểm quan sát là t t0, 0 h, ,t0Nhthì chuỗi thời gian được kí hiệu là x x0, , ,1 x và N N là độ dài của chuỗi 1
Nếu T thì chuỗi thời gian là dãy vô hạn về cả hai phía
Vì biến ngẫu nhiên thực là ánh xạ đo được từ không gian xác suất
,F, ) vào không gian đo được () nên quá trìnhX là hàm của cặp ( , ) t t đo được theo với mỗi tT.
Ví dụ Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay
Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số
tiêu dùng…đều là những thể hiện rất thực tế của chuỗi thời gian
Trong giới hạn của luận văn này ta chỉ xét cho trường hợp T là tập các
số nguyên và chúng ta sẽ sử dụng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện
1.4 Quá trình dừng và phân tích hệ số tự tương quan
1.4.1 Khái niệm về quá trình dừng
Giả sử X t là chuỗi thời gian X Khi đó t2
a) Hàm số X( )t X với t t T gọi là hàm trung bình của X t b) Hàm 2 biến X( , ) t s cov(X X t, s) X t X( )t X s X( )s với ,
s t được gọi là hàm tự hiệp phương sai của T X t
Chuỗi thời gian X t, t được gọi là dừng nếu thỏa mãn:
+) X t 2 , t
Trang 11+) X t m, t
+) X( , )t s X(t r s, r), t s r, ,
Nhận xét Nếu X t dừng thì t, X( , )t s X(t s,0) và chính vì vậy với một quá trình dừng thì có thể định nghĩa lại hàm hiệp phương sai bằng cách chỉ định nghĩa thông qua một hàm một biến
Quá trình dừng đóng vai trò bản chất trong việc phân tích chuỗi thời gian
và dĩ nhiên trong thực tế, các chuỗi thời gian quan sát thường chưa phải là một chuỗi dừng Vì vậy, khi gặp những dữ liệu như thế, phải có những xử lý thích hợp để biến chuỗi thời gian nguyên thủy thành một chuỗi mới phù hợp với điều kiện của tính dừng Công cụ đầu tiên nghiên cứu chuỗi thời gian là hàm tự hiệp phương sai
Trang 121.4.2 Hàm tự hiệp phương sai của một quá trình dừng
Mệnh đề (Các tính chất sơ cấp) Nếu (.)là hàm tự hiệp phương sai của một quá trình dừng X t thì: t,
với n a, đã nêu ở trên
Định lí (Đặc trưng của hàm tự hiệp phương sai) Một hàm thực xác định trên
tập được gọi là hàm tự hiệp phương sai của một chuỗi thời gian dừng nếu
và chỉ nếu nó là chẵn và xác định không âm
Định lí Nếu X t, t là quá trình dừng, và nếu a , i i thỏa mãn điều
1.4.3 Hệ số tương quan và tự tương quan mẫu
1.4.3.1 Hệ số tương quan mẫu
Nếu ta quan sát được n giá trị của chuỗi X t là x x1, 2, ,x và n giá trị n
của chuỗi Y là t y y1, 2, ,y thì hệ số hiệp phương sai n Cov X Y( , ) được ước lượng bởi XY X Y*
Còn hệ số tương quan của X và Y được tính bởi công thức:
Trang 131.4.3.2 Hệ số tự tương quan mẫu (ACF)
Giả sử ta quan sát được n giá trị của chuỗi X t là x x1, 2, ,x Khi đó ước n lượng của hệ số tự hiệp phương sai X( )h là hệ số tự hiệp phương sai mẫu được
cho bởi:
1
1 ( )
n h
t
t h t
i) n là số quan sát của đại lượng X
ii) x là thể hiện của t X tại thời điểm t t
iii) X là giá trị trung bình của các thể hiện của chuỗi thời gian
Nhận xét
( ) và ( )h h đo mối tương quan giữa đoạn số liệu x x1, 2, ,x n h với đoạn
số liệu x h1,x h2, ,x ncách nhau một độ trễ của thời gian là h
Giá trị ( ) h nằm giữa 1 và +1 Và ( )h (h)với mọi độ trễ của thời gian h Do vậy trong quá trình nghiên cứu ta chỉ xét những h 0
Như vậy ACF là một hàm hay đồ thị của độ tự tương quan của mẫu ở
độ trễ h1 2, , ACF có thể được dùng để giúp chúng ta tìm ra một chuỗi thời
gian dừngx x1, 2, ,x Việc này có thể được thực hiện vì chúng ta có thể liên n
kết động thái của ACF với sự dừng của chuỗi thời gian
Tổng quát, với một chuỗi số liệu không có tính mùa có thể chỉ ra rằng:
i) Nếu ACF của chuỗi thời gian x x1, 2, ,x n hoặc giảm thật nhanh hoặc giảm
Trang 14dần khá nhanh thì giá trị của chuỗi thời gian được xem là dừng
ii) Nếu ACF của chuỗi thời gian x x1, 2, ,x n giảm dần thật chậm thì chuỗi thời gian được xem là không dừng
Ý nghĩa chính xác của từ “khá nhanh” và “thật chậm” có phần tùy ý và
tốt nhất được xác định bằng kinh nghiệm Hơn thế nữa, kinh nghiệm chỉ ra rằng với dữ liệu không có tính mùa, việc ACF giảm khá nhanh, nếu có thường xảy
ra sau một độ trễ h 2
1.4.4 Hệ số tự tương quan riêng
Hệ số tự tương quan riêng là khái niệm ít được sử dụng hơn so với hệ số
tự tương quan trong việc phân tích chuỗi thời gian Trên thực tế, hệ số tự tương quan riêng chỉ giúp cho ta việc nhận dạng mô hình tự hồi quy trung bình trượt ARMA để dự báo
Ta có thể quan niệm một cách thô thiển là hệ số tự tương quan riêng của chuỗi số liệu X t nhằm để đo mức độ kết hợp giữa chuỗi thời gian X t và chuỗi thời gian trễ X t k khi ảnh hưởng của các quan sát xen vào ở giữa đã bị loại trừ (ví dụ k 4thì ta loại X t1,X t2,X t3ra khỏi việc tính toán)
Định nghĩa Hệ số tự tương quan riêng của chuỗi thời gian dừng X t , được
kí hiệu là ( ) k chính là hệ số tương quan của hai biến ngẫu nhiên:
k
k j
Trang 15Như vây hàm tự tương quan riêng mẫu (PACF) là một danh sách hay đồ
thị của các trị số tự tương quan riêng của mẫu ở các độ trễ k 1, 2, đại lượng này mô tả một cách trực giác các trị tự tương quan của mẫu đối với các giá trị
quan sát chuỗi thời gian ngăn cách bằng một độ trễ k lần đơn vị thời gian
Một lần nữa, để áp dụng phương pháp luận Box-Jenkins, chúng ta phải
thử và cố gắng phân loại động thái của PACF
Đầu tiên, PACF của một chuỗi thời gian không có tính mùa có thể giảm thật nhanh Với dữ liệu không có tính mùa, kinh nghiệm chỉ ra rằng nếu PACF
tắt, một cách tổng quát nó sẽ giảm thật nhanh sau một độ trễ bé hơn hay bằng 2
Thứ hai, chúng ta nói rằng PACF giảm dần nếu hàm này không giảm thật nhanh nhưng giảm đi theo một “dạng ổn định” PACF có thể giảm dần theo
một dạng hàm mũ tắt dần (không dao động hoặc có dao động), một dạng sóng hình sin tắt dần hoặc một dạng bị trội bởi một trong hai dạng trên hoặc một tổ
hợp của chúng Hơn nữa, PACF có thể giảm dần khá nhanh hoặc giảm dần thật
chậm
Trang 16Chương 2 PHÂN TÍCH TƯƠNG QUAN CHÍNH TẮC VÀ XẤP XỈ MỞ RỘNG HIỆP PHƯƠNG SAI CỦA CHUỖI THỜI GIAN DỪNG 2.1 Bài toán nhận dạng dãy hiệp phương sai
Trọng tâm của các thủ tục được mô tả ở trên là bài toán nhận dạng một dãy hiệp phương sai sau đây Giả sử
0, 1, 2 , v (1.1)
là một tập hữu hạn các ma trận hiệp phương sai cỡ m m được ước lượng theo
một cách nào đó từ một dãy m chiều của các quan sát
y y y0, 1, 2 , yT (1.2)
và xét bái toán tìm một bộ ba tối tiểu các ma trận ( , , )A C C nghĩa là nếu (A,C)
có thể quan sát được hoàn toàn và (A, C') có thể đạt được hoàn toàn, thỏa mãn
CAk1C ' Ak k = 1,2,…,v (1.3)
sao cho dãy vô hạn
0, 1, 2, (1.4)
thu được từ (1.1) bằng cách đặt CAk1C ' Ak với k = v+1,v+2,…, chính là
một dãy hiệp phương sai thật sự
Bài toán tìm bộ ba tối thiểu ( , , )A C C thỏa mãn (1.3) được gọi là bài toán thể hiện phần tối thiểu Bộ ba ( , , )A C C thường được tính bằng cách phân tích
tối thiểu một ma trận khối Hankel tương ứng với các dữ liệu (1.1) như sau:
Trang 17trong đó i + k -1 = ν và ma trận Hankel H được chọn là càng gần vuông càng
tốt khi lấy i j 1 Trong thực tế, (1,3) có được nếu và chỉ nếu thỏa (1,5) với
mọi (i,j) sao cho i j 1 v, và do đó phân tích tối thiểu phải được thực hiện
với một sự lựa chọn (i, j) để ma trận Hankel (1,5) có hạng tối đa Dãy vô hạn
0, 1, 2 thu được theo cách này bằng cách thiết lập CAk1C ' Ak với
k = v+1,v+2,… được gọi là một mở rộng hữu tỷ tối thiểu của dãy hữu hạn (1.1)
và nói chung không phải là một dãy tự hiệp phương sai Số chiều r của một phần mở rộng hữu tỷ tối thiểu được gọi là bậc đại số của dãy riêng (1.1) Rõ ràng bậc r bằng bậc McMillan của ma trận hữu tỷ m × m
Trang 18 ( ei ) 0, [0, 2 ) (1.10)
Tính chất này tương đương với Φ là một ma trận mật độ phổ Trong thực tế, nó
là mật độ phổ của dãy hiệp phương sai (1.4) Rõ ràng (1.1) không thể là một
dãy tự hiệp phương sai riêng trừ khi T ν > 0, nhưng điều này là chưa đủ
Theo quan điểm về phép nhận dạng, có thể có hai cách để xác định một
mô hình ( , , )A C C từ dãy hiệp phương sai hữu hạn (1.1) Một cách đã được đưa
ra trong tài liệu là làm tối thiểu hoá (1.5) một ma trận khối Hankel hữu hạn dưới dạng cân bằng (Aoki, 1990, van Overschee và De Moor, 1993) Điều đó đưa đến một giải pháp cho bài toán thể hiện riêng tối thiểu và như sẽ được chỉ
ra trong bài này, không có một bảo đảm trước rằng phương pháp này sẽ đưa đến một mở rộng dương Thực tế không có vấn đề gì với dạng biến thiên (biến thiên ngẫu nhiên) của các ước lượng hiệp phương sai (1.1), và để nhấn mạnh điểm này, ta giả định ban đầu rằng tất cả các chuỗi dữ liệu (1.2) dài vô hạn Một phương pháp nhận dạng tiếng ồn về mặt lý thuyết, sẽ không được xem xét trong bài này, trước tiên có thể được thay thế để thực hiện mở rộng dương và sau đó sử dụng một thủ tục đệ quy mô hình ngẫu nhiên trên bộ ba ( , , )A C C của
chuỗi mở rộng dương
Các vấn đề liên quan đến phần mở rộng dương sẽ được thảo luận tại mục 2.2, ở mục này sự ràng buộc tính dương sẽ được giải thích Thất bại trong giải quyết khó khăn này đã được chỉ ra bởi các tác giả của bài báo này tại các cuộc họp khoa học trong mười năm qua Điều này đã không mang lại hiệu quả rõ rệt, ngoại trừ hai bài báo gần đây, Heij et al (1992) và Vaccaro và Vukina (1993), trong đó những vấn đề này đã được đề cập Chúng tôi minh họa cho quan điểm của mình về thủ tục nhận dạng của Aoki (1990) và chứng minh rằng có một giả định ẩn và khó kiểm tra tuy nhiên nếu thiếu nó thì quy trình sẽ không được đảm bảo thành công Điều cơ bản là không có phương pháp nhận dạng không gian
Trang 19con nào được nghiên cứu sẽ luôn luôn làm việc với các dữ liệu tổng quát nên một vài điều kiện không hoàn toàn tự nhiên trên các dữ liệu là cần thiết
2.2 Tính dương, tính không dương và mở rộng xấp xỉ của ma trận hiệp phương sai Hankel
2.2.1 Giả thiết về bậc của dãy hiệp phương sai
Giải pháp của vấn đề thực hiện tối thiểu hoá một phần, tức là việc tìm bộ
ba ( , , )A C C thỏa mãn (1.1) nói chung không phải là duy nhất Tính không duy
nhất này đã được nghiên cứu, chẳng hạn Kalman và các cộng sự (1969), Kalman (1979) và Gragg và Lindquist (1983), không phải là một vấn đề trong bài báo này Vì vậy, để tránh điều này, chúng ta sẽ giả thiết là bậc đại số của (1.1) bằng bằng bậc đại số của
0, 1, 2 , v1 (2.1)
vì vậy ta có thể sử dụng một ma trận Hankel (1.5) dựa trên dữ liệu này, tức là,
với i + j = ν, cho phép chúng ta xác định ma trận Hankel dich chuyển
Trang 20( , , )A C C duy nhất, xem Kung (1978) Trong thực tế, ma trận Hankel H có thể
được phân tích thành
H = UΣV’ U’U = I = V’V (2.3) trong đó Σ là ma trận chéo cấp n gồm các trị kỳ dị khác không được sắp theo thứ tự giảm dần Đặt Ω: = UΣ1/2 và : = VΣ1/2 sẽ dẫn đến một phân tích
ở đây σ(H) là ma trận chuyển Hankel (2.2) và ρ1(H) là khối dòng đầu tiên của
H Suy ra bộ ba (A,C, C) cần phải được lấy bởi
A 1/2U ' ( ) H V 1/2, (2.5a)
C p H V1( ) 1/ 2, (2.5b)
C p H U1( ') 1/ 2, (2.5c)
một dạng mà chúng ta gọi là như là khoảng hữu hạn cân bằng, vì nó được cân
bằng theo nghĩa cả và ' đều bằng Σ, và '
1
i
C CA
C CA
hoặc thậm chí ổn định, ngay cả khi ma trận Toeplitz T ν được xác định dương Như được trình bày trong Byrnes và Lindquist (1982), có những tập con mở
của không gian dữ liệu hiệp phương sai (1.1), với nó A là không ổn định, huống
Trang 21tục của Aoki (1990) là dựa trên giả thiết ẩn sau đây mà không hoàn toàn tự nhiên
Giả định 2.1 Dữ liệu hiệp phương sai (1.1) có thể được tạo ra chính xác bởi
một hệ ngẫu nhiên chưa biết nào đó có số chiều bằng hạng của H
Vì vậy, chúng ta không những cần phải biết rằng có một hệ cơ bản hữu hạn chiều, mà còn cần phải có một giới hạn trên đối với số chiều của nó Phải
Để làm rõ điểm này, ta hãy gọi 0, 1, 2, là một mở rộng hữu tỷ
tối thiểu của 0, 1, 2, , v nếu hàm hữu tỷ (1.7) có bậc tối thiểu Theo
định nghĩa thì đây là bậc đại số của 0, 1, 2, , v Một mở rộng hữu
tỷ được gọi là dương nếu, với mỗi μ > ν, ma trận khối Toeplitz T μ được tạo nên
từ các chuỗi vô hạn tương ứng (1.4) là xác định dương Một mở rộng với tính
chất này được gọi là mở rộng hữu tỷ dương Ta đã biết rằng mở rộng
0, 1, 2, là dương nếu và chỉ nếu (1,7) dương thực sự, tức là hàm hữu
tỷ Z(z) là giải tích trong đường tròn đóng đơn vị và hàm ma trận
( ) z Z z ( ) Z (1/ ) ' z (2.7)
là xác định không âm trên vòng tròn đơn vị, có Φ là ma trận mật độ phổ Một
mở rộng dương hữu tỷ dương tối thiểu của chuỗi hữu hạn (1.1) là sự mở rộng
mà số chiều của bộ ba ( , , )A C C trong (1,6) càng nhỏ càng tốt
Trang 222.2.2 Định nghĩa bậc dương của dãy hiệp phương sai
Định nghĩa 2.2 Bậc dương p của dãy tự hiệp phương sai hữu hạn
{0,1,…,} là số chiều của mở rộng dương tối thiểu bất kỳ
Một ví dụ đã biết của một mở rộng dương là mở rộng entropy cực đại
(Whittle, 1963) tương ứng với mật độ phổ Φ(z) := W(z)W(1/z)’, trong đó yếu tố phổ W(z) là nghịch đảo (sai khác một nhân tử ma trận hằng) của đa thức ma trận Levinson-Szego bậc ν tương ứng với dãy tự hiệp phương sai hữu hạn (1.1)
Vì hàm hữu tỷ W(z) nói chung có bậc McMillan bằng mν, suy ra từ lý thuyết phân tích phổ (Anderson, 1958) rằng Z(z) cũng có bậc mν Do đó, bậc dương p
bị chặn dưới bởi bậc đại số r và bị chặn trên bởi mν
Như đã nêu, vấn đề phổ biến trong các tài liệu (Aoki, 1990, van Overschee và De Moor năm 1993 và những người khác) là việc bỏ qua các ràng buộc về tính dương và sử dụng đại số chứ không phải là mở rộng dương, thường được tính bằng việc phân tích tối thiểu một ma trận khối Hankel như (1,5), hoặc về nguyên tắc, bằng phương pháp tương đương, ngay cả khi các ma trận Hankel không được tính toán rõ ràng Trong thực tế, Giả định 2.1 cũng có thể được phát biểu theo cách sau
2.2.3 Giả định về bậc dương p của dãy hiệp phương sai
Giả định 2.1’ Bậc dương p của (1.1) tương đương với bậc đại số
Giả định này quy định một thuộc tính của dãy tự hiệp phương sai (1.1),
nó không tổng quát Ta có thể minh họa điều này bằng việc xét bài toán mở
rộng hữu tỉ một dãy tự hiệp phương sai vô hướng hữu hạn (1.1) Bậc dương p nằm giữa bậc đại số r và ν Lưu ý không phải là trường hợp p = ν và cũng không phải trường hợp p <ν là "điều hiếm có", bởi vì có các tập hợp mở các
dãy hiệp phương sai (1.1) của cả hai trường hợp trên Trong Byrnes và
Lindquist (1996) đã chỉ ra rằng với mỗi μ sao cho ν/2 ≤ μ ≤ ν có một tập mở
Trang 23được, có vô hạn các bộ ba tối thiểu không tương đương ( , , )A C C khi đưa ra
một mở rộng dương, một trong số đó là mở rộng entropy cực đại Trong thực
tế, có thể chỉ ra rằng các mở rộng ν chiều ấy tạo nên một không gian Euclide
(Byrnes và Lindquist, 1989) Điều này cho thấy rằng dữ liệu hữu hạn (1.1) không có đủ thông tin để thiết lập một hệ cơ bản "thực sự" Tương tự với
trường hợp khi p < ν
Ví dụ 2.3 Xét trường hợp m = 1 và ν = 2, tức là, xét một dãy hiệp phương sai
riêng vô hướng {0,1,2}.Nếu 1 = 2= 0, ta có r = p = 0 Mặt khác ta luôn có r = 1, ở những chỗ bậc dương có thể hoặc là một hoặc hai Đặt γ0: =
1/0 và γ1 := (2
1 + 2)/(1 - 2
1), Có thể chỉ ra (Geogion, (1987, hoặc trong
Byrnes và Lindquist, năm 1996, nhiều ví dụ khác cũng được đưa ra) rằng p = 1
nếu và chỉ nếu
0
0 1
và p = 2 nếu ngược lại
Trong thực tế, không khó khăn để xây dựng các ví dụ mà sự khác biệt giữa hạng đại số và hạng dương là lớn tùy ý, như định lý sau đây
2.2.4 Sự khác biệt giữa bậc đại số và bậc dương
Định lý 2.4 Giả sử n cố định Khi đó với một ν lớn tùy ý có một hàm hữu
tỷ ổn định ( ) Z z bậc n, sao cho ma trận Toeplitz T v có dạng (1.8) gồm các hệ số của mở rộng Laurent (1.7), là xác định dương khi T v1 là không xác định
Chứng minh Trước tiên ta chứng minh cho trường hợp n =1 Xét một hàm vô
Trang 24Với một dãy vô hướng (1.4) sao cho 0=1 Ta biết rằng T là xác định dương khi và chỉ khi
t t
t
t t t
và T t đúng là kỳ dị khi có hữu hạn escape Byrnes và các cộng sự (1991) cũng
đã chỉ ra rằng { t} được sinh bởi một hệ tuyến tính
1 1
cos sin
, sin cos
Trong đó := arctan K2 1 Vì vậy t là độ nghiêng của một đường thẳng đi
qua gốc tọa độ của R2 quay ngược chiều kim đồng hồ với một góc theo mỗi
bước thời gian Hệ quả là
arctan t+1 = arctan t +
Trang 25Hơn nữa, giả thiết rằng 0 > 0, điều kiện Schur t < 1 sẽ khôg thỏa mãn chừng nào t+1 âm hoặc không xác định, như có thể thấy từ hệ thức đề quy đầu tiên
của (2.3p) Vì vậy (2.2p) thỏa mãn khi và chỉ khi
z Z
n n
n n
1 1
2 1 2 1
2 1
Ở đây { t} và { t } là các đa thức Szego loại một và loại hai tương ứng Hàm Z
có tính chất là n tham số Schur đầu tiên của nó, {0, 1 ,…,n-1}, đúng là dữ liệu xác định duy nhất n , n-1, n và n-1;[1987],[1994] Theo [1994] nó chỉ ra rằng các tham số Schur còn lại được sinh bởi
t t
t n
t t t
2 a b
Vì vậy, ta cần quy nạp bài toán với trường hợp n = 1 Nếu ta chọn tham
số Schur ban đầu đủ bé sao cho n (z) và n-1 (z) xấp xỉ z n và z n-1,
n (z) + 0 n-1 (z)
Trang 26là ổn định nếu ta chọn a := 1-2 và b := 1+ với > 0 đủ bé nào đó Thế thì 1
K và chứng minh cho trường hợp n = 1 hoàn thành với một biến đổi tầm
thường
Từ định lý này, ta không thể kiểm tra tính dương của một mở rộng hữu
tỷ của (1.1) bằng cách kiểm tra một ma trận Toeplitz hữu hạn cho dù số chiều
đủ lớn
Bây giờ, ta quay trở lại các qui trình phép nhận dạng của Aoki (1990)
Trong thực tế hạng của H sẽ luôn luôn đủ và để tính toán một thể hiện riêng
của số chiều hợp lý, vấn đề cơ bản là phân vùng Σ thành
1 2
0 0
chuẩn Hankel, tạo nên xấp xỉ tốt nhất khác của H theo chuẩn l2 là ma trận
Hankel và có cùng hạng với H1 Tuy nhiên nếu 2 là rất nhỏ so với 1, thì H1
dần tới H và vì vậy Hankel xấp xỉ được Vì lý do đó thủ tục của Aoki (1990) dựa trên dữ liệu gốc H và (H) Như vậy việc nhận dạng H với H1 trong (2.9p)
và để ý rằng UU’1 = I và VV’1 = I, cùng cách tính như trên bảo đảm bộ ba quy
nạp A r,C r,C r được cho bởi
A r 11/ 2U1'(H V) 1 11/ 2,
C p H V( ) 1/ 2, (2.10b)
Trang 27Trong thực tế, vì U U1 1' V V1 1' [ , 0],I điều này có được bằng việc chỉ giải (2.5)
với σ(H), ρ1(H) và p H1( ') và việc thay thế vào trong (2.10)
Tuy nhiên, cần phải chửng tỏ rằng (2.11) tương ứng với một hệ ngẫu nhiên, nghĩa là,
' 1 1
là thực sự dương, với điều kiện Z được xác định bởi (1.6) thực dương Các vấn
đề về sự ổn định đã được trả lời trong khẳng định ở Pernebo và Silverman (1982) và được đề cập trong Aoki (1990) Tuy nhiên, vấn đề quan trọng về dương tính không được thảo luận trong Aoki (1990) và tính đúng đắn của nó vẫn còn bị nghi ngờ Tuy nhiên, tính dương sẽ được chứng minh với một thủ tục sửa đổi mô tả ở dưới
Theo Akaike (1975) và Desai và các cộng sự.(1984, 1985), để thay cho
H ta sẽ xét một Ma trận Hankel được chuẩn hóa
1
,
T
H L HL (2.14)
trong đó L-và L+ là các nhân tử Cholesky tam giác dưới của ma trận Toeplitz T
-và T + của (1.1) và dãy tương ứng của các hiệp phương sai chuyển vị tương
Trang 28ứng Đây cũng là ma trận Hankel được xét trong van Overschee và De Moor (1993) Lấy phân tích kì dị của H thay cho H, các trị kỳ dị trở thành hệ số
tương quan chính tắc, nghĩa là cosin của góc giữa quá khứ và tương lai của
quá trình y Các ma trận của hệ có thể được xác định theo một cách tương tự (2.5), nhưng bây giờ
1 1
'T 'T
(2.15) thay thế (2.4) nên phép thể hiện là không cân bằng theo cùng cách (xác định) như trên Để thấy điều này, xét phân tích kì dị H U U ' sao cho H =
(L U ) ( _ ) '. L V Vì H = và phân tích này là duy nhất sai khác một phép '
biến đổi tọa độ trong không gian trạng thái, ta có thể lấy 1/ 2
hệ giữa quá khứ và tương lai của chuỗi thời gian y
2.3 Lý thuyết về thể hiện ngẫu nhiên trong không gian Hilbert của hàm mẫu
Việc phân tích các vấn đề lý thuyết cơ bản đằng sau phép nhận dạng không gian con được thực hiện trong nội dung hình học của lý thuyết hiện thực ngẫu nhiên, xem,ví dụ trong Lindquist Picci (1985, 1991) Trong mục này, chúng tôi giới thiệu một số khái niệm cơ bản từ lý thuyết này và làm cho chúng phù hợp với vấn đề về phép nhận dạng Với mục đích này, đầu tiên chúng tôi thảo luận về một trường hợp lý tưởng trong đó chuỗi thời gian (1.2) dài vô hạn
tức là T = ∞, và các dữ liệu hiệp phương sai có sẵn được đưa ra bởi giới hạn
ergodic
Trang 29'
0
1 lim
Khi đó, các ước lượng mẫu trong chuỗi (1.1) chính là ma trận hiệp phương sai
và ma rận Toeplitz Tv được hình thành từ các dữ liệu, xác định dương và đối
xứng Chúng tôi giới thiệu không gian Hilbert của các chuỗi (vô hạn) các dữ liệu quan sát { } yt , cho phép sử dụng các khái niệm hình học và thiết bị máy
móc của hệ thống lý thuyết tuyến tính ngẫu nhiên được phát triển trong Lindquist và Picci (1985, 1991) vào nhận dạng thống kê Tương tự, chúng tôi biến đổi các toán tử về số lượng ngẫu nhiên đã được xác định trên không gian xác suất trừu tượng thành mẫu thử nghiệm của các thuật toán thống kê liên quan đến tính toán dựa trên các dữ liệu quan sát
2.3.1 Không gian Hillbert của các hàm mẫu
Trong phép nhận dạng chúng tôi chỉ truy cập vào một chuỗi hữu hạn các
với một dãy hiệp phương sai tương ứng {A k}k0, thì mỗi ma trận A k của chuỗi
được tính toán từ dữ liệu (3.2) bởi giới hạn ergodic dạng (1.11) Trong phần 5,
ta điều chỉnh lý thuyết để giải quyết trường hợp của dữ liệu hữu hạn (3.1)
Với mỗi k xác định ma trận cỡ m
( ) : [ ,t t , t , ]
Trang 30và xét dãy y: { ( )} y t t Vấn đề này liên quan đến chuỗi thời gian dừng m chiều có được từ dữ liệu (3.2) Không gian Y của tất cả các tổ hợp tuyến tính
hữu hạn
'( );
a y t
ak m, tk
là một không gian vector thực và có thể được trang bị một tích vô hướng được
xác định bởi mở rộng của dạng song tuyến tính
rõ ràng tích vô hướng này không phụ thuộc vào t0 Tích vô hướng này không
suy biến nếu ma trận Toeplitz T k được tạo từ các dữ liệu hiệp phương sai
0, 1, 2, ,k là một ma trận đối xứng dương xác định với mọi k Ở đây, ta
sẽ giả sử rằng dãy T k k 0 là bắt buộc, tức là Tk cI , với mọi
0, 0
c k (Xem Giả định (3.2) dưới đây như một tính chất thay thế) Chúng tôi cũng xác định một toán tử dịch chuyển trên lớp các ma trận nửa vô hạn (3.3), bằng cách thiết lập
U ' ( )a y t a y t' ( 1) t , a m,
xác định ánh xạ tuyến tính là đẳng cự liên quan đến tích vô hướng (3.4) và có
thể mở rộng bởi tính chất tuyến tính lên toàn bộ Y Đặc biệt là dãy các ma trận {y(k)} tương ứng với chuỗi thời gian y được tạo ra kịp thời bởi tác động của
Trang 31Đặt y { ( )}y t t0 là một quá trình dừng ngẫu nhiên mở rộng trung bình bằng không được xác định trên một không gian xác suất {Ω,A,P} để giới hạn
(1.11) tồn tại cho hầu như tất cả các quỹ đạo {y t y( , );t t0,1, 2, } Khá dễ dàng để thấy rằng bất cứ khi nào giới hạn tồn tại, hàm ma trận m n k → A k
thu được từ một quỹ đạo đặc biệt khi đó là một hàm hiệp phương sai [Sự tương
tự thời gian liên tục của tính chất này cũng được chú ý bởi Wiener (1933)] Hơn nữa nếu giới hạn mẫu (gần như chắc chắn) không phụ thuộc vào quỹ đạo đặc biệt và do đó nhất thiết phải trùng với "tập hợp " hàm hiệp phương sai, ta
sẽ gọi đó là quá trình dừng bậc hai Điều kiện cho tính chất dừng bậc hai đã được cho, ví dụ trên trang 210 trong quyển sách của Hannan (1970) Rõ ràng từ định lý ergodic của Birkhoff rằng với mọi quá trình dừng ergodic (trung bình bằng không) cũng là ergodic bậc hai
Trong Phụ lục này, ta sẽ chứng minh rằng các tính chất của cấu trúc
không gian Hilbert liên quan đến một chuỗi thời gian dừng y, được định nghĩa
trên trang 10, đồng nhất với các tính chất của không gian Hilbert cảm sinh bởi một quá trình ergodic bậc hai
Hai khuôn khổ, tức là, cấu trúc “chuỗi thời gian” thống kê và cấu trúc" xác suất", thực chất là đẳng cấu với nhau Để xem điều này, chọn một quỹ đạo
"biểu diễn" của y, tức là một trong tập hợp con của Ω (của một xác suất) mà
giới hạn (1.11) tồn tại Rõ ràng rằng tính tổng quát sẽ không mất trong giả định
là không gian xác suất Ω của y là "không gian mẫu", của tất cả các quỹ đạo có thể có của y, tức là tập của tất cả các chuỗi bán vô hạn
{ , , , }, t m
Với lựa chọn này, sẽ là σ- đại số của các tập con của mặt trụ của Ω và là
biến ngẫu nhiên t: th của quá trình, y(t), chỉ là hàm dự báo chính tắc
( , ) : t t.
y