Bảng 3.1 : mô hình toán học của hệ thống động Liên tục Rời rạc Biến trạng thái và phương trình trạng thái [1]: Sử dụng phép đổi biến, phương trình vi phân cấp cao có thể chuyển đổi thàn
Trang 1oOo
HỌC VIÊN : NGUYỄN SỸ HOÀNG ANH
ĐỀ TÀI LUẬN VĂN THẠC SĨ
Chuyên ngành : Kỹ thuật vô tuyến điện tử
SỬ DỤNG MẠCH LỌC KALMAN ĐỂ TRIỆT NHIỄU
Trang 2ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học :
PGS.TS LÊ TIẾN THƯỜNG
Cán bộ chấm nhận xét 1 :
Ký tên Cán bộ chấm nhận xét 2 :
Luận văn thạc sĩ được bảo vệ tại
HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ
TRƯỜNG ĐẠI HỌC BÁCH KHOA ngày 28 tháng 12 năm 2006
Trang 3Tp HCM, ngày 28 tháng 12 năm 2006
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: NGUYỄN SỸ HOÀNG ANH Phái: Nam
Ngày, tháng, năm sinh: 02/05/1980 Nơi sinh : NGHỆ AN
Chuyên ngành: KỸ THUẬT VÔ TUYẾN ĐIỆN TỬ MSHV: 01403302
I- TÊN ĐỀ TÀI:
SỬ DỤNG MẠCH LỌC KALMAN TRIỆT NHIỄU TRONG BỘ BEAMFORMER
II- NHIỆM VỤ VÀ NỘI DUNG:
III- NGÀY GIAO NHIỆM VỤ (Ngày bắt đầu thực hiện LV ghi trong Quyết định
giao đề tài): QĐ số 81 ngày 22/02/2006
IV- NGÀY HOÀN THÀNH NHIỆM VỤ: 06/10/2006
V- CÁN BỘ HƯỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên):
PGS.TS LÊ TIẾN THƯỜNG
QL CHUYÊN NGÀNH
PGS.TS LÊ TIẾN THƯỜNG
Nội dung và đề cương luận văn thạc sĩ đã được Hội đồng chuyên ngành thông qua
Ngày tháng năm
TRƯỞNG PHÒNG ĐT – SĐH TRƯỞNG KHOA QL NGÀNH
Trang 4LỜI CÁM ƠN
Tôi xin chân thành cám ơn thầy Lê Tiến Thường đã tận tình giúp đỡ, hướng dẫn tôi thực hiện đề tài này Xin cám ơn tất cả các giảng viên đã giảng dạy các môn học trong chương trình thạc sĩ, và cám ơn phòng Đào tạo Sau đại học đã giúp đỡ cho tôi rất nhiều trong quá trình học tập
Tôi xin đặt biệt cám ơn và kính dâng tất cả lòng yêu thương, công sức và thành quả đạt được cho người mẹ đáng kính và người cha quá cố của tôi Cám ơn các thành viên trong gia đình, đặc biệt là chị tôi, người đã khuyến khích, động viên giúp tôi vượt qua nhiều khó khăn từ khi bắt đầu cho đến khi kết thúc chương trình thạc sĩ
Thành quả của tôi hôm nay không chỉ của riêng mình tôi mà có cả sự đóng góp của MỌI NGƯỜI
NGUYỄN SỸ HOÀNG ANH
Trang 5TÓM TẮT LUẬN VĂN THẠC SĨ
Trong phạm vi đề tài nghiên cứu, tôi đã tập hợp lại lý thuyết chính về mạch lọc Kalman đã được áp dụng, chứng minh lại bài toán Kalman tuyến tính đã được áp
dụng, xây dựng mô hình bài toán Kalman mở rộng có sai số lệch bậc hai và áp
dụng vào dãy anten kết hợp với điều kiện tối ưu hóa trong trường hợp xấu nhất Nội dung quyển luận văn được tóm tắt một số điểm chính như sau :
- Phần 1: Mở đầu : Đặt vấn đề, hướng nghiên cứu, phạm vi thực hiện đề tài
- Phần 2: Tổng quan : Giới thiệu chung về dãy anten, bộ beamformer, các kỹ thuật thích nghi, một số nghiên cứu trước đó, phạm vi đề tài thực hiện và sự khác biệt giữa đề tài thực hiện với các nghiên cứu trước đây
- Phần 3: Mạch lọc Kalman : Cơ sở lý thuyết về mạch lọc Kalman, các công
cụ toán học sử dụng trong mạch lọc Kalman Phần này đưa ra các cơ sở mạch lọc Kalman rời rạc cơ bản và các điều kiện toán, công cụ toán học để xây dựng mạch lọc Kalman rời rạc tuyến tính và là cơ sở để xây dựng bài toán mạch lọc Kalman rời rạc mở rộng ở phần 5
- Phần 4: Kiến thức cơ bản về dãy anten – phased array : kiến thức cơ bản về anten và dãy anten Giới thiệu một số bộ beamformer đã có
- Phần 5: Xây dựng mô hình bài toán Kalman mở rộng có sai số lệch bậc hai
và áp dụng vào dãy anten : giới thiệu và chứng minh lại việc áp dụng mạch lọc Kalman tuyến tính vào dãy anten, giới thiệu điều kiện tối ưu hóa trong
trường hợp xấu nhất, xây dựng bài toán Kalman mở rộng có sai số lệch và
áp dụng kết hợp với điều kiện tối ưu hóa trong trường hợp xấu nhất vào dãy
anten Mô phỏng giải thuật SMI (Sample Matrix Inversion), mạch lọc Kalman tuyến tính và mạch lọc Kalman mở rộng áp dụng vào dãy anten Đánh giá kết quả mô phỏng thực hiện
- Phần 6 : Kết luận và hướng phát triển luận văn
Trang 6Quality of transmitting and receiving signal is always considered as the key role contributing to the success for a communication process Therefore, many scientists are interested in this topic, especially in improving quality of wireless signals At first, researchers focused on improving single antenna With the time, they have upgraded the transmitted and received system to phased array – a system of antennas that transmit and receive signal at the same time By using the differences
of the received signals at these antennas, the beamforming from these antennas can get rid of noise and interference to robust the output signal So it makes an amazing result compared with that of single antenna
There are many ways to improve quality of synthesis signal in adaptive phased array, an antenna system can adjust itself to robust the output from the changing evironment, such as : constant modulus beamforming, mean squared error beamforming, diagonal load beamforming, capon beamforming, minimum variance distortionless response (MVDR) beamformer This thesis pays attention to improving MVDR beamformer using extended Kalman filter [5] and worst case performance optimization condition [3] by building a novel extended Kalman filter model with bias error and applying this model to MVDR beamformer
There are some differences from the first applying conventional Kalman filter to MVDR beamformer using extended Kalman filter and to that in this thesis The first idea to apply conventional Kalman filter in phased array was executed by Yuan Hwang Chen and Ching Tai Chiang in 1993 [4] This beamformer produces a good synthesis beam in the condition of good steering vector However, like any other adaptive beamformers founded at that time, conventional Kalman beamformer
is very sensitive with steering error or any mismatch between desired source direction and actual source direction And steering vector error made itself a big problem for many researchers In 2003, S A Vorobyov, A B Gershman, Z Q Lou gave out worst case performance optimization condition and solved this
Trang 7efficient to online implement[5] In August 2005, A El Keyi, T Kirubajaran, A B Gershman tried to solved it again with the xtended Kalman filter but the solution is not general enough With the effort to improve it, I build up a novel extended Kalman filter model with the second order bias error and apply this model to the beamformer The simulation results prove a good performance and help us to evaluate the impact of some factors to the beamformer and the impact of these factor together
Trang 8
Mục lục
1 MỞ ĐẦU 1
2 TỔNG QUAN 4
3 MẠCH LỌC KALMAN 7
3.1 Hệ thống tuyến tính động và các công cụ toán học 7
3.1.1 Hệ thống động 7
3.1.2 Hệ thống liên tục tuyến tính và nghiệm 9
3.1.3 Hệ thống tuyến tính rời rạc và nghiệm 14
3.1.4 Phương pháp tính hàm mũ ma trận: 15
3.1.5 Đặc điểm trực giao 16
3.2 Mạch lọc tuyến tính tối ưu và bộ dự đoán 21
3.2.1 Những nét chính về mạch lọc Kalman 21
3.2.2 Kalman filter 22
3.2.3 Kalman – Bucy filter 28
3.2.4 Hàm tổn thất bậc hai 31
3.3 Mạch lọc Kalman mở rộng 33
3.3.1 Mô hình bài toán 34
3.3.2 Tuyến tính hóa bằng quỹ đạo danh nghĩa 35
3.3.3 Tuyến tính hóa bằng quỹ đạo ước lượng 37
3.3.4 Mạch lọc Kalman mở rộng 37
3.3.5 Sai số bậc hai trong mô hình phép đo 40
4 KIẾN THỨC CƠ BẢN VỀ DÃY ANTEN – PHASED ARRAY 42
4.1 Định nghĩa về Phased array 42
4.2 Các thông số anten cơ bản 42
4.3 Các đặc tính của dãy anten 46
4.3.1 Trường bức xạ của dãy anten 46
4.3.2 Các cách tổng hợp tín hiệu cơ bản 47
Trang 94.3.3 Tổng hợp tín hiệu trên dãy anten thẳng 48
4.3.4 Tổng hợp tín hiệu trên anten mặt phẳng 49
4.4 Dãy anten thích ứng – Adaptive array 50
4.4.1 Các thông số cơ bản 50
4.4.2 Mô hình tín hiệu 52
4.4.3 Một số loại dãy anten thích nghi 56
4.4.4 Một số phương pháp tối ưu hóa S/N 58
5 XÂY DỰNG MÔ HÌNH BÀI TOÁN KALMAN MỞ RỘNG CÓ SAI SỐ LỆCH BẬC HAI VÀ ÁP DỤNG VÀO DÃY ANTEN 65
5.1 Bài toán tổng quát và ý tưởng sử dụng mạch lọc Kalman 65
5.2 Áp dụng mạch lọc Kalman tuyến tính – bài toán đơn giản hóa, tăng tốc độ hội tụ 66
5.3 Vấn đề mới – bài toán steering vector 72
5.4 Xây dựng mô hình bài toán Kalman mở rộng có sai số lệch bậc hai và áp dụng vào dãy anten giải bài toán steering vector 76
5.4.1 Xây dựng mạch lọc Kalman mở rộng bậc hai có sai số lệch bậc hai 76 5.4.2 Áp dụng mạch lọc Kalman mở rộng có sai số lệch bậc hai 79
5.5 Mô phỏng 81
5.5.1 Mô phỏng 1: steering vector không bị sai số 83
5.5.2 Mô phỏng 2 : sai số trong steering vector 88
5.5.3 Mô phỏng 3 : steering vector bị lệch khỏi hướng thu 94
5.6 Đánh giá kết quả mô phỏng 100
6 Kết luận và hướng phát triển đề tài 103
Tài liệu tham khảo 104
Trang 101 MỞ ĐẦU
Trong các hệ thống thông tin, việc truyền và nhận tín hiệu luôn đóng vai trò cơ bản nhất và là yếu tố then chốt nhất đảm bảo cho hệ thống thông tin có thể hoạt động Có hai phương thức truyền tín hiệu : vô tuyến và hữu tuyến Đối với phương thức truyền tín hiệu hữu tuyến, tín hiệu được truyền trong môi trường truyền dẫn được thiết lập riêng từ nguồn đến đích như : cặp dây xoắn đôi, cáp đồng trục, cáp quang Khác hẳn với phương thức truyền hữu tuyến, phương thức vô tuyến không sử dụng môi trường truyền riêng từ nguồn đến đích mà tín hiệu được phát thẳng vào không gian
So sánh giữa hai phương thức truyền dẫn, việc truyền nhận tín hiệu hữu tuyến luôn dễ dàng, chất lượng cao hơn so với truyền vô tuyến Tuy nhiên, việc lắp đặt các phương tiện truyền dẫn hữu tuyến phải tùy thuộc vào điều kiện địa hình, chỉ thuận lợi nhất trong điều kiện đồng bằng Vì vậy, trong điều kiện hệ thống thông tin trở nên toàn cầu hóa, việc xây dựng, lắp đặt và bảo trì truyền dẫn hữu tuyến trở thành một vấn đề rất lớn, tầm cỡ quốc gia, đòi hỏi tốn rất nhiều công sức, chi phí, nhân lực, trang thiết bị mạng lưới cho việc thiết kế, lắp đặt và bảo trì Ngược lại, phương thức vô tuyến lại đảm bảo truyền tín hiệu được dễ dàng hơn, thuận lợi hơn và bảo dưỡng thiết bị tập trung nên dễ dàng hơn Từ tính hiệu quả của nó, vấn đề truyền nhận tín hiệu vô tuyến luôn là vấn đề luôn được giới khoa học quan tâm nghiên cứu
Đã có rất nhiều đề tài nghiên cứu đưa ra nhiều hướng giải quyết vấn đề nâng chất lượng truyền và nhận tín hiệu vô tuyến Ban đầu, người ta chỉ quan tâm đến việc cải tiến chất lượng của thiết bị truyền nhận là anten đơn Hàng loạt các nghiên cứu, khảo sát về anten để cải tiến chất lượng thu đã được xúc tiến : anten
vô hướng, anten có cực, anten parabol… Kế tiếp đó, khi cải tiến anten đến một mức giới hạn, người ta lại dùng các anten ghép với nhau để cải thiện chất lượng thu Bằng cách này, tín hiệu thu được đã cải thiện đáng kể, nhất là đối với các tín hiệu được truyền ở khoảng cách rất xa như truyền trên biển, truyền vệ tinh,
Trang 11không gian và radar Đây là vấn đề đang được nghiên cứu rộng rãi trên thế giới
và cũng là hướng nghiên cứu trong luận văn này
Vấn đề chính trong việc sử dụng dãy anten là cách tổng hợp tín hiệu Bằng cách tổng hợp tín hiệu thích hợp, người ta có thể đạt được tỉ lệ tín hiệu trên nhiễu cao nhất, cao hơn hẳn so với việc sử dụng anten đơn Thêm vào đó, dãy anten còn nổi bậc ở khả năng triệt các tín hiệu giao thoa Điều này có nghĩa là tín hiệu đươc tổng hợp phải thu được tín hiệu mong muốn theo hướng thu chất lượng cao
và đồng thời tối thiểu hóa tín hiệu giao thoa tồn tại ở các hướng khác Vì vậy các phương pháp tổng hợp tín hiệu trong dãy anten đã và đang được nghiên cứu đều
có chung mục đích cuối cùng là phải đạt tỉ số tín hiệu trên nhiễu và giao thoa cao nhất
Có nhiều phương pháp để tổng hợp tín hiệu và khử đáp ứng nhiễu và giao thoa trong dãy anten như : phương pháp thích nghi (adaptive processing), phương pháp loại bỏ búp sóng (sidelobe canceller), phương pháp khử giao thoa lớn nhất (postbeamformer interference canceller)… Trong phạm vi luận văn này, tôi đã
sử dụng bộ beamformer cưỡng bức tối ưu (constraint optimal beamformer) dùng mạch lọc Kalman mở rộng để tối ưu hóa các trọng số anten cho phương pháp thích nghi (adaptive processing) trong điều kiện dừng (stationary) và băng thông hẹp (narrow band) Trong phương pháp thích nghi, điều quan trọng nhất là xác định đúng hướng tín hiệu Sau khi xác định được hướng tín hiệu, phương pháp thích nghi sẽ tự động triệt nhiễu và giao thoa có trong tín hiệu một cách tự động
và không cần biết sự tồn tại của tín hiệu giao thoa theo hướng nào trong không gian Đây cũng là đặc điểm nổi bậc của phương pháp thích nghi so với các phương pháp khác vì các phương pháp này luôn bắt buộc phải xác định hướng tín hiệu giao thoa
Tuy nhiên, do bản chất của phương pháp thích nghi là tối ưu hóa theo hướng thu tín hiệu nên các phương pháp đề nghị trước đây này mặc dù có khả năng thu tín hiệu tốt nhưng rất nhạy cảm với sai số trong steering vector – vector trọng số đáp ứng đại diện cho hướng thu tín hiệu Sau khi nghiên cứu, bằng cách sử dụng
Trang 12mạch lọc Kalman mở rộng kết hợp với điều kiện tối ưu hóa trong trường hợp xấu nhất, bộ beamformer vẫn có khả năng thu tín hiệu rất tốt trong khi các steering vector bị sai số trong khả năng cho phép Kết quả thực hiện được cho thấy : nếu steering vector hoàn toàn đúng, bộ beamformer cho kết quả triệt giao thoa tương đương và kết quả triệt nhiễu tốt hơn so với phương pháp Kalman tuyến tính hoặc các phương pháp truyền thống khác Nếu steering vector bị lệch
đi hoặc sai số trong phạm vi cho phép, bộ beamformer vẫn cho kết quả tốt trong khi bộ beamformer áp dụng mạch lọc Kalman tuyếtn tính và các phương pháp truyền thống hoàn toàn mất khả năng triệt tín hiệu giao thoa Với kết quả trên, việc sử dụng dãy anten sẽ trở nên đơn giản và nhẹ nhàng hơn do không cần độ chính xác cao và sẽ giúp khả năng sử dụng dãy anten trở nên phổ biến
Trang 132 TỔNG QUAN
Dãy anten (phased array) là một hệ thống các anten được ghép lại với nhau để thu tín hiệu Các anten này có quan hệ với nhau theo góc pha của tín hiệu thu và được tổng hợp sao cho tạo ra mẫu bức xạ chung lớn nhất theo hướng định trước
và đồng thời loại bỏ các tín hiệu không mong muốn Kỹ thuật này ban đầu được phát triển bởi Luis Alvares trong thế chiến thứ hai và được áp dụng trong hệ thống radar có thể hướng được dùng để hỗ trợ việc hạ cánh cho các máy bay ở Anh Kỹ thuật này nhanh chóng được nghiên cứu, phát triển và phổ biến, điển hình là hệ thống dãy anten dùng trong không gian đã được giải Nobel ở trường đại học Cambridge
Beamformer thích nghi là hệ thống xử lý tín hiệu tín hiệu trong dãy anten thường được sử dụng trong hệ thống radar hoặc thu phát trên biển Đây là một
kỹ thuật cho phép chỉnh hướng thu tín hiệu dãy anten theo các hướng mong muốn mà không cần sự điều chỉnh cơ học nào cả Điểm khác biệt lớn nhất giữa
bộ beamformer thích nghi và bộ beamformer qui ước là khả năng điều chỉnh hoạt động phù hợp với sự thay đổi của những yếu tố môi trường xung quanh Không những thế, nó còn cho phép triệt tiêu các nguồn tín hiệu không mong muốn
Có nhiều thuật toán được áp dụng vào kỹ thuật thích nghi, tuy nhiên các thuật toán này đều hướng đến giải quyết ý tưởng chung của kỹ thuật thích nghi : tối thiểu hóa tín hiệu thu được trong điều kiện các trọng số anten đã bảo toàn tín hiệu thu theo hướng mong muốn Các kỹ thuật thích nghi [2] sau đã được nghiên cứu, phát triển và sử dụng :
- Thuật toán trung bình bình phương tối thiểu (Least mean square Algorithm)
- Thuật toán ma trận nghịch đảo (Sample matrix Inversion Algorithm)
- Thuật toán đệ qui bình phương tối thiểu (Recursive least square Algorithm)
- Phương pháp Gradient liên hợp (Conjugate Gradient Method)
Trang 14- Thuật toán tải đường chéo ma trận covariance (Diagonal load of covariance matrix Algorithm)
- Thuật toán đường chéo trị riêng (Eigenspace based Algorithm)
- Thuật toán Kalman
- …
Các kỹ thuật thích nghi trên đã giải quyết được bài toán thu phát cơ bản trên cơ
sở đã xác định được hướng thu và các thông số steering vector đo đạt là hoàn toàn chính xác Các giải thuật trên đã được chứng minh bằng công cụ toán học
sẽ hội tụ đến kết quả tối ưu
Tuy nhiên, một trong những vấn đề chính của dãy anten thích nghi là sai số giữa steering vector hướng theo nguồn tín hiệu và steering vector lý tưởng luôn luôn tồn tại Các sai số này có thể do sai số trong đo đạt, sai số khi hướng dãy anten theo hướng tín hiệu, … Trong khi đó, kỹ thuật thích nghi rất nhạy cảm với loại sai số này vì nó sẽ làm giải thuật thích nghi hiểu lầm tín hiệu cần thu thành tín hiệu giao thoa và kết quả là nó sẽ gây ra hiện tượng tự triệt tiêu tín hiệu mong muốn
Có nhiều giải pháp đã được đề nghị để giải quyết vấn đề này như là phương pháp tải đường chéo của ma trận covariance mẫu (diagonal load of the sample covariance matrix), và bộ beamformer dựa trên kỹ thuật trị riêng (eigenspace based beamformer) Các giải pháp trên đã được chứng minh là sẽ cho kết quả rất tốt nhưng chỉ với điều kiện xác định trước các nguồn nhiễu và các nguồn giao thoa và sai số trong steering vector Giải pháp thích nghi tốt nhất được đưa ra
gần đây là phương pháp tối ưu hóa trong trường hợp xấu [3] nhất giải quyết
cho bất kỳ sai số có trong steering vector của S A Vorobyov, A B Gershman,
và Z Q Lou Nó cho phép tối thiểu hóa năng lượng nhiễu và giao thoa trong điều kiện steering vector bị sai số bé hơn một số ấn định trước Các tác giả đã đưa ra được điều kiện áp dụng cho kỹ thuật thích nghi và dùng phương pháp
SOCP để giải quyết bài toán Tuy nhiên, thuật toán SOCP có độ phức tạp cao
và số phép tính toán khá lớn (tương đương O[M3] – bậc ba của biến sử dụng)
Trang 15Trong bài báo tiếp theo [5], A El Keyi, T Kirubajaran và A B Gershman đã áp dụng mạch lọc Kalman mở rộng để giải quyết bài toán tuy nhiên, bài toán trên
chưa đủ tính tổng quát do không xây dựng cụ thể bài toán Kalman mở rộng có
thêm sai số lệch bậc hai Do đó, để có kết quả chính xác khi áp dụng mạch lọc Kalman mở rộng và đánh giá chính xác vai trò các thông số khác của điều kiện tối ưu hóa trong trường hợp xấu nhất cũng như hoạt động của dãy anten, phải xây dựng lại mô hình áp dụng bài toán Kalman mở rộng có tham số lệch bậc hai
Vì vậy trong luận văn này, tôi xây dựng bài toán Kalman mở rộng có thêm sai
số lệch bậc hai và áp dụng bài toán vừa xây dụng vào áp dụng cùng với điều kiện tối ưu hóa trong trường hợp xấu nhất vào dãy anten để giải quyết bài
toán, tăng tốc độ hội tụ cũng như giảm độ phức tạp bài toán xuống O[M2] Kết quả mô phỏng cho thấy mạch lọc Kalman mở rộng kế thừa được kết quả của phương pháp mạch lọc Kalman truyền thống kết hợp với khả năng chịu đựng sai
số trong steering vector Ngoài ra kết quả mô phỏng còn cho phép đánh giá ngưỡng sai số steering vector của điều kiện tối ưu hóa trong trường hợp xấu nhất
Trang 163 MẠCH LỌC KALMAN
3.1 Hệ thống tuyến tính động và các công cụ toán học
3.1.1 Hệ thống động
Hệ thống động được biểu diễn bằng phương trình vi phân [1]:
Hệ thống là một tập hợp các phần tử có liên quan với nhau và được xem xét một cách toàn bộ Nếu các thuộc tính được quan tâm của hệ thống thay đổi theo thời gian, hệ thống đó được gọi là hệ thống động Thuật ngữ
tiến trình được dùng để chỉ sự hoạt động của hệ thống theo thời gian
Bảng 3.1 : mô hình toán học của hệ thống động Liên tục Rời rạc
Biến trạng thái và phương trình trạng thái [1]:
Sử dụng phép đổi biến, phương trình vi phân cấp cao có thể chuyển đổi thành phương trình vi phân cấp thấp hơn bằng các biến phụ thuộc vi phân Vì vậy, ta chỉ xét hệ thống được biểu diễn bằng phương trình vi phân bậc nhất Các hệ thống có phương trình bậc cao hơn sẽ được chuyển đổi về phương trình vi phân bậc nhất tương đương để giải quyết
Trang 17Hệ thống biểu diễn bằng phương trình vi phân bậc nhất được phân loại
tổng quá trong bảng 3.1 Dạng tổng quát nhất là phương trình vi phân
biến đổi theo thời gian đại diện cho hệ thống động biến đổi theo thời
gian Nó sẽ được biểu diễn theo dạng vector :
với dấu chấm (.) là ký hiệu của phép đạo hàm theo thời gian và hàm f
biểu diễn một hệ thống gồm n phương trình :
với t là biến độc lập, là đại lượng đại diện cho thời gian cùng n biến phụ
thuộc {xi |1 ≤ i ≤ n} và r giá trị đầu vào {ui |1 ≤ i ≤ r} Tập hợp các
phương trình trên gọi là phương trình trạng thái của hệ thống động
Biến trạng thái biểu diễn độ tự do của hệ thống động : các biến x1, x2, ,
xn gọi là các biến trạng thái của hệ thống động biểu diễn trong phương
trình 3.2 Thông thường, các biến trạng thái được biểu diễn dưới dạng
vector :
x(t) = [x1(t) x2(t) xn(t)]T (3.3)
gọi là vector trạng thái của hệ thống động Không gian n chiều của vector
trạng thái được gọi là không gian trạng thái của hệ thống động Phụ thuộc
vào mức độ liên tục của hàm f i và ui, giá trị x i(t0) tại thời điểm khởi đầu t0
sẽ xác định duy nhất giá trị nghiệm xi(t) trên khoảng thời gian [t0, tf], với
giá trị khởi đầu t0 và giá trị cuối tf Vì vậy, các giá trị khởi đầu biểu thị độ
tự do độc lập của một hệ thống động Mỗi tập hợp n giá trị x 1(t0), x 2(t0),
, x n(t0) với các giá trị không phụ thuộc lẫn nhau sẽ xác định duy nhất
trạng thái của hệ thống động trong khoảng thời gian [t0, tf]
Tính liên tục và rời rạc [1]:
Trang 18Hệ thống được biểu diễn theo phương trình 3.2 được gọi là liên tục do
biến t thay đổi liên tục trong khoảng thời gian [t0, tf] Nếu biến t chỉ được
xét đến tại các thời điểm {t0, t1, }, hệ thống được gọi là hệ thống rời
rạc và được biểu diễn bởi các trạng thái :
x k = x(t k ) = f(x(tk),tk, tk+1) (3.4)
Hệ thống thay đổi theo thời gian và hệ thống bất biến theo thời gian [1]:
Mặc dù giá trị u(t) có thể là hàm theo thời gian, nhưng sự phụ thuộc hàm
trạng thái của u và x có thể không phụ thuộc thuộc vào thời gian Hệ
thống có tính chất trên gọi là hệ thống bất biến theo thời gian
3.1.2 Hệ thống liên tục tuyến tính và nghiệm
Mô hình từ đầu vào đến đầu ra của hệ thống động tuyến tính [1]:
Hình 3.1 : Sơ đồ khối của hệ thống động tuyến tính
Hệ thống như hình 3.1 biểu diễn hệ thống liên tục tuyến tính với ba loại
biến :
• Ngõ vào ui : là các giá trị đã biết
• Các trạng thái : thông thường là các biến ẩn, không thể đo đạt trực
Trang 19
Hệ thống động tuyến tính được biểu diễn bằng phương trình vi phân
tuyến tính n trạng thái sau :
( ) ( ) ( ) ( )
n n n
( ) ( ) ( ) ( )
r r r
Ma trận F(t) được gọi là ma trận hệ số động, trong đó các phần tử của ma
trận gọi là các thông số động và C(t) được gọi là ma trận tương tác ngõ
vào, tương ứng với các phần tử gọi là hệ số tương tác ngõ vào
Ngõ ra và ma trận độ nhạy phép đo[1]:
Đối với hệ thống tuyến tính, quan hệ giữa ngõ ra và biến trạng thái được
biểu diễn theo phương trình :
( ) ( ) ( ) ( )
n n n
Trang 20( ) ( ) ( ) ( )
r r r
Ma trận H được gọi là ma trận độ nhạy phép đo Các phần tử của ma trận
H gọi là hệ số độ nhạy và là hàm phụ thuộc vào thời gian Ma trận D gọi
là ma trận tương tác ngõa vào – ra
Phương trình hiệu và ma trận chuyển trạng thái [1]:
Phương trình hiệu là phiên bản rời rạc của phương trình vi phân Nó
thường được biểu diễn dưới dạng hiệu giữa các biến trạng thái tại hai thời
điểm liên tiếp : x(tk+1) – x(tk) và được biểu diễn theo hàm ψ hoặc hàm φ :
x(tk+1) – x(tk) = ψ(tk, x(tk), u(tk)) (3.12)
x(tk+1) = φ (tk, x(tk), u(tk)) (3.13)
φ (tk, x(tk), u(tk)) = x(tk) + ψ(tk, x(tk), u(tk)) (3.14)
Đối với hệ thống tuyến tính, sự phụ thuộc hàm của biến x(tk+1) vào x(tk)
và u(tk) được viết lại như sau :
x(tk+1) – x(tk) = Ψ(tk)x(tk) + C(tk)u(tk) (3.15)
x(tk+1) = Φk xk + Ck uk (3.16)
Φk = I + Ψ(tk) (3.17)
với hàm Ψ, Φ được ký hiệu thay thế cho hàm ψ, φ tương ứng Ma trận φ
được gọi là ma trận chuyển đổi trạng thái Còn ma trận C đuợc gọi là ma
trận tương tác ngõ vào rời rạc
Giải phương trình vi phân cho ma trận chuyển đổi trạng thái [1]:
Ma trận chuyển trạng thái là nghiệm của phương trình ma trận thuần nhất
được định nghĩa dưới đây :
Phương trình ( )x t =F t x t( ) ( ) được gọi là thành phần thuần nhất của
phương trình vi phân tuyến tính ( )x t =F t x t( ) ( )+C t u t( ) ( ) Nghiệm của
Trang 21phương trình thuần nhất dễ dàng giải được so với toàn bộ phương trình vi
phân và nó cấu thành nghiệm tổng quát của phương trình vi phân tuyến
tính
Nghiệm cơ bản của phương trình vi phân thuần nhất : ma trận hàm giá trị
Φ(t) được gọi là nghiệm cơ bản của phương trình vi phân thuần nhất
( ) ( ) ( )
x t =F t x t trong khoảng t ∈ [0, T] nếu Φ( =t) F t( ) ( )Φ và t
Φ(0) = In, với In là ma trận đơn vị n x n Chú ý rằng với bất kỳ vector
khởi đầu x(0) nào, vector x(t) = Φ(t) x(0) đều là nghiệm của phương trình
Sự tồn tại và tính khả nghịch của nghiệm cơ bản : nếu các phần tử của ma
trận F(t) là hàm liên tục trong khoảng kín [0,T] thì ma trận nghiệm cơ bản
Φ(t) sẽ tồn tại và khả nghịch trong khoảng 0≤ 0 ≤ τ, với một giá trị τ nào
đó
Ma trận chuyển đổi trạng thái : chú ý rằng nghiệm cơ bản Φ(t) biến đổi
giá trị khởi đầu x(0) của hệ thống động đến trạng thái x(t) tại thời điểm t
Trang 22sẽ biến đổi nghiệm từ thời điểm t đến nghiệm tại thời điểm τ Vì vậy ma
trận Φ(t) trên được gọi là ma trận chuyển đổi trạng thái đối với phương
trình vi phân tuyến tính thuần nhất
Qui ước : ma trận chuyển đổi trạng thái Φ(τ,t) sẽ chuyển đổi trạng thái từ
thời điểm t đến thời điểm τ
Các tính chất của ma trận chuyển đổi trạng thái (qui ước Φ(τ,0)= Φ(τ)):
Dạng nghiệm gần đúng của hệ thống bất biến theo thời gian [1]:
Trong trường hợp này, ma trận F sẽ là hằng số theo thời gian Giá trị
nghiệm vẫn là hàm số theo thời gian, nhưng ma trận chuyển trạng thái sẽ
chỉ phụ thuộc vào hiệu (t –τ)
t F i
Trang 231 Sử dụng phép xấp xỉ eFt và bỏ đi các thành phần bậc cao trong trường
hợp các giá trị đặc tính đều nằm trong vòng tròn đơn vị trên mặt phẳng phức
2 Sử dụng phép biến đổi Laplace : Φ(t) = eFt = L-1(sI – F)-1, với t≥0 và I
là ma trận đơn vị
3 Sử dụng phương pháp xấp xỉ Padé trong phần 2.6
3.1.3 Hệ thống tuyến tính rời rạc và nghiệm
Rời rạc hóa hệ thống tuyến tính [1]
Đơn giản hóa với u là hằng số : nếu u là hằng số trong khoảng thời gian
[tk-1, tk], tích phân trong công thức trên có thể được đơn giản hóa :
Hệ thống bất biến theo thời gian [1]:
Đối với hệ thống liên tục bất biến theo thời gian được rời rạc hóa sử dụng
các khoảng thời gian cố định, ma trận Φ, Γ, H và D độc lập với các chỉ số
thời gian rời rạc Nghiệm sẽ được viết dưới dạng gần đúng :
1 1
0 0
Trang 24Φk = L-1[(zI - Φ]-1z (3.37)
với z là biến đổi z của biến và L-1 là biến đổi z ngược
3.1.4 Phương pháp tính hàm mũ ma trận:
Sử dụng xấp xỉ Padé đối với hàm mũ ma trận [1]
Hàm mũ với biến z sẽ được mở rộng :
là các chuỗi tử số và mẫu số của phép xấp xỉ Padé của ez Đặc điểm chính
của phương trình cuối là không có thành phần hàm mũ bé hơn (p+q) ở vế
phải Điều này đủ để đảm bảo việc xác định các hệ số ak và bk của chuỗi
q p q k b
k q k
=
Áp dụng vào hàm mũ ma trận : công thức trên áp dụng vào các chuỗi số
với các hệ số vô hướng và các ma trận vuông Đối với ma trận X kích
Trang 25Giới hạn của sai số xấp xỉ [1]:
đối với ma trận X kích thước n x n và có các phần tử là xij Sai số xấp xỉ
được định nghĩa là tỉ lệ của chuẩn ∞ ma trận của sai số xấp xỉ với chuẩn
ma trận ∞ của giá trị thực Sai số xấp xỉ được phân tích bởi Moler và Van
Loan [7] Golub và Van Loan [8] chứng minh nó thỏa mãn bất đẳng thức:
Chú ý rằng giới hạn này chỉ phụ thuộc vào tổng (p+q) Trong trường hợp
đó, độ phức tạp của xấp xỉ Padé đối với mức độ sai số chấp nhận được
nhỏ nhất là khi p = q, nghĩa là bậc của chuỗi tử số và chuỗi mẫu số bằng
nhau
Giới hạn đối số : bài toán xấp xỉ Padé là bài toán giới hạn sai số vì nó
tăng theo hàm số mũ cùng với chuẩn ||X||∞ Ward [9] đã kết hợp phương
pháp tỉ lệ và bình phương để xấp xỉ giới hạn sai số ban đầu
Trang 26Sơ đồ khối đại diện cho bộ ước lượng trạng thái của hệ thống được mô tả
như sau :
Hình 3.2 Sơ đồ khối mô hình bộ ước lượng Giá trị ước lượng ˆ( )x t của x(t) sẽ là đầu ra của mạch lọc kalman
Sai số ước lượng được định nghĩa là hiệu số giữa giá trị thực của biến
ngẫu nhiên x(t) và giá trị ước lượng ˆ( )x t
Hàm tổn thất bình phương có dạng :
[ ( )x t −x tˆ( )]T M x t[ ( )−x tˆ( )] (3.49) với M là ma trận n x n đối xứng dương
Bộ ước lượng lý tưởng đối với hàm tổn thất bậc hai được định nghĩa là
giá trị ước lượng ˆ( )x t tối thiểu hóa giá trị kỳ vọng của tổn thất, với xác
suất có điều kiện thông qua những số liệu từ z(t) Người ta cũng đã chứng
minh rằng ước lượng tối ưu của x(t) là giá trị kỳ vọng có điều kiện của
x (t) cho bởi z(t) :
ˆx =E〈x(t)|z(t)〉 tối thiểu hóa
E x t[ ( )−x tˆ( )]T M x t[ ( )−x tˆ( )] | ( )z t (3.50)
Bài toán thông thường là như sau : cho trước z(t), 0 ≤ t ≤ t1 Ước lượng
giá trị x(t) tại thời điểm t = t2
Mạch lọc Kalman
ước lượng
ˆ( )
x t
quan sát z(t)
Trang 27J =E x t[ ( )−x tˆ( )] [T M x t( )−x tˆ( ) | ( )] z t (3.53)
0
ˆ
dJ dx
= −2ME x t[ ( )−x tˆ( )] | ( )z t (3.55)
E x t z tˆ( ) | ( ) =x tˆ( )=E x t z t( ) | ( ) (3.56)
Điều này chứng minh kết quả của phương trình (3.50) Nếu x(t) và z(t) là
hàm hợp, giá trị variance không tuyến tính tối thiểu và giá trị variance
tuyến tính tối thiểu của bộ ước lượng trùng nhau :
Chứng minh cho trường hợp rời rạc [1]:
Gọi hàm mật độ xác suất là hàm phân bố Gauss :
và các biến độc lập zi Biểu thức 3.62 sẽ có tính chất giá trị trung bình
bằng zero giống như chuỗi xk
Trang 28Chứng minh tương tự cho trường hợp liên tục
Độ lệch của giá trị variance ước tính tuyến tính tối thiểu:
với
Đặc điểm trực giao :
Giá trị nghiệm E〈x|z〉 của bài toán ước lượng không chỉ đơn giản là ước
lượng Nếu x và z là hàm hợp bình thường, E〈x|z〉 = α0z + α1 (3.67)
Với x, z và M là các số vô hướng, giá trị α0, α1 tối thiểu hóa sai số trung
Trang 29Thay giá trị α0 vào :
E〈[x – α0 – α1z]2〉 = E〈[x – E〈x〉 – α1(z – E〈x〉)]2〉
= E〈[(x – E〈x〉) – α1(z – E〈x〉)]2〉
= E〈[x – E〈x〉]2〉 + α12E〈 [z – E〈x〉]2〉
– 2α1E〈(x – E〈x〉)(z – E〈x〉)〉 (3.74)
Trang 30Hình 3.3 Sơ đồ trực giao
3.2 Mạch lọc tuyến tính tối ưu và bộ dự đoán
Bài toán ước lượng [1]:
Đây là bài toán ước lượng trạng thái của hệ thống ngẫu nhiên tuyến tính bằng cách sử dụng các phép đo là các hàm tuyến tính của các trạng thái Giả sử rằng hệ thống ngẫu nhiên có thể được đại diện bở mô hình xây dựng và mô hình phép đo như sau :
Bảng 3.2 : Mô hình hệ thống tuyến tính và phép đo
Hệ thống x t( )=F t x t( ) ( )+w t( ) xk = Φk-1xk-1 + wk-1 (3.81)
Phép đo z(t) = H(t)x(t) + v(t) zk = Hkxk + vk (3.82)
E〈w(t)wT(s)〉=δ(t-s)Q(t) E〈wkwTi〉=Δ(k-i)Qk (3.84)
E〈v(t)vT(s)〉=δ(t-s)R(t) E〈vkvTi〉=Δ(k-i)Rk (3.85) với Δ(k – l) và δ(t – s) là hàm Kronecker và hàm Dirac
Đại lượng nhiễu xây dựng vk và nhiễu phép đo wk được giả sử là hàm Gaussian có trung bình bằng 0 Tương tự, giá trị ban đầu x0 cũng là biến Gaussian có trung bình bằng x0 và có covariance P0 đã biết trước Ngoài
ra, các giá trị của chuỗi wk và vk được qui ước là không tương quan với nhau
x x – α 1 z
Trang 31Mục tiêu của bài toán là tìm giá trị ước lượng tìm vector n trạng thái xk,
kí hiệu ˆx , và hàm tuyến tính của các phép đo z k i, … , zk sao cho tối thiểu
hóa tổng trung bình bình phương sai số :
E x t[ ( )−x tˆ( )]T M x t[ ( )−x tˆ( )] (3.86) với M là ma trận hệ số xác định không âm đối xứng
Các điểm chính [1]:
Bài toán ước lượng Gaussian toàn phương tuyến tính : kết quả cuối cùng
của bài toán là phải tối ưu hóa toàn bộ các phép ước lượng tuyến tính các
trạng thái của hệ thống ngẫu nhiên tuyến tính Hệ thống động là tuyến
tính, các hàm biểu diễn ở dạng toàn phương và các biến ngẫu nhiên có
dạng Gaussian
Các ứng dụng :
• Dự đoán : các giá trị quan sát sẽ được sử dụng làm tiền đề cho các giá
trị ước lượng trạng thái của hệ thống động sau đó:
tobs < test
• Bộ lọc : các giá trị quan sát trước và tại thời điểm ước lượng sẽ được
sử dụng để ước lượng các trạng thái của hệ thống động
tobs ≤ test
• Làm trơn : các giá trị quan sát được sẽ được sử dụng sau khi đã ước
lượng các trạng thái của hệ thống động
tobs ≥ testĐặc điểm trực giao : sự trực giao sẽ được sử dụng để tạo ra bộ dự đoán
Các bài báo của nhiều tác giả đã chứng minh rằng điều này sẽ giúp các
bộ dự đoán tối thiểu hóa variance, không thiên lệch và chắc chắn
3.2.2 Kalman filter
Bài toán cập nhật có quan sát cho bộ ước lượng trạng thái hệ thống [1]:
Giả sử rằng một phép đo được thực hiện tại thời điểm tk và các kết quả
của nó được sử dụng để cập nhật phép ước lượng trạng thái của hệ thống
Trang 32ngẫu nhiên vào thời điểm tk Giả sử rằng các phép đo có quan hệ tuyến
tính với các trạng thái và được biểu diễn bằng đẳng thức:
zk = Hxk +vk
với H là ma trận độ nhạy của phép đo và vk là sai số phép đo
Bộ ước lượng tuyến tính [1]:
Tối ưu hóa phép ước lượng tuyến tính sẽ tương đương với tối ưu hóa
phép ước lượng tổng quát không tuyến tính với điều kiện hai biến x và z
là hàm hợp Gaussian Vì thế, ta có đầy đủ điều kiện để thực hiện phép
cập nhật trạng thái ˆ ( )x k + dựa trên kết quả quan sát zk theo quan hệ tuyến
tính :
xˆk( )+ =K x1k kˆ ( )− +K z k k (3.87)
với ˆ ( )x k − là giá trị ước lượng ban đầu của xk và ˆ ( )x k + là giá trị ước
lượng sau
Bài toán tối ưu hóa [1]:
Là bài toán xác định độ lợi Kalman 1
không bao gồm thành phần nhiễu wk tại thời điểm tk Vì thành phần nhiễu
wk và vk được giả thuyết là không tương quan với nhau, nên ta có :
EwkziT = 0 với i=1,k Thay xk và ˆ ( )x k + từ các biểu thức trước đó vào
Trang 33K như trên, biểu thức (3.88) luôn được thỏa mãn
Vấn đề còn lại của bài toán là phải chọn K k sao cho thỏa mãn biểu thức
Giá trị ˆx k phụ thuộc tuyến tính vào xk, trong đó xk lại phụ thuộc tuyến
tính zk Vì vậy ta có thể viết lại biểu thức (3.89) :
Trang 34Từ cấu trúc của hệ thống : T ˆ ( ) 0T
Ew z =Ew x + = Thế vào biểu thức trên ta có :
Sử dụng thêm giả thuyết : ( ) T 0
Ex − v = Biểu thức trên sẽ được biến đổi thành :
Trang 35Bằng cách thay thế K từ biểu thức 3.99, biểu thức 3.103 sẽ được biến k
đổi như sau :
Để tính toán độ bất định trong phép ước lượng ma trận covariance,
Kalman đã sử dụng phép ngoại suy sai số covariance như sau :
( ) ( ) ( )T
P − =E x⎡⎣ − x − ⎤⎦
xˆk( )− = Φk−1xˆk−1( )+ (3.109) Suy ra :
xˆk( )− −x k = Φk−1xˆk−1( )+ − (3.110) x k
Trang 364 Tính toán giá trị ˆ ( )x k + sử dụng giá trị K k và các giá trị ước tính ban
đầu ˆ ( )x k − và dữ liệu đầu vào zk
Bảng 3.3 : Phương trình mạch lọc Kalman rời rạc
Trang 37Ngoại suy ước lượng hệ thống
( ) 1 1( )
ˆk k ˆk
x − = Φ − x − + Ngoại suy covariance sai số
3.2.3 Kalman – Bucy filter
Tương tự như trường hợp rời rạc, tín hiệu ngẫu nhiên liên tục x(k) và sự
quan sát z(t) được cho bởi biểu thức [1]:
+ -
Trang 38Bài toán vẫn là tìm giá trị ước lượng cho vector x(t), kí hiệu là ˆ( )x t , biết
rằng giá trị ˆ( )x t là hàm tuyến tính với z(t) trong khoảng 0≤ t ≤ T, đồng
thời tối thiểu hóa hàm :
với Φ(tk,tk-1) là ma trận chuyển trạng thái từ thời điểm tk-1 đến thời điển tk
và 0(Δt2) biểu thị thành phần bậc lớn hơn hoặc bằng 2
Giá trị nhiễu phép đo :
( )k
k
R t R
Trang 39Tương tự, bằng cách kết hợp (3.87) và (3.109), đồng thời tính giới hạn
tính giới hạn Δt → 0, ta thu được :
x tˆ( )=F t x t( ) ( )ˆ +K t z t( ) [ ( )−H t x t( ) ( )ˆ ] (3.128)
với điều kiện đầu x(0)
Các biểu thức (3.125), (3.127), (3.128) đã định nghĩa bộ ước lượng
Kalman liên tục, hay Kalman Bucy filter
Trang 403.2.4 Hàm tổn thất bậc hai
Mạch lọc Kalman tối thiểu hóa bất kỳ hàm tổn thất bậc hai nào của phép
ước lượng sai số Để chứng minh tính chất này, người ta đã sử dụng độ
lệch trong ước lượng của mạch lọc Kalman Điều này đồng nghĩa với
ˆx E x= , hay giá trị ước lượng là trung bình của hàm phân bố xác suất
trạng thái
Hàm tổn thất bậc hai của phép ước lượng sai số [1]:
Hàm tổn thất là một hàm thực của kết quả của một sự kiện ngẫu nhiên
Hàm tổn thất phản ánh giá trị của kết quả đó Giá trị khái niệm đó có lúc
có thể mang tính chủ quan
Hàm tổn thất của các ước lượng : trong lý thuyết ước lượng, tổn thất
thường là hàm số của các sai số ước tính (là hiệu giữa giá trị ước lượng
và giá trị đúng) và thường là hàm đơn điệu tăng theo giá trị tuyệt đối của
sai số ước tính
Hàm tổn thất bậc hai : nếu x là vector thực n giá trị tương ứng với kết quả
của một sự kiện và ˆx là giá trị ước lượng của x, hàm tổn thất bậc hai đối
với sai số ước lượng sẽ có dạng :
L x x(ˆ− )=[x x M x xˆ− ]T [ˆ− (3.129) ]với M là ma trận được định nghĩa dương và đối xứng M được định nghĩa
đối xứng vì cấu trúc đối xứng của nó không ảnh hưởng đến kết quả của
hàm tổn thất Tính chất đối xứng của M đảm bảo rằng kết quả của hàm
tổn thất chỉ bằng zero khi không có sai số và giá trị tổn thất là hàm đơn
điệu tăng của sai số ước lượng
Giá trị kỳ vọng của hàm tổn thất bậc hai :
Tiếp đây ta sẽ chứng minh hàm kỳ vọng của hàm tổn thất bậc hai của sai
số ước lượng ˆx x − là hàm bậc hai của ˆx E x− với E xˆ =E x
Ta có :
x xˆ− =(x E xˆ− ) (− x E x− )
(3.130)