2 CP Canonical Polyadic Phân tích phần tử song song3 CP-MS Canonical Polyadic - Modified Canonical Polyadic - PETRELS Phân tích phần tử song song sử dụng PETRELS tên thuật toán 7 CS Com
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Trang 2Hà Nội - 2019
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS TS NGUYỄN LINH TRUNG
2 GS TS ĐỖ NGỌC MINH
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận án do tôi thực hiện Những kết quả từ các công trình củacác tác giả khác mà tôi sử dụng trong luận án đều được trích dẫn rõ ràng, cụ thể Cáckết quả tính toán, mô phỏng là trung thực
Nếu có gì sai trái, tôi xin hoàn toàn chịu trách nhiệm
Hà Nội, ngày 24 tháng 10 năm 2019
Học viên
Trương Minh Chính
Trang 4LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo, PGS TS Nguyễn Linh Trung,người đã hướng dẫn tôi tận tình, chu đáo trong quá trình thực hiện luận án Sự chỉ bảotận tâm của thầy đã mang lại cho tôi hệ thống các phương pháp, kiến thức cũng như
kỹ năng hết sức quý báu để có thể hoàn thiện luận án một cách tốt nhất
Tôi xin chân thành cảm ơn quý thầy cô giáo: GS TS Karim Abed-Meraim,
GS TS Đỗ Ngọc Minh, PGS TS Marie Luong, TS Lê Vũ Hà, PGS TS Trần ĐứcTân và TS Nguyễn Việt Dũng, những người đã góp phần hướng dẫn chuyên môn, hỗtrợ và động viên tôi trong suốt thời gian thực hiện luận án
Tôi xin trân trọng cảm ơn Ban Giám hiệu Nhà trường, quý thầy giáo, cô giáo củakhoa Điện tử - Viễn thông, phòng Đào tạo, phòng Tổ chức Hành chính, Trường Đạihọc Công nghệ, Đại học Quốc gia Hà Nội, đã tham gia giảng dạy, hướng dẫn và tạođiều kiện giúp đỡ tôi trong thời gian thực hiện luận án; đặc biệt là sự quan tâm hướngdẫn, động viên của PGS TS Chử Đức Trình, PGS TS Trần Xuân Tú cùng nhữngthầy cô giáo, các bạn sinh viên trong Bộ môn Tín hiệu và Hệ thống, Trường Đại họcCông nghệ, những người đã thực sự quan tâm và đối xử với tôi như một thành viêncủa Trường Đại học Công nghệ
Tôi xin trân trọng cảm ơn Ban Giám hiệu Nhà trường, khoa Vật lý, khoa Sư phạm
Kỹ thuật, phòng Tổ chức Hành chính và phòng Kế hoạch Tài chính, Trường Đại học
Sư phạm, Đại học Huế đã hỗ trợ tôi trong suốt thời gian học tập và thực hiện luận án
Tôi xin chân thành cảm ơn những người thân trong gia đình, những người đã hỗtrợ tôi rất nhiều về cả vật chất lẫn tinh thần để tôi có thể học tập đạt kết quả tốt và thựchiện thành công luận án này
Xin chân thành cảm ơn những người bạn, đặc biệt là ThS Nguyễn Hoàng Anh,ThS Vũ Hoàng Tuân, ThS Phạm Ngọc Thạch, những người đã hỗ trợ tôi rất nhiều về
cả vật chất lẫn tinh thần để tôi có thể học tập đạt kết quả tốt và thực hiện thành côngluận án này
Trang 5Luận án này được hỗ trợ bởi:
- Đề tài nghiên cứu khoa học số 57/2011/HDDT, Trung tâm Nghiên cứu Châu
Á, Đại học Quốc gia Hà Nội;
- Đề tài nghiên cứu khoa học số 102.02-2015.32, Quỹ Phát triển khoa học vàcông nghệ Quốc gia (National Foundation for Science and Technology Development
- NAFOSTED)
Dữ liệu điện não đồ sử dụng trong luận án được sử dụng từ kết quả của đề tàinghiên cứu khoa học số QG.10.40, Đại học Quốc gia Hà Nội
Tôi xin chân thành cảm ơn!
Hà Nội, ngày 24 tháng 10 năm 2019
Trương Minh Chính
Trang 6MỤC LỤC
Trang phụ bìa i
Lời cam đoan ii
Lời cảm ơn iii
Mục lục 1
Danh mục các ký hiệu và chữ viết tắt 4
Danh mục các bảng 7
Danh mục các hình vẽ, đồ thị 8
MỞ ĐẦU 10
CHƯƠNG 1 CƠ SỞ VỀ ÁP DỤNG PHƯƠNG PHÁP LẤY MẪU NÉN CHO TẠO ẢNH CỘNG HƯỞNG TỪ NHANH VÀ PHÂN TÍCH PHẦN TỬ SONG SONG CHO TÍN HIỆU ĐIỆN NÃO ĐỒ 20
1.1 Giới thiệu 20
1.2 Phương pháp lấy mẫu nén 20
1.2.1 Tín hiệu thưa và tín hiệu có thể nén 21
1.2.2 Mô hình lấy mẫu tín hiệu trong phương pháp lấy mẫu nén 22
1.2.3 Khôi phục tín hiệu trong phương pháp lấy mẫu nén 24
1.3 Một số tính chất của hệ hỗn loạn 25
1.3.1 Hệ logistic 25
1.3.2 Tạo dãy tất định có tính chất của phân bố Gauss 26
1.3.3 Tạo dãy tất định có tính chất của phân bố Bernoulli hoặc phân bố đều 27
1.4 Bài toán phân tích CP thích nghi cho ten-xơ bậc 3 28
1.4.1 Ước lượng không gian con cho dữ liệu không đầy đủ 28
1.4.2 Phân tích CP cho ten-xơ bậc 3 32
1.4.3 Thuật toán phân tích CP thích nghi cho ten-xơ bậc 3 33
1.5 Kỹ thuật tạo ảnh cộng hưởng từ 36
1.5.1 Nguyên lý thu tín hiệu cộng hưởng từ 36
1.5.2 Nguyên lý và phương trình tạo ảnh 38
1.5.3 Phương pháp tạo ảnh cộng hưởng từ tĩnh nhanh 40
Trang 71.6 Áp dụng phương pháp lấy mẫu nén cho tạo ảnh cộng hưởng từ nhanh 41
1.6.1 Cơ sở của việc áp dụng CS cho MRI 41
1.6.2 Áp dụng CS cho MRI: Phương pháp lấy mẫu nén ngẫu nhiên 42 1.6.3 Áp dụng CS cho MRI: Phương pháp lấy mẫu nén hỗn loạn 44 1.7 Áp dụng phân tích CP cho xử lý tín hiệu EEG 45
1.7.1 Giới thiệu về EEG 45
1.7.2 Hệ thống điện cực 46
1.7.3 Dữ liệu EEG với cấu trúc ten-xơ bậc 3 47
1.7.4 Áp dụng phân tích CP cho dữ liệu EEG dạng ten-xơ bậc 3 48
1.8 Kết luận 49
CHƯƠNG 2 ÁP DỤNG LẤY MẪU NÉN TẤT ĐỊNH TRÊN CƠ SỞ CÁC HỆ HỖN LOẠN CHO TẠO ẢNH CỘNG HƯỞNG TỪ NHANH 50
2.1 Giới thiệu 50
2.2 Một số vấn đề chi tiết về áp dụng lấy mẫu nén cho tạo ảnh cộng hưởng từ nhanh 50
2.2.1 Mô hình áp dụng CS cho MRI 50
2.2.2 Các phương pháp áp dụng CS cho MRI và những hạn chế 55
2.2.3 Tiêu chí xây dựng cơ sở lấy mẫu tất định 56
2.2.4 Đánh giá chất lượng ảnh khôi phục 56
2.3 Các phương pháp đề xuất áp dụng CS hỗn loạn cho MRI 57
2.3.1 Phương pháp 1: CS hỗn loạn cho MRI 57
2.3.2 Phương pháp 2: CS hỗn loạn cho SWIFT 59
2.4 Mô phỏng và đánh giá 61
2.4.1 Dữ liệu mô phỏng 61
2.4.2 Kịch bản mô phỏng 61
2.4.3 Phương pháp 1: CS hỗn loạn cho MRI 63
2.4.4 Phương pháp 2: CS hỗn loạn cho SWIFT 66
2.4.5 Xác suất thành công và tỷ lệ lấy mẫu nén 68
2.5 Kết luận 71
CHƯƠNG 3 PHÂN TÍCH PHẦN TỬ SONG SONG THÍCH NGHI CHO TEN-XƠ BẬC 3 VÀ ÁP DỤNG XỬ LÝ TÍN HIỆU EEG KHÔNG ĐẦY ĐỦ 73 3.1 Giới thiệu 73
Trang 83.2 Cơ sở của các thuật toán đề xuất 73
3.2.1 Bài toán ước lượng không gian con và phân tích CP thích nghi cho dữ liệu không đầy đủ 73
3.2.2 Cơ sở đề xuất thuật toán 74
3.2.3 Đề xuất hàm chi phí 75
3.3 Đề xuất thuật toán ước lượng không gian con cho dữ liệu không đầy đủ 77 3.3.1 Thuật toán 1: SW-PETRELS 77
3.3.2 Thuật toán 2: NL-PETRELS 80
3.3.3 Thuật toán 3: MS-PETRELS 81
3.3.4 Độ phức tạp của thuật toán 83
3.3.5 Mô phỏng và đánh giá thuật toán 83
3.4 Phát triển thuật toán phân tích CP thích nghi cho ten-xơ bậc 3, dữ liệu không đầy đủ 88
3.4.1 Mô hình bài toán 88
3.4.2 Thuật toán phân tích CP thích nghi cho ten-xơ bậc 3, dữ liệu không đầy đủ 89
3.4.3 Mô phỏng và đánh giá thuật toán 90
3.5 Áp dụng phân tích CP thích nghi cho dữ liệu EEG không đầy đủ 101
3.5.1 Áp dụng 1: Trích xuất thông tin 102
3.5.2 Áp dụng 2: Khôi phục dữ liệu 106
3.6 Kết luận 109
KẾT LUẬN VÀ KIẾN NGHỊ 110
DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 112
TÀI LIỆU THAM KHẢO 113
PHỤ LỤC A THUẬT TOÁN PETRELS 119
PHỤ LỤC B THUẬT TOÁN PHÂN TÍCH CP THÍCH NGHI 120
PHỤ LỤC C THUẬT TOÁN NCG 121
Trang 9DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Danh mục ký hiệu
1 In nghiêng, chữ thường hoặc in
hoa, ví dụ a, N
Đại lượng vô hướng
2 In đậm, chữ thường, ví dụ a Đại lượng véc-tơ, các thành phần của véc-tơ a
được ký hiệu là a i
3 In đậm, kiểu chữ in hoa,
ví dụ A
Ma trận, các thành phần của ma trận A được ký hiệu là a ij hoặc là [A] ij
7 ( ·) T Chuyển vị của ma trận (hoặc véc-tơ) (·)
8 ( ·) H Chuyển vị liên hợp phức (Hermitian ) của ma
18 k·k2 ` 2 -norm của véc-tơ, ma trận hoặc ten-xơ (·)
Trang 102 CP Canonical Polyadic Phân tích phần tử song song
3 CP-MS Canonical Polyadic - Modified
Canonical Polyadic - PETRELS Phân tích phần tử song song sử
dụng PETRELS (tên thuật toán )
7 CS Compressed Sensing Lấy mẫu nén (tên phương pháp )
8 CS-MRI Compressed Sensing - Magnetic
Resonance Imaging
Lấy mẫu nén cho ảnh cộng hưởng
từ (tên phương pháp )
9 EEG Electroencephalogram Điện não đồ
10 FMS Factor Match Score Chỉ số khớp của ten-xơ
11 HSn hyperbolic secant pulse Họ xung hyperbolic secant
12 MAE Mean Absolute Error Sai số tuyệt đối trung bình
13 MRI Magnetic Resonance Imaging Tạo ảnh cộng hưởng từ
14
MS-PETRELS
Modified Simplified PETRELS Ước lượng không gian con đơn
giản cải tiến (tên thuật toán )
15 NCG Nonlinear Conjugate Gradient Građien liên hợp phi tuyến
(tên thuật toán )
16
NewCCS-MRI
New Chaotic Compressed Sensing - Magnetic Resonance Imaging
Lấy mẫu nén hỗn loạn mới cho ảnh cộng hưởng từ
(tên phương pháp )
17
NL-PETRELS
Non-Linear PETRELS Ước lượng không gian con phi
tuyến tính (tên thuật toán )
18 NRE Normalized Residual Error Sai số chuẩn hóa
Trang 1119 NMRSE Normalize Root Mean Square
21 PETRELS Parallel Estimation and Tracking
by REcursive Least Squares
Ước lượng song song sử dụng đệ quy bình phương tối thiểu
(tên thuật toán )
23 RIP Restricted Isometry Property Tính chất đẳng cự giới hạn
24 SCF Standard Cost Function Hàm chi phí tiêu chuẩn
25 SEP Subspace Estimation
Simplified PETRELS Ước lượng không gian con
PE-TRELS đơn giản (tên thuật toán )
27 STD Standard Deviation Độ lệch chuẩn
28 SWIFT Sweep Imaging with Fourier
Sliding Window PETRELS Ước lượng không gian con cửa sổ
trượt (tên thuật toán )
30 TCS Tensor Completion Score Chỉ số khôi phục ten-xơ
31 TPSF Transform Point Spread
Function
Hàm trải điểm chuyển đổi
Trang 12DANH MỤC CÁC BẢNG
Bảng 3.1: Giá trị của các tham số trong mô phỏng chứng minh hiệu suất
cao của thuật toán MS-PETRELS 84Bảng 3.2: Giá trị của các tham số trong mô phỏng so sánh với thuật toán
PETRELS 85Bảng 3.3: Quan hệ giữa giá trị FMS trung bình với số lượng kênh bị
mất dữ liệu của các thuật toán CP-WOPT, CP-NL, CP-PETRELS
và CP-MS 105Bảng 3.4: Quan hệ giữa giá trị TCS trung bình với số lượng kênh bị
mất dữ liệu của các thuật toán CP-WOPT, CP-NL, CP-PETRELS
và CP-MS 107
Trang 13DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1: Hệ logistic với α = 4 26Hình 1.2: Tần suất thống kê (histogram ) của dãy logistic trước và sau khi
chuyển đổi để có tính chất của biến ngẫu nhiên Gauss 27Hình 1.3: Mô hình bài toán phân tích CP cho ten-xơ bậc 3 có kích thước hai
chiều cố định và kích thước một chiều tăng theo thời gian 34Hình 1.4: Hình minh họa các trường gradien và lấy mẫu không gian k 38Hình 1.5: Các kiểu lấy mẫu không gian k cho ảnh MRI 39Hình 1.6: Lược đồ các xung trong phương pháp SWIFT 40Hình 1.7: Hệ thống Jasper’s 10/20 và ACNS 10/10 46Hình 1.8: Sơ đồ khối xây dựng ten-xơ EEG đặc trưng của Acar và các cộng sự 48Hình 2.1: Mô hình bài toán áp dụng CS cho MRI 51Hình 2.2: Không gian k của ảnh MRI và lấy mẫu không gian k 53Hình 2.3: Minh họa tính thưa của ảnh MRI 62Hình 2.4: Minh họa các phương pháp khôi phục ảnh bằng biến đổi sóng con
và CS cho MRI tại tỷ số nén rcs = 0.35 65Hình 2.5: Giá trị NRMSE (trung bình) của các phương pháp CS-MRI, CCS-
MRI và NewCCS-MRI 66Hình 2.6: Ảnh gốc và ảnh khôi phục bằng phương pháp CCS-MRI và CCS-
SWIFT tại tỷ số nén rcs = 0.3 67Hình 2.7: Giá trị MAE (trung bình) của phương pháp CCS-MRI và CCS-
SWIFT 68Hình 2.8: Ảnh gốc và ảnh khôi phục bằng phương pháp CCS-MRI và CCS-
SWIFT tại tỷ số nén rcs = 0.25 69Hình 2.9: Tỷ lệ khôi phục ảnh thành công của các phương pháp CS-MRI,
CCS-MRI, NewCCS-MRI và CCS-SWIFT 70Hình 3.1: Giá trị SEP và NREcủa các thuật toán SW-PETRELS, PETRELS,
MS-PETRELS và S-PETRELS theo thời gian ước lượng 85
Trang 14Hình 3.2: Giá trị SEP của các thuật toán PETRELS, SW-PETRELS,
MS-PETRELS và NL-MS-PETRELS theo thời gian ước lượng tại các tỷ lệ quan
sát khác nhau 86Hình 3.3: Giá trị NRE của các thuật toán PETRELS, SW-PETRELS, MS-
PETRELS và NL-PETRELS theo thời gian ước lượng tại các tỷ lệ quan
sát khác nhau 87Hình 3.4: Mô hình phân tích CP thích nghi đối với ten-xơ bậc 3 dữ liệu
không đầy đủ 89Hình 3.5: Thời gian thực hiện các thuật toán tại tỷ lệ quan sát 40% 93Hình 3.6: Giá trị STDA(τ ) theo thời gian ước lượng τ của các thuật toán
CP-PETRELS, CP-SW, CP-MS, CP-NL và CP-WOPT tại các tỷ lệ quan
sát khác nhau trong trường hợp không gian con thay đổi, không nhiễu 94Hình 3.7: Giá trị STDC(τ )theo thời gian ước lượng τ của các thuật toán CP-
PETRELS, CP-SW, CP-MS, CP-NL và CP-WOPT tại các tỷ lệ quan sát
khác nhau trong trường hợp không gian con thay đổi, không nhiễu 95Hình 3.8: Giá trị STDx(τ )theo thời gian ước lượng τ của các thuật toán CP-
PETRELS, CP-SW, CP-MS, CP-NL và CP-WOPT tại các tỷ lệ quan sát
khác nhau trong trường hợp không gian con thay đổi, không nhiễu 96Hình 3.9: Giá trị NRE theo thời gian ước lượng τ của các thuật toán CP-
PETRELS, CP-SW, CP-MS và CP-NL tại các tỷ lệ quan sát khác nhau
trong trường hợp không gian con không thay đổi, nhiễu 10−3 99Hình 3.10: Giá trị NRE theo thời gian ước lượng τ của các thuật toán CP-
PETRELS, CP-SW, CP-MS và CP-NL tại các tỷ lệ quan sát khác nhau
trong trường hợp không gian con không thay đổi, nhiễu 10−2 100Hình 3.11: Các ma trận thành phần A, B, C của dữ liệu 103Hình 3.12: Ước lượng các ma trận thành phần A, B, C sử dụng thuật toán
CP-WOPT và thuật toán đề xuất CP-NL 104Hình 3.13: Minh họa khôi phục dữ liệu bằng các thuật toán CP-WOPT, CP-
NL, CP-PETRELS và CP-MS 108
Trang 15MỞ ĐẦU
1 Bối cảnh nghiên cứu
Trong thời gian gần đây, xử lý dữ liệu không đầy đủ là vấn đề được quan tâmnghiên cứu nhiều bởi các nhà khoa học trên thế giới Các thể hiện cụ thể của vấn
đề xử lý dữ liệu không đầy đủ có trong nhiều lĩnh vực khác nhau như lấy mẫu nén
và các ứng dụng, khôi phục vùng ảnh bị mất hoặc bị hư hại, khôi phục ma trận,ước lượng không gian con, v.v [4, 20, 27, 28, 74]
Vấn đề xử lý dữ liệu không đầy đủ xuất hiện khi 1) hoặc là chúng ta chủ động
xử lý trên một khối lượng dữ liệu nhỏ hơn các phương pháp xử lý tiêu chuẩn nhằmhạn chế số chiều của dữ liệu xử lý hoặc để đơn giản hóa quá trình lấy mẫu, hoặcloại bỏ phần dữ liệu nào đó không có độ tin cậy cao; 2) hoặc là chúng ta không cóđược dữ liệu đầy đủ do lỗi của hệ thống thu tín hiệu hoặc lỗi kênh truyền Nhiềuphương pháp xử lý và công cụ toán học khác nhau đã được đề xuất cho những thểhiện khác nhau của vấn đề xử lý dữ liệu không đầy đủ Trong thời gian gần đây,phương pháp lấy mẫu nén và phân tích ten-xơ đã được quan tâm nghiên cứu pháttriển, có ứng dụng trong nhiều lĩnh vực khác nhau [4, 14, 23, 26, 72, 74]
Phương pháp lấy mẫu nén (Compressed Sensing hay Compressive Sampling
- CS) là phương pháp xử lý dữ liệu không đầy đủ, thực hiện quá trình lấy mẫu với sốmẫu ít hơn so với số mẫu trong các phương pháp lấy mẫu theo tốc độ Nyquist Cácphương pháp lấy mẫu truyền thống được thực hiện lấy mẫu với tốc độ Nyquist, sau
đó dữ liệu thường được nén cho các ứng dụng khác nhau bằng cách loại bỏ những
dữ liệu không cần thiết Tư tưởng chính của CS là khắc phục những nhược điểm
của phương pháp lấy mẫu truyền thống bằng cách chỉ lấy mẫu những “dữ liệu thực
sự quan trọng” dùng để khôi phục lại tín hiệu ban đầu CS có thể áp dụng cho quá
trình lấy mẫu và khôi phục tín hiệu đối với các tín hiệu thưa hoặc tín hiệu có thểnén [13, 15, 21] CS đã được nghiên cứu phát triển và ứng dụng trong nhiều lĩnhvực như xử lý ảnh, nén dữ liệu, khôi phục ma trận, v.v [14, 23, 26]
Ten-xơ và các phép phân tích ten-xơ đã được phát triển và ứng dụng trongnhiều lĩnh vực như vật lý, hóa học, xử lý tín hiệu, v.v Ten-xơ là khái niệm tổng
Trang 16quát của mảng nhiều chiều, phù hợp với biểu diễn và lưu trữ dữ liệu nhiều chiều.
Để tạo thuận lợi cho những tính toán trên đối tượng ten-xơ, phát triển trên nềntảng các phép tính đối với véc-tơ và ma trận, phân tích phần tử song song (ParallelFactor - PARAFAC, hoặc Canonical Polyadic - CP) và phân tích Tucker đã đượcnghiên cứu phát triển [37] Đối với xử lý dữ liệu không đầy đủ dưới cấu trúc ten-xơ,
đã có những công trình nghiên cứu phát triển đối với CP, cụ thể là bài toán phântích ten-xơ và khôi phục ten-xơ [4, 72, 74]
Trong lĩnh vực xử lý tín hiệu y sinh, vấn đề xử lý dữ liệu không đầy đủ đangđược quan tâm nghiên cứu và có ứng dụng cho các kỹ thuật hỗ trợ chẩn đoán lâmsàng phổ biến như kỹ thuật tạo ảnh cộng hưởng từ (Magnetic Resonance Imaging
- MRI) hay điện não đồ (Electroencephalogram - EEG)
MRI là kỹ thuật tạo ảnh không can thiệp trực tiếp vào đối tượng được chụp(noninvasive ), được sử dụng phổ biến trong y học cho mục đích chẩn đoán lâmsàng MRI sử dụng các xung kích thích có tần số trong khoảng tần số vô tuyến(Radio Frequency - RF) để kích thích các hạt nhân trong đối tượng được chụp ảnh(ví dụ các bộ phận của con người như não, răng, đầu gối, v.v.), sau đó thu tín hiệubức xạ từ đối tượng để tạo ảnh Ảnh thu được phản ánh cấu trúc vật lý của đốitượng được chụp [38, 39, 69, 70]
Trong những năm qua, kỹ thuật MRI đã có nhiều cải tiến nhằm nâng cao tốc
độ tạo ảnh Về mặt xử lý tín hiệu, có thể nâng cao tốc độ tạo ảnh MRI bằng cách
áp dụng phương pháp lấy mẫu mới, như CS, với số mẫu ít hơn so với các phươngpháp lấy mẫu theo chuẩn Nyquist, từ đó rút ngắn được thời gian của các quá trìnhvật lý trong tạo ảnh CS đã áp dụng thành công trong việc lấy mẫu và khôi phụctín hiệu cho MRI, tạo cơ sở cho việc nghiên cứu phát triển về tăng tốc độ tạo ảnhMRI trên cơ sở xử lý tín hiệu [41–43]
Tín hiệu điện não đồ bề mặt (scalp EEG, luận án chỉ quan tâm nghiên cứu tínhiệu EEG được thu bởi hệ thống điện cực trên bề mặt da đầu người được đo, gọi
là EEG) là tín hiệu phản ánh hoạt động của não Kỹ thuật thu EEG là kỹ thuật antoàn cho người được đo, vì vậy tín hiệu EEG được sử dụng rộng rãi cho mục đíchchẩn đoán lâm sàng Mặt khác, tín hiệu EEG cũng được sử dụng cho các ứng dụnggiao tiếp và điều khiển [59, 63, 68] Do nhu cầu xử lý tín hiệu EEG trong các miềnkhác nhau hoặc khai thác thông tin từ các cơ sở dữ liệu khác nhau nên số chiều của
Trang 17dữ liệu EEG đã tăng lên: Thay vì xử lý trên dữ liệu có số chiều là 1 (véc-tơ) hay 2(ma trận), số chiều của dữ liệu xử lý là lớn hơn 2 Có nghĩa là cấu trúc ten-xơ đãđược sử dụng để lưu trữ và xử lý tín hiệu EEG [2–4, 17, 18, 45, 47] Mặt khác, xử
lý tín hiệu EEG cũng đối mặt với vấn đề dữ liệu không đầy đủ [4, 61, 62]
Từ những thực tế đó, luận án quan tâm nghiên cứu các giải thuật phân tích và
xử lý tín hiệu dữ liệu không đầy đủ ứng dụng trong y sinh, theo hướng như sau:1) Nghiên cứu các giải thuật CS cho MRI (Chủ động thu thập dữ liệu không đầy
đủ để tăng tốc độ xử lý);
2) Nghiên cứu các giải thuật phân tích CP cho EEG (Phân tích CP trên dữ liệukhông đầy đủ hoặc khôi phục lại dữ liệu bị mất mát bằng phân tích CP)
2 Tổng quan về các vấn đề nghiên cứu
Mục này trình bày tổng quan và một số hạn chế của các phương pháp, giảipháp kỹ thuật đã có trong hai vấn đề nghiên cứu, cụ thể là vấn đề các giải thuật CScho MRI và vấn đề phân tích CP cho EEG
Trong những năm qua, kỹ thuật MRI đã có nhiều cải tiến nhằm nâng cao tốc
độ tạo ảnh Các phương pháp nâng cao tốc độ tạo ảnh MRI tập trung vào các hướngchủ yếu sau:
1) Khai thác tính chất lý-hóa của đối tượng được chụp nhằm cải tiến phươngpháp kích thích và thu nhận tín hiệu Theo hướng này, các phương pháp mới
sử dụng các xung vô tuyến đặc biệt để thay đổi cách thức kích thích và thu tínhiệu nhằm giảm tổng thời gian kích thích và thu nhận tín hiệu; hoặc là thựchiện song song quá trình kích thích và thu nhận tín hiệu trên các phần khônggian khác nhau của đối tượng được chụp ảnh [10];
2) Thay đổi phương pháp lấy mẫu nhằm hạn chế số lượng các chu kỳ thực hiệnkích thích, thu tín hiệu so với các phương pháp truyền thống [41–43]
Những cải tiến về mặt vật lý bị hạn chế bởi các ràng buộc vật lý của khối vậtliệu được chụp ảnh hoặc những ràng buộc vật lý trong máy MRI, vì vậy hạn chếcủa các phương pháp thu nhận ảnh MRI là thời gian thu nhận ảnh dài
Một đặc điểm của MRI là tín hiệu thu được từ hiện tượng cộng hưởng từ là tínhiệu trong không gian k, bản chất chính là biến đổi Fourier của tín hiệu ảnh muốn
có Để có được ảnh cuối cùng, các phương pháp tạo ảnh phổ biến thực hiện lấy
Trang 18mẫu không gian k với tốc độ Nyquist, sau đó thực hiện biến đổi Fourier ngược tínhiệu trong không gian k Trong [15], Candes và các cộng sự đã xây dựng ảnh MRI
có độ trung thực cao từ dữ liệu lấy mẫu không đầy đủ (under sampling ) khônggian k Tiếp theo đó, Lustig và các cộng sự đã đề xuất và xây dựng phương pháp
áp dụng CS cho MRI, gọi là CS-MRI (Compressed Sensing MRI) [41–43] TrongCS-MRI, các tác giả đã chỉ ra sự tương đồng về mặt phương pháp giữa CS và MRI
và cơ sở cho việc áp dụng CS đối với MRI, theo đó ảnh MRI có tính chất thưatrong miền sóng con (wavelet ) Trong CS-MRI, tín hiệu thu được là một phần củakhông gian k (lấy mẫu không đầy đủ không gian k), với các mẫu được thu thậpmột cách ngẫu nhiên Quá trình khôi phục ảnh MRI không phải là biến đổi Fourierngược theo truyền thống mà là giải bài toán phi tuyến tính với các ràng buộc liênquan đến bản chất của ảnh MRI, như tính chất thưa trong miền sóng con
Phương pháp CS-MRI được xây dựng khá hoàn thiện về mặt cơ sở phươngpháp luận và cơ sở toán học Một nhược điểm của CS-MRI là quá trình lấy mẫuđược thực hiện trên cơ sở lấy mẫu ngẫu nhiên CS trên cơ sở lấy mẫu ngẫu nhiên cólợi thế về chứng minh toán học, tuy nhiên lại khó thực hiện trong thực tế Ngượclại, CS trên cơ sở lấy mẫu tất định (theo nghĩa cơ sở lấy mẫu được xây dựng là mộtquá trình xác định, không phải từ chuỗi hoặc quá trình ngẫu nhiên) có một số ưuđiểm so với CS trên cơ sở lấy mẫu ngẫu nhiên, như thời gian thực hiện, cấu trúc rõràng, tiết kiệm bộ nhớ, v.v [11]
Trong CS nói chung, đã có các công trình phát triển cơ sở lấy mẫu theo hướngtất định nhằm hạn chế những nhược điểm của cơ sở lấy mẫu ngẫu nhiên [40, 73].Phát triển CS-MRI theo hướng xây dựng cơ sở lấy mẫu tất định, các công trìnhcủa nhóm nghiên cứu ở Phòng Thí nghiệm Tín hiệu và Hệ thống, Trường Đạihọc Công nghệ, Đại học Quốc gia Hà Nội đã xây dựng phương pháp CCS-MRI(Chaotic Compressed Sensing MRI) [24, 57, 65] Đây chính là phương pháp ápdụng CS tất định trên cơ sở hệ hỗn loạn cho các kỹ thuật MRI khác nhau, bao gồmMRI truyền thống, MRI trải phổ và MRI song song Một thực tế là mật độ nănglượng trong không gian k của ảnh MRI phân bố không đồng đều, năng lượng tậptrung ở vùng trung tâm và giảm dần ra biên không gian k theo quy luật hàm mũ
Vì vậy, khi xây dựng giải thuật CS cho MRI, ngoài yếu tố lấy mẫu ngẫu nhiên haytất định, cần thiết phải xem xét điều chỉnh để quá trình lấy mẫu phù hợp với mật độ
Trang 19năng lượng không gian k theo hướng ưu tiên chọn những mẫu không gian k ở gầnvùng trung tâm Để giải quyết vấn đề này, phương pháp CCS-MRI xây dựng cơ sởlấy mẫu trên hệ hỗn loạn, có tính chất thống kê như các biến ngẫu nhiên Gauss.Phương pháp CCS-MRI kế thừa về mặt phương pháp luận phương pháp CS-MRI,
có kết quả tốt và dễ thực thi vì cơ sở lấy mẫu là tất định Tuy nhiên, việc lấy mẫudựa trên hệ hỗn loạn có tính chất thống kê như biến ngẫu nhiên Gauss dẫn đến sựlinh hoạt trong việc lấy mẫu bị hạn chế, có nhược điểm khi phân bố năng lượngtrong không gian k không phải gần với phân bố Gauss
Các phương pháp CS-MRI và CCS-MRI đã giải quyết vấn đề lấy mẫu khôngliên kết (là một yêu cầu đối với quá trình lấy mẫu trong CS) Tuy nhiên, các phươngpháp này chưa kết hợp CS với một kỹ thuật MRI có tốc độ tạo ảnh cao, nhằm pháthuy lợi thế giữa tăng tốc độ về vật lý và tăng tốc độ về xử lý tín hiệu
Từ thực tế như đã trình bày ở trên, việc tiếp tục nghiên cứu phát triển các giảithuật CS cho MRI là vấn đề cần thiết
Đối với xử lý tín hiệu EEG, các công trình gần đây quan tâm nghiên cứu xử
lý tín hiệu EEG nhiều chiều, dưới cấu trúc ten-xơ Trong trường hợp xử lý EEGđơn kênh, tín hiệu là một véc-tơ; nếu đồng thời xử lý đa kênh, tín hiệu sẽ là một matrận với hai chiều lần lượt là kênh và thời gian Để có những đặc trưng khác của tínhiệu EEG, như các đặc trưng về tần số, tín hiệu EEG thường được biến đổi Fourierhoặc biến đổi sóng con, lúc đó tín hiệu EEG đa kênh là một ten-xơ bậc 3 với cácchiều lần lượt là kênh, thời gian và tần số Nếu xem xét tín hiệu EEG đồng thời vớiviệc phân tích theo những khoảng thời gian khác nhau, với những kích thích hoặchoạt động khác nhau của con người, lúc này tín hiệu EEG sẽ là ten-xơ bậc 4 vớicác chiều lần lượt là khoảng thời gian, kênh, thời gian và tần số [17]
Phân tích CP được sử dụng để hỗ trợ tính toán, xử lý tín hiệu EEG dưới cấutrúc ten-xơ Cho đến nay, các thuật toán phân tích CP cho EEG là các thuật toán
xử lý chế độ khối Các thuật toán xử lý chế độ khối có ưu điểm là có độ chính xáccao, tuy nhiên thời gian xử lý của các thuật toán này là lớn và phụ thuộc vào kíchthước của khối dữ liệu xử lý [17]
Việc xử lý tín hiệu EEG còn đối mặt với việc mất mát dữ liệu, tức là chỉ thuđược tín hiệu không đầy đủ với các thể hiện cụ thể như sau:
◦ Trong xử lý tín hiệu, tín hiệu từ kênh (hoặc khoảng thời gian) nào đó có
Trang 20những bất thường về mặt kỹ thuật, dẫn đến tín hiệu từ kênh này (hoặc khoảngthời gian này) không được tin cậy và bị loại bỏ;
◦ Khi có một vài điện cực tiếp xúc không ổn định hoặc hỏng hóc kỹ thuật, dẫnđến không thu được tín hiệu từ các điện cực này;
◦ Do lỗi truyền tín hiệu trong hệ thống điều khiển dựa trên EEG
Vì vậy, xử lý tín hiệu EEG không đầy đủ là cần thiết Cho đến nay, chỉ có thuật toánphân tích CP tối ưu trọng số (CP Weighted OPTimization - CP-WOPT) của Acar
và cộng sự trong [4] đề cập đến nội dung phân tích CP của tín hiệu EEG khôngđầy đủ CP-WOPT cũng là thuật toán xử lý chế độ khối, chưa có thuật toán xử lýthích nghi trong trường hợp dữ liệu không đầy đủ
Từ thực tế đó, luận án định hướng nghiên cứu phân tích CP thích nghi chotín hiệu EEG nhằm đạt được những lợi thế về mặt thời gian xử lý Với cách biểudiễn ten-xơ dưới dạng ma trận, thuật toán phân tích CP thích nghi có thể quy vềthuật toán ước lượng không gian con, như cách giải quyết của Nion và cộng sựtrong [53] Kế thừa và phát triển các kết quả trong [53], áp dụng cho trường hợp
dữ liệu không đầy đủ, các thuật toán phân tích CP mà luận án đề xuất được pháttriển trên các thuật toán ước lượng không gian con trong trường hợp dữ liệu khôngđầy đủ Bài toán ước lượng không gian con thích nghi khá phổ biến với thuậttoán ước lượng không gian con bằng phép chiếu xấp xỉ (Projection ApproximationSubspace Tracking - PAST) [71], thuật toán ước lượng không gian con bằng phépchiếu trực giao xấp xỉ (Orthonormal Projection Approximation Subspace Track-ing) [1], thuật toán ước lượng song song sử dụng đệ quy bình phương tối thiểu(Parallel Estimation and Tracking by REcursive Least Squares - PETRELS) [16].PETRELS là thuật toán ước lượng không gian con cho dữ liệu không đầy đủ cóhiệu suất cao, luận án thực hiện các phát triển trên thuật toán này
3 Vấn đề nghiên cứu
Những vấn đề nghiên cứu của luận án là:
◦ Vấn đề #1: Phát triển các giải thuật CS tất định trên cơ sở các hệ hỗn loạn để
tăng tốc độ tạo ảnh MRI CS đã áp dụng thành công để tăng tốc cho tạo ảnhMRI, vì vậy việc nghiên cứu phát triển phương pháp CS cho MRI là vấn đềhợp lý Sử dụng CS tất định sẽ cải thiện được những nhược điểm của phươngpháp CS-MRI Khi phát triển giải thuật CS tất định cho MRI, luận án quan
Trang 21tâm và giải quyết vấn đề 1) lấy mẫu linh hoạt với phân bố năng lượng khônggian k và 2) kết hợp được những cải tiến trong lĩnh vực vật lý Hướng nghiêncứu này sẽ khắc phục được các nhược điểm của các phương pháp áp dụng CScho MRI hiện nay.
◦ Vấn đề #2: Phát triển các thuật toán ước lượng không gian con cho dữ liệu
không đầy đủ, từ đó xây dựng thuật toán phân tích CP thích nghi cho ten-xơ,
áp dụng cho xử lý EEG Phân tích CP cho dữ liệu EEG có cấu trúc ten-xơ làhướng nghiên cứu đang được quan tâm và phát triển Phân tích CP thích nghi
sẽ đảm bảo thời gian thực hiện nhanh, thỏa mãn ràng buộc thời gian cho cácứng dụng trực tuyến Mặt khác, phân tích CP cho dữ liệu không đầy đủ giảiquyết vấn đề mất mát dữ liệu trong xử lý EEG
4 Mục tiêu nghiên cứu
◦ Mục tiêu chung: Nghiên cứu phát triển các giải thuật xử lý tín hiệu hiện đại,
giới hạn quan tâm đến CS và CP, để hỗ trợ xử lý tín hiệu y sinh với tốc độnhanh trong trường hợp dữ liệu không đầy đủ
5 Hướng tiếp cận và phương pháp nghiên cứu
1) Đối với vấn đề phát triển các giải thuật CS tất định trên cơ sở các hệ hỗn loạn
để tăng tốc độ tạo ảnh MRI, các hướng tiếp cận như sau:
◦ CS tất định trên cơ sở các hệ hỗn loạn đã được nghiên cứu và công bốtrong [40, 73]; CS cho MRI đã được nghiên cứu và công bố trong [15,41–43]; CS tất định trên cơ sở hệ hỗn loạn cho MRI đã được nghiên cứu
và công bố trong [24, 57, 65] Luận án tiếp cận hướng nghiên cứu CSdựa trên cơ sở các hệ hỗn loạn, áp dụng cho MRI
Trang 22◦ Để kết hợp những lợi thế trong cải tiến phương pháp tạo ảnh MRI về vật
lý và xử lý tín hiệu, luận án nghiên cứu giải thuật CS tất định trên cơ
sở các hệ hỗn loạn cho phương pháp tạo ảnh cộng hưởng nhanh, đó làphương pháp tạo ảnh cộng hưởng từ tĩnh nhanh với biến đổi Fourier(SWeep Imaging with Fourier Transformation - SWIFT) đã được đềxuất trong [29]
2) Đối với vấn đề phát triển các thuật toán ước lượng không gian con cho dữ liệukhông đầy đủ, từ đó xây dựng thuật toán phân tích CP thích nghi cho ten-xơ,
áp dụng cho xử lý tín hiệu EEG, các hướng tiếp cận như sau:
◦ PETRELS là thuật toán ước lượng không gian con cho dữ liệu khôngđầy đủ có hiệu suất cao, tuy nhiên PETRELS vẫn tồn tại những nhượcđiểm cần khắc phục, vì vậy luận án tập trung nghiên cứu nhằm phát triểnthuật toán ước lượng không gian con từ thuật toán PETRELS;
◦ Trong [53], Nion và cộng sự đã đề xuất thuật toán phân tích CP thíchnghi cho ten-xơ bậc 3 phát triển từ ước lượng không gian con cho trườnghợp dữ liệu đầy đủ; các phát triển tiếp theo có thể kể đến là [48, 50].
Từ các công trình này và các thuật toán ước lượng không gian con đềxuất, luận án nghiên cứu phát triển thuật toán phân tích CP thích nghicho ten-xơ bậc 3 đối với dữ liệu không đầy đủ.
◦ Từ các mô hình xử lý tín hiệu EEG dưới cấu trúc ten-xơ [2–4, 17, 18,
45, 47, 67], luận án tìm hiểu mô hình dữ liệu và áp dụng phù hợp chocác thuật toán phân tích CP thích nghi đề xuất
Các phương pháp và giải thuật đề xuất được đánh giá, so sánh bằng mô phỏngtrên máy tính sử dụng phần mềm Matlab với dữ liệu phân tích và dữ liệu thật
6 Nội dung nghiên cứu
Luận án tập trung nghiên cứu phát triển những nội dung sau:
1) Phát triển giải thuật CS tất định trên cơ sở các hệ hỗn loạn cho MRI, nội dungnày được trình bày chi tiết trong các mục 2.2, 2.3, 2.4;
2) Đề xuất kết hợp CS tất định với phương pháp MRI hiện đại nhằm phát huylợi thế về mặt vật lý và xử lý tín hiệu, nội dung này được trình bày chi tiếttrong các mục 2.3, 2.4;
Trang 233) Phát triển các thuật toán ước lượng không gian con cho dữ liệu không đầy
đủ, nội dung này được trình bày chi tiết trong các mục 3.2, 3.3;
4) Xây dựng thuật toán phân tích CP thích nghi cho ten-xơ bậc 3 có kích thướchai chiều cố định và kích thước một chiều tăng theo thời gian, nội dung nàyđược trình bày chi tiết trong mục 3.4;
5) Áp dụng mô hình phân tích CP thích nghi cho dữ liệu EEG không đầy đủ,nội dung này được trình bày chi tiết trong mục 3.5
7 Phạm vi và giới hạn nghiên cứu
Luận án tập trung nghiên cứu các vấn đề trong giới hạn sau:
◦ Đối với CS tất định: Phát triển CS tất định trên các hệ hỗn loạn;
◦ Đối với MRI: Xử lý đối với ảnh MRI 2 chiều;
◦ Đối với phân tích CP thích nghi và ước lượng không gian con: Giới hạnnghiên cứu không gian con có số chiều thấp và thay đổi chậm;
◦ Đối với mô hình mất mát dữ liệu: Ngẫu nhiên
8 Đóng góp chính của luận án
Luận án có 2 đóng góp chính:
1) Theo hướng chủ động thu thập dữ liệu không đầy đủ để tăng tốc độ xử lý,luận án đề xuất 2 phương pháp mới về CS tất định dựa trên hệ hỗn loạn chotạo ảnh MRI truyền thống và phương pháp SWIFT;
2) Theo hướng khôi phục lại dữ liệu bị mất mát trong quá trình thu thập bằngphân tích CP, luận án đề xuất 3 thuật toán mới nhằm cải tiến thuật toánPETRELS dùng cho ước lượng không gian con của dữ liệu không đầy đủ
Từ đó, luận án đề xuất thuật toán phân tích CP thích nghi cho ten-xơ bậc 3không đầy đủ (sử dụng các thuật toán ước lượng không gian con), áp dụngcho trích xuất thông tin và khôi phục dữ liệu EEG không đầy đủ
Trang 24◦ Chương 1 (Cơ sở): Chương này trình bày cơ sở của những vấn đề nghiên cứutrong luận án, bao gồm phương pháp CS; các vấn đề toán học về hệ hỗn loạn,ước lượng không gian con cho dữ liệu không đầy đủ, phân tích CP cho ten-xơ
và hai vấn đề ứng dụng cho xử lý tín hiệu y sinh, đó là CS cho MRI và phântích CP cho EEG;
◦ Chương 2 (CS tất định cho MRI): Chương này trình bày những phát triển củaluận án trong việc đề xuất các phương pháp CS tất định trên cơ sở các hệ hỗnloạn cho tạo ảnh MRI nhanh;
◦ Chương 3 (Phân tích CP thích nghi cho EEG): Chương này trình bày những
đề xuất của luận án về các thuật toán mới cho ước lượng không gian con đốivới dữ liệu không đầy đủ và thuật toán phân tích CP thích nghi cho ten-xơbậc 3, áp dụng vào xử lý tín hiệu EEG;
◦ Phần kết luận: Phần này trình bày các kết luận của luận án và hướng pháttriển tiếp theo
Trang 25và phương pháp tạo ảnh cộng hưởng từ tĩnh nhanh, SWIFT; mục 1.6 trình bày vềcác phương pháp CS cho MRI, bao gồm phương pháp CS-MRI và phương phápCCS-MRI; mục 1.7 trình bày về việc áp dụng phân tích CP cho xử lý tín hiệu EEGvới cấu trúc ten-xơ bậc 3; mục 1.8 là kết luận của chương này.
1.2 Phương pháp lấy mẫu nén
CS là phương pháp lấy mẫu mới, cho phép tái tạo tín hiệu từ số lượng các mẫu
ít hơn so với số lượng mẫu theo tốc độ Nyquist trong các phương pháp lấy mẫutruyền thống Để thực hiện được điều này, phương pháp CS dựa trên hai nguyêntắc, đó là tính thưa thớt (sparsity ) và tính không liên kết (incoherence ) Tính thưathớt liên quan đến bản chất thưa của tín hiệu khi được biểu diễn theo một cơ sở phùhợp; tính không liên kết liên quan đến mối quan hệ giữa hệ thống lấy mẫu (theophương pháp CS) và hệ thống biểu diễn tín hiệu [13, 15, 21]
CS bao gồm hai quá trình, đó là quá trình lấy mẫu và quá trình khôi phục tínhiệu Quá trình lấy mẫu trong CS là quá trình lấy mẫu tuyến tính, được đặc trưng
Trang 26toán bởi ma trận lấy mẫu Quá trình lấy mẫu trong CS là quá trình lấy mẫu khôngđầy đủ, theo nghĩa số lượng mẫu thu được là ít hơn số lượng mẫu theo tiêu chuẩnNyquist Quá trình khôi phục tín hiệu là quá trình khôi phục không tuyến tính bằngcách giải bài toán tối ưu [13, 15, 21].
CS có thể áp dụng thành công với tín hiệu thưa hoặc tín hiệu có thể nén Haikhái niệm tín hiệu thưa và tín hiệu có thể nén sẽ được làm rõ trong mục tiếp theo
1.2.1 Tín hiệu thưa và tín hiệu có thể nén
1.2.1.1 Biểu diễn tín hiệu
Trong xử lý tín hiệu, tín hiệu thường được biểu diễn là một véc-tơ trong khônggian véc-tơ phù hợp Nếu {ψi}N1 là một cơ sở của RN, tín hiệu x ∈ RN được biểudiễn như sau:
trong đó các hệ số ci với i = 1, 2, , N là duy nhất
Nếu Ψ là ma trận kích thước N × N với các cột là ψi của cơ sở {ψi}N1 và c
là véc-tơ kích thước N với các phần tử là các hệ số ci thì x được biểu diễn là
Tín hiệu x được gọi là thưa K nếu c có tối đa K hệ số khác 0, các hệ số cònlại bằng 0 Lúc đó c được gọi là véc-tơ thưa K [6, 14]
Mô hình tín hiệu thưa chỉ quan tâm đến số lượng hệ số bằng 0 và khác 0 củavéc-tơ c, vị trí của các hệ số bằng 0 là bất kỳ, do đó mô hình tín hiệu thưa K làkhông tuyến tính Với mọi x1, x2 thưa K và các số thực a, b bất kỳ, véc-tơ dạng
ax1 + bx2 có tối đa 2K hệ số khác 0 Nói cách khác, một tổ hợp tuyến tính củahai véc-tơ thưa K bất kỳ không phải là một véc-tơ thưa K Tuy nhiên, ta có thể kết
Trang 27luận rằng tổ hợp tuyến tính của hai véc-tơ thưa K là một véc-tơ thưa tối đa là 2K,
vì tổ hợp tuyến tính này sẽ có không nhiều hơn 2K hệ số có giá trị khác 0
Chúng ta có thể tái tạo tín hiệu thưa hoặc tín hiệu có thể nén bằng cách chỉ
sử dụng các hệ số có giá trị lớn [6, 14]
1.2.2 Mô hình lấy mẫu tín hiệu trong phương pháp lấy mẫu nén
Trong phương pháp CS, tín hiệu x ∈ RN được lấy mẫu bằng cách sử dụngphép biến đổi tuyến tính, như sau:
trong đó Φ, kích thước M × N, được gọi là ma trận lấy mẫu Với mô hình này,
ma trận Φ biến đổi một véc-tơ N chiều thành một véc-tơ M chiều, M thường nhỏhơn N; y được gọi là độ đo [14]
Nếu x có biểu diễn thưa qua cơ sở Ψ, có nghĩa là x = Ψc, c là một véc-tơthưa K, đối chiếu với mô hình (1.3), ta có
Trang 28liền với bản chất của tín hiệu, vì vậy sẽ thuận tiện hơn nếu ta xét tính chất về đẳng
cự giới hạn (Restricted Isometry Property - RIP) và khái niệm độ không liên kếtliên quan đến cấu trúc của ma trận Φ và Ψ, từ đó trình bày về các cách thỏa mãnđiều kiện khôi phục tín hiệu
1.2.2.1 Tính chất đẳng cự giới hạn
Xét định nghĩa hệ số đẳng cự của một ma trận như định nghĩa 1.1
Định nghĩa 1.1 (Hệ số đẳng cự [12])
định nghĩa là giá trị nhỏ nhất thỏa mãn
(1− δK)kxk22 ≤ kΘxk22 ≤ (1 + δK)kxk22 (1.5)
Trong công thức (1.5), kxk2là `2-norm của x, được xác định bởi kxk2 = xTx1/2
Ma trận Θ có tính chất RIP bậc K hay thỏa mãn RIP bậc K nếu tồn tại δK(0 < δK < 1) thỏa mãn công thức (1.5) với tất cả các véc-tơ x thưa K [14] Lúc đó
Θcó tính chất gần như bảo toàn chiều dài hình học (chiều dài Euclide) của các tínhiệu thưa K, nói cách khác các véc-tơ thưa K sẽ không thuộc không gian không(null space ) của Θ Điều kiện RIP cũng bao hàm ý nghĩa là khi Θ thỏa mãn RIPbậc K thì các tập gồm K cột của Θ có tính chất gần trực giao [14]
Giả sử rằng, phương pháp CS lấy mẫu tín hiệu thưa K và Θ thỏa mãn RIPbậc 2K với 0 < δ2K < 1, lúc đó ta có
(1− δ2K)kx1 − x2k22 ≤ kΘx1 − Θx2k22 ≤ (1 + δ2K)kx1− x2k22, (1.6)với mọi x1, x2 thưa K Như đã trình bày ở phần trước, khi x1 và x2 thưa K thì(x1 − x2)thưa 2K Biểu thức (1.6) sẽ đảm bảo khôi phục các tín hiệu thưa K [14].Trong phương pháp CS thì M < N, thậm chí M N, do đó ma trận Θ (khikhông thỏa mãn tính chất RIP) có không gian không khác rỗng, tồn tại vô số giátrị x ∈ RN sao cho Θx = 0 Như vậy, đối với một giá trị x0 ∈ RN, có vô số giátrị x ∈ RN sao cho Θx = Θx0 Vì vậy, ma trận Θ phải thỏa mãn tính chất nào đó
để đối với mọi x, x0
∈ RN, x 6= x0 thì ta có Θx 6= Θx0 Đối chiếu với tính chất
Trang 29RIP ở công thức (1.6), khi Θ thỏa mãn RIP bậc 2K thì sẽ đảm bảo cho khôi phụctín hiệu thưa K [12, 14].
1.2.2.2 Sự không liên kết
Trong phương pháp CS, để khôi phục tín hiệu thưa K trung thực thì Θ phảithỏa mãn RIP bậc 2K Tuy nhiên, việc tính toán để xác định điều kiện này là kháphức tạp Một cách thỏa mãn RIP là sự không liên kết [14]
Giả sử Φ, là cơ sở trực giao của RN, được sử dụng cho việc lấy mẫu tín hiệu
x và Ψ là cơ sở trực giao của RN, được sử dụng để biểu diễn tín hiệu x Độ liênkết giữa cơ sở lấy mẫu và cơ sở biểu diễn như trong định nghĩa 1.2
Định nghĩa 1.2 (Độ liên kết giữa cơ sở lấy mẫu và cơ sở biểu diễn [14])
1,√
N
.Trong phương pháp CS, Ψ thường gắn liền với bản chất của tín hiệu, vì vậy để
có thể khôi phục thành công tín hiệu, người ta thường thiết kế Φ sao cho độ liênkết nhỏ [14]
Trong [14], các tác giả cũng chỉ ra rằng ma trận Φ với các phần tử ngẫu nhiên
có độ liên kết nhỏ với bất kỳ cơ sở làm thưa Ψ nào
1.2.3 Khôi phục tín hiệu trong phương pháp lấy mẫu nén
Bài toán khôi phục tín hiệu trong phương pháp CS được tóm tắt là: Từ véc-tơ
độ đo y và các ma trận Φ, Ψ, ta phải khôi phục c (tương đương với việc khôi phục
xvì Ψ đã xác định) một cách chính xác hoặc xấp xỉ [23]
Bài toán khôi phục tín hiệu x có thể dựa trên chuẩn `0-norm hoặc `1-norm
`0-norm của véc-tơ x, ký hiệu là kxk0, được xác định bằng số lượng cácphần tử khác 0 của x Ước lượng x theo chuẩn `0-norm là xác định ˆx thỏa mãnphương trình
ˆ
x = arg min
Trang 30`1-norm của véc-tơ x, ký hiệu là kxk1, được xác định bởi kxk1 =
N
X
i=1
|xi|.Ước lượng x theo chuẩn `1-norm là xác định ˆx thỏa mãn phương trình
Trong phương pháp CS, người ta thường sử dụng `1-norm để khôi phục tínhiệu, vì hàm `1-norm là hàm lồi (convex ) Tính chất lồi của `1-norm dẫn đến việckhôi phục tín hiệu theo `1-norm được quy về giải bài toán tuyến tính, với độ phứctạp bậc đa thức của chiều dài tín hiệu [23, 26] Các chuẩn `0-norm và `2-normkhông được sử dụng cho khôi phục tín hiệu bởi vì:
1) `2-norm đo năng lượng của tín hiệu mà không liên quan đến tính chất thưacủa tín hiệu Vì vậy, sử dụng chuẩn `2-norm để khôi phục tín hiệu sẽ cho kếtquả không chính xác;
2) Khi sử dụng `0-norm như công thức (1.8), vì x thưa K nên việc giải (1.8) sẽcho phép khôi phục x Tuy nhiên độ phức tạp thuật toán cao vì phải khảo sáttất cả các tổ hợp K vị trí khác 0 từ N vị trí
1.3 Một số tính chất của hệ hỗn loạn
Những hệ hỗn loạn khác nhau như logistic, tent, Chebyshev, v.v đều có nhữngtính chất có thể sử dụng thay thế cho các biến ngẫu nhiên nhằm tạo nên quá trìnhhoàn toàn tất định, tiết kiệm bộ nhớ và thuật toán so với thao tác trên các biến ngẫunhiên Luận án tập trung khai thác các tính chất có thể sử dụng của hệ logistic
1.3.1 Hệ logistic
Hệ logistic là hệ hỗn loạn sinh ra bởi công thức
hL(n + 1) = αhL(n)(1− hL(n)), (1.11)trong đó α là tham số điều khiển, n là chỉ số, nhận các giá trị từ 0 đến L − 1 đốivới một dãy gồm L phần tử, hL(0)là giá trị khởi tạo Thay đổi tham số α và giá trịkhởi tạo hL(0) sẽ dẫn đến việc hình thành các dãy hỗn loạn khác nhau [64]
Trang 31Khi α nhận những giá trị khác nhau, hệ logistic tương ứng sẽ có những tínhchất khác nhau [64] Hệ logistic với α = 4 có những tính chất đặc biệt, như sau:
◦ Với bất kỳ giá trị khởi tạo nào, công thức (1.11) ánh xạ các giá trị trongkhoảng (0, 1) về các giá trị trong khoảng (0, 1); một cách diễn đạt khác,các giá trị của dãy thuộc khoảng (0, 1) Hình 1.1 minh họa tính chất này
◦ Hàm phân bố xác suất có tính chất đối xứng Hàm phân bố xác suất của dãytrong trường hợp α = 4 được xác định là
Việc xây dựng các giá trị của dãy logistic là tất định Từ các giá trị của dãy logistic,
ta có thể thực hiện các biến đổi để có được các dãy số có tính chất mong muốn
1.3.2 Tạo dãy tất định có tính chất của phân bố Gauss
Chúng ta có thể tạo ra dãy tất định có tính chất của dãy ngẫu nhiên phân bốGauss bằng các công thức trực tiếp hoặc biến đổi từ các dãy tất định khác như dãytent, dãy Chebyshev Dãy có tính chất của biến ngẫu nhiên Gauss, GL(n), thu đượcbằng cách biến đổi dãy logistic, như sau: [64, tr 232]
GL(n) = ln[ hL(n)
Với công thức biến đổi (1.13), chúng ta sẽ có được dãy GL(n)có phân bố Gauss,trung bình 0 và phương sai π [64, tr 232] Hình 1.2 minh họa tính chất này
Trang 32(b) Tần suất thống kê của G L (n) tương ứng
và phân bố Gauss khớp với G L (n)Hình 1.2 Tần suất thống kê (histogram ) của dãy logistic trước và sau khi chuyển đổi
để có tính chất của biến ngẫu nhiên Gauss
Dãy logistic bao gồm 1000 phần tử với α = 4 và GL(0) = 0.37 Tần suất
thống kê (histogram ) của dãy logistic như hình 1.2(a) Hình 1.2(b) là tần suất
thống kê của dãy tương ứng GL(n) sau khi đã chuyển đổi theo công thức (1.13),
đường màu đỏ là hàm mật độ của phân bố Gauss lý thuyết khớp với dãy GL(n),
giá trị cụ thể của hàm này là: Giá trị trung bình µ = −0.003507 và phương sai
σ = 3.12988 Khi tạo dãy logistic với độ dài càng lớn, giá trị σ càng tiến đến π
1.3.3 Tạo dãy tất định có tính chất của phân bố Bernoulli hoặc phân bố đều
Theo lý thuyết, từ dãy hỗn loạn logistic, Chebyshev, ta có thể xây dựng dãy
nhị phân, có tính chất thống kê như biến ngẫu nhiên Bernoulli [36, 60]
Dãy logistic như đã định nghĩa trong công thức (1.11) và hàm phân bố trong
công thức (1.12) có tính chất đối xứng chẵn (even-symmetric ), cụ thể là
Trang 33Theo [60, Định lý], dãy B(n) là dãy có phân bố Bernoulli Trong [60], cáctác giả cũng chỉ ra rằng, lúc đó với bất kỳ q > 0, b = (b1, b2, , bq), bi ∈ {0, 1}
1.4 Bài toán phân tích CP thích nghi cho ten-xơ bậc 3
1.4.1 Ước lượng không gian con cho dữ liệu không đầy đủ
1.4.1.1 Bài toán ước lượng không gian con cho dữ liệu không đầy đủ
Giả sử rằng, tại thời điểm τ, dữ liệu x ∈ RM được tạo thành theo mô hình [16]
trong đó các cột của ma trận U(τ) ∈ RM ×r(τ )sinh ra không gian con với số chiềuthấp, n(τ) là nhiễu Gauss Giá trị r(τ) được giả thiết là không biết chính xác tạithời điểm τ, thay đổi chậm theo thời gian và luôn nhỏ hơn một giá trị r
Trong trường hợp quan sát không đầy đủ, thay vì x(τ), chúng ta chỉ có y(τ),được xác định như sau:
trong đó p(τ) = [p1(τ ), p2(τ ), , pM(τ )]T là véc-tơ quan sát, bao gồm các phần
tử có giá trị 1 và 0: pi(τ ) = 1nếu phần tử thứ i của x(τ) được quan sát và pi(τ ) = 0trong trường hợp ngược lại; P(τ) là ma trận quan sát, dạng ma trận đường chéo,được tạo thành từ p(τ) nhằm mục đích tạo thuận lợi trong thực hiện các biến đổitoán học: P(τ) = diag {p(τ)}; ∗ là ký hiệu của tích cặp: Với các véc-tơ p ∈ RM
và x ∈ RM, y = p ∗ x ⇐⇒ yi = pixi với i = 1, 2, 3, , M
Với đầu vào là dãy các quan sát không đầy đủ, {y(τ), pτ)}t
τ =1, thuật toán ướclượng không gian con cho đầu ra tại thời điểm t: Thứ nhất là ma trận W(t), kíchthước M × r, việc xác định ma trận này mang lại một không gian con có số chiềuthấp (không gian cột của W(t)); thứ hai là các hệ số a(t) tại thời điểm t tương ứng
Trang 341.4.1.2 Thuật toán PETRELS
Thuật toán PETRELS là thuật toán ước lượng song song sử dụng đệ quy bìnhphương tối thiểu có hiệu suất cao [16] Thuật toán PETRELS hướng đến việc xácđịnh W(t) là nghiệm của phương trình
Bước 1: Ước lượng a(t) và x(t) dựa vào không gian con W(t − 1)
PETRELS sử dụng W(t − 1), là không gian con đã được xác định tại thờiđiểm (t − 1), để lần đầu ước lượng a(t) như sau:
a(t) = min
a∈R rkP(t) (y(t) − W(t − 1)a)k22
= WT(t− 1)P(t)W(t − 1)†
WT(t− 1)y(t), (1.22)trong đó (·)† là giả nghịch đảo của ma trận (·)
Tiếp theo, x(t) được ước lượng theo công thức
Bước 2: Ước lượng không gian con (W(τ)) theo hàng
Trong bước này, a(t) và x(t) được sử dụng để ước lượng W(t), xác địnhW(t)là nghiệm của phương trình
Trang 35W(t) được ước lượng theo từng hàng,
m(t)qua R†
m(t− 1) Từ công thức (1.27), ta có
Rm(t) = Rm(t− 1) + pm(t)a(t)aT(t) (1.31)Thuật toán PETRELS tính toán R†
Bước 3: Cập nhật a(t) dựa vào không gian con W(t) đã ước lượng trong bước 2.
Thay W(t−1) bởi không gian vừa ước lượng được W(t) vào công thức (1.22)
để cập nhật giá trị cho a(t)
Thuật toán PETRELS được tóm tắt trong thuật toán 1.1, chi tiết thuật toánPETRELS được trình bày trong phụ lục A
Trang 36Thuật toán 1.1:Thuật toán PETRELS [16]
Đầu vào:
{(y(τ), Pτ)}tτ =1, yτ ∈ RM, Pτ ∈ RM ×M Dữ liệu và ma trận quan sát
Đầu ra:
Khởi tạo: W(0) ngẫu nhiên; R†
1.4.1.3 Thuật toán PETRELS đơn giản
Trong [16], các tác giả cũng đề xuất một cải tiến của thuật toán PETRELS,gọi là PETRELS đơn giản (Simplified PETRELS, viết tắt là S-PETRELS)
Thuật toán S-PETRELS bao gồm 3 bước, trong đó bước 1 và bước 3 đượcthực hiện hoàn toàn giống với thuật toán PETRELS Tại bước 2, thuật toán S-PETRELS thực hiện đơn giản hơn: Ma trận W(τ) được cập nhật theo công thứcW(τ ) = W(τ − 1) + P(τ) (x(τ) − W(τ − 1)a(τ)) aT(τ )R†(τ ), (1.35)tức là Rm(τ )được tính giống nhau cho tất cả các hàng m,
Rm(τ ) = R(τ ) = λR(τ − 1) + a(τ)aT(τ ) (1.36)
Trang 371.4.2 Phân tích CP cho ten-xơ bậc 3
Một ten-xơ bậc N là một mảng N chiều, mỗi phần tử của ten-xơ được xácđịnh bởi N chỉ số tương ứng Ví dụ, ten-xơ bậc 3, X ∈ RI×J×K, bao gồm các phần
tử xijk với 1 ≤ i ≤ I, 1 ≤ j ≤ J, 1 ≤ k ≤ K Sau đây là một số khái niệm liênquan và định nghĩa phân tích CP của ten-xơ bậc 3 [37, 53]
◦ slice hay lát cắt của ten-xơ bậc 3 là thành phần 2 chiều của một ten-xơ, đượcxác định khi cho một chiều cố định và lấy tất cả các thành phần của 2 chiềucòn lại Ví dụ với X ∈ RI×J×K, các slice của X là Xi::, X:j:, X::k (ký hiệu
Xi::là ma trận, trích xuất từ ten-xơ X bằng cách cố định chiều thứ nhất i, lấytất cả các giá trị của chỉ số chiều thứ hai và thứ ba: 1 ≤ j ≤ J, 1 ≤ k ≤ K)
◦ Ten-xơ hạng 1 (rank-one tensor ): Một ten-xơ bậc 3, X ∈ RI×J×K, được gọi
là ten-xơ hạng 1 nếu X có thể được viết dưới dạng tích ngoài của 3 véc-tơ,
trong đó a ∈ RI×1, b ∈ RJ×1, c ∈ RK×1; có nghĩa là xijk = aibjck
◦ Tích Kronecker của các ma trận A ∈ RI×J và B ∈ RK×L, ký hiệu A ⊗ B,
là ma trận kích thước IK × JL và được xác định bởi
X(3) ∈ RKJ×I như trong [53], chi tiết như sau:
Trang 38Định nghĩa 1.3 (Phân tích phần tử song song của ten-xơ [37])
dưới dạng tổng của số lượng ít nhất các ten-xơ hạng 1, như sau:
B∈ RJ×R,C ∈ RK×R; R được gọi là hạng của ten-xơ.
Phân tích CP có thể được biểu diễn dưới dạng ma trận theo những cách khácnhau, tùy thuộc vào cách biểu diễn ma trận cho ten-xơ
Định nghĩa 1.4 (Phân tích CP dưới dạng ma trận [53])
1.4.3 Thuật toán phân tích CP thích nghi cho ten-xơ bậc 3
Mô hình bài toán phân tích CP cho ten-xơ bậc 3 được minh họa trong hình 1.3.Ten-xơ bậc 3, X ∈ RI×J(t)×K, có kích thước hai chiều (I và K) cố định và kíchthước chiều J(t) tăng theo thời gian Tại các điểm thời gian, các slice mới đượcthêm vào ten-xơ theo chiều J(t) (tức là J(t) = J(t − 1) + 1) Yêu cầu đặt ra làphân tích CP cho ten-xơ
Để phân tích CP cho ten-xơ X(t), chúng ta có thể sử dụng các phương phápphân tích chế độ khối hoặc chế độ thích nghi Các phương pháp phân tích chế độkhối đòi hỏi phải có tất cả dữ liệu của ten-xơ; trong lúc đó các thuật toán thích nghichỉ yêu cầu các ma trận thành phần tại thời điểm (t − 1) và slice mới thêm vào tạithời điểm t
Luận án định hướng phát triển các thuật toán CP thích nghi cho ten-xơ bậc 3dựa trên các thuật toán ước lượng không gian con cho dữ liệu không đầy đủ
Trang 39t = 2
t = 1 K
I
J(t)
t = 2
t = 1 K
I
J(t)
Ten-xơ bậc 3, X(t)
Các ma trận thành phần:
A(t), B(t), C(t)
Phân tích phần tử song song
Xử lý khối: Đầu vào là tất
cả các quan sát từ thời điểm
τ = 0 đến τ = t
Xử lý thích nghi: Đầu vào
là A(t − 1), B(t − 1), C(t − 1), quan sát tại thời điểm τ = t
Ma trận hóa ten-xơ
Xử lý thích nghi Ước lượng không gian con
Dữ liệu không đầy đủ
Gọi các ma trận A = [a1, , aR] ∈ RI×R, B = [b1, , bR] ∈ RJ×R,
C = [c1, , cR] ∈ RK×R là các ma trận thành phần trong phân tích CP củaten-xơ X, phân tích CP của X có thể được viết dưới dạng ma trận như sau:
trong đó X(1)là biểu diễn ma trận của ten-xơ X theo công thức (1.40)
Tại thời điểm (t − 1), (t > 1), phân tích CP của X(t − 1) dạng ma trận là
X(1)(t− 1) = W(t − 1)BT(t− 1), (1.44)trong đó W(t − 1) = A(t − 1) C(t − 1)
Trang 40Ten-xơ X(t) tại thời điểm t thu được từ ten-xơ X(t − 1) bằng cách thêm slicemới theo chiều J(t) Lúc này, phân tích CP trở thành
Thuật toán phân tích CP thích nghi thực hiện ước lượng các ma trận thànhphần tại thời điểm t ( tức là A(t), B(t) và C(t)) dựa vào các ma trận thành phầntại thời điểm (t − 1) (tức là A(t − 1), B(t − 1) và C(t − 1)) và slice mới tại thờiđiểm t
Khi biểu diễn ten-xơ dưới dạng ma trận, các slice mới được biểu diễn thànhmột véc-tơ và trở thành một cột của X(1)(t), cụ thể là
X(1)(t) = X(1)(t− 1) x(t)
trong đó x(t) là biểu diễn véc-tơ của slice tại thời điểm t
Phân tích CP dạng ma trận tại thời điểm t và (t − 1) được viết lại như sau:
Thuật toán phân tích CP thích nghi được tóm tắt trong thuật toán 1.2, chi tiếtthuật toán này được trình bày trong phụ lục B
Nếu x(t) thuộc một không gian con, có nghĩa là x(t) thuộc không gian sinhbởi các cột của ma trận W(t), bước 1 và bước 2 trong thuật toán 1.2 chính là ướclượng không gian con Sau thi thực hiện bước 1 và bước 2, thuật toán có đượckhông gian con là không gian cột của ma trận W(t)
... slicemới theo chiều J(t) Lúc n? ?y, phân tích CP trở thànhThuật tốn phân tích CP thích nghi thực ước lượng ma trận thànhphần thời điểm t ( tức A(t), B(t) C(t)) dựa vào ma trận thành phầntại thời... X(1)(t− 1) x(t)
trong x(t) biểu diễn véc-tơ slice thời điểm t
Phân tích CP dạng ma trận thời điểm t (t − 1) viết lại sau:
Thuật tốn phân tích CP thích nghi tóm tắt thuật... chi tiếtthuật tốn trình b? ?y phụ lục B
Nếu x(t) thuộc khơng gian con, có nghĩa x(t) thuộc không gian sinhbởi cột ma trận W(t), bước bước thuật tốn 1.2 ướclượng không gian Sau thi thực bước