1. Trang chủ
  2. » Luận Văn - Báo Cáo

Hệ thống xử lý tín hiệu điện não tự động phát hiện gai động kinh

155 27 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 155
Dung lượng 4,89 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Phương pháp lựa chọn đặc trưng mới cho hệ thống đa bước phát hiện gai động kinh đa kênh dựa trên phân tích ten-xơ.. nhẹ, tức là xuất hiện gai động kinh trong tín hiệu điện não đồ, luận á

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỊ ANH ĐÀO

HỆ THỐNG XỬ LÝ TÍN HIỆU ĐIỆN NÃO

TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KINH

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ, TRUYỀN THÔNG

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỊ ANH ĐÀO

HỆ THỐNG XỬ LÝ TÍN HIỆU ĐIỆN NÃO

TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KINH

Chuyên ngành: Kỹ thuật Viễn thông

Mã số: 9510302.02

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ, TRUYỀN THÔNG

NGƯỜI HƯỚNG DẪN KHOA HỌC:PGS TS NGUYỄN LINH TRUNG

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan luận án do tôi thực hiện Những kết quả từ các công trình củacác tác giả khác mà tôi sử dụng trong luận án đều được trích dẫn rõ ràng, cụ thể Cáckết quả tính toán, mô phỏng là trung thực

Nếu có gì sai trái, tôi xin hoàn toàn chịu trách nhiệm

Hà Nội, ngày 5 tháng 11 năm 2019

Nghiên cứu sinh

Nguyễn Thị Anh Đào

Trang 4

LỜI CẢM ƠN

Trước tiên, tôi xin bày tỏ sự trân trọng, lòng biết ơn sâu sắc đến thầy giáo, PGS

TS Nguyễn Linh Trung, người đã tận tình hướng dẫn và định hướng cho tôi thực hiệncông trình nghiên cứu này Trong quá trình thực hiện đề tài, thầy là người luôn độngviên, hỗ trợ và tận tình giúp đỡ những lúc tôi cảm thấy khó khăn và giúp tôi vượt quatrở ngại

Tôi xin gửi lời cảm ơn chân thành tới GS TS Karim Abed-Meraim, GS TSBoualem Boashash và PGS TS Trần Đức Tân, Ths Lê Trung Thành, TS NguyễnViệt Dũng, Ths Nguyễn Văn Lý, TS Lê Vũ Hà, Ths Đinh Văn Việt, Ths NguyễnThế Hoàng Anh, Ths Trương Minh Chính, TS Trần Thị Thúy Quỳnh những người

đã góp phần hỗ trợ tôi về chuyên môn trong quá trình làm luận án Tôi xin bày tỏ lòngbiết ơn sâu sắc đến Bác sĩ, TS Hoàng Cẩm Tú, người đã tận tâm hỗ trợ tôi hoàn thành

bộ dữ liệu sử dụng trong luận án

Tôi xin trân trọng cảm ơn Ban Giám hiệu Nhà trường, Khoa Điện tử-Viễn thông,phòng Đào tạo Trường Đại học Công nghệ, Đại học Quốc Gia Hà Nội, đã giảng dạy,hướng dẫn và tạo điều kiện giúp đỡ tôi; đặc biệt là sự quan tâm, động viên của TS.Nguyễn Hồng Thịnh, người đã thực sự quan tâm và đối xử với tôi như một thành viêncủa Trường Đại học Công nghệ

Tôi xin bày tỏ sự trân trọng, lòng biết ơn sâu sắc tới Đảng ủy, Ban Giám hiệuNhà trường, Khoa Điện tử viễn thông, Phòng tổ chức cán bộ Trường Đại học Kỹ thuậtHậu cần Công an Nhân dân; đặc biệt là sự quan tâm, tạo điều kiện của PGS TS.Nguyễn Đăng Tiến, TS Nguyễn Văn Căn, TS Đặng Việt Xô, TS Đặng Văn Tuyên,

TS Phạm Thị Thúy Hằng và Ths Phạm Xuân Cảnh đã hết sức hỗ trợ, tạo mọi điềukiện thuận lợi cho tôi trong quá trình thực hiện đề tài

Tôi xin cảm ơn những người thân trong gia đình, đặc biệt là chồng tôi đã hỗ trợtôi rất nhiều cả về vật chất và tinh thần để tôi có thể học tập đạt kết quả tốt và thựchiện thành công luận án này

Trang 5

Luận án này được hỗ trợ bởi:

- Đề tài nghiên cứu khoa học mã số 102.02-2015.32 và đề tài mã số 2019.14, Quỹ Phát triển khoa học và công nghệ Quốc gia (National Foundation forScience and Technology Development - NAFOSTED)

102.04 Dữ liệu điện não đồ sử dụng trong luận án được sử dụng từ kết quả của đề tàinghiên cứu khoa học mã số QG.10.40, Đại học Quốc Gia Hà Nội

Tôi xin chân thành cảm ơn!

Hà Nội, ngày 5 tháng 11 năm 2019

Nguyễn Thị Anh Đào

Trang 6

MỤC LỤC

Trang phụ bìa i

Lời cam đoan ii

Lời cảm ơn iii

Mục lục 1

Danh mục ký hiệu và chữ viết tắt 4

Danh mục các bảng 9

Danh mục hình vẽ 11

MỞ ĐẦU 15

CHƯƠNG 1 CƠ SỞ VÀ TỔNG QUAN 26

1.1 Giới thiệu 26

1.2 Điện não đồ 26

1.3 Động kinh 27

1.4 Chuẩn đo quốc tế 10-20 29

1.5 Cơ sở dữ liệu EEG sử dụng trong luận án 30

1.5.1 Đo đạc và thu thập dữ liệu 30

1.5.2 Tiền xử lý dữ liệu EEG 32

1.5.3 Cơ sở dữ liệu EEG 33

1.6 Ma trận đánh giá 33

1.7 Đường cong ROC 36

1.8 Các khái niệm cơ bản về ten-xơ 38

1.9 Phân tích ten-xơ 42

1.9.1 Phân tích CP 42

1.9.2 Phân tích Tucker 43

1.10.Xấp xỉ hạng thấp đa tuyến tính cho các ten-xơ 44

1.10.1 Phân tích CP 45

1.10.2 Phân tích Tucker 45

1.10.3 Phân tích ten-xơ với ràng buộc không âm 46

1.10.4 Phân tích CP với ràng buộc không âm 48

1.10.5 Phân tích Tucker với ràng buộc không âm 48

Trang 7

1.11.Kết luận chương 1 49

CHƯƠNG 2 HỆ THỐNG ĐA BƯỚC TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KINH ĐƠN KÊNH 51

2.1 Giới thiệu 51

2.2 Hệ thống đa bước tự động phát hiện gai động kinh đơn kênh 52

2.2.1 Tiền xử lý 53

2.2.2 Trích xuất đặc trưng 57

2.2.3 Phân loại 59

2.2.4 Hệ chuyên gia 61

2.3 Đường cong ROC tổng hợp cho hệ thống đa bước 62

2.3.1 Sự phụ thuộc củaSEN vàp1 SPEqvào ngưỡng quyết định 62

2.3.2 Ước lượng đường cong ROC tổng hợp cho hệ thống đa bước 66

2.4 Mô phỏng và thảo luận 70

2.4.1 Dữ liệu 70

2.4.2 Ma trận đánh giá 70

2.4.3 Kết quả mô phỏng và thảo luận 73

2.5 Kết luận chương 2 77

CHƯƠNG 3 HỆ THỐNG ĐA BƯỚC TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KINH ĐA KÊNH DỰA TRÊN PHÂN TÍCH TEN-XƠ 80

3.1 Giới thiệu 80

3.2 Phương pháp xấp xỉ hạng thấp đa tuyến tính đồng thời mở rộng cho các ten-xơ (SMLRAT) 81

3.2.1 Mối liên hệ giữa SLRAM và phân tích ten-xơ 81

3.2.2 Xấp xỉ hạng thấp đa tuyến tính đồng thời mở rộng cho các ten-xơ 82 3.3 Hệ thống đa bước phát hiện gai động kinh đa kênh dựa trên phân tích ten-xơ 85

3.3.1 Biểu diễn dữ liệu 86

3.3.2 Trích xuất đặc trưng 87

3.3.3 Lựa chọn đặc trưng 91

3.3.4 Phân loại 92

3.4 Kết quả mô phỏng và thảo luận 92

3.4.1 Biểu diễn dữ liệu 93

Trang 8

3.4.2 Trích xuất đặc trưng 93

3.4.3 Lựa chọn đặc trưng 96

3.4.4 Phân loại 98

3.5 Phương pháp lựa chọn đặc trưng mới cho hệ thống đa bước phát hiện gai động kinh đa kênh dựa trên phân tích ten-xơ 119

3.5.1 Phương pháp 119

3.5.2 Mô phỏng và đánh giá 122

3.6 Kết nối với các nghiên cứu liên quan 123

3.6.1 Kết nối với phân tích thành phần đồng thời 125

3.6.2 Kết nối với phân tích không gian con đồng thời 125

3.6.3 Kết nối với phân tích thành phần chính đa tuyến tính 126

3.7 Kết luận chương 3 127

KẾT LUẬN VÀ KIẾN NGHỊ 129

DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 132

TÀI LIỆU THAM KHẢO 134

PHỤ LỤC A CHỨNG MINH ĐỊNH LÝ 3.1 146

PHỤ LỤC B CHỨNG MINH HỆ QUẢ 3 147

PHỤ LỤC C CHỨNG MINH HỆ QUẢ 5 148

Trang 9

DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT

hoặc chữ hoa in hoa, ví dụ a, N

Đại lượng vô hướng

4 chữ thường in đậm, ví dụ a Đại lượng véc-tơ, các thành phần của véc-tơ a

11 xX, Yy Tích nội của ten-xơ X và ten-xơ Y

12 pq # Giả nghịch đảo của ma trận pq

16 xA, By Tích nội của ten-xơ A và ten-xơ B có cùng kích

thước

17 A ` B Xếp chồng của ten-xơ A với ten-xơ B

18 pkq Mode (chế độ) của ma trận hoặc ten-xơ

Trang 10

19 Apkqcủa ten-xơ A bậc n Mode-k (chế độ k) của ten-xơ A, k ¤ n

20 A  k U Phép nhân k-mode của ten-xơ A với ma trận U

21 xi1i2 iN Phần tử của ten-xơ X P R I 1 I 2 I N

30 γ pf i q Điểm Fisher của đặc trưng fi

Trang 11

Parallel Factor Analysis

Phân tích phần tử song song

3 CSA Concurrent Subspaces Analysis Phân tích không gian con đồng

thời

4 CWT Continuous Wavelet Transform Biến đổi sóng con liên tục

5 EEG Electroencephalogram Điện não đồ

6 FHWA First Half Wave Amplitude Biên độ cạnh trước

7 FHWD First Half Wave Duration Thời gian tồn tại cạnh trước

8 FHWS First Half Wave Slope Độ dốc cạnh trước

9 GLRAM Generalized Low Rank

Approximations Matrix

Xấp xỉ hạng thấp mở rộng của các

ma trận

10 GSLRAT Generalized Simultaneous

Multilinear LRA of Tensors

Xấp xỉ hạng thấp đa tuyến tính mở rộng cho các ten-xơ đồng thời

11 HODA Higher Order Discriminant

Analysis

Phân tích phân biệt bậc cao

12 HOOI Higher-order Orthogonal

Iteration

Lặp trực giao bậc cao

13 HOSVD Higher-Order Singular Value

Decomposition

Phân tích giá trị riêng bậc cao

14 ILFS Infinite Latent Feature Selection Lựa chọn đặc trưng ẩn không giới

hạn

15 KMC K-means Clustering Phân cụm K-Means

16 LLCFS Feature Selection For Local

18 LRA Low Rank Approximation Xấp xỉ hạng thấp

19 LRAT Low-rank Approximation Of

Tensor

Xấp xỉ hạng thấp cho các ten-xơ

Trang 12

20 LRMA Low-rank Matrix

22 MR-NTD Manifold Regularization

Nonnegative Tucker Decomposition

Phân tích Tucker chính tắc với ràng buộc không âm

23 NCP Nonnegative CP Decomposition Phân tích CP với ràng buộc không

27 PCA Principal Component Analysis Phân tích các thành phần chính

28 PNES Psychogenic Non-Epileptic

Seizure

Xung không động kinh tâm lý

29 ROC Receiver Operating

31 SHWA Second Half Wave Amplitude Biên độ cạnh sau

32 SHWD Second Half Wave Duration Thời gian tồn tại cạnh sau

33 SHWS Second Half Wave Slope Độ dốc cạnh sau

34 SLMRA Simultaneous Low Multilinear

Rank Approximation

Xấp xỉ hạng thấp đa tuyến tính đồng thời

35 SLRAM Simultaneous Low Rank

Approximation Of Multiple Matrices

Xấp xỉ hạng thấp cho các ma trận đồng thời

36 SLRAT Simultaneous Low Rank

Approximation Of Multiple Tensors

Xấp xỉ hạng thấp cho các ten-xơ đồng thời

37 SM-PCA Sparse Multilinear Principal

Component Analysis

Phân tích thành phần chính đa tuyến tính thưa

Trang 13

38 SVD Singular Value Decomposition Phân tích giá trị riêng

39 SVM Support Vector Machine Máy vectơ hỗ trợ

40 UDFS Unsupervised Discriminative

Feature Selection

Lựa chọn đặc trưng phân biệt không giám sát

41 UM-PCA Unconstrained Multilinear

Principal Component Analysis

Phân tích các thành phần chính đa tuyến tính không ràng buộc

Trang 14

DANH MỤC CÁC BẢNG

Bảng 1.1: Tập dữ liệu EEG 34

Bảng 1.2: Kết quả xét nghiệm và tình trạng của bệnh 34

Bảng 2.1: Tập dữ liệu huấn luyện 70

Bảng 2.2: Tập dữ liệu kiểm tra 71

Bảng 2.3: Kết quả phát hiện gai động kinh của hệ thống theo từng bước 73

Bảng 2.4: Tỉ lệ dương tính thật (SEN) và tỉ lệ âm tính thật (SPE) 73

Bảng 2.5: Tỉ lệ dương tính thật trung bình (SENtb) theo các phương pháp 74 Bảng 2.6: Kết quả của hệ thống sau bộ phân loại ANN khi chưa sử dụng hệ chuyên gia 75

Bảng 2.7: Kết quả ước lượng ROC tổng hợp của hệ thống đa bước 77

Bảng 3.1: Tập dữ liệu EEG 94

Bảng 3.2: Hiệu suất phát hiện gai động kinh của mô hình CP-KNN sử dụng xác thực chéo LOOC 102

Bảng 3.3: Hiệu suất phát hiện gai động kinh của mô hình NCP-KNN sử dụng xác thực chéo LOOC 103

Bảng 3.4: Hiệu suất phát hiện gai động kinh của mô hình TD-KNN sử dụng xác thực chéo LOOC 103

Bảng 3.5: Hiệu suất phát hiện gai động kinh của mô hình NTD-KNN sử dụng xác thực chéo LOOC 104

Bảng 3.6: Hiệu suất phát hiện gai động kinh của mô hình CP-NB sử dụng xác thực chéo LOOC 105

Bảng 3.7: Hiệu suất phát hiện gai động kinh của mô hình NCP-NB sử dụng xác thực chéo LOOC 105

Bảng 3.8: Hiệu suất phát hiện gai động kinh của mô hình TD-NB sử dụng xác thực chéo LOOC 106

Bảng 3.9: Hiệu suất phát hiện gai động kinh của mô hình NTD-NB sử dụng xác thực chéo LOOC 106

Trang 15

Bảng 3.10:Hiệu suất phát hiện gai động kinh của mô hình CP-DT sử dụngxác thực chéo LOOC 107Bảng 3.11:Hiệu suất phát hiện gai động kinh của mô hình NCP-DT sử dụngxác thực chéo LOOC 108Bảng 3.12:Hiệu suất phát hiện gai động kinh của mô hình TD-DT sử dụngxác thực chéo LOOC 108Bảng 3.13:Hiệu suất phát hiện gai động kinh của mô hình NTD-DT sửdụng xác thực chéo LOOC 109Bảng 3.14:Hiệu suất phát hiện gai động kinh của mô hình NTD-SVM dựatrên phương pháp đề xuất bởi Phan-Cichocki 110Bảng 3.15:Hiệu suất phát hiện gai động kinh của mô hình NTD-KNN dựatrên phương pháp được đề xuất bởi Phan-Cichocki 111Bảng 3.16:Hiệu suất phát hiện gai động kinh của mô hình NTD-NB dựatrên phương pháp được đề xuất bởi Phan-Cichocki 111Bảng 3.17:Hiệu suất phát hiện gai động kinh của mô hình NTD-DT dựatrên phương pháp được đề xuất bởi Phan-Cichocki 112Bảng 3.18:Hiệu suất phát hiện gai động kinh của mô hình NTD-SVM sửdụng xác thực chéo LOOCV 115Bảng 3.19:Hiệu suất phát hiện gai động kinh sử dụng các mô hình học máykhác nhau 116Bảng 3.20:Xếp chồng các ten-xơ, sử dụng các bộ phân loại SVM, KNN,

NB và DT với500đặc trưng có ý nghĩa nhất 117

Trang 16

DANH MỤC HÌNH VẼ

Hình 1.1 Dữ liệu điện não đồ một bệnh nhân trong tập dữ liệu luận án sử

dụng 27

Hình 1.2 Điện não đồ có chứa gai động kinh [114] 28

Hình 1.3 Hình thái của một số gai động kinh [114] 28

Hình 1.4 Vị trí các điện cực đo điện não theo chuẩn quốc tế10  20[73] 29

Hình 1.5 Mặt bên của hộp sọ biểu diễn các điểm đo từ điểm hốc mũi (nasion) đến mấu ngoài xương chẩm (inion) [73] 29

Hình 1.6 Mặt phía trước của hộp sọ theo chuẩn đo quốc tế 10  20[73] 30

Hình 1.7 Các điện cực [117] 31

Hình 1.8 Vị trí các điện cực (22, 23) để đo nhiễu mắt [117] 31

Hình 1.9 Vị trí các điện cực (30, 31) để đo nhiễu cơ [117] 31

Hình 1.10 Đường cong ROC 37

Hình 1.11 Cột, dòng và ống của các chế độ của ten-xơ bậc ba 38

Hình 1.12 Các lát nằm ngang, ở bên và mặt trước của ten-xơ bậc ba 39

Hình 1.13 Ma trận hóa một ten-xơ bậc 3 42

Hình 1.14 Phân tích CP của ten-xơ X bậc ba X P RIJK thành R thành phần 43

Hình 1.15 Phân tích Tucker của ten-xơ bậc baXPRIJK 44

Hình 2.1 Sơ đồ khối của hệ thống đa bước tự động phát hiện gai động kinh đơn kênh 52

Hình 2.2 Một số gai động kinh thực tế trong tập dữ liệu Đường tròn màu đỏ minh họa vị trí đỉnh gai động kinh và hình ngôi sao minh họa vị trí đỉnh gai không động kinh 54

Hình 2.3 Sáu đặc trưng của một đỉnh gai động kinh [6] 55

Hình 2.4 Mạng nơ-ron gồm 3 perceptron 55

Hình 2.5 Bẩy đặc trưng của một gai động kinh trong một thang tỉ lệ biến đổi sóng con [81] 57

Trang 17

Hình 2.6 a) Gai động kinh (b) hệ số biến đổi sóng con của56mẫu của mộtgai động kinh trong 10 thang tỉ lệ 59Hình 2.7 Cấu trúc của mạng ANN được sử dụng trong hệ thống đa bước 60Hình 2.8 Ngưỡng quyết định θ cho phép tách không gian đo thành haikhông gian con biểu diễn hai lớp trong tập dữ liệu 63Hình 2.9 Hàm phân bố mật độ xác suất của phân bố Gauss và phân bốLogistic 67Hình 2.10 Hàm tích lũy đảo của phân bố Logistic (hàm probit) và phân bốGauss (hàm logit) 67Hình 2.11 Kết quả của hệ thống tự động phát hiện gai động kinh theo từngbước 72Hình 2.12 Đường cong ROC của mạng ANN trên tập dữ liệu huấn luyện vàtập dữ liệu kiểm tra 75Hình 2.13 Đường cong ROC tổng hợp của hệ thống đa bước tự động pháthiện gai động kinh 76

Hình 3.1 Hệ thống phát hiện gai động kinh đa kênh dựa trên phân tích ten-xơ 86Hình 3.2 Phổ giá trị riêng trong 3 chế độ của ten-xơ động kinh Với mỗichế độ, hình bên trên (màu xanh) ứng với tập các giá trị riêng, hìnhbên dưới (màu đỏ) ứng với phổ phương sai của chúng 95Hình 3.3 Ma trận thời gian chung A P R5615 thu được từ phép phân tíchTucker với ràng buộc không âm của ten-xơ động kinh và ten-xơ khôngđộng kinh 97Hình 3.4 Ma trận thang tỉ lệ B P R2010thu được từ phép phân tích NTD.Trục x biểu diễn số thành phần (các véc tơ cột), trục y biểu diễn 20thang tỉ lệ trong dải thang tỉ lệ từ thang tỉ lệ4đến thang tỉ lệ8 98Hình 3.5 Ma trận kênh chung C P R1919 của ten-xơ gai động kinh thuđược từ phép phân tích NTD 99

Trang 18

Hình 3.6 Các ma trận A,B thu được sử dụng các phương pháp phân tíchten-xơ (NTD, TD, NCP) của ten-xơ động kinh Trục x biểu diễn sốthành phần (các véc tơ cột), trụcycủa ma trận thời gian chungAbiểudiễn 56mẫu theo thời gian và trục y của ma trận thang tỉ lệ chung Bbiểu diễn20thang tỉ lệ trong dải thang tỉ lệ từ thang tỉ lệ4đến thang tỉ

lệ8 100Hình 3.7 Điểm Fisher (dấu màu xanh) và trị số p (dấu màu đỏ) của cácđặc trưng Các đặc trưng được xắp xếp dựa vào điểm fisher của chúng.Mức có ý nghĩap  0.05được sử dụng để đưa ra quyết định loại bỏ giảthiết đảoH 0, loại bỏ các đặc trưng có giá trịp ¡ 0.05 101Hình 3.8 Véc tơ gồm 10đặc trưng có ý nghĩa nhất được lựa chọn cho lớpgai động kinh và lớp gai không động kinh Các véc tơ đặc trưng củahai gai động kinh là tương tự nhau, véc tơ của hai gai không động kinh

là khác nhau 101Hình 3.9 Hiệu suất phân loại theo số lượng đặc trưng được lựa chọn 102Hình 3.10 Hiệu suất phát hiện gai động kinh của mô hình KNN khi áp dụngphương pháp trích xuất đặc trưng do luận án đề xuất so với các phươngpháp dựa trên phân tích ten-xơ khác (CP, NCP, TD và NTD) 104Hình 3.11 Hiệu suất phát hiện gai động kinh của mô hình NB khi áp dụngphương pháp trích xuất đặc trưng do luận án đề xuất so với các phươngpháp dựa trên phân tích ten-xơ khác (CP, NCP, TD và NTD) 107Hình 3.12 Hiệu suất phát hiện gai động kinh của mô hình DT khi áp dụngphương pháp trích xuất đặc trưng do luận án đề xuất so với các phươngpháp dựa trên phân tích ten-xơ khác (CP, NCP, TD và NTD) 109Hình 3.13 Hiệu suất phát hiện gai động kinh của4bộ phân loại sử dụng cácđặc trưng được trích xuất bởi phương pháp của Phan-Cichocki 113Hình 3.14 Hiệu suất phát hiện gai động kinh của SVM với các đặc trưng sửdụng các phương pháp phân tích ten-xơ: CP, NCP, TD và NTD 114Hình 3.15 Hiệu suất phát hiện gai động kinh với các đặc trưng được tríchxuất sử dụng NTD với bộ phân loại SVM, KNN, NB và DT 116

Trang 19

Hình 3.16 Đường cong ROC của hệ thống phát hiện gai động kinh đa kênh

sử dụng (a) Phương pháp phát hiện gai động kinh dựa trên phân tíchten-xơ và (b) Phương pháp xếp chồng các ten-xơ 118Hình 3.17 Hệ thống phát hiện gai động kinh đa kênh sử dụng phương pháplựa chọn đặc trưng kết hợp2phương pháp lựa chọn đặc trưng là điểmFisher và trị sốp 120Hình 3.18 Trị sốplà xác suất xảy ra một kết quả quan sát được với giả thiếtđảoH 0 là đúng 121Hình 3.19 Điểm Fisher (dấu màu xanh) và trị số p (dấu màu đỏ) của cácđặc trưng Các đặc trưng được xắp xếp dựa vào điểm fisher của chúng.Mức có ý nghĩap  0.05được sử dụng để đưa ra quyết định loại bỏ giảthiết đảoH0, loại bỏ các đặc trưng có giá trịp ¡ 0.05 123Hình 3.20 Giá trị SEN, ACC và AUC của hệ thống theo số lượng các đặctrưng được lựa chọn sử dụng các phương pháp lựa chọn đặc trưng sửdụng bộ phân loại SVM 124

Trang 20

MỞ ĐẦU

1 Bối cảnh nghiên cứu

Động kinh (epilepsy) là một rối loạn thần kinh và là một trong những rối loạnnghiêm trọng phổ biến nhất của bộ não, được đặc trưng bởi sự xuất hiện xung độngkinh lặp đi lặp lại nhiều lần Bệnh động kinh chiếm1%trong số các bệnh tật trên toàncầu Theo nghiên cứu [10] năm 2010, trên thế giới có khoảng 50 triệu người mắc bệnhđộng kinh, gần40triệu người bị động kinh ở các nước phát triển, trong đó80  90%người bị động kinh không được điều trị [17, 107] Khoảng 4 tỷ người (50% dân sốtoàn cầu) sống ở châu Á, trong đó khoảng23triệu người mắc bệnh động kinh [116].Chẩn đoán bệnh tức là dựa vào triệu chứng của bệnh nhân và một số xét nghiệmlâm sàng, cận lâm sàng để các bác sĩ xác định bệnh nhân có bị bệnh hay không Trongchẩn đoán bệnh động kinh, bác sĩ dựa vào nhận biết các triệu chứng đặc trưng củatừng cơn, dấu hiệu thần kinh và tâm thần, tuổi khởi phát và căn nguyên của các cơn

co giật lâm sàng Một xét nghiệm lâm sàng quan trọng hay được sử dụng nhất để chẩnđoán và theo dõi tiến triển của bệnh động kinh là đo điện não đồ của bệnh nhân Điệnnão đồ (EEG – Electroencephalogram) là cách sử dụng mũ điện cực ghi lại các hoạtđộng điện của não bộ Dựa vào quan sát dữ liệu điện não đồ, bác sĩ có thể chẩn đoánbệnh động kinh, thể loại động kinh và khu vực não bị tổn thương, thông qua các dấu

ấn sinh học của động kinh được thể hiện trên điện não đồ Dấu ấn sinh học của độngkinh gồm xung động kinh (epileptic seizure) và một số dạng sóng động kinh như gaiđộng kinh (epileptic spike), sóng sắc (sharp wave), phức hợp gai và sóng, đa gai Vớicác xét nghiệm lâm sàng, bác sĩ chỉ quan sát được gai động kinh trên điện não đồ củabệnh nhân Xung động kinh của bệnh nhân được ghi lại khi bệnh nhân được theo dõiđiện não đồ24 {24giờ trong bệnh viện Gai động kinh xuất hiện trên điện não đồ trướchoặc sau cơn động kinh [60]

Tại Việt Nam, việc chẩn đoán nhầm bệnh động kinh ở tuyến huyện và tỉnh xảy

ra khá phổ biến do hai nguyên nhân như sau:

Thứ nhất, các bác sĩ chuyên khoa phân tích và chẩn đoán bệnh động kinh từ dữ

Trang 21

liệu thô (chưa được xử lý bậc cao) được đo trực tiếp từ máy đo điện não Tín hiệu điệnnão thô thông thường chứa nhiều loại nhiễu như nhiễu điện lưới, nhiễu mắt, nhiễu cơdẫn đến việc quan sát các gai động kinh khó khăn.

Thứ hai, theo chuẩn đo điện não quốc tế, tín hiệu điện não đo trong khoảng thờigian ít nhất là20phút Đối với một số trường hợp cụ thể, tín hiệu điện não phải đượcgiám sát 24 {24 Tuy nhiên, ở Việt Nam, do số lượng bệnh nhân lớn, các bệnh viện

bị quá tải nên thông thường, các bệnh nhân được đo tín hiệu điện não để bác sĩ chẩnđoán bệnh chỉ trong khoảng thời gian là 10 phút Điều này dễ dẫn đến việc có thểkhông phát hiện ra bệnh động kinh đối với bệnh nhân bị bệnh động kinh hoặc chẩnđoán nhầm thể loại bệnh động kinh

Việc chẩn đoán nhầm bệnh động kinh có thể dẫn đến nhiều hệ lụy Ví dụ, cónhững bệnh nhân bị động kinh nhưng thời gian đo ngắn, tín hiệu có nhiều nhiễukhông được xử lý lọc nhiễu nên bác sĩ không phát hiện ra bệnh, dẫn đến trường hợpngười bệnh bị bệnh động kinh nhưng không được điều trị Bệnh động kinh có nhiềuloại động kinh khác nhau, việc chẩn đoán không chính xác dẫn đến việc cho thuốcđộng kinh không đúng loại có thể gây ra những tác dụng phụ không mong muốn và

có trường hợp làm bệnh trở thành nặng hơn

Trong gần 40năm qua, đã có nhiều công trình nghiên cứu về nhận biết các dấu

ấn sinh học (biomarker) của bệnh động kinh như nhận biết xung động kinh (seizure)kết hợp với lâm sàng và một số xét nghiệm khác để chẩn đoán các thể động kinh Một

số công trình nghiên cứu về phát hiện xung động kinh được đề xuất trong [4, 44, 45,

67, 119, 120] và phát hiện gai động kinh trong [43, 45] Xung động kinh thường khóxuất hiện trong thời gian đo khi làm xét nghiệm lâm sàng Xung động kinh đo đượckhi bệnh nhân được đo giám sát24 {24trong bệnh viện Ở Việt Nam rất ít khi đo giámsát24 {24, trừ khi bệnh nhân bị bệnh nặng và cần phẫu thuật bỏ phần não tổn thươnggây nên động kinh để điều trị Vì vậy, rất khó khăn để có được dữ liệu điện não đồ cóchứa xung động kinh ở Việt Nam để nghiên cứu Mặt khác, khi bệnh nhân xuất hiện

xung động kinh tức là trường hợp bệnh nhân đã bị bệnh nặng Ngoài ra, các hoạt

động khác của não hoặc nhiễu (do điều kiện ghi điện não chưa theo chuẩn quốc tế)

có thể tạo ra các gai không động kinh (giả gai) trên tín hiệu EEG, dễ gây nhầm lẫn

cho bác sĩ dẫn đến hiện tượng chẩn đoán nhầm bệnh Vì vậy, để hỗ trợ cho các bác

sĩ trong việc chẩn đoán, phát hiện bệnh động kinh ngay trong giai đoạn bệnh còn

Trang 22

nhẹ, tức là xuất hiện gai động kinh trong tín hiệu điện não đồ, luận án đặt ra vấn đề

nghiên cứu hệ thống xử lý tín hiệu điện não tự động nhận biết gai động kinh, sử dụng các kỹ thuật xử lý tín hiệu tiên tiến nhằm tăng tính khách quan và độ chính xác trong việc phát hiện gai động kinh.

2 Tổng quan về các vấn đề nghiên cứu

Do việc dò gai thủ công tốn rất nhiều thời gian của bác sĩ nên việc xây dựngcác hệ thống để phát hiện gai động kinh tự động là hướng nghiên cứu đang được quantâm ở Việt Nam cũng như trên thế giới Việc tự động phát hiện gai động kinh có thểcung cấp thông tin về mật độ gai và hội chứng của bệnh động kinh Trong những nămvừa qua, đã có nhiều công trình nghiên cứu về tự động phát hiện gai động kinh nhưtrong [5, 43, 52, 81, 94, 95, 97, 109, 127] Tuy nhiên, việc nghiên cứu về tự động pháthiện gai động kinh vẫn gặp khó khăn do một số nguyên nhân như sau

Khó khăn đầu tiên là định nghĩa về gai động kinh, không có định nghĩa chínhxác về gai động kinh [45] Thực tế, số lượng gai động kinh trên điện não đồ là nhỏhơn rất nhiều so với số gai không phải là gai động kinh, vì vậy, có thể có những trườnghợp hai bác sĩ khác nhau có thể sẽ không đánh dấu cùng một sự kiện là gai động kinh.Thứ hai, việc xây dựng và phát triển tập huấn luyện về gai rất tốn kém và mấtnhiều thời gian do có sự khác nhau về hình thái của gai động kinh đối với các bệnhnhân khác nhau

Ở Việt Nam, việc sử dụng các bản ghi EEG trong chẩn đoán và điều trị bệnhđộng kinh vẫn còn ở giai đoạn sơ khai do một số lý do như sau: (i) sự khan hiếm củacác bác sĩ thần kinh có kinh nghiệm có thể đưa ra các phân tích chất lượng cao dựatrên thông tin thần kinh điện, (ii) thời gian làm xét nghiệm lâm sàng là ghi điện não đồngắn hơn (10phút) so với thời gian ghi điện não đồ theo chuẩn quốc tế thông thường(thời gian ghi điện não tối thiểu là20phút) và (iii) có nhiều nhiễu do môi trường ghiđiện não chưa chuẩn gây ra Hai lý do là (ii) và (iii) làm cho công việc của các bác sĩthần kinh ở Việt Nam trở nên khó khăn hơn các đồng nghiệp quốc tế Chính vì hai lý

do này đã dẫn đến tỷ lệ phát hiện nhầm bệnh động kinh cao Vì vậy, để hỗ trợ các bác

sĩ cải thiện chất lượng và chẩn đoán bệnh động kinh đang là một trong những vấn đềcấp thiết

Trong nhiều thập kỷ qua, nhiều phương pháp khác nhau đã được đề xuất để giải

Trang 23

quyết vấn đề phát hiện gai động kinh Một số phương pháp so sánh các tham số điệncủa các dạng sóng EEG với các ngưỡng thực tế của gai động kinh [46, 77] Trongnghiên cứu [98] Pfurtscheller và đồng nghiệp đã đề xuất một số kỹ thuật lọc để pháthiện gai động kinh Trong [47], Gotman và đồng nghiệp đã phát triển một hệ thốngphát hiện gai động kinh, nhạy với các trạng thái khác nhau của tín hiệu EEG Trongmột số nghiên cứu đánh giá gần đây, các phương pháp phát hiện tự động gai động kinhđược phân loại thành các nhóm khác nhau dựa trên các đặc điểm thần kinh học [60]hoặc các kỹ thuật [120] Để khái quát lại các nghiên cứu về các hệ thống tự động pháthiện gai động kinh đã có, luận án chia các hệ thống phát hiện gai động kinh tự độngthành hai nhóm dựa vào cấu trúc của hệ thống là các hệ thống đơn giản và các hệ thống

đa bước Các hệ thống phát hiện gai động kinh đơn giản thường có cấu trúc đơn giản,

sử dụng một hoặc hai phương pháp xử lý tín hiệu hoặc học máy để phát hiện gai độngkinh tự động Các hệ thống phát hiện gai động kinh đa bước được xây dựng dựa trên

sự kết hợp nhiều phương pháp xử lý tín hiệu, kỹ thuật học máy, tận dụng lợi thế củatừng kỹ thuật để thu thập và trích chọn các đặc trưng phù hợp, xử lý và phân loại thôngtin Một số hệ thống đơn giản được trình bày trong [43, 94, 95, 97, 109, 127] sử dụngmột số kỹ thuật như phân tích thành phần độc lập (Principal Component Analysis -PCA), phân cụm K-means (K-Means clustering), máy vectơ hỗ trợ (Support VectorMachine - SVM), mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) Một số

hệ thống đa bước có thể kể đến như [6, 52, 81] kết hợp sử dụng nhiều phương pháp

xử lý tín hiệu như lọc nhiễu, biến đổi sóng con, mạng nơ-ron nhận tạo và hệ chuyêngia Trong các hệ thống đã đề xuất để phát hiện gai động kinh thì thông thường hệthống đa bước có hiệu suất cao hơn các hệ thống đơn giản Tuy nhiên, hai hệ thống đabước đã được đề xuất bởi [6, 81] vẫn còn một số hạn chế Thứ nhất, hai phương pháp

đa bước hiện hành chưa xử lý hiệu quả, việc sử dụng số lượng thang tỉ lệ của biến đổisóng con chưa tối ưu, quá nhiều thang tỉ lệ nên có thể dẫn đến tốc độ xử lý chậm [Hạnchế 1] Thứ hai, còn khá nhiều giả gai trong khi chưa khai thác được mối liên hệ theothời gian giữa các gai gần nhau [Hạn chế 2]

Hầu hết các hệ thống phát hiện gai động kinh đã trình bày trên tập trung vàophân tích dữ liệu EEG trên một kênh tại một thời điểm, không xử lý các tín hiệu điệnnão đồng thời trên nhiều kênh Indiradevi trong [60] đã đề xuất một hệ thống pháthiện dựa trên phân tích đa mức, đa phân giải nhằm kết hợp đồng thời các thông tin

Trang 24

EEG trong miền thời gian, tần số và không gian để tự động xác định các gai độngkinh.

Trong thực tế, dữ liệu EEG là không dừng, thay đổi theo thời gian và theo từngbệnh nhân Khi quan sát tín hiệu điện não đồ (EEG) của các bệnh nhân bị động kinh,khả năng xuất hiện gai động kinh trên các kênh gần nhau trong cùng một thời điểm làcao, nên các phương pháp xử lý đa kênh đồng thời có thể sẽ cho phép khai thác mốiliên hệ theo không gian của gai động kinh, tăng khả năng phát hiện gai động kinh.Indiradevi là người duy nhất đề cập đến định vị khu vực não tổn thương gây nên cácgai động kinh sử dụng đồng thời thông tin từ nhiều kênh [60]

Dữ liệu EEG có thể được biểu diễn bằng một ma trận hai chiều với một chiều

là thời gian và chiều còn lại là không gian (các kênh hay các điện cực) Nếu chuyểnđổi dữ liệu EEG đa kênh sang miền tần số sử dụng biến đổi sóng con thì dữ liệuEEG có thể được biểu diễn bằng các mảng 3 chiều hay ten-xơ 3 chiều là thời gian,kênh (điện cực) và thang tỉ lệ [25] Phân tích ten-xơ trở thành một công cụ hữu ích

để phân tích dữ liệu nhiều chiều Với sự phát triển của các ứng dụng dữ liệu lớn,phân tích ten-xơ trở thành một phương pháp dành được sự quan tâm của nhiều nhómnghiên cứu Có thể thấy phân tích ten-xơ được áp dụng trong các ứng dụng về xử lý tínhiệu [23] Hai phương pháp phân tích ten-xơ phổ biến là i) phân tích các hệ số songsong (PARAFAC) hay còn gọi với tên khác là phân tích CP và ii) phân tích Tucker Córất nhiều nghiên cứu sử dụng phân tích ten-xơ phân tích tín hiệu điện não nói chungnhư [25, 58] và phát hiện xung động kinh nói riêng như [1, 3, 8, 32, 33, 93, 100, 111].Trong [100], Evangelia Pippa và đồng nghiệp sử dụng phân tích ten-xơ để nhận biếtcác sự kiện không động kinh (bao gồm: xung không động kinh tâm lý (Psychogenicnonepileptic seizures - PNES), ngất xỉu phế vị mạch (Vasovagal Syncope - VVS) và

sự kiện động kinh là sóng động kinh toàn thể hóa (Generalized Spike Wave - GSW).Trong năm2006và2007[1–3], Acar và đồng nghiệp sử dụng phân tích ten-xơ để loạinhiễu, xác định vị trí tổn thương của não và nhận biết xung động kinh M De Vos vàđồng nghiệp cũng sử dụng phân tích ten-xơ để định vị vùng khởi phát động kinh [32].Tuy nhiên, các nhóm nghiên cứu này [1, 3, 8, 25, 32, 33, 58, 93, 111] chưa nghiên cứunhận biết gai động kinh đa kênh, chưa khai thác được mối liên hệ về không gian giữacác gai động kinh trên các kênh gần nhau tại một thời điểm [hạn chế3]

Trong các ứng dụng khai phá dữ liệu nói chung và xử lý tín hiệu y sinh nói riêng

Trang 25

(ví dụ, tín hiệu EEG), xấp xỉ hạng thấp (Low Rank Approximation - LRA) là một bàitoán được sử dụng phổ biến [86] Mục tiêu của xấp xỉ hạng thấp là tìm một không giancon có số chiều nhỏ hơn chiều của dữ liệu ban đầu nhưng vẫn chứa được những thôngtin chính của dữ liệu Trong những năm qua, có rất nhiều công trình nghiên cứu đề giảibài toán xấp xỉ hạng thấp cho các ma trận hoặc ten-xơ đơn [22, 72] Xấp xỉ hạng thấp

có không gian con thu được là2 chiều có thể kể đến các đóng góp trong [27, 34, 61,

63, 82, 83, 112, 130, 132, 136], sử dụng các phương pháp như phân tích giá trị riêng2chiều (2dSVD), phân tích các thành phần chính2chiều (2dPCA), xấp xỉ hạng thấp mởrộng của các ma trận (Generalized Low Rank Approximations Matrix - GLRAM) .Trường hợp, không gian con thu được có số chiều lớn hơn2trong [80, 96, 126, 129]

sử dụng các phương pháp như phân tích Tucker chính tắc với ràng buộc không âm(Manifold Regularization Nonnegative Tucker Decomposition - MR-NTD), phân tíchcác thành phần chính đa tuyến tính không ràng buộc (Unconstrained Multilinear PCA

- UMPCA), phân tích các thành phần chính đa tuyến tính thưa (Sparse MultilinearPrincipal Component Analysis - SMPCA) . Tuy nhiên, trong các công trình trênchưa có công trình nào nghiên cứu để giải bài toán xấp xỉ hạng thấp cho một chuỗi cácten-xơ đồng thời (Generalized Simultaneous Multilinear LRA of Tensors - GSLRAT)[hạn chế4]

Để đánh giá chất lượng của thuật toán/hệ thống đề xuất trong việc phân loại

dữ liệu, hai công cụ thường được sử dụng là ma trận đánh giá (evaluation matrix) vàđường cong ROC (Receiver Operating Characteristic) [19] Với ma trận đánh giá, haichỉ số dành được sự quan tâm lớn trong lĩnh vực y sinh là tỉ lệ dương tính thật (độnhạy - Sensitivity), tỉ lệ âm tính thật (độ đặc hiệu - Specificity) [19] Đường congROC được sử dụng trong rất nhiều lĩnh vực như nghiên cứu y sinh, khoa học dữ liệu

và học máy Ưu điểm chính của đường cong ROC so với ma trận đánh giá là đườngcong ROC biểu diễn mối quan hệ, sự đánh đổi giữa tỉ lệ dương tính thật và tỉ lệ âmtính thật dựa vào việc chọn ngưỡng quyết định [38] Một tham số của đường congROC là diện tích dưới đường cong ROC (Area Under Curve - AUC) biểu diễn hiệusuất của các bộ phân loại nhị phân Do đó, đường cong ROC thường được sử dụng đểđánh giá chất lượng của các bộ phân loại và so sánh chất lượng của các bộ phân loạinhị phân trong nhiều lĩnh vực, bao gồm cả chẩn đoán y tế [50] Trong những năm gầnđây, có nhiều công trình nghiên cứu sử dụng đường cong ROC để đánh giá chất lượng

Trang 26

của hệ thống như [81] Một số công trình nghiên cứu đã đề xuất các phương pháp đểước lượng đường cong ROC tổng hợp [15, 29, 37, 57, 59, 87], tuy nhiên chưa có côngtrình nào đề xuất đường cong ROC tổng hợp cho hệ thống đa bước (hệ thống xếp tầng

sử dụng nhiều ngưỡng quyết định) [hạn chế5]

3 Vấn đề nghiên cứu

1 Khai thác mối liên hệ theo thời gian của gai động kinh gần nhau và nâng caohiệu quả xử lý (chất lượng và độ phức tạp tính toán) trong nhận biết gai động kinh[góp phần trả lời Hạn chế1, 2] Nghiên cứu đường cong ROC cho hệ thống đa bước

có sử dụng nhiều ngưỡng quyết định (hệ thống xếp tầng) để đánh giá chất lượng của

Nghiên cứu cải tiến các hệ thống xử lý tín hiệu điện não hỗ trợ nhận biết gai

động kinh bằng cách khai thác mối liên hệ giữa các gai gần nhau theo thời gian dựa trên phân tích dữ liệu EEG đơn kênh và không gian dựa trên phân tích dữ liệu EEG

đa kênh đồng thời.

4.2 Mục tiêu cụ thể

1) Xây dựng một hệ thống đa bước phát hiện gai động kinh tự động, khai thác mối liên hệ giữa các gai gần nhau theo thời gian Đề xuất phương pháp ước lượngđường cong ROC cho hệ thống đa bước để ước lượng hiệu suất của hệ thống đa bước

2) Xây dựng một hệ thống phát hiện gai động kinh tự động nhằm khai thác được mối liên hệ giữa các gai gần nhau theo không gian sử dụng phương pháp phân tíchten-xơ

5 Hướng tiếp cận và phương pháp

Đối với mục tiêu 1, hướng tiếp cận là khai thác liên hệ thời gian theo thông tinhình thái học của gai động kinh mà Boos đặt ra trong [13] là sau các gai động kinhthường là các sóng chậm, được gọi là phức hợp gai và sóng chậm Khoảng thời gianxảy ra sóng chậm thường từ150tới350 mili giây Tức là không tồn tại quá1gai động

Trang 27

kinh trong khoảng thời gian đó [13] Một hướng tiếp cận khác là cải tiến phương pháptrích xuất đặc trưng trong hệ thống đa bước để nâng cao hiệu quả phát hiện gai độngkinh Hướng tiếp cận để tổng hợp đường cong ROC cho hệ thống đa bước là sử dụnghàm phân bố Gauss và phân bố Logistic dựa vào đặc trưng hàm tích lũy đảo của cácphân bố này là hàm tăng dần trong khoảngr0, 1s.

Phương pháp: Sau khi phân loại được từng gai động kinh riêng rẽ, nghiên cứu

để xây dựng hệ chuyên gia khai thác mối liên hệ giữa các gai động kinh xuất hiện gầnnhau về mặt thời gian Để cải tiến phương pháp trích xuất đặc trưng, luận án cải tiếncách chọn thang tỉ lệ trong biến đổi sóng con trong phép biến đổi sóng con để tríchxuất đặc trưng của các gai động kinh

Đối với mục tiêu 2, hướng tiếp cận là khai thác thông tin đa kênh của các gaiđộng kinh

Phương pháp: Dựa trên phương pháp được đề xuất trong [100] và [99] Trong [100],Pippa và đồng nghiệp đã áp dụng phương pháp phân tích ten-xơ do Phan đề xuấttrong [99] để phát hiện sự kiện động kinh là sóng động kinh toàn thể hóa Luận án cảitiến phương pháp được đề xuất bởi Phan trong [99] để phát hiện gai động kinh

6 Nội dung và tập dữ liệu nghiên cứu

Luận án tập trung nghiên cứu hai nội dung chính sau:

1) Xây dựng hệ thống phát hiện gai động kinh đơn kênh trong đó cải tiến bướctrích chọn đặc trưng, xây dựng hệ chuyên gia đơn giản khai thác thông tin về các gaiđộng kinh gần nhau Nghiên cứu phương pháp ước lượng đường cong ROC để đánhgiá chất lượng của hệ thống đa bước có nhiều ngưỡng quyết định

2) Xây dựng hệ thống phát hiện gai động kinh đa kênh sử dụng phương phápphân tích ten-xơ

Trong hai nội dung nghiên cứu trên, nội dung 1 được trình bày cụ thể trongchương2và nội dung 2được trình bày chi tiết trong chương3

Tập dữ liệu EEG luận án nghiên cứu: Luận án nghiên cứu dữ liệu EEG của17bệnh nhân bị động kinh gồm11bệnh nhân nam và 6bệnh nhân nữ, được thu thập vàxây dựng trong khuôn khổ đề tài QG.10.40 [117] Chi tiết về quá trình đo đạc và thuthập dữ liệu, tiền xử lý và cơ sở dữ liệu EEG của các bệnh nhân bị động kinh sử dụngtrong luận án được trình bày chi tiết trong Chương 1, mục 1.5, trang27–30

Trang 28

7 Phạm vi và giới hạn nghiên cứu

Luận án tập trung nghiên cứu trong giới hạn sau:

 Đối với hệ thống đa bước phát hiện gai động kinh tự động đơn kênh, luận án

đề xuất cải tiến cách sử dụng số thang tỉ lệ trong biến đổi sóng con và đề xuất một hệchuyên gia đơn giản để loại bỏ giả gai sau bước phân loại Mặt khác, để đánh giá chấtlượng của hệ thống đề xuất, luận án đề xuất phương pháp ước lượng ROC tổng thểcho hệ thống đa bước sử dụng hai phân bố là phân bố Gaussian và phân bố Logistic

 Đối với hệ thống phát hiện gai động kinh tự động đa kênh, luận án đề xuấtphương pháp trích xuất đặc trưng và phương pháp lựa chọn đặc trưng mới Với phươngpháp trích xuất đặc trưng đề xuất, luận án tìm không gian đặc trưng của gai động kinh

để trích xuất các đặc trưng của gai động kinh và các đặc trưng của gai không độngkinh để nhận biết các gai động kinh Với phương pháp lựa chọn đặc trưng, luận án

đề xuất kết hợp hai phương pháp lựa chọn đặc trưng phổ biến là phương pháp điểmFisher và trị số p bằng cách sử dụng thuật toán phổ biến là tìm chuỗi con chung lớnnhất

8 Đóng góp chính của luận án

Luận án có hai đóng góp chính là:

1) Xây dựng một hệ thống đa bước phát hiện gai động kinh dựa trên việc phân

tích tín hiệu EEG đơn kênh, khai thác mối liên hệ theo thời gian giữa các gai động

kinh gần nhau trên từng kênh Các đóng góp chính của hệ thống như sau:

 Bước Trích xuất đặc trưng, luận án cải tiến việc lựa chọn số lượng thang tỉ lệ (5thang tỉ lệ) trong biến đổi sóng con so với cách sử dụng8thang tỉ lệ như đề xuấttrong [81],

 Bước Hệ chuyên gia, luận án đề xuất một hệ chuyên gia rất đơn giản khai thác

mối liên hệ về thời gian giữa các gai động kinh gần nhau để loại bỏ giả gai saubước phân loại của bộ phân loại ANN

 Để đánh giá chất lượng của hệ thống đa bước, luận án đề xuất hai phươngpháp ước lượng đường cong ROC tổng thể của hệ thống đa bước sử dụng nhiềungưỡng quyết định dựa trên hai phân bố phổ biến là phân bố Gaussian và phân

bố Logistic, luận án cũng chứng minh phương pháp đề xuất bằng toán học

Trang 29

2) Xây dựng một hệ thống đa bước để phát gai động kinh tự động dựa trên việc

phân tích tín hiệu EEG đa kênh, khai thác mối liên hệ theo không gian của các gai

động kinh trên các kênh gần nhau Các đóng góp cụ thể trong từng bước của hệ thốngnhư sau:

 Bước Trích xuất đặc trưng, luận án có 2 đóng góp đó là: i) đề xuất bài toán,

thuật toán để giải bài toán xấp xỉ hạng thấp đa tuyến tính đồng thời cho cácten-xơ (SMLRAT) Luận án đã chứng minh rằng bài toán SMLRAT có thể nhậnđược các nghiệm tối ưu địa phương bằng cách sử dụng hai thuật toán phân tíchten-xơ thông dụng là HOSVD và Tucker-ALS ii) trích xuất các đặc trưng củagai động kinh dựa trên việc ước lượng không gian đặc trưng của gai động kinh(“eigenspikes”) sử dụng thuật toán đề xuất là thuật toán SMLRAT mở rộng vớiràng buộc không âm

 Bước Lựa chọn đặc trưng, luận án đề xuất phương pháp lựa chọn đặc trưng kết

hợp hai phương pháp lựa chọn đặc trưng thông dụng là phương pháp điểm Fisher

và phương pháp trị sốpsử dụng thuật toán tìm chuỗi con chung lớn nhất

9 Bố cục luận án

Chương mở đầu: trình bày bối cảnh nghiên cứu; tổng quan nhanh và các hạn

chế về nhận biết gai động kinh tự động; các vấn đề nghiên cứu; mục tiêu nghiên cứu;hướng tiếp cận và phương pháp nghiên cứu; nội dung nghiên cứu; phạm vi và giới hạnnghiên cứu; các đóng góp chính và bố cục của luận án

Chương1[Cơ sở và tổng quan]: trình bày các kiến thức cơ sở cho hai nội dungnghiên cứu chính mà luận án đưa ra như: điện não đồ; chuẩn đo quốc tế10–20; độngkinh; ma trận đánh giá; đường cong ROC; cơ sở dữ liệu sử dụng trong luận án; một

số khái niệm cơ bản về ten-xơ; phân tích ten-xơ và xấp xỉ hạng thấp đa tuyến tính chocác ten-xơ và cuối cùng là kết luận Chương1

Chương 2[Hệ thống đa bước tự động phát hiện gai động kinh đơn kênh]: giớithiệu về một số hệ thống tự động phát hiện gai động kinh tự động hiện có; trình bày hệthống đa bước tự động phát hiện gai động kinh đơn kênh và chức năng cụ thể của từngbước của hệ thống; giới thiệu phương pháp ước lượng đường cong ROC tổng hợp cho

hệ thống đa bước; kết quả mô phỏng, đánh giá hệ thống đa bước tự động phát hiện gaiđộng kinh đơn kênh và cuối cùng kết luận Chương2

Trang 30

Chương3[Hệ thống đa bước tự động phát hiện gai động kinh đa kênh dựa trênphân tích ten-xơ]: trình bày phương pháp xấp xỉ hạng thấp đa tuyến tính đồng thời

mở rộng cho các ten-xơ; hệ thống đa bước phát hiện gai động kinh đa kênh dựa trênphân tích ten-xơ; kết quả mô phỏng và thảo luận hệ thống đa bước phát hiện gai độngkinh đa kênh; phương pháp lựa chọn đặc trưng mới cho hệ thống đa bước phát hiệngai động kinh đa kênh; kết nối với các nghiên cứu liên quan và cuối cùng là kết luậnChương3

Chương 4 [Kết luận] trình bày kết luận và hướng phát triển, danh mục các tàiliệu tham khảo và các công trình công bố của luận án

Trang 31

CHƯƠNG 1.

CƠ SỞ VÀ TỔNG QUAN

1.1 Giới thiệu

Chương 1 trình bày những khái niệm cơ bản về điện não đồ; chuẩn đo quốc tế

10  20; động kinh; cơ sở dữ liệu điện não đồ sử dụng trong luận án; ma trận đánh giá;đường cong ROC; các khái niệm cơ bản về ten-xơ; phân tích ten-xơ; xấp xỉ hạng thấp

đa tuyến tính cho các ten-xơ

1.2 Điện não đồ

Điện não đồ (EEG) là biểu đồ biểu diễn sự thay đổi hiệu điện thế của các tín hiệuđược ghi trên da đầu bằng cách sử dụng các điện cực Biên độ của tín hiệu EEG nằmtrong dải từ vài µV đến xấp xỉ 200 µV Tần số của tín hiệu EEG nằm trong khoảngr0.5, 70sHz Hình 1.1 minh họa dữ liệu điện não đồ của một bệnh nhân bị động kinhtrong tập dữ liệu luận án sử dụng

EEG được tổng hợp bởi5nhịp cơ bản là nhịp delta, theta, alpha, beta và gamma.Nhịp delta có tần số trong khoảng r0.5, 4s Hz, nhịp theta có tần số trong khoảngr4, 7.5s Hz, nhịp alpha có tần số trong khoảngr8, 13.5s Hz, nhịp beta có tần số trongkhoảng r14, 30s Hz và nhịp gamma có tần số lớn hơn 30 Hz Trong các nhịp cơ bảntrên, nhịp delta thường xuất hiện trong giấc ngủ sâu Nếu nhịp này xuất hiện ở trẻ emthì tín hiệu điện não là bình thường còn khi xuất hiện ở người lớn thì đó chính là dấuhiệu bệnh lý của não Nhịp theta thường quan sát thấy trên vùng trán Nếu nhịp thetaxuất hiện không liên tục trên điện não đồ của người lớn thì đó cũng là dấu hiệu bệnh

lý của não Nhịp alpha là nhịp dễ quan sát nhất trong tín hiệu điện não, có hai dạng làhình sin hoặc hình tròn Nhịp alpha xuất hiện khi đo ở nửa sau của đầu Trong điệnnão đồ, nếu nhịp beta có biên độ nhỏ hơn 20 µV là bình thường và lớn hơn 25 µV

là có dấu hiệu của bệnh lý Nhịp gamma thường ít xuất hiện trong điện não đồ, nóđược quan sát thấy trên tín hiệu điện não khi di chuyển ngón tay trong lúc đo điện não

đồ [114]

Trang 32

Hình 1.1 Dữ liệu điện não đồ một bệnh nhân trong tập dữ liệu luận án sử dụng.

1.3 Động kinh

Động kinh hay còn gọi là động kinh phong được định nghĩa là một rối loạn nãomãn tính, được đặc trưng bởi sự xuất hiện xung động kinh lặp đi lặp lại nhiều lần.Xung động kinh là kết quả của sự phóng điện bất thường, đồng bộ và quá mức củacác nơ-ron thần kinh trong não bộ [39] Đặc trưng của động kinh được biểu hiện làcác cơn co giật, mất ý thức tạm thời

Trong chẩn đoán động kinh, bác sĩ thường dựa vào các dấu hiệu nhận biết trênđiện não đồ của người bệnh như hình dạng, mật độ xuất hiện các dạng động kinh (gaiđộng kinh, sóng nhọn, phức hợp sóng và gai, đa gai và sóng, phức hợp đa gai .) đểxác định vị trí khởi phát dạng động kinh cũng như tình trạng bệnh của người bệnh.Gai động kinh (epileptic spike) là một dạng động kinh được bác sĩ sử dụng phổbiến nhất trong chẩn đoán bệnh động kinh Thời gian tồn tại của gai động kinh ngắn,thường trong khoảngr20, 70smili giây, được đặc trưng bởi đường dốc đi lên và xuốngđột ngột, tạo ra đỉnh nhọn Hình 1.2 minh họa điện não đồ có chứa gai động kinh.Không có định nghĩa rõ ràng về gai động kinh [45] Hình thái của gai động kinh đa

Trang 33

Hình 1.2 Điện não đồ có chứa gai động kinh [114].

dạng và phức tạp, thay đổi theo bệnh nhân Hình 1.3 minh họa hình thái của một sốgai động kinh trong thực tế [40]

Hình 1.3 Hình thái của một số gai động kinh [114]

Trang 34

1.4 Chuẩn đo quốc tế 10-20

Các chuẩn đo quốc tế nói chung và chuẩn đo quốc tế 10  20nói riêng được xâydựng và phát triển nhằm tạo ra các cơ sở dữ liệu thống nhất theo cùng chuẩn đo Cácchuẩn đo mang đến nhiều lợi ích như cho phép so sánh tín hiệu điện não của cùng mộtngười bệnh tại các thời điểm đo khác nhau, giữa các người bệnh và giữa người bệnh

và người bình thường Hình 1.4 minh họa chuẩn đo điện não quốc tế10  20[73] Các

Hình 1.4 Vị trí các điện cực đo điện não theo chuẩn quốc tế 10  20[73]

chữ cái C, T, P, O, E, F và Fp lần lượt biểu thị vị trí vùng đỉnh đầu (central), thái dương(temporal), đỉnh (parietal), chẩm (occipital), tai (ear), vùng trán (frontal) và tiền trán(prefrontal) Số thứ tự trong các ký hiệu: số lẻ biểu diễn nửa đầu bên trái và số chẵnbiểu diễn nửa đầu bên phải

Hình 1.5 Mặt bên của hộp sọ biểu diễn các điểm đo từ điểm hốc mũi (nasion) đếnmấu ngoài xương chẩm (inion) [73]

Trang 35

Hình 1.6 Mặt phía trước của hộp sọ theo chuẩn đo quốc tế10  20 [73].

Các điểm đo trong chuẩn10 20được chia thành5vùng riêng biệt, như biểu diễntrên hình 1.5 và hình 1.6 Hình 1.5 biểu diễn các điểm đo từ điểm hốc mũi (nasion)đến mấu ngoài xương chẩm (inion) Fp là vị trí điện cực phía trước, F là đường phíatrước của các điện cực, C là đường tâm của các các điện cực, P là đường đỉnh của cácđiện cực và O là đường chẩm Tỷ lệ phần trăm biểu diễn tỉ lệ với khoảng cách đo từđiểm hốc mũi đến mấu ngoài xương chẩm Đường trung tâm bằng50% khoảng cách

từ điểm hốc mũi đến mấu ngoài xương chẩm Khoảng cách điện cực phía trước vàđiện cực chẩm là10%, khoảng cách của các điện cực còn lại là 20%khoảng cách từđiểm hốc mũi đến mấu ngoài xương chẩm

1.5 Cơ sở dữ liệu EEG sử dụng trong luận án

1.5.1 Đo đạc và thu thập dữ liệu

Luận án sử dụng dữ liệu điện não đồ của các bệnh nhân được chẩn đoán lâmsàng bị bệnh động kinh Dữ liệu này được đo sử dụng hệ thống theo tiêu chuẩn quốc

tế10–20gồm19điện cực (kênh) được gắn cố định trên mũ như biểu diễn trên hình 1.7.Ngoài 19điện cực này, hệ thống thống đo theo tiêu chuẩn quốc tế 10–20còn có cácđiện cực bên ngoài được sử dụng để đo nhiễu mắt, nhiễu cơ và tín hiệu điện tim đồ.Hai điện cực bên ngoài được gắn ở phía trên và phía dưới mí mắt để đo nhiễu mắt(vị trí 22, 23trên hình 1.8) và hai điện cực được gắn cằm để đo nhiễu cơ (vị trí30, 31trên hình 1.9) Hai điện cực bên ngoài được sử dụng để đo tín hiệu điện tim đồ đượcgắn trên mạch chủ trên hai cổ tay của bệnh nhân Nối 2 điểm gốc mũi và điểm chẩm

Trang 36

(a) Điện cực gắn cố định trên mũ (b) Điện cực bên ngoài mũ điện cực

Hình 1.7 Các điện cực [117]

Hình 1.8 Vị trí các điện cực (22, 23) để đo nhiễu mắt [117]

Hình 1.9 Vị trí các điện cực (30, 31) để đo nhiễu cơ [117]

với nhau ta có đường dọc giữa (đường trung bình) Đường trung bình sẽ gồm có cácđiện cực là Fz, Cz, Pz Để đo tín hiệu EEG của các bệnh nhân, mũ điện cực được đội

Trang 37

lên đầu các bệnh nhân sao cho đường trung bình của mũ (đường nối hai điểm là gốcmũi và điểm chẩm) trùng với đường trung bình của đầu bệnh nhân được đo và vị trícác điện cực dọc theo đường trung bình mũ đặt đúng vị trí Mũ được kéo xuống tai vàtóc ẩn sau tai của các bệnh nhân được gạt gọn sao cho không làm ảnh hưởng đến cácđiện cực Sau khi các bệnh nhân đội mũ, trước khi đo cần kiểm tra lại xem các điệncực đặt dọc theo đường trung bình mũ đã ở vị trí đúng chưa, sau đó gắn dây an toàn

để cố định mũ Các bệnh nhân được yêu cầu gội đầu sạch để đảm bảo các điện cựctiếp xúc tốt và không được uống bất kỳ thuốc gì, chất kích thích và đồ uống có đường

8tiếng trước khi đo Trong quá trình đo các bệnh nhân được ngồi trên ghế và ở trạngthái nghỉ ngơi, thư giãn

1.5.2 Tiền xử lý dữ liệu EEG

Dữ liệu điện não của các bệnh nhân bị động kinh được ghi sử dụng phần mềmProFusionEEG ver 4.1 và được lưu dưới dạng các file có đuôi “*.eeg” Vị trí của cácgai động kinh được đánh dấu bởi một bác sĩ có nhiều kinh nghiệm của Bệnh viện Nhitrung ương Quy trình xây dựng cơ sở dữ liệu EEG có các gai động kinh luận án sửdụng được thực hiện như sau [117]:

 Bước 1: Sử dụng phần mềm ProFusion để mở các bản ghi điện não của từngbệnh nhân Bác sĩ quan sát và đánh dấu các thời điểm và các kênh có gai động kinh

Bước 2: Chuyển đổi dữ liệu điện não đồ từ định dạng “*.eeg” sang định dạng

cơ sở dữ liệu của Matlab là các file “.mat”

 Bước 3: Lọc nhiễu sử dụng bộ lọc thông thấp có tần số cắt là 70Hz , bộ lọcthông cao có tần số cắt0.5Hzvà bộ lọc chặn dải Notch có tần số cắt là50Hz

Bước 4: Xác định vị trí các gai trong matlab (các file “.mat”) dựa vào vị trí gaitrong tín hiệu điện não liên tục (các file “.eeg”)

 Bước 5: Dựa vào vị trí các gai vừa xác định trong Matlab, thực hiện cắt gaitrong Matlab

 Bước 6: Tổng hợp cơ sở dữ liệu của từng bệnh nhân, sau đó lưu vào một cơ

sở dữ liệu sử dụng cấu trúc struct trong Matlab Dữ liệu của từng bệnh nhân được lưugồm các trường sau: tên (name); giới tính (gender); thời gian đo (total-duration); dữliệu điện não (EEG-signal); vị trí các gai (indices); vị trí kênh (channel-number) ứngvới vị trí gai trong trường indices; tổng số gai động kinh (total-number-spikes)

Trang 38

1.5.3 Cơ sở dữ liệu EEG

Cơ sở dữ liệu EEG của các bệnh nhân được chuẩn đoán lâm sàng bị động kinh

sử dụng trong luận án được trình bày chi tiết trong Bảng 1.1 Dữ liệu EEG được ghibằng hệ thống đo theo chuẩn đo quốc tế10–20, gồm19kênh dữ liệu, tốc độ lấy mẫu

là256 Hz Hệ thống ghi EEG có kèm theo một máy ghi video có thể đồng thời theodõi chuyển động của bệnh nhân, tạo điều kiện thuận lợi cho các bác sĩ thần kinh phânbiệt nhiễu trong quá trình đánh giá, đánh dấu vị trí các gai động kinh Thời gian ghi

dữ liệu EEG thay đổi đối với mỗi bản ghi của các bệnh nhân, từ 6 phút tới 28phút

Độ tuổi của các bệnh nhân nằm trong dải từ4tuổi đến72tuổi Bệnh nhân16được đotrong2khoảng thời gian là16avà16b Tổng số lượng gai động kinh của17bệnh nhântrong tập dữ liệu luận án sử dụng là1442 gai Số lượng gai động kinh của các bệnhnhân phân bố không đều Bệnh nhân9có số gai động kinh ít nhất (1gai) và bệnh nhân

2 có số lượng gai động kinh nhiều nhất (635 gai) Do dữ liệu điện não hiển thị trênphần mềm đo Profusion đã được lọc nhiễu điện lưới có tần số50Hz, loại bỏ các thànhphần tần số lớn hơn 70Hz (do dữ liệu điện não có tần số dưới 70Hz) và thành phầntần số không phải tín hiệu điện não có tần số <0.5Hz, thành phần này thường làm tínhiệu bị kéo lên hay bị dịch nền Tín hiệu EEG thu được trong thực tế gồm nhiều loạinhiễu Do đó, luận án sử dụng3 bộ lọc là bộ lọc thông thấp, thông cao (sử dụng bộlọc Butterworth có tần số cắt lần lượt là70Hz và0.5Hz) và bộ lọc thông dải (bộ lọcNotch có tần số cắt là50Hz) để loại nhiễu số này làm tín hiệu có xu hướng bị kéo lênhay bị dịch nền Do tính trễ của bộ lọc do mà các mẫu đầu tiên sẽ được lọc nhiễu chưatốt và chứa nhiều nhiễu do đó luận án loại bỏ đoạn dữ liệu đầu tiên (cụ thể, với tập dữliệu hiện tại, luận án loại bỏ 1000 mẫu dữ liệu đầu tiên) Quá trình lọc nhiễu của bướctiền xử lý không loại bỏ bất cứ gai động kinh nào trong tập dữ liệu luận án sử dụng.Các gai động kinh trong dữ liệu EEG của các bệnh nhân bị động kinh luận án sử dụngđược đánh dấu bởi một bác sĩ có nhiều kinh nghiệm của Bệnh viện Nhi trung ương

1.6 Ma trận đánh giá

Các xét nghiệm chẩn đoán trong y học thường được sử dụng để phân loại cácbệnh nhân thành hai nhóm là có bệnh hay không có bệnh, tùy theo sự có hay không cómột hoặc một số triệu chứng, dấu hiệu bị bệnh Mối liên hệ giữa kết quả xét nghiệm

của một bệnh nhân được biểu diễn trên bảng 1.2 Trong luận án, các thuật ngữ dương tính và âm tính được sử dụng để biểu diễn kết quả của xét nghiệm là có hay không có

Trang 39

Bảng 1.2 Kết quả xét nghiệm và tình trạng của bệnh

Trong một số lĩnh vực, đặc biệt là trong y tế, để định lượng khả năng chẩn đoáncủa xét nghiệm người ta thường sử dụng ma trận đánh giá Hai tham số quan trọng

Trang 40

của ma trận đánh giá thường được sử dụng là độ nhạy SEN (Sensitivity) và độ đặchiệuSPE(Specificity).

Độ nhạy là tỷ lệ dương tính thật (True Positive Rate -TPR), được tính như sau:

TPR  SEN  TP

trong đó, TP (True Positive) là dương tính thật, tức là bệnh nhân có bệnh, kết quả xétnghiệm là dương tính và FN (False Negative) là âm tính giả, tức là trường hợp cóbệnh nhưng kết quả xét nghiệm chỉ ra là không có bệnh

Độ đặc hiệu SPE là tỷ lệ âm tính thật (True Negative Rate - TNR), được tínhnhư sau:

TNR  SPE  TN

trong đó, TN (True Negative) âm tính thật, tức là bệnh nhân không có bệnh, kết quảxét nghiệm là âm tính và FP (False Positive) là dương tính giả, tức là bệnh nhân không

có bệnh nhưng kết quả xét nghiệm lại đưa ra là dương tính

Tỉ lệ dương tính giả (False Positive Rate -FPR) được tính như sau:

phương pháp có khả năng phát hiện bệnh tốt Vì vậy, để chẩn đoán bệnh (phát hiện

ra bệnh nhân có bệnh hay không có bệnh), loại trừ khả năng bệnh nhân mắc bệnh mà

kết quả xét nghiệm lại âm tính, thông thường sử dụng phương pháp có độ nhạy cao.

Trường hợp kết quả xét nghiệm là dương tính giả, tức là thực tế bệnh nhân không cóbệnh nhưng kết quả xét nghiệm lại đưa ra là có bệnh sẽ dẫn đến nhiều hệ lụy cho bệnh

Ngày đăng: 26/03/2020, 16:28

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w