V l0 02858 noi dung co giật Động kinh và nhận diện co giật Động kinh Điện não V l0 02858 noi dung co giật Động kinh và nhận diện co giật Động kinh Điện não
Trang 1CHUONG 4 - MO PHONG HE THONG
4.1 Chuẩn bị dữ liệu EEG phuc vụ huấn luyện và kiểm tra
Chúng tôi sử dụng hệ thống đo EEG dòng E-series của Compumedics để thu đữ
liệu EEG trên 4 bệnh nhân Công việc được thực hiện tại phòng thí nghiệm của bộ
môn Xử lý thông tin Sơ đồ đặt điện cực theo tiêu chuẩn quốc tế 10-20 Bản ghi gồm
19 kênh đữ liệu, với tần số lẫy mẫu 256Hz Trong quá trình đo sử dụng bộ lọc thông dải từ 0.5 Hz đến 70Hz, bộ lọc notch filter 50Hz Dữ liệu sau khi đo được gửi cho chuyên gia đánh giá Cả 4 bệnh nhân đều đang trong quá trình điều trị động kinh Các bản ghi EEG đều xuất hiện gai Vi tri các đỉnh có khả năng là gai được các chuyên gia đánh dấu trên 19 kênh riêng biệt sau đó tổng hợp các thông tin về thời gian, không gian trên tất cả các kênh để kết luận một đỉnh có phải gai hay không Tổng thời gian
đo là 2 giờ 35 phút (trung bình 38.75 phút/bệnh nhân) Cả 4 bệnh nhân đều là nam giới, độ tuổi từ 4 đến 19 Tổng số gai được các chuyên gia đánh dấu là 71 gai Trong
số này, chúng tôi phân chia thành 2 loại, 56 gai phục vụ mục đích huấn luyện, 15 gai còn lại phục vụ kiểm tra hoạt động của hệ thống
Trang 267 4.2 Tiền xử lý
Tiền xử lý là giai đoạn đầu tiên của quá trình phát hiện gai tự động Giai đoạn này áp dụng các phương pháp xử lý đơn giản dựa trên hình thái (morphology) của tập
dữ liệu thô EEG thu từ thiết bị đo nhằm loại bớt những dữ liệu không chứa gai Mục tiêu của giai đoạn tiền xử lý bao gồm: i) phát hiện đỉnh, ij) loại bớt các đỉnh không phải gai và giữ lại các đỉnh có khả năng là gai Su dung cac phương pháp đơn giản trong giai đoạn này làm tăng hiệu suất của hệ thống khi phải xử lý trên một tập đữ liệu lớn và giảm bớt khối lượng tính toán cho các giai đoạn tiếp theo Do đó, tiêu chuẩn đánh giá của giai đoạn này là độ nhạy và tỉ lệ đữ liệu loại bỏ được
Đề hoàn thành mục tiêu trên, giai đoạn tiền xử lý được thực hiện theo hai bước: 1) tìm kiếm các đỉnh, tính toán các tham số của đỉnh và hoạt động nên, 2) sử dụng mạng perceptron để phân loại các đỉnh thành loại không phải gai và loại có khả năng
là gai dựa trên các tham số phân tích được ở bước 1
4.2.1 Phân tích các đặc trưng cúa đỉnh và hoạt động nền dựa trên hình thái
Dé phục vụ quá trình phát hiện ga1 tự động, các nghiên cứu đã tìm và tính toán
các đặc trưng về hình thái của gai Định nghĩa gai: “một xung (transient), phân biệt rõ ràng với hoạt động nên, có đỉnh nhọn quan sát ở tốc độ giấy thông thường, thời gian ton tai trong khoang 20 ms đến 70 ms” [2] Gai có đỉnh tương đối nhọn, biên độ lớn hơn các hoạt động nên Các gai đã được các chuyên gia xác nhận trên các bán ghi khác nhau được tính toán về độ lớn, thời gian tôn tại, độ đốc phục vụ quá trình phát hiện gal
4.2.1.1 Tìm đỉnh và loại bớt artifact
Trước tiên, tín hiệu trên mỗi kênh được tính trung bình và được trừ ra khỏi tín hiệu gốc Sau đó, hệ thông tìm kiêm và đánh dâu các đỉnh trên tập đữ liệu của mỗi kênh Thuật toán xác định đỉnh như sau: so sánh mẫu hiện tại với hai mẫu xung quanh, nêu mâu này lớn nhat thi mau là đỉnh đương, nêu mâu nhỏ nhât thì mau là đỉnh âm
Dữ liệu đã được loại bỏ artifact do chớp mắt, cử động, cơ trước khi được xử lý
để tìm đỉnh Nhiễu tần số 50Hz do điện lưới cũng được loại bỏ ngay trong quá trình
đo Các điểm gẫy (tồn tại những đỉnh quá nhỏ) trên các cạnh được loại bớt dựa trên cơ
Trang 3chế lẫy ngưỡng Các đỉnh này được loại bỏ bằng cơ chế lấy ngưỡng [5] như sau: nếu
độ dài đoạn nối 2 đỉnh kề nhau nhỏ hơn độ đài của đoạn liền kề phía trước và phía sau, đồng thời nếu đoạn này có biên độ và thời gian tương ứng nhỏ hơn 2 pV va 20 ms thi các đỉnh này được loại bỏ khỏi danh sách các đỉnh đã được đánh dẫu ở bước trên Công việc này giúp triệt tiêu các điểm gẫy khúc giữa các đỉnh trong quá trình mô hình hóa gai, đồng thời loại bỏ được một số lượng đáng kế các artifact
Hình 4.2 mô phỏng dữ liệu EEG trên một kênh lấy trong khoảng thời gian 1 giây gồm 256 mẫu
Hình 4.3 biểu điễn các đỉnh được hệ thống tìm thấy và đánh dấu
Hình 4.4 biểu diễn các đỉnh có biên độ nhỏ được loại bỏ khỏi đanh sách đỉnh, chỉ còn các đỉnh có biên độ đủ lớn được giữ lại Các đỉnh có biên độ nhỏ được loại bỏ (khoanh tròn) Thuật toán được thực hiện trên toàn bộ các bản ghi thu được để tìm và loại bớt các đỉnh nhỏ, đánh dấu các đỉnh phát hiện được
Trang 4Hình 4.3: Các đỉnh trên EEG được đánh dấu
Loai bo cac dinh co bien do nho 40r
Trang 54.2.1.2 Tính toán các tham số đặc trưng
Các đỉnh phát hiện được trong bước trước được chia thành các cạnh (halfwave)
để tính toán các tham số như biên độ, độ dốc, thời gian tồn tại Một đỉnh được mô hình hóa như một tam giác gồm đường nằm ngang được coi là cạnh đáy, hai cạnh còn lại là cạnh trước và cạnh sau Các tham số về hình thái được tính toán trên mô hình này Các đỉnh có các tham số không phù hợp được loại bỏ bớt Mô hình gai này chỉ được sử dụng trong giai đoạn tiền phân loại, ở các giai đoạn sau dữ liệu EEG ốc được sử dụng
Hinh 4.5: Cac dac trung hinh thai cua dinh [5]
Trong nghiên cứu của mình Nurettin Acir và cộng sự [5] đã đưa ra các tham số đặc trưng về hình thái của một đỉnh như sau:
1 Biên độ cạnh trước (FHWA): được đo bằng hiệu độ lớn đỉnh - đáy của cạnh trước (ba đỉnh liền kề nhau tạo thành một tam giác)
2 Biên độ cạnh sau (SHW4): được đo băng hiệu độ lớn đỉnh- đáy của cạnh sau 3 Thời gian tôn tại cạnh trước (FHWD): được tính bằng khoảng thời gian từ đáy cạnh trước đến đỉnh cạnh trước
4 Thời gian tôn tại cạnh sau (SHWD): được tính bằng khoảng thời gian từ đỉnh
đên đáy cạnh sau
Trang 6Trước tiên, các đỉnh âm và dương được đánh dấu FHWA được tính băng biên
độ đỉnh đương trừ biên độ đỉnh âm phía trước SHWA được tính bằng biên độ đỉnh dương trừ biên độ đỉnh âm phía sau Kết quả của giai đoạn tìm đỉnh và các đặc trưng
là một ma trận gồm các cột về vị trí của đỉnh, tham số của đỉnh và đánh dấu đỉnh tương ứng là ga1 hay không theo đánh giá của chuyên gia
Bảng các thông số được tính toán cho các đỉnh tìm được trong 256 mẫu của
| AL 14.2823) 33.2235) 10) 9) 1.42823) 3.6215 đ Wo 7) _3.6915| 8.656414
| 6 60.5242 56.5609} A 8] 8.656414) 7.070113
— 8) 20) 7.070113) 2.93047) .L L 3| Z.23047 0.777433
93 233224 2211 —- 3 5} 0.777433) 0.45422 _ An 0 nS 1 20} 0.45422) 1.366255)
pe 21) 9.4308) 1/57 6 6 S718) 0.29295 pe: 22.1757 21253 6 lI 0.29295) 0.836318
pe 23) 9.1995, 9.7763) AN 6} 0.836318) 0.96275
po 24) 5.7765, 18826 6 12] 0.96275) 0.990889
pe 25| 18.8269, 31.4281) I2 24) 0.990889) 1.309504
pd 26| 31.4281) 13.6176) 24 5} 1.309504) 2.72352
Trang 7được các bài toán mà các mẫu có thể phân chia thành hai vùng tuyến tính Tuy nhiên,
mang perceptron van la một lớp hàm được sử dụng rộng rãi do tốc độ nhanh và tin cậy khi được áp dụng trong một số bài toán phân loại mà mạng này có thể giải quyết [22]
Đề quá trình huấn luyện hội tụ, các tham số của đỉnh phải đảm bảo phân chia đỉnh thành hai vùng tuyến tính Mạng này được huấn luyện bằng tập hợp dữ liệu cho trước bao gồm các đỉnh là gai và không phải gai đã được chuẩn bị để phân loại các đỉnh
thành hai loại [5]
4.2.2.1 Cầu trúc mạng perceptron một lớp
Mạng perceptron một lớp được sử dụng trong hệ thống này gồm 6 đầu vào, l nơ-ron, 1 đầu ra Hàm truyền hardlim quy định đầu ra là 0 tương ứng với đỉnh không phải gai và 1 tương ứng với đỉnh có khả nắng là gai
Mạng sử dụng thuật toán huấn luyện có giám sát để điều chỉnh các trọng số liên kết
Dữ liệu huấn luyện là tập hợp {ø,í,} trong đó ø; là vector đữ liệu đầu vào và í;
là đầu ra mong muốn Trong trường hợp cụ thể này, ø, là vector gồm 6 đặc trưng của đỉnh đã được phân tích trong bước trước (thời gian tồn tại, biên độ, độ dốc của cạnh trước, cạnh sau) và í, có một trong hai giá trị l1 hoặc 0 tương ứng với đỉnh là gai hoặc
đỉnh không phải gai đã được chuyên gia đánh giá.
Trang 8Hinh 4.6: Mang Perceptron [22]
Vector trọng số liên kết được cập nhật theo công thức [22]:
Trong đó W là vector trọng số liên kết của mạng, đ” là dữ liệu ra mong muốn, ?Ÿ là
dữ liệu ra thực tê, 77 là tôc độ học của mạng, X” là vector đữ liệu đâu vào, & là sô thứ
tự của mẫu Hàm lôi ra của perceptron được xác định theo công thức:
Mạng perceptron được huấn luyện để phân chia các đỉnh thành loại có khả năng
là gai và loại không phải gai dựa trên tập dữ liệu do chuyên gia đánh đấu Trong giai đoạn này, tham số độ nhạy được ưu tiên cao, phải đảm bảo tất cả số gai đã được chuyên gia đánh dấu được hệ thống chi nhận Tham số về độ chọn lọc sẽ cho biết tỉ lệ
Trang 9phân loại của hệ thống Tham số này càng lớn, cho phép giảm khối lượng tính toán trong các giai đoạn sau Tỉ sô lỗi trên giờ lớn là châp nhận được ở giai đoạn này
Dữ liệu dùng để huẫn luyện mạng perceptron là ma trận các tham số phân tích trên tập hợp các bản ghi gồm 5888 mẫu với các đỉnh và các tham số của đỉnh được tính toán trong bước trước Trong đó có 10 gai đã được đánh dấu bởi chuyên gia Tốc
độ học của mạng được gán bằng 1 Mạng perceptron được khởi tạo bằng hàm newp(p,t) Hàm huấn luyện sử dụng là hàm train() của Matlab
Dữ liệu kiểm tra hoạt động của mạng là ma trận các tham số được phân tích từ bản ghi có độ dài 2123 mẫu, trong đó có 4 gai
Khả năng phân loại của hệ thống được đánh giá dựa trên độ nhạy, độ chọn lọc
và tốc độ sai trên giờ Độ nhạy là tỉ số giữa số gai hệ thống phát hiện đúng trên số gai
được đánh dấu bởi chuyên gia Độ chọn lọc được định nghĩa là tỉ sỐ giữa sỐ gai hệ thống phát hiện đúng trên tông số gai mà hệ thống ghi nhận Các gai phát hiện được gọi là đúng nếu cả chuyên gia và hệ thống đều ghi nhận là gai Tỉ số lỗi được đo bằng
số lỗi mà hệ thống phát hiện sai trên một giờ
Performance: = Mean Absolute Error (rac)
Training State (plottrainstate}
Plot Interval: ~„ 1 epochs
Trang 10Sau giai đoạn tiền phân loại, các đỉnh có khả năng là gai được phát hiện bởi mang perceptron dugc trich xuất để tạo một tập dữ liệu mới trong đó dữ liệu gốc vẫn được dữ nguyên Dữ liệu trích xuất là một cửa số chứa đỉnh nằm ở vị trí trung tâm Chúng tôi sử dụng một cửa số gồm 128 điểm dữ liệu thô chứa đỉnh để phân tích wavelet Việc sử đụng cửa số đủ lớn giúp mang các thông tin về bối cảnh tại đó gai xuất hiện Cửa số được xác định như sau: từ điểm đỉnh, chúng tôi lẫy 10 điểm về phía trước và 117 điểm về phía sau [5]
4.3 Biến đổi wavelet
Phân tích tín hiệu trong miễn tần số sử dụng biến đổi Fourier chỉ cho biết thông tin về các thành phần tần số xuất hiện trong tín hiệu mà không cho biết thông tin về thời gian tại đó thành phân tần số xuất hiện Các biến đổi đột ngột (transient) chỉ khác không trong một khoảng thời gian ngắn, chúng có tính cục bộ cao, chỉ xuất hiện tại những thời điểm nhất định EEG là tín hiệu không dừng, do đó biến đổi Fourier không thích hợp trong việc phân tích các đặc trưng tần số của EEG Các phép biến đổi thời gian- tần số cung cấp thêm thông tin về thời gian tại đó thành phần tần số xuất hiện
Gai động kinh là một biến đổi có tần số cao so với các hoạt động nên, đó là lý
do tại sao ta chỉ cần quan tâm đến một số dải tần số nhất định của gai mà không phải tất cả các dải tần số Việc lựa chọn các scales thích hợp để huấn luyện mạng ANN làm giảm đáng kê số lượng đầu vào mạng ANN, đồng thời không làm giảm nhiều lượng thông tin chứa trong đữ liệu Điều này đặc biệt có ý nghĩa khi phải xử lý trên lượng đữ liệu lớn gồm nhiều kênh như EEG Việc ứng dụng wavelet cho phép mở rộng cửa số quan sát đỉnh để chứa đựng thêm các thông tin về hoạt động nền Điều này sẽ khó thực
Trang 11hiện nếu dữ liệu thô này được đưa trực tiếp tới đầu vào mạng ANN do làm tăng s6 đầu vào và khối lượng tính toán của ANN
Biến đổi CWT của hàm theo thời gian x(‡) được định nghĩa như sau:
4.3.1 Hàm wavelet
Một tín hiệu được phân tích thành các hàm wavelet dựa trên việc trượt hàm wavelet mẹ theo chiều thời gian và mở rộng theo các scale khác nhau Việc lựa chọn hàm wavelet mẹ phụ thuộc vào từng ứng dụng Lựa chọn các hàm wavelet khác nhau ảnh hưởng đến hệ số của các scale và do đó ảnh hưởng đến việc phát hiện gai của hệ thống Trong đề tài này, chúng tôi thử nghiệm với hàm wavelet bior1.5 Hàm bior1.5 thuộc họ hàm bior là hàm đối xứng, không trực giao
32 scales được sử dụng để phân rã các đoạn EEG được lựa chọn bởi giai đoạn tiền phân loại Tham số z được lẫy mẫu đối xứng:
Trang 13Hình 4.10 chỉ ra kết quả của biến đổi wavelet Đường trên cùng biểu điễn một đoạn tín hiệu gốc trong đó có chứa các gai Các đường bên dưới là các scale 1, 2, 4, 6 và 8 của phép biến đôi wavelet Ta thấy rằng, ở các scale này các thành phân tần số thấp bị loại
bỏ, chỉ còn xuất hiện các thành phần tần số cao Các thành phân tần số được phân tách một cách trật tự, từ thành phân tần số cao tới thành phần có tân số thấp Như vậy, sau quá trình biên đôi wavelet, cac gai ndi trdi trong 8 scale dau tiên
4.3.2.1 Lựa chọn đỉnh trên các scales [6]
Các scale được phân tích WT không được đưa trực tiếp đến đầu vào mạng ANN, sau khi phân tích và lựa chọn, các đỉnh vượt một ngưỡng nhất định trên các scales nay duoc sử dụng để tính toán các đặc trưng làm đầu vào mạng ANN
Các ngưỡng khác nhau được đặt cho mỗi scale, sóng nào vượt quá ngưỡng đã đặt được ghi nhận cho các bước xử lý tiếp theo Biên độ hoạt động nền của các hệ số wavelet tại các scales được sử dụng làm ngưỡng
Trung bình động của hệ số trên scale thứ ø là 4ver”() được tính theo công thức [6]:
Aver"(£)= Aver" (t-l).é +@"().(1—#) (4.7) Ngưỡng tại điểm ¿ là ø”(¿) được tính theo công thức:
Ø?()= aon (t—1).é+| @" (1) — Aver"()|.(1— £) (4.8)
Trong d6 w"(t) 1a hé số wavelet, 4ver"() là giá trị trung bình động của các hệ số wavelet tại scale n Hệ số ễ được đặt băng 0.9933 Giá trị ban đầu của (0) va Aver” duoc tinh bang gia trị trung bình của đoạn có ø”(/)tương đối trơn Giá trị của œ; (0) và 4ver" chỉ được cập nhật khi biên độ 2” (¿) nhỏ hơn biên độ hoạt động nên
Trang 14Hình 4.10: Phân tích tín hiệu dùng wavelet với hàm sóng con bIor 1.5
4.3.2.2 Tính toán các tham số của đỉnh [6]
2500
Đê huân luyện cho mạng nơ-ron, chúng tôi sử dụng các tham sô được tính toán
từ các hệ sô của các scales Sử dụng các tham sô đặc trưng được tính từ các hệ sô wavelet thay vì lẫy trực tiếp các hệ số wavelet hay các tham số của dữ liệu EEG thô vì dạng sóng EEG khác nhau nhiều từ bản ghi này sang bản ghi khác, rất khó để mạng
đỉnh trên các scales Các đỉnh này được tính toán các tham sô vr
A
Các tham số được lựa chọn là:
ANN có thể nhóm lại các dạng sóng khác nhau này Ko và cộng sự [13] đã kết luận rằng việc sử dụng đữ liệu thô của EEG làm đầu vào cho mạng nơ-ron để phát hiện gai
là không khả thi cho các công nghệ máy tính hiện tại Để đưa tới đầu vào mạng nơ-ron cho bước phân loại tiếp theo, một số scale được lựa chọn Sau đó các sóng có độ lớn vượt quá một ngưỡng nhất định được trích xuất Các sóng này được biểu hiện bởi các
Trang 15RÁU =|aca | /@r(P) › RÁ\„ =l cx |/O;(P) (4.9)
Trong đó ø;(p) là biên độ nền của hệ số wavelet tại thời điểm sóng đạt tới đỉnh Biên độ nền được tính theo công thức (4.7) và (4.8)
Biên độ tương đối 2 ( R4,, và RA,,: được tính bằng thương giữa hiệu độ lớn giữa đỉnh và các điểm uốn với biên độ nên
RA,, =| Igy |/@r(P) > RA, =| cz / O;(P) (4.10) Trong đó, điểm uốn được định nghĩa là điểm đầu tiên tại đó độ dốc của đỉnh giảm hơn 50% so với độ đốc của điểm phía trước (tính từ đỉnh)
Thời gian tồn tại 1(W,): số điểm dữ liệu giữa điểm đầu và điểm cuối của sóng,
tương ứng với W„, trong Hình 4.11
Thời gian tồn tại 2 (W,): số điểm đữ liệu giữa hai điểm uốn của sóng, tương ứng với ƒ,„ trong Hình 4.11
Trang 1681 5) Thời gian tổn tai 3 (W,): là khoảng cách giữa hai “điểm giữa” Các điểm giữa là
các điểm tại đó biên độ bằng một nửa biên độ của |z„„| hoặc | z¿; |, tương ứng với W„ trong Hình 4.11
6) Độ sắc nét (SH): là sự tốc độ thay đối của độ dốc tại điểm đỉnh Nếu điểm đỉnh được ký hiệu là x, SH được tính như sau:
4.4 Mạng nơ-ron nhân tạo
Một ưu điểm nổi bật của mạng ANN là được huấn luyện dựa trên tập hợp các mẫu mà không cần một định nghĩa rõ ràng về gai Quá trình huấn luyện bao gồm việc cung cấp các mẫu đã được đánh dấu là gai và các mẫu không phải gai để mạng ANN học Quá trình học và ghi nhận gai được thực hiện tương tự như cách của con người
Do các gai không được định nghĩa định rõ ràng để chỉ ra tập các quy tắc cụ thể, việc sử dụng mạng ANN là phù hợp cho việc phát hiện gai [11] Hơn nữa, khi được huấn luyện thích hợp, mạng ANN có khả năng nhận biết cả các gai chưa từng xuất hiện trong quá trình huấn luyện, đây là một ưu điểm khi mà hình dạng của gai biến đổi trên các bản ghi khác nhau
Trong hệ thống này, chúng tôi sử dụng đầu vào mạng ANN là các tham số của
sóng vượt quá một ngưỡng động trên các scale của biến đối Wavelet Các đỉnh được phân tích bởi biến đổi wavelet, phân tách thành các scale, sau đó các scale mang thông tin đặc trưng cho gai được lựa chọn Các sóng có biên độ vượt quá ngưỡng động trên mỗi scale được phân tích các đặc trưng Các đặc trưng này được đưa tới đầu vào mạng ANN Mạng ANN được sử dụng là mạng Multilayer Perceptron (MLP), với đầu vào là