1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim

8 20 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 8
Dung lượng 582,53 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nội dung chính của bài viết này là đề xuất giải pháp nâng cao chất lượng (độ chính xác) nhận dạng tín hiệu điện tim ECG (ElectroCardioGraphy), dựa trên việc sử dụng cây quyết định nhị phân (Binary Decision Tree) để phối hợp nhiều mô hình nhận dạng đơn là các mạng nơron kinh điển MLP (Multi Layer Perceptron), mạng nơron logic mờ TSK (Takaga-Sugeno-Kang), máy học vectơ hỗ trợ SVM (Support Vectơ Machines) và rừng ngẫu nhiên RF (Random Forest).

Trang 1

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim

Decision tree application to build a coordinated model to improve the

quality of ECG signal recognition

Đỗ Văn Đỉnh, Phạm Văn Kiên

Email: dodinh75@gmail.com

Trường Đại học Sao Đỏ Ngày nhận bài: 9/10/2019 Ngày nhận bài sửa sau phản biện: 23/12/2019

Ngày chấp nhận đăng: 31/12/2019

Tóm tắt

Nội dung chính của bài báo này là đề xuất giải pháp nâng cao chất lượng (độ chính xác) nhận dạng tín hiệu điện tim ECG (ElectroCardioGraphy), dựa trên việc sử dụng cây quyết định nhị phân (Binary Decision Tree) để phối hợp nhiều mô hình nhận dạng đơn là các mạng nơron kinh điển MLP (Multi Layer Perceptron), mạng nơron logic mờ TSK (Takaga-Sugeno-Kang), máy học vectơ hỗ trợ SVM (Support Vectơ Machines) và rừng ngẫu nhiên RF (Random Forest) Sử dụng các hàm cơ sở Hermite (Hermite Basis Functions) để khai triển phức bộ QRS và hai đặc tính về thời gian là khoảng cách giữa hai đỉnh R liên tiếp (R-R), giá trị trung bình của 10 khoảng cách R-R cuối cùng Các thuật toán

đã được triển khai thử nghiệm trên các bộ mẫu số liệu kinh điển của quốc tế cơ sở dữ liệu MIT-BIH (Massachusetts Institute of Technology, Boston’s Beth Israel Hospital) và cơ sở dữ liệu MGH từ trang web http://physionet.org

Từ khóa: Mạng nơron; MLP; TSK; SVM; hệ thống tích hợp; cây quyết định; chức năng cơ sở Hermite;

tín hiệu điện tâm đồ (ECG); IC FPAA; IC ARM.

Abstract

The paper presents a solution to improve the accuracy of arrhythmia recognition based on the integration

of multiple classifiers using the binary decision tree The solution uses as the single classifiers the classical MLP (Multi Layer Perceptron), neuro-fuzzy TSK network (Takaga-Sugeno-Kang), SVM (Support Vectơ Machines) and RF (Random Forest) The Hermite basis functions were used to generate the feature vectơs together with 2 time-based features: the last R-R period and the average of last 10 R-R periods The proposed solution was tested with ECG signals taken from 2 databases MIT-BIH (Massachusetts Institute of Technology, Boston’s Beth Israel Hospital) and MGH available at http://physionet.org

Keywords: Neural network; MLP; TSK; SVM; Integrated System; Decision Tree; Hermite Basis Functions; Electrocardiogram (ECG) Signals; IC FPAA; IC ARM

Người phản biện: 1 PGS.TS Trần Vệ Quốc

2 PGS.TS Bạch Long Giang

CÁC CHỮ VIẾT TẮT

ARM Advanced RISC Machine

DT Decision Tree

ECG ElectroCardioGram

FN False Negative

FP False Positive

FPAA Field Programable Analog Arrays

IC Intergrated Circuit MIT-BIH MIT-BIH Arrhythmia Database MGH/MF MGH/MF Waveform Database MLP Multi Layer Perceptron Network

PC Personal Computer QRS QRS Complex

RF Random Forest

SD Secure Digital SVD Singular Value Decomposition SVM Support Vectơ Machines

Trang 2

1 ĐẶT VẤN ĐẾ

Tín hiệu điện tim ECG có độ biến đổi rất mạnh cả

về hình dáng, biên độ ở các trường hợp bệnh lý

Tín hiệu cũng dễ bị ảnh hưởng bởi nhiễu từ bên

ngoài, tình trạng sức khỏe hay tâm lý của bệnh

nhân Nên nhận dạng ECG là một trong những bài

toán khó Thực tế hiện nay có nhu cầu về thiết bị

đo điện tim thông minh có chức năng nhận dạng

tự động các trường hợp bệnh lý, yêu cầu giải pháp

nhận dạng cần có độ chính xác cao và phân biệt

được nhiều loại bệnh để có thể áp dụng cho nhiều

đối tượng bệnh nhân,…

Xuất phát từ những nhu cầu thực tế trên, mục tiêu

đặt ra của bài báo này là đề xuất một giải pháp để

nâng cao chất lượng nhận dạng tín hiệu điện tim

(giảm số mẫu nhận dạng sai)

Hiện nay, đã có rất nhiều các giải pháp khác nhau

để nâng cao chất lượng nhận dạng tín hiệu điện

tim ECG được các tác giả trong nước và quốc tế

nghiên cứu và công bố, như từ khâu thu thập, tiền

xử lý, trích chọn đặc tính hay khối nhận dạng (phi

tuyến) Đa số các giải pháp đều ở dạng “mô hình

đơn”, một số ít các giải pháp ở dạng “mô hình phối

hợp” Như trong nghiên cứu [1], tác giả kết hợp

hai mô hình đơn là SVM và PSO (Particles Swarm

Optimization) kết quả thử nghiệm trên bộ cơ sở dữ

liệu L MIT-BIH có độ chính xác tăng khoảng 4% so

với khi sử dụng SVM đơn lẻ, hay như trong công

trình [4] tác giả kết hợp mạng logic mờ Fuzzy KNN

(Fuzzy K Nearest Neighbors) và mạng MLP cho

kết quả có độ chính xác được cải thiện từ 97,3%

lên 98%

Xu thế đang phát triển hiện nay là sử dụng các

mô hình phối hợp để nhận dạng, nhất là các bài

toán đòi hỏi độ nhận dạng có chính xác cao như

nhận dạng tín hiệu điện tim ECG, mô hình sử dụng

nhiều mô hình nhận dạng đơn để đưa ra các kết

luận (có thể khác biệt) sau đó thêm một khâu xử

lý nữa để tổng hợp lại các kết quả từ các mô hình

nhận dạng đơn để đưa ra kết luận cuối cùng, một

số ưu điểm của giải pháp “mô hình phối hợp”:

- Mỗi “mô hình đơn” được coi như một chuyên gia

độc lập, việc phối hợp nhiều chuyên gia sẽ cho kết

quả đáng tin cậy hơn

- Sử dụng các đánh giá từ nhiều góc độ, từ nhiều

phương pháp khác nhau nên thông tin có thể

phong phú hơn dẫn tới chất lượng quyết định sẽ

cao hơn

Tuy nhiên, mô hình này cũng có một số nhược

điểm như:

- Hệ thống sẽ cồng kềnh, phức tạp hơn

- Cần xây dựng phương pháp tổng hợp phù hợp, nếu phối hợp không tốt thì sẽ làm kết quả kém đi

Hình 1 Sơ đồ chung của mô hình phối hợp

Sơ đồ khối tổng quát của giải pháp phối hợp được trình bày như trên hình 1, trong đó các hệ thống nhận dạng đơn sẽ xử lý cùng một tín hiệu đầu vào

từ đối tượng (nhưng theo các cách khác nhau) và đầu ra của các hệ thống nhận dạng đơn sẽ tạo thành đầu vào của khối tổng hợp, kết quả của khối tổng hợp cũng sẽ là kết quả nhận dạng cuối cùng

Từ mục đích đặt ra ở trên, qua tìm hiểu, phân tích những ưu điểm của các giải pháp nâng cao chất lượng nhận dạng tín hiệu điện tim ECG, bài báo lựa chọn theo hướng nghiên cứu thứ hai, tức là sử dụng mô hình phối hợp song song nhiều mô hình nhận dạng đơn

Một số phương pháp tổng hợp kết quả đã được các tác giả khác áp dụng như [5, 6]:

- Biểu quyết theo đa số (Majority voting)

- Biểu quyết có trọng số (Weighted voting)

- Tổng hợp theo xác suất điều kiện Bayes,… Bài báo này đã đề xuất sử dụng Cây quyết định nhị phân (Binary Decision Tree) làm khối tổng hợp kết quả và các mô hình nhận dạng đơn được

sử dụng là: mạng nơron kinh điển MLP, mạng nơron logic mờ TSK, máy vectơ hỗ trợ SVM và rừng ngẫu nhiên RF Các mô hình đơn này được lựa chọn do đây là các kết quả đã được công bố trên các tạp chí và hội thảo quốc tế nên đảm bảo được sự khách quan và tính chính xác [7], đồng thời cũng là những kết quả đươc thực hiện trên cùng một bộ số liệu đầu vào nên việc so sánh sẽ thuận tiện và có tính thuyết phục, trong đó phương pháp rừng ngẫu nhiên RF được nhóm tác giả xây dựng thêm ở trong bài báo này

Theo hình 2, giả thiết mỗi khối nhận dạng đơn Ci

sẽ tạo ra đầu ra kết quả tương ứng y i (i = 1,2, ,M)

nó là một giá trị chứa mã nhận dạng Khi đó đầu vào của cây quyết định sẽ là vectơ tổng hợp

x = [y i , y i , y M] Đầu ra của Cây quyết định z sẽ là kết luận cuối cùng về nhịp tim đang xử lý

Mô hình nhận dạng đơn 1

Mô hình nhận dạng đơn 2

Mô hình nhận dạng đơn M

y1

y2

yM ECG

z

Hệ thống tổng hợp kết quả

Trang 3

Hình 2 Mô hình kết hợp sử dụng cây quyết định

2 CÂY QUYẾT ĐỊNH

Cây quyết định DT (Decision Tree) là một mô hình

phân loại dữ liệu kinh điển đã được sử dụng rất

rộng rãi trong nhiều ứng dụng thực tế Cây thường

được mô tả ở dạng cấu trúc phân tầng như trên

hình 3 Cây gồm một tập hợp các nút và nhánh với

các điều kiện sau:

- Tồn tại một nút được gọi là nút gốc

- Nút chứa điều kiện phân nhánh

- Ở nút lá (không có nhánh con) thì kết quả nhận

dạng sẽ là kết quả chung của lá

Cây quyết định có các nút điều kiện đơn giản

nhưng do phối hợp nhiều nút nên ta có được hàm

phân chia có độ phi tuyến cao phù hợp với các bài

toán phân loại phức tạp, nhưng việc xây dựng các

điều kiện nút vẫn tương đối đơn giản (bài báo sử

dụng thuật toán ID3 để xây dựng cây)

Hình 3 Ví dụ về cấu trúc của cây quyết định

Trong bài báo sử dụng cây nhị phân (bậc 2) để

đơn giản hóa việc mô tả các thuật toán, điều này

không làm giảm tính tổng quát của cây do một cây

bậc bất kỳ đều có thể chuyển về một cây nhị phân

tương đương như trong hình 4

Hình 4 Phương pháp chuyển một nút bậc cao (hình

trái) thành một nút nhị phân (bậc 2) (hình phải)

C1

C2

CM

Trích chọn đặc tính

Tổng hợp kết quả = Cây quyết định

y1

y2

yM

Thu thập

và tiền

xử lý

ECG

z

.

3 CÁC MÔ HÌNH NHẬN DẠNG ĐƠN 3.1 Mạng nơron MLP

Mạng MLP là mạng nơron phổ biến, nó là một mạng truyền thẳng với các phần tử cơ bản gọi là nơron Trong bài báo sử dụng mạng MLP với một lớp ẩn có cấu trúc như hình 5 Nhiệm vụ đặt ra

là phải xác định cấu trúc cố định cho mạng MLP:

số lớp ẩn, hàm truyền đạt của mỗi lớp, số lượng nơron trên mỗi lớp, trọng số ghép nối giữa nơron trong mô hình MLP có thể được điều chỉnh lại cho phù hợp trong quá trình học để xuất các tín hiệu đầu ra mong muốn Thuật toán của quá trình học được sử dụng cho mô hình MLP trong bài báo này

đã được đề xuất bởi Levenberg và Marquardt [9]

Hình 5 Mạng MLP với một lớp ẩn

3.2 Mạng nơron mờ TSK

Mô hình nhận dạng đơn thứ hai được sử dụng trong bài báo là mạng Takagi-Sugeno-Kang (TSK) Mạng TSK đã được trình bày khá chi tiết trong [9] nên trong bài báo này sẽ không trình bày lại nữa, bài báo sử dụng mô hình TSK có cấu trúc như trong nghiên cứu [7, 8]

3.3 Mô hình phân loại SVM

Mô hình nhận dạng đơn thứ ba dùng trong bài báo này là SVM (Support Vectơ Machine) hay còn gọi là máy vectơ hỗ trợ Mặc dù mô hình SVM chỉ phân chia dữ liệu thành hai lớp, tuy nhiên việc phân loại đối với nhiều lớp hơn cũng không hề phức tạp, có thể áp dụng phương pháp một chọi một, hay một chọi tất cả như trong nghiên cứu [5] Phương pháp hiệu quả hơn là phương pháp một chọi một, ở phương pháp này nhiều mạng SVM được xây dựng để phân loại trong tất cả các tổ hợp của hai lớp dữ liệu Với N lớp, chúng ta phải xây dựng mạng SVM đơn lẻ

X=?

Đối tượng nhận dạng

X=A

X=B

X=C

Đối tượng nhận dạng

X=?

Đối tượng nhận dạng

X=A

X=B

X=C

X=A Đối tượng nhận dạng

Input

Trang 4

3.4 Rừng ngẫu nhiên RF

Mô hình nhận dạng đơn cuối cùng dùng trong bài

báo này là mô hình rừng ngẫu nhiên RF (Random

Forest) được phát triển từ L Breiman (2001) [3],

cấu trúc cơ bản của mô hình RF là tập hợp số

lượng lớn N các cây quyết định không cắt tỉa, cấu

trúc của mỗi cây quyết định được huấn luyện ngẫu

nhiên từ một tập dữ liệu mẫu biết trước Các bước

tạo cấu trúc của RF:

- Đầu vào là tập dữ liệu dùng để huấn luyện

- Mỗi mô hình RF là tập hợp N cây quyết định với

N được lựa chọn trước

- Cấu trúc của mỗi cây quyết định được huấn

luyện bởi một tập mẫu lấy ngẫu nhiên trong bộ

mẫu chung

- Các cây quyết định đơn không cần sử dụng các

thuật toán cắt tỉa để giảm nút lá hoặc để giảm số

tầng của cây

- Khâu tổng hợp các kết quả nhận dạng từ N cây

quyết định phổ biến sử dụng phương pháp bỏ phiếu

theo đa số để đưa ra kết quả cuối cùng cho RF

Như vậy đối với một mẫu dữ liệu mới đưa vào để

kiểm tra, trước tiên nó được đưa qua N cây quyết

định để phân loại, mỗi cây sẽ có 1 kết quả riêng

(có thể giống hoặc khác nhau) và N kết quả này

sẽ đưa vào khâu tổng hợp để xử lý và đưa ra kết

quả cuối cùng

4 TRÍCH CHỌN ĐẶC TÍNH VÀ CƠ SỞ DỮ LIỆU

TÍN HIỆU ĐIỆN TIM ECG

4.1 Trích chọn đặc tính tín hiệu điện tim

Bài báo sử dụng các hàm cơ sở Hermite (Hermite

Basis Functions) để khai triển các phức bộ QRS

nhằm lấy các hệ số khai triển làm vectơ đặc trưng

của tín hiệu Ngoài ra ta còn sử dụng thêm hai

đặc tính về thời gian: khoảng cách giữa hai đỉnh

R liên tiếp, giá trị trung bình của 10 khoảng cách

R-R cuối cùng

Hàm Hermite có công thức như sau:

Với H n( )x là đa thức Hermite được định nghĩa ở

dạng đệ quy:

Cho n ≥ 1 với

Quan sát trên hình 6 ta có thể bậc của hàm

Hermite càng cao thì tốc độ biến thiên của hàm

càng lớn, hay nói cách khác hàm sẽ chứa nhiều thành phần bậc càng cao Đồng thời dáng điệu của các hàm cũng khá tương đồng với hình dạng các thành phần cơ bản trong tín hiệu ECG Đây chính là cơ sở của việc sử dụng hàm Hermite để phân tích tín hiệu điện tim ECG

Hình 6 Đồ thị của hàm Hermite bậc n: a) n=0; b) n=1; c) n=3; d) n=10

Để biểu diễn tín hiệu điện tim s(t) theo N hàm Hermite đầu tiên như trong công thức (3), ta sử dụng phân tích theo các giá trị kỳ dị SVD (Singular Value Decomposition) để tìm nghiệm tối ưu của hệ phương trình bậc nhất có số phương trình nhiều hơn số ẩn, chi tiết có thể tìm hiểu trong [7, 8]

Hình 7 Xấp xỉ tín hiệu ECG bằng N hàm Hermite

đầu tiên: a) N=5; b) N=10; c) N=12; d) N=16

Từ hình 7 ta có thể nhận thấy tín hiệu ECG và nhất

là đoạn phức bộ QRS đã được xấp xỉ rất tốt khi

sử dụng 16 hàm Hermite cơ sở đầu tiên, sai số tại các đỉnh Q, R và S nhỏ, trong hình 8 ta thấy ngay

cả với các trường hợp bệnh lý, tín hiệu biến thiên

s (t)c

i i=0

N−1

𝜓𝜓!(𝑥𝑥) = (√𝜋𝜋 ⋅ 2!⋅ 𝑛𝑛!)"#$𝑒𝑒"%$!𝐻𝐻!(𝑥𝑥) (1)

(2)

𝐻𝐻!"#(𝑥𝑥) = 2𝑥𝑥 ⋅ 𝐻𝐻!(𝑥𝑥) − 2𝑛𝑛 ⋅ 𝐻𝐻!$#(𝑥𝑥)

0( ) 1; ( ) 2 1

H xH x = x

(d) (c)

Trang 5

mạnh thì việc khai triển tới 16 hàm Hermite cơ sở

đầu tiên vẫn khá tốt

Hình 8 Hình ảnh xấp xỉ tín hiệu ECG bằng 16 hàm

Hermite đầu tiên đối với một số loại nhịp tim khác

Tập hợp 16 các giá trị này được sử dụng để tạo

thành vectơ đặc tính của tín hiệu điện tim Ngoài

ra sử dụng thêm hai đặc tính về thời gian: khoảng

cách giữa hai đỉnh R liên tiếp R-R, giá trị trung

bình của 10 khoảng cách R-R cuối cùng Như vậy,

vectơ đặc tính có 18 giá trị

4.2 Cơ sở dữ liệu của tín hiệu điện tim ECG

a) Cơ sở dữ liệu MIT-BIH

Bộ cơ sở dữ liệu tín hiệu điện tim ECG đầu tiên sử

dụng trong bài báo là bộ cơ sở dữ liệu về chứng

loạn nhịp tim nổi tiếng MIT BIH [2], lựa chọn lấy

các bản ghi của 19 bệnh nhân (mã số trong cơ sở

dữ liệu là 100, 105, 106, 109, 111, 114, 116, 118,

119, 124, 200, 202, 207, 208, 209, 212, 214, 221

và 222), phân loại 6 kiểu rối loạn nhịp tim được

xem xét là: block nhánh trái (L), block nhánh phải

(R), ngoại tâm thu nhĩ (A), ngoại tâm thu thất (V),

rung thất (I) và tâm thất lỗi nhịp (E) và 1 kiểu nhịp

bình thường (N) Số lượng chi tiết mẫu lấy từ bản

ghi của 19 bệnh nhân được thống kê chi tiết trong

bảng 1 và bảng 2 dưới đây:

Bảng 1 Bảng phân chia số lượng mẫu học và

mẫu kiểm tra của 7 loại rối loạn nhịp tim từ CSDL

MIT-BIH

Loại

nhịp Tổng số mẫu Số mẫu học kiểm tra Số mẫu

Tổng 6643 3611 3068

Bảng 2 Bảng phân chia số lượng mẫu học và mẫu

kiểm tra của 2 loại nhịp

Loại nhịp Tổng số mẫu Số mẫu học kiểm tra Số mẫu

Tổng 6643 3611 3068

b) Cơ sở dữ liệu MGH

Bộ cơ sở dữ liệu thứ hai là MGH [11], bộ CSDL này gồm có 250 bản ghi của tín hiệu ECG, thu thập từ 250 bệnh nhân tim mạch tại các phòng chăm sóc đặc biệt, phòng mổ, phòng thí nghiệm thông tim, tại Bệnh viện Đa khoa Massachusetts Bài báo lựa chọn sử dụng các mẫu tín hiệu ECG của 20 bản ghi có mã số là: 029, 030, 058, 105,

106, 107, 108, 110, 111, 114, 117, 119, 121, 123,

124, 125, 128, 131, 137, 142, lấy ra tổng 4500 mẫu với 3 loại nhịp: bình thường (N - Normal sinus rhythm), nhịp ngoại tâm thu thất (V - Premature ventricular contraction) và loạn nhịp trên thất (S - Supraventricular premature beat) Số lượng chi tiết số mẫu sử dụng được thống kê chi tiết trong bảng 3 và bảng 4 dưới đây

Bảng 3 Bảng phân chia số lượng mẫu học và mẫu

kiểm tra của 3 loại nhịp

Loại nhịp Tổng số mẫu Số mẫu học kiểm tra Số mẫu

Tổng 4500 3000 1500

Bảng 4 Bảng phân chia số lượng mẫu học và mẫu

kiểm tra của 2 loại nhịp

Loại nhịp Tổng số mẫu Số mẫu học kiểm tra Số mẫu

Tổng 4500 3000 1500

5 KẾT QUẢ TÍNH TOÁN 5.1 Kết quả thử nghiệm trên bộ cơ sở dữ liệu MIT-BIH

a) Nhận dạng 7 loại nhịp tim

Với bốn mô hình nhận dạng đơn MLP, SVM, TSK,

RF trong bài báo, các thông số của các mô hình này được huấn luyện độc lập trên cùng một bộ dữ liệu học, có kết quả như sau:

- Đầu tiên, với cấu trúc của mô hình MLP có 1 lớp ẩn, với 20 nơron, trong đó có 7 nơron đầu ra (tương ứng với 7 loại rối loạn nhịp tim)

Trang 6

- Còn đối với các thông số của mô hình SVM: với

7 lớp và theo phương pháp 1 chọi 1 để tìm ra lớp

chiến thắng trong mô hình SVM Cho bộ mẫu có 7

lớp nên nhóm tác giả phải xây dựng 21 mạng SVM

đơn lẻ cho từng cặp tổ hợp 2 loại tín hiệu một lúc

- Cấu trúc của mạng TSK có 21 luật suy luận và 7

kết quả đầu ra

- Cuối cùng mô hình RF có 100 cây quyết định,

mỗi cây có tối đa 9 tầng, tổng hợp kết quả theo

phương pháp bỏ phiếu theo đám đông

Tất cả kết quả đầu ra từ các mô hình nhận dạng

đơn trên sẽ được đẩy vào đầu vào cho Cây quyết

định DT, và sẽ có thêm một quá trình học nữa để

xây dựng các thông số cho Cây quyết định DT, kết

quả cuối cùng của quá trình nhận dạng tín hiệu

điện tim ECG là đầu ra của Cây quyết định DT

Đối với 4 mô hình nhận dạng đơn trên ta sẽ thử

nghiệm các trường hợp tổng hợp kết quả từ 3 mô

hình (có 4 khả năng phối hợp là MLP-TSK-SVM;

MLP-TSK-RF; MLP-RF-SVM và RF-TSK-SVM) và

có 1 mô hình phối hợp cả 4 mô hình đơn

MLP-SVM-TSK-R Sử dụng chung một bộ dữ liệu mẫu

để kiểm tra mô hình nhận dạng Kết quả kiểm tra

này sẽ được sử dụng để so sánh với kết quả của

các nghiên cứu trước Trong bảng 5 và hình 9 thể

hiện kết quả sai số kiểm tra của 4 mô hình nhận

dạng cơ sở MLP, TSK, SVM, RF và 4 mô hình

phối hợp Tất cả các mạng mô hình phân loại đầu

tiên sẽ được huấn luyện trên cùng một bộ dữ liệu

học và sau đó được kiểm tra trên một bộ dữ liệu

kiểm tra khác

Bảng 5 Kết quả nhận dạng 7 loại nhịp (CSDL

MIT-BIH) bằng các mô hình đơn và các mô hình

kết hợp

Hệ thống phân loại Sai số Sai số (%)

Từ bảng 5 ta có thể thấy kết quả của các mô hình

phối hợp sử dụng cây quyết định DT đã được cải

thiện hơn so với kết quả của các mô hình nhận

dạng đơn Chất lượng của mô hình phối hợp phụ

thuộc vào chất lượng của từng mô hình nhận dạng

đơn và số lượng mô hình đơn, thông thường số

lượng mô hình nhận dạng đơn càng lớn thì cho ra

kết quả tổng hợp càng tin cậy hơn

Hình 9 Đồ thị cột thể hiện số mẫu nhận dạng sai

của các mô hình nhận dạng - bộ cơ sở dữ liệu MIT-BIH - phân loại 7 loại nhịp tim

b) Nhận dạng hai loại nhịp tim bình thường và bất thường

Thực hiện tương tự như đối với khi các mô hình nhận dạng 7 loại nhịp tim ở mục (a), ta xây 4 mô hình nhận dạng đơn MLP, SVM, TSK, RF và có kết quả như sau:

- Đầu tiên, với cấu trúc của mô hình MLP có 1 lớp ẩn, với 20 nơron, trong đó có 2 nơron đầu ra (tương ứng với hai loại nhịp tim bình thường và bất thường)

- Còn đối với các thông số của mô hình SVM chỉ cần xây dựng với 1 lớp và theo phương pháp 1 chọi 1 để phân loại hai loại nhịp tim bình thường

và bất thường

- Cấu trúc của mạng TSK có 18 luật suy luận và 2 kết quả đầu ra

- Cuối cùng mô hình RF có 100 cây quyết định, mỗi cây có 9 tầng, tổng hợp kết quả theo phương pháp bỏ phiếu theo đám đông

Bảng 6 Kết quả nhận dạng hai loại nhịp (CSDL

MIT-BIH) bằng các mô hình đơn và các mô hình kết hợp

Hệ thống phân loại Sai số Sai số (%)

Tích hợp MLP-TSK-SVM 21 0,68 Tích hợp MLP-TSK-RF 22 0,72 Tích hợp MLP-RF-SVM 23 0,75 Tích hợp RF-TSK-SVM 16 0,52 Tích hợp MLP-TSK-SVM-RF 15 0,49

Từ bảng 6 ta có thể thấy đối với trường hợp phân loại hai loại nhịp tim bình thường và bất thường, ta cũng thu được kết quả của các mô hình phối hợp

sử dụng cây quyết định DT cao hơn đáng kể so với kết quả của các mô hình nhận dạng đơn

Số mẫu nhận dạng sai

Trang 7

Hình 10 Đồ thị cột thể hiện số mẫu nhận dạng sai

của các mô hình nhận dạng - bộ CSDL MIT-BIH -

phân loại hai loại nhịp tim bình thường và bất thường

5.2 Kết quả thử nghiệm trên bộ CSDL MGH

Để đánh giá thêm độ chính xác và tin cậy của mô

hình nhận dạng phối hợp bằng Cây quyết định DT,

bài báo thử nghiệm thêm với bộ CSDL MGH, và

thu được các kết quả như trong bảng 7 và bảng 8

Bảng 7 Kết quả nhận dạng ba loại nhịp (CSDL

MGH/MF) bằng các mô hình đơn và các mô hình

kết hợp

Hệ thống phân loại Sai số Sai số (%)

Tích hợp MLP-TSK-SVM 25 1,67

Tích hợp MLP-TSK-RF 30 2,00

Tích hợp MLP-RF-SVM 25 1,67

Tích hợp RF-TSK-SVM 25 1,67

Tích hợp MLP-TSK-SVM-RF 21 1,40

Hình 11 Đồ thị cột thế hiện số mẫu nhận dạng sai của

các mô hình nhận dạng - bộ CSDL MGH - phân loại

ba loại nhịp tim Bảng 8 Kết quả nhận dạng hai loại nhịp (CSDL

MGH/MF)

Hệ thống phân loại Sai số Sai số (%)

Số mẫu nhận dạng sai

Số mẫu nhận dạng sai

Tích hợp MLP-TSK-SVM 17 1,13 Tích hợp MLP-TSK-RF 20 1,33 Tích hợp MLP-RF-SVM 19 1,27 Tích hợp RF-TSK-SVM 18 1,20 Tích hợp MLP-TSK-SVM-RF 15 1,00

Hình 12 Đồ thị cột thể hiện số mẫu nhận dạng sai

của các mô hình nhận dạng - bộ CSDL MGH - phân loại hai loại nhịp tim bình thường và bất thường

5.3 Đánh giá kết quả

Từ các kết quả thử nghiệm trên, ta có một số đánh giá như sau:

- Qua các kết quả thử nghiệm trên bộ cơ sở dữ liệu

MIT-BIH và MGH/MF (là được các nhóm nghiên cứu quốc tế thường dùng để tham chiếu), bài báo

đã minh chứng được giải pháp kết hợp song song nhiều mô hình nhận dạng cơ sở bằng Cây quyết định DT đã tiếp tục nâng cao chất lượng kết quả nhận dạng tín hiệu điện tim ECG Sai số kiểm tra

(số mẫu nhận dạng sai) của các mô hình kết hợp

đều thấp hơn so với các mô hình nhận dạng cơ sở

- Riêng có một trường hợp bằng nhau - trong bảng 8, sai số của mô hình SVM và mô hình kết hợp MLP-TSK-RF có số mẫu nhận dạng sai là 20

6 KẾT LUẬN

Bài báo đã đề xuất được giải pháp nâng cao chất lượng nhận dạng tín hiệu điện tim ECG dựa trên việc sử dụng cây quyết định DT để phối hợp nhiều

mô hình nhận dạng đơn Các thuật toán đã phần nào được triển khai thử nghiệm trên các bộ mẫu

số liệu kinh điển của quốc tế là MIT-BIH và MGH/

MF đã được các nhóm nghiên cứu quốc tế thường dùng để tham chiếu

TÀI LIỆU THAM KHẢO

[1] Bazi F and Melgani Y (2008), Classification of electrocardiogram signals with support vectơ machines and particle swarm optimization, IEEE Transactions on Information Technology

in Biomedicine, vol 12(5), pp 667- 677.

Số mẫu nhận dạng sai

Trang 8

[2] G và R Mark Moody, (2001), The impact of

the MIT-BIH Arrhythmia Database, IEEE Eng

in Medicine and Biology 20(3): 45-50.

[3] L Breiman (2001), Random forests Machine

Learning, Vol 45, pp.5-32.

[4] O Castillo, E Ramírez, J Soria (2010), Hybrid

System for Cardiac Arrhythmia Classification

with Fuzzy K-Nearest Neighbors and

Multi-Layer Perceptrons combined by a Fuzzy

Inference System, 2010 International Joint

Conference on Neural Networks (IJCNN), pp

1-6.

[5] S.Osowski, L.Tran Hoai, T Markiewicz (2006),

Ensemble of neural networks for improved

recognition and classification of arrhythmia

Metrology for a Sustainable Development

September, Rio de Janeiro, Brazil, pp 17-22.

[6] S.Osowski, T Markiewicz, L Tran Hoai (2008),

Recognition and classification system of

arrhythmia using ensemble of neural networks,

Article in Measurement, Vol 41, pp 610-617.

[7] Trần Hoài Linh, Phạm Văn Nam, Vương Hoàng

Nam (2014), Multiple neural network integration using a binary decision tree to improve the ECG signal recognition accuracy, International

Journal of Applied Mathematics and Computer Science Volume 24, Issue 3, pp 647-655 [8] Trần Hoài Linh, Phạm Văn Nam, Nguyễn

Đức Thảo (2015), A hardware implementation

of intelligent ECG classifier, COMPEL: The

International Journal for Computation and Mathematics in Electrical and Electronic Engineering, vol 34, Iss: 3, pp 905-919 [9] Trần Hoài Linh (2014), Mạng nơron và ứng dụng trong xử lý tín hiệu Nhà xuất bản Bách

Khoa Hà Nội.

[10] S.Osowski, T Markiewicz, L Tran Hoai (2008),

Recognition and classification system of arrhythmia using ensemble of neural networks,

Article in Measurement, Vol 41, pp 610-617 [11] http://www.physionet.org

THÔNG TIN TÁC GIẢ

Đỗ Văn Đỉnh

- Tóm tắt quá trình đào tạo, nghiên cứu (thời điểm tốt nghiệp và chương trình đào tạo, nghiên cứu):

+ Năm 1998: Tốt nghiệp Đại học chuyên ngành Tự động hóa, Trường Đại học Bách khoa

Hà Nội + Năm 2005: Tốt nghiệp Thạc sĩ chuyên ngành Tự động hóa, Trường Đại học Bách khoa

Hà Nội + Năm 2018: Tốt nghiệp Tiến sĩ chuyên ngành Điều khiển và Tự động hóa, Trường Đại học Bách khoa Hà Nội

- Công việc hiện tại: Giảng viên, cán bộ phòng Khoa học công nghệ và hợp tác quốc tế, Trường Đại học Sao Đỏ

- Các nghiên cứu chính là ứng dụng trí tuệ nhân tạo trong các giải pháp đo lường, điều khiển và tự động hóa, các thiết bị đo thông minh

- Email: dodinh75@gmail.com

- Điện thoại: 0982586160

Phạm Văn Kiên

- Tóm tắt quá trình đào tạo, nghiên cứu (thời điểm tốt nghiệp và chương trình đào tạo, nghiên cứu):

+ Năm 2002: Tốt nghiệp Đại học chuyên ngành Sư phạm kỹ thuật Tin học, Trường Đại học Bách khoa Hà Nội

+ Năm 2007: Tốt nghiệp Thạc sĩ chuyên ngành Giáo dục nghề nghiệp, Trường Đại học Bách khoa Hà Nội liên kết với trường TU Dresden (Đức)

- Công việc hiện tại: Giảng viên, Phó Trưởng Khoa, Trưởng Bộ môn Công nghệ thông tin, Khoa Điện tử - Tin học, Trường Đại học Sao Đỏ

- Các nghiên cứu chính: Giải pháp phần mềm, kỹ thuật nhận dạng, trí tuệ nhân tạo

- Điện thoại: 0986362233

Ngày đăng: 19/01/2021, 09:42

HÌNH ẢNH LIÊN QUAN

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim - Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
ng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim (Trang 1)
Tuy nhiên, mô hình này cũng có một số nhược điểm như:  - Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
uy nhiên, mô hình này cũng có một số nhược điểm như: (Trang 2)
Quan sát trên hình 6 ta có thể bậc của hàm Hermite càng cao thì tốc độ biến thiên của hàm  - Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
uan sát trên hình 6 ta có thể bậc của hàm Hermite càng cao thì tốc độ biến thiên của hàm (Trang 4)
Mô hình nhận dạng đơn cuối cùng dùng trong bài báo này là mô hình rừng ngẫu nhiên RF (Random  Forest) được phát triển từ L - Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
h ình nhận dạng đơn cuối cùng dùng trong bài báo này là mô hình rừng ngẫu nhiên RF (Random Forest) được phát triển từ L (Trang 4)
Hình 11. Đồ thị cột thế hiện số mẫu nhận dạng sai của - Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
Hình 11. Đồ thị cột thế hiện số mẫu nhận dạng sai của (Trang 7)
các mô hình nhận dạng - bộ CSDL MGH - phân loại ba loại nhịp tim - Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
c ác mô hình nhận dạng - bộ CSDL MGH - phân loại ba loại nhịp tim (Trang 7)
Hình 10. Đồ thị cột thể hiện số mẫu nhận dạng sai của các mô hình nhận dạng - bộ CSDL MIT-BIH -  phân loại hai loại nhịp tim bình thường và bất thường - Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
Hình 10. Đồ thị cột thể hiện số mẫu nhận dạng sai của các mô hình nhận dạng - bộ CSDL MIT-BIH - phân loại hai loại nhịp tim bình thường và bất thường (Trang 7)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm