PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.PHÂN TÍCH TÍN HIỆU ĐIỆN TIM CHO VIỆC CẢI THIỆN TRONG CHẨN ĐOÁN BỆNH TIM.
TÍNH CẤP THIẾT CỦA ĐỀ TÀI LUẬN ÁN
Tim mạch là một bộ phận liên quan mật thiết đến sức khỏe con người và đang gia tăng đáng kể ở Việt Nam cũng như trên thế giới Tỷ lệ mắc bệnh tim mạch ngày càng cao và đây là một trong những nguyên nhân tử vong hàng đầu tại Việt Nam và toàn cầu, đặc biệt là ở các thành phố khi mà số bệnh nhân tim mạch tại Việt Nam đang ngày càng tăng lên Bên cạnh các bệnh tim bẩm sinh, các yếu tố ngoại cảnh như mỡ máu và cholesterol tăng cùng với nhiều bệnh tim khác đang dần trở thành trạng thái mãn tính đe dọa tính mạng người bệnh Theo thống kê năm 2015, khoảng 20% dân số Việt Nam bị bệnh tim mạch và tăng huyết áp; trên thế giới, tim mạch gây chết 17,9 triệu người mỗi năm và dự kiến lên 23,6 triệu người vào năm 2030, trong khi năm 2018 có tới một phần ba số ca tử vong tại Việt Nam được thống kê là do bệnh tim mạch.
Tín hiệu điện tim ECG ghi lại quá trình biến đổi dòng điện của tim khi hoạt động và dựa vào đó có thể chẩn đoán các loại bệnh tim mạch; tuy nhiên biên độ và thời gian thay đổi của tín hiệu ECG rất nhỏ, và một số đặc trưng của các loại bệnh liên quan đến tim mạch khó được nhận diện bằng mắt thường, vì vậy công cụ máy tính có cài đặt phần mềm xử lý tín hiệu điện tim và chẩn đoán bệnh tim có thể hỗ trợ bác sĩ chẩn đoán dễ dàng hơn Các bệnh lý tim mạch rất đa dạng và phức tạp, gây nhiều khó khăn cho việc chẩn đoán, phân loại và điều trị Xây dựng một công cụ phân loại chính xác các loại bệnh tim dựa trên tín hiệu ECG là yêu cầu thiết yếu nhằm giúp bác sĩ chẩn đoán sớm và nhận diện các bệnh tim khác nhau Với kết quả phân loại bằng máy tính có độ chính xác cao, bác sĩ có thể dễ dàng đưa ra các chẩn đoán chính xác và điều trị bệnh hiệu quả hơn.
Các cơ sở dữ liệu tín hiệu ECG đã được công bố trên nhiều trang web và được nhiều nhà nghiên cứu sử dụng Tuy nhiên, cùng một loại bệnh tim có thể biểu hiện khác nhau ở từng bệnh nhân, làm tăng biến thiên của dữ liệu ECG và khiến việc phân loại bệnh tim từ tín hiệu ECG trở nên khó khăn hơn Hơn nữa, sự khác biệt giữa các loại bệnh tim dẫn đến kết quả nhận dạng không đồng nhất Trong bối cảnh đó, một thuật toán tiền xử lý và chuẩn hóa dữ liệu nhằm nâng cao hiệu suất phân loại bệnh tim là rất cần thiết.
ECG thu được chứa thông tin y tế quan trọng nhưng đồng thời mang nhiều nhiễu xuất phát từ nhiều nguồn như tâm lý người bệnh khi đo, nguồn cấp điện, kết nối đầu dò, đường cơ sở tín hiệu bị trôi, thiết bị đo và các yếu tố khác Do đó, tiền xử lý tín hiệu điện tim nhằm loại bỏ các thành phần nhiễu không mong muốn là bước then chốt trong phân tích tín hiệu, giúp cải thiện chất lượng và độ tin cậy của các chỉ số chẩn đoán.
Dù đã có nhiều kỹ thuật được các nhà khoa học ứng dụng để xử lý tín hiệu điện tim (ECG) trước đây, vẫn còn nhiều thách thức trong xử lý tín hiệu ECG và trong phân loại bệnh tim dựa trên ECG Những thách thức này bắt nguồn từ nhiều yếu tố khác nhau sẽ được mô tả chi tiết như sau [6].
Biến đổi của đặc trưng tín hiệu ECG và nhịp tim ở mỗi cá nhân cho thấy dù cùng mắc một loại bệnh, mỗi người vẫn có các đặc trưng ECG riêng biệt Nhịp tim của từng người cũng dao động theo từng thời điểm sinh lý và trạng thái tinh thần khác nhau, khiến việc phân tích ECG trở nên mang tính cá nhân hóa cao Vì vậy, nhận dạng và đánh giá tín hiệu ECG cần xem xét yếu tố cá nhân để đạt được độ chính xác cao trong ứng dụng lâm sàng và theo dõi bệnh.
Hiện nay không có quy luật phân loại tối ưu cho việc nhận diện bệnh tim từ tín hiệu ECG Mặc dù đã có nhiều phương pháp được áp dụng, chưa có thuật toán nào được xem là tối ưu cho việc phân loại bệnh tim.
Phức tạp trong tín hiệu ECG là một vấn đề thực tiễn: một tín hiệu ECG chuẩn thường chứa các đỉnh P, Q, R, S, T và U, nhưng thực tế có thể có hàng nghìn đỉnh với hình dạng đa dạng khác nhau Sự đa dạng này khiến việc trích xuất đặc trưng của ECG trở nên khó khăn và ảnh hưởng đến độ chính xác phân tích nhịp tim Để xử lý hiệu quả, cần các phương pháp xử lý tín hiệu và học máy tiên tiến nhằm nhận diện và phân loại các đặc trưng của ECG trong khi vẫn chịu đựng nhiễu và biến đổi hình dạng đỉnh Các từ khóa liên quan như tín hiệu ECG, đỉnh P Q R S T U, hàng nghìn đỉnh, trích xuất đặc trưng và phức tạp của tín hiệu ECG nên được tích hợp một cách tự nhiên để tối ưu hóa SEO.
Xây dựng một bộ phân loại tín hiệu ECG theo thời gian thực là một thách thức lớn trong xử lý tín hiệu sinh học bởi tín hiệu ECG chứa nhiều tham số biến đổi phức tạp như biên độ, hình dạng waveform, nhiễu, wander baseline và biến thiên nhịp tim giữa các người bệnh Để nhận diện và phân loại nhịp tim hoặc bất thường một cách nhanh chóng đòi hỏi xử lý dữ liệu theo luồng, tối ưu hóa độ trễ và tối ưu hoá tài nguyên tính toán khi triển khai trên thiết bị biên hoặc hệ thống giám sát y tế Để đạt hiệu suất cao, cần kết hợp tiền xử lý như lọc nhiễu, chuẩn hóa dữ liệu và loại bỏ nhiễu nền với các kỹ thuật học máy hoặc học sâu có khả năng trích xuất đặc trưng từ ECG ở nhiều mức độ, đồng thời xử lý đồng thời nhiều tham số như đặc trưng hình thái, xác suất nhịp và biến thiên thời gian Các chỉ số đánh giá như độ nhạy, đặc hiệu, F1-score và độ trễ dự báo phải được cân nhắc để đảm bảo độ tin cậy trong chuẩn đoán và giám sát liên tục Ứng dụng của phân loại tín hiệu ECG thời gian thực vô cùng rộng, từ hỗ trợ chẩn đoán rối loạn nhịp tim, theo dõi bệnh nhân ICU cho tới hệ thống cảnh báo sớm, đòi hỏi sự cân bằng giữa độ chính xác, khả năng tổng quát và khả năng triển khai trên các nền tảng phần cứng khác nhau.
❖ CÁC KẾT QUẢ TRONG VÀ NGOÀI NƯỚC ĐÃ ĐƯỢC CÔNG BỐ:
Do những hệ lụy rất lớn của bệnh tim mạch, đã có nhiều công trình nghiên cứu trong và ngoài nước về phân tích tín hiệu điện tim và xây dựng các phương pháp phân loại bệnh tim được công bố rộng rãi Dưới đây là tóm lược một số kết quả nghiên cứu nước ngoài nổi bật liên quan đến các kỹ thuật phân tích tín hiệu điện tim (ECG) và các phương pháp phân loại bệnh tim, nhằm cung cấp cái nhìn tổng quan về tiến bộ và ứng dụng trong lĩnh vực này.
Trong luận án tiến sĩ thực hiện năm 2014 với đề tài “Phân tích tín hiệu loạn nhịp tim” của tác giả Chử Đức Hoàng, tác giả phân tích các đặc điểm của tín hiệu loạn nhịp tim từ dữ liệu ECG, đề xuất cải tiến phương pháp xác định phức hợp QRS dựa trên khung Pan–Hamilton–Tompkins để nhận diện phức hợp QRS một cách chính xác hơn, xây dựng giải thuật phân tích khử khuynh hướng động đa trị (Multi Detrended Fluctuation Analysis) nhằm phát hiện các bất thường ở bệnh nhân loạn nhịp tim, và xây dựng véc tơ chuẩn hóa RR từ dữ liệu ECG kết hợp với giải thuật khử khuynh hướng động để hình thành mô hình thu nhận, xử lý, phân tích và hỗ trợ chẩn đoán sớm các triệu chứng loạn nhịp tim Kết quả cho thấy độ chính xác của bộ phân loại đạt 89%.
Luận án tiến sĩ của tác giả Nguyễn Đức Thảo, thực hiện vào năm 2016, mang tựa đề “Nâng cao chất lượng nhận dạng tín hiệu điện tim dựa trên giải pháp loại bỏ ảnh hưởng từ nhịp thở của người bệnh” Nghiên cứu tập trung vào nhận dạng tín hiệu điện tim (ECG) và đề xuất giải pháp loại bỏ ảnh hưởng từ nhịp thở của người bệnh nhằm nâng cao chất lượng nhận dạng, độ chính xác và độ tin cậy của hệ thống ECG.
Trong luận án này, tác giả sử dụng bộ lọc để loại bỏ thành phần nhịp thở trong tín hiệu ECG, sau đó tín hiệu đã lọc được đưa vào mạng nơ-ron mờ Takagi-Sugeno-Kang (TSK) để nhận dạng các loại bệnh tim Để cải thiện độ chính xác của nhận dạng, phương pháp đề xuất bổ sung hai thông tin từ nhịp thở vào tín hiệu ECG Đồng thời, tác giả áp dụng mạng TSK với 4 kịch bản khác nhau và kết quả tốt nhất đạt 96.6% cho bài toán nhận dạng 3 loại bệnh tim.
Luận án tiến sĩ của tác giả Phạm Văn Nam (2018) với đề tài Xây dựng mô hình nhận dạng kết hợp nhằm nâng cao độ chính xác phân loại tín hiệu điện tim loạn nhịp đã nghiên cứu phát triển một hệ thống nhận dạng kết hợp nhằm cải thiện độ tin cậy của việc phân loại tín hiệu loạn nhịp tim Cụ thể, đề tài sử dụng một bộ phân loại kết hợp từ ba công cụ: mạng nơ-ron truyền thẳng nhiều lớp (MLP), máy vectơ hỗ trợ (SVM) và rừng ngẫu nhiên (RF), với đầu ra của các bộ phân loại này được đưa vào một cây quyết định để xác định loại bệnh tim tương ứng với tín hiệu nhịp tim Kết quả hệ thống cho thấy độ chính xác nhận dạng bệnh tim đạt 98.76%.
Mặc dù nghiên cứu trong nước về tín hiệu điện tim (ECG) và phân loại bệnh tim từ tín hiệu ECG còn tương đối hạn chế, các nghiên cứu nước ngoài về lĩnh vực này lại phong phú hơn Trong tài liệu tham khảo [10], tác giả R Rodríguez và các cộng sự đề xuất một phương pháp ngưỡng thích nghi kết hợp với phân tích thành phần chính PCA để trích đặc trưng của tín hiệu ECG Họ tập trung vào việc trích xuất đặc trưng của phức hợp QRS như một đặc trưng nổi bật của ECG Cụ thể, phức hợp QRS được trích xuất bằng biến đổi Hilbert và kết hợp với PCA dựa trên kỹ thuật ngưỡng thích nghi nhằm xác định đặc trưng của tín hiệu ECG Kết quả của nghiên cứu cho thấy có thể nhận diện phức hợp QRS trong tín hiệu điện tim.
MỤC TIÊU NGHIÊN CỨU CỦA LUẬN ÁN
Với những thách thức trong quá trình phân loại bệnh tim và trên cơ sở các kết quả điều tra từ các công trình nghiên cứu trước đây, luận án này đặt ra mục tiêu rõ ràng và các mong muốn đạt được nhằm nâng cao độ chính xác của phân loại bệnh tim, cải thiện phương pháp thu thập và phân tích dữ liệu lâm sàng và hình ảnh y tế, đồng thời đóng góp vào kiến thức khoa học và thực hành chẩn đoán Mục tiêu cụ thể gồm xây dựng và đánh giá một mô hình phân loại tối ưu cho bệnh tim, đánh giá hiệu quả trên tập dữ liệu lâm sàng và hình ảnh, và đề xuất các khuyến nghị ứng dụng trong y tế để cải thiện chẩn đoán sớm và quản lý bệnh tim.
Xây dựng một phương pháp lọc nhiễu tín hiệu điện tim ECG và chuẩn hóa tín hiệu nhằm phục vụ cho trích xuất đặc trưng và phân loại, từ đó nâng cao độ chính xác của quá trình nhận diện bệnh tim Trước tiên, phân tích chi tiết các thành phần cơ bản của tín hiệu ECG và các đặc trưng đặc thù theo từng loại bệnh tim khác nhau Dựa trên phân tích này, thiết kế bộ lọc nhiễu cho tín hiệu điện tim và tiến hành trích xuất các đặc trưng đồng thời giảm chiều của tín hiệu ECG để thu được thành phần mang nhiều thông tin nhất mà ít chịu ảnh hưởng của nhiễu Quy trình lọc nhiễu và trích xuất đặc trưng được tích hợp với các bước chuẩn hóa tín hiệu nhằm tăng hiệu quả phân loại bằng các mô hình học máy và đánh giá trên tập dữ liệu thực tế.
Đề xuất một hệ thống trích xuất đặc trưng kết hợp với bộ phân loại nhằm phân loại các loại bệnh tim từ tín hiệu điện tim đã được lọc nhiễu Hệ thống sẽ nghiên cứu và trích xuất các đặc trưng đặc thù của từng loại bệnh tim trên tín hiệu nhịp tim, từ đó phát triển một bộ phân loại có độ chính xác cao để phân loại các loại bệnh tim dựa trên các đặc trưng này Quá trình xử lý tín hiệu và trích đặc trưng sẽ cho ra kết quả phân loại có độ tin cậy cao, hỗ trợ bác sĩ tham chiếu như một tham chiếu chẩn đoán sớm và chính xác hơn, từ đó đưa ra giải pháp điều trị phù hợp cho bệnh nhân.
ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu là dữ liệu tín hiệu điện tim (ECG) từ nhiều loại bệnh khác nhau được tải về và xây dựng thành một bộ dữ liệu chuẩn phục vụ cho các nghiên cứu về chẩn đoán bằng ECG Quá trình xử lý và phân tích tín hiệu ECG được thực hiện bằng Matlab và Python nhằm xây dựng các thuật toán xử lý tín hiệu và phân loại bệnh tim Các phương pháp đánh giá hiệu suất của bộ phân loại bệnh tim như độ chính xác, độ nhạy, độ đặc hiệu và ROC-AUC được áp dụng để đánh giá hiệu quả của các mô hình trên bộ dữ liệu chuẩn Bộ dữ liệu chuẩn và công cụ xử lý được kỳ vọng sẽ hỗ trợ nghiên cứu sau này và tăng cường khả năng triển khai các ứng dụng chẩn đoán dựa trên ECG trong thực tế.
Phạm vi nghiên cứu của luận án tập trung vào 5 loại bệnh tim được phân loại từ tín hiệu ECG, dựa trên một bộ dữ liệu ECG công khai đã được nhiều nhà khoa học công nhận và nghiên cứu Luận án thiết kế và triển khai một bộ xử lý nhằm phân loại các loại bệnh tim từ tín hiệu ECG, đóng góp vào nâng cao độ chính xác nhận diện trong thực tiễn Việc sử dụng bộ dữ liệu mở và được xác thực bởi cộng đồng khoa học giúp các thuật toán xử lý tín hiệu và phân loại được kiểm chứng và lặp lại Mục tiêu tổng quát là tối ưu hóa quá trình nhận diện bệnh tim từ ECG thông qua các phương pháp xử lý tín hiệu và phân loại hiệu quả.
CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Dựa trên đối tượng nghiên cứu và mục tiêu đã được xác định của luận án, cách tiếp cận và phương pháp nghiên cứu được trình bày một cách có hệ thống và chi tiết, với sự phân chia thành các bước thực hiện cụ thể nhằm đảm bảo tính logic và tính tái lập của kết quả, đồng thời được tối ưu hóa cho SEO bằng cách kết hợp từ khóa liên quan và câu văn mạch lạc để người đọc dễ nắm bắt nội dung và mục tiêu nghiên cứu.
Phương pháp khảo sát lý thuyết được thực hiện bằng cách tìm hiểu, phân tích và tổng hợp các cơ sở lý thuyết liên quan đến luận án, đồng thời tổng hợp các phương pháp và kết quả từ các công trình nghiên cứu trước đó đã được công bố trong nước và nước ngoài về xử lý và phân loại bệnh tim Những cơ sở lý thuyết này sau khi được khảo sát và phân tích sẽ làm nền tảng tiền đề cho việc xác định bài toán nghiên cứu và lựa chọn hướng tiếp cận phù hợp cho luận án.
Phương pháp tính toán, thiết kế và hiệu chỉnh được xây dựng dựa trên việc khảo sát các lý thuyết liên quan nhằm phát triển một hệ thống phân loại bệnh tim hiệu quả Hệ thống này sẽ được tính toán và thiết kế để nhận diện và phân loại các dấu hiệu liên quan đến bệnh tim, đảm bảo tính khả thi và độ chính xác cao Quá trình thiết kế sẽ được kiểm tra và hiệu chỉnh liên tục để tối ưu hóa hiệu suất, mang lại kết quả tốt nhất cho chuẩn đoán và quản lý bệnh tim.
Phương pháp mô phỏng được thực hiện qua các hệ thống lọc nhiễu tín hiệu, hệ thống trích đặc trưng và hệ thống phân loại bệnh tim, được thiết kế và lập trình để xử lý và mô phỏng việc phân loại bệnh tim nhằm thu thập kết quả nghiên cứu Tập dữ liệu mô phỏng do các nhà khoa học trên thế giới sử dụng có độ tin cậy cao, giúp các nghiên cứu và ứng dụng lâm sàng trở nên hiệu quả hơn.
Phương pháp phân tích và tổng hợp được sử dụng để tổng hợp các kết quả đạt được trong luận án và so sánh chúng với các kết quả đã được công bố trước đó Quá trình so sánh giúp làm nổi bật những điểm tương đồng và khác biệt, từ đó bình luận và phân tích ưu nhược điểm của phương pháp được đề xuất trong luận án Kết quả của quá trình này cho phép đánh giá tính khả thi, độ tin cậy và tính ứng dụng của phương pháp, đồng thời đề xuất các hướng cải thiện và các ứng dụng tiềm năng cho nghiên cứu và thực tiễn.
ĐÓNG GÓP VỀ KHOA HỌC CỦA LUẬN ÁN
❖ Đóng góp mới về khoa học của luận án
Mục tiêu ban đầu của nghiên cứu là phân tích tín hiệu điện tim ECG nhằm cải thiện chẩn đoán bệnh tim Mục tiêu cụ thể là phân loại chính xác các loại bệnh tim để có thể giúp bác sĩ chẩn đoán sớm và chính xác hơn trên bệnh nhân, từ đó bác sĩ có thể đưa ra phác đồ điều trị tốt hơn Vì vậy, những đóng góp mới về mặt khoa học của luận án gồm:
- Đề xuất giải thuật WDFR để lọc các thành phần nhiễu của tín hiệu điện tim
Trong lĩnh vực phân tích tín hiệu ECG, phương pháp phân tích tín hiệu sử dụng biến đổi wavelet kết hợp với ngưỡng cứng và ngưỡng mềm đã được áp dụng hiệu quả để loại bỏ nhiễu trong tín hiệu điện tim Nghiên cứu cũng khảo sát và đề xuất hàm wavelet tối ưu cho quá trình loại bỏ nhiễu ECG, nhằm nâng cao độ chính xác và độ tin cậy của phân tích Đồng thời, thuật toán Pan-Tompkins được cải tiến nhằm xác định vị trí đỉnh R trong phức hợp QRS để phân tách tín hiệu ECG thành từng nhịp tim một cách rõ ràng Các yếu tố này kết hợp với nhau giúp xử lý tín hiệu ECG hiệu quả hơn, cải thiện phát hiện nhịp tim và phân tích các đặc trưng nhờ tối ưu hóa các bước lọc nhiễu và nhận diện đỉnh R.
Trong bài viết này, chúng tôi đề xuất một giải thuật trích đặc trưng cho tín hiệu điện tim bằng cách kết hợp kernel với phép biến đổi wavelet và phương pháp phân tích thành phần chính wkPCA Các đặc trưng được trích xuất từ tín hiệu ECG sẽ được đưa vào mạng nơ-ron truyền thẳng nhiều lớp nhằm phân loại các loại bệnh tim Hệ thống đề xuất sẽ được kiểm chứng trên một tập dữ liệu ECG đã công bố bởi các nhà khoa học, nhằm đánh giá hiệu suất và khả năng tổng quát của phương pháp.
Đề xuất một mạng học sâu gồm các lớp tích chập kết hợp với các lớp kết nối đầy đủ để trích xuất đặc trưng và phân loại bệnh tim từ tín hiệu ECG ngay trong cấu trúc mạng Các lớp tích chập được thiết kế để nắm bắt đặc trưng của các loại bệnh tim trên tín hiệu ECG một cách toàn diện, nhằm nâng cao hiệu suất phân loại; các đặc trưng này được đưa vào các lớp kết nối đầy đủ để thực hiện phân loại các loại bệnh tim với độ chính xác cao Đồng thời, đề xuất một phương pháp tính kích thước kernel của các lớp tích chập dựa trên dạng sóng con trong tín hiệu nhịp tim nhằm tối ưu hóa việc trích xuất đặc trưng và cải thiện độ chính xác phân loại bệnh tim.
Ý nghĩa thực tiễn của luận án là xây dựng một công cụ phân loại bệnh tim có độ chính xác cao, có thể được áp dụng trong hệ thống chẩn đoán từ xa qua internet và máy chủ Mạng phân loại bệnh tim được đề xuất có thể triển khai thành hệ thống chẩn đoán từ xa, nơi bác sĩ nhập tín hiệu điện tim (ECG) và nhận được dự đoán tình trạng tim để hỗ trợ chẩn đoán sớm và điều trị tối ưu cho bệnh nhân Kết quả nghiên cứu cũng cho thấy khả năng áp dụng và triển khai hệ thống chẩn đoán bệnh tim từ xa có máy chủ kết nối internet, cho phép bác sĩ tải dữ liệu ECG lên hệ thống và nhận kết quả chẩn đoán từ mạng Các kết quả này đồng thời có thể được dùng cho giảng dạy cho sinh viên ngành kỹ thuật y sinh tại Bộ Môn Điện Tử Công Nghiệp – Y Sinh của Trường Đại Học Sư Phạm Kỹ Thuật TP.HCM.
CẤU TRÚC CỦA LUẬN ÁN
Chương 2: Cơ sở lý thuyết, chương này trình bày tóm tắt các cơ sở lý thuyết đã được sử dụng để xử lý và phân loại bệnh tim từ tín hiệu điện tim ECG Hơn nữa, tập dữ liệu điện tim sử dụng trong luận án cũng được trình bày rõ trong chương này
Chương 3: Giải thuật WDFR cho lọc nhiễu của tín hiệu điện tim và tách nhịp tim, chương này trình bày giải thuật WDFR được đề xuất để lọc nhiễu của tín hiệu điện tim Cụ thể, hệ thống áp dụng thuật toán wavelet để phân rã tín hiệu thành các thành phần sóng con Phương pháp ngưỡng sẽ được áp dụng để lọc nhiễu trên các thành phần sóng con này Sau đó, các thành phần sóng con đã lọc nhiễu sẽ được khôi phục lại thành tín hiệu ECG mới Hơn nữa, tín hiệu điện tim sau khi lọc nhiễu sẽ được sử dụng để xác định vị trí đỉnh R của phức hợp QRS và từ đó làm cơ sở để tách từng nhịp tim từ tín hiệu nhịp tim nhằm phục vụ cho trích đặc trưng và phân loại ở các chương phía sau của luận án
Chương 4: Trích đặc trưng tín hiệu điện tim dùng giải thuật wkPCA cho phân loại bệnh, chương này trình bày giải thuật wkPCA được đề xuất để trích các đặc trưng của các loại bệnh trên tín hiệu nhịp tim Hơn nữa, một mạng nơ-ron truyền thẳng bốn lớp gồm ba lớp ẩn và một lớp ngõ ra sẽ được sử dụng để phân loại các loại bệnh tim đã được trích ở trước Hiệu suất của bộ phân loại được đánh giá dựa vào ma trận nhầm lẫn và đồ thị đường cong ROC Kết quả hệ hiệu suất phân loại theo phương pháp được đề xuất cũng sẽ được trình bày chi tiết
Chương 5: Tính toán kích thước kernel của các lớp tích chập trong mạng học sâu cho phân loại bệnh tim và ứng dụng mạng đề xuất vào hệ thống phân loại bệnh từ xa, chương này trình bày cấu trúc một mạng học sâu được đề xuất để phân loại bệnh tim Một phương pháp tính các kích thước của các kernel trong các lớp tích chập của mạng học sâu được đề xuất nhằm nâng cao độ chính xác của quá trình phân loại Cụ thể, một mạng học sâu với bảy lớp tích chập kết hợp với bốn lớp mạng kết nối đầy đủ sẽ được sử dụng để trích đặc trưng và phân loại các loại bệnh tim Trong đó, các lớp tích chập được thiết kế để trích đặc trưng và các lớp kết nối đầy đủ sẽ được sử dụng để phân loại bệnh Hiệu quả của hệ thống được đề xuất cũng được kiểm chứng trên tập dữ liệu đã giới thiệu ở chương 2 và các kết quả được trình bày chi tiết Hơn nữa, một hệ thống chẩn đoán bệnh từ xa cũng được thiết kế sử dụng hệ thống mạng học sâu đã được đề xuất để phát triển nhằm hỗ trợ bác sĩ cũng như bệnh nhân nhận được thông tin bệnh tim từ tín hiệu điện tim thông qua internet
Chương 6: Kết luận và hướng phát triển, chương này trình bày tóm lược những kết quả đã đạt được của luận án và những hướng phát triển tiếp theo của luận áp trong thời gian tới.
TỔNG QUAN VỀ TÍN HIỆU ĐIỆN TIM
ECG hay điện tim là một đường cong ghi lại các biến thiên của điện áp do tim phát ra trong hoạt động co bóp, với biên độ rất nhỏ nên chỉ tính bằng mV và đòi hỏi thiết bị có độ nhạy cao; cho đến năm 1903, Einthoven mới lần đầu ghi lại tín hiệu điện tim bằng một điện kế có đầy đủ độ nhạy Phương pháp ghi điện tim tương tự như cách ghi các đường cong biến thiên tuần hoàn khác: dòng điện tim tác động lên một bút ghi để bút ghi dao động và ghi tín hiệu lên giấy Ngày nay có rất nhiều loại máy ghi tín hiệu điện tim với độ chính xác cao và tiện lợi, có thể in dạng sóng nhịp tim lên giấy, hiển thị trên màn hình hoặc ghi lại dữ liệu điện tim vào máy tính phục vụ nghiên cứu Các thiết bị này có thể có một hay nhiều chuyển đạo, cho phép ghi đồng thời nhiều kênh, và có thể ghi điện tim liên tục 24 giờ trên băng của một máy nhỏ gắn lên người được gọi là Cardiocassette Type Holter.
Tín hiệu điện tim được thu thập không chỉ hỗ trợ bác sĩ chẩn đoán và điều trị các bệnh lý tim mạch mà còn cung cấp dữ liệu cho các nhà khoa học nghiên cứu và phân tích nhằm hạn chế tác hại của bệnh tim ở con người Mỗi nhịp tim bao gồm các thành phần sóng P, phức hợp QRS, sóng T và có thể có sóng U; các đỉnh P, Q, R, S, T và U, cùng các khoảng thời gian PR, RR, QRS và ST và các phân đoạn PR và ST là những yếu tố cơ bản của nhịp tim Những đặc trưng này được xem là các thành phần đặc trưng của tín hiệu ECG và có giá trị biên độ hoặc thời gian khác nhau tùy từng loại bệnh lý hoặc từng bệnh nhân Chi tiết của các thành phần được mô tả như hình 2.1 ở dưới [18] Tuy nhiên, mỗi đặc trưng mang một hoặc nhiều thông tin khác nhau Vì vậy, trên một nhịp tim thực tế, tín hiệu ECG thông thường có thể không mang đầy đủ các thành phần này, đặc biệt là sóng U thường ít xuất hiện Hơn nữa, do ảnh hưởng của nhiễu, các thành phần sóng này sẽ không được thể hiện rõ Do đó, trích xuất đặc trưng tín hiệu ECG là quá trình làm sao để nắm bắt được những thành phần tồn tại và ổn định nhất nhằm đại diện cho các loại bệnh lý khi phân loại.
Hình 2.1 Các thành phần cơ bản chứa đựng trong một nhịp tim
Như mô tả ở trên, nhịp tim gồm các thành phần cơ bản là sóng P, phức hợp QRS, sóng T và sóng U; hình dạng, thời gian kéo dài của phức hợp và thời gian giữa các thành phần có ý nghĩa đặc biệt trong chẩn đoán bệnh tim Quá trình cấu thành của các sóng và đặc điểm của từng thành phần được mô tả chi tiết như bảng 2.1; dù các đặc trưng thời gian có thể khác nhau giữa các thành phần và giữa các loại bệnh, những khoảng thời gian này không được thể hiện một cách rõ ràng với từng bệnh cụ thể, và một người bệnh có thể có khoảng thời gian tương tự người không bệnh Vì vậy, việc phân loại bệnh chỉ dựa vào đặc trưng thời gian là rất khó khăn, và khi trích đặc trưng tín hiệu ECG thường ngoài tham số thời gian còn xem xét hình dạng của các thành phần Ngoài ra, sự chênh lệch thời gian giữa các nhịp tim của cùng một bệnh nhân hoặc giữa các bệnh nhân khác nhau cũng ảnh hưởng đến kết quả phân loại; do đó, việc trích đặc trưng tín hiệu ECG thường kết hợp trích xuất đặc trưng ở cả miền không gian lẫn miền tần số Dưới đây trình bày tóm lượt các sóng đặc trưng trên tín hiệu ECG.
Sóng P là hình thành do quá trình khử cực tâm nhĩ, bắt nguồn từ nhĩ trái và nhĩ phải và biểu thị sự khởi đầu của co nhĩ; trong ECG, biên độ sóng P bình thường thường dưới 2 mm (0,2 mV), cho thấy hoạt động điện của hai nhĩ diễn ra đồng bộ; thời gian của sóng P ngắn và ổn định, phản ánh quá trình khử cực nhĩ diễn ra nhanh chóng; các bất thường về hình dạng, biên độ hoặc thời gian của sóng P có thể gợi ý các rối loạn nhĩ hoặc bất thường dẫn truyền.
Sóng P có thời gian từ 0,08 đến 0,1 giây Việc tăng biên độ và kéo dài thời gian của sóng P liên quan đến tình trạng tâm nhĩ lớn; tăng biên độ gợi ý tâm nhĩ phải lớn, trong khi kéo dài thời gian khử cực gợi ý tâm nhĩ trái lớn.
Phức hợp QRS biểu thị quá trình khử cực của tâm thất và hình dạng cùng thời gian của phức hợp phụ thuộc vào chiều khử cực và vị trí đặt điện cực trên cơ thể; do đó trên giấy ghi điện tâm đồ có thể thấy các phức hợp khác nhau tùy hướng khử cực và cách tiếp cận điện thế từ các điện cực khác nhau Trong trạng thái bình thường, phức hợp QRS kéo dài từ 0,06 đến 0,12 giây.
Sóng Q là sóng âm đầu tiên của phức hợp QRS Ở người bình thường, sóng Q thường nhỏ và ngắn, hình thành do quá trình khử cực vách liên thất Một sóng Q sâu mang biên độ âm lớn và kéo dài cho thấy sự hoại tử cơ tim, thường gặp trong nhồi máu cơ tim cũ hoặc nhồi máu cơ tim không có ST chênh lệch (NSTEMI).
Sóng R là sóng dương đầu tiên của phức hợp điện tâm đồ (ECG) và sóng S là sóng âm theo sau, được hình thành do khử cực thất Về bản chất, hai sóng này tương đương và cùng phản ánh quá trình khử cực thất, nhưng cường độ của sóng R phụ thuộc vào hướng khử cực so với vị trí đặt điện cực Khi điện cực ở các chuyển đạo mà hướng khử cực hướng về phía nó, như DII, V5 và V6, sóng R sẽ cao hơn Ngược lại, ở các chuyển đạo mà chiều khử cực đi ra xa vị trí đặt điện cực, như ở V1 và V2, sóng R sẽ ưu thế hơn.
Sóng T là thành phần sóng xuất hiện sau phức hợp QRS trên điện tâm đồ, đại diện cho quá trình tái cực muộn của hai tâm thất Giá trị của sóng T rất lớn trong việc nhận định các tình trạng thiếu máu cơ tim, vì những biến đổi ở sóng T có thể phản ánh mức độ thiếu oxy và sự tổn thương của cơ tim Việc đánh giá hướng, độ cao và hình dạng của sóng T, kết hợp với các yếu tố lâm sàng và các chỉ số ECG khác, giúp chẩn đoán và theo dõi diễn tiến của thiếu máu cơ tim cũng như các tình trạng liên quan đến tổn thương cơ tim.
Sóng U: nguồn gốc của sóng U vẫn chưa được xác định rõ; các giả thuyết cho rằng nó có thể là do tái cực chậm ở sợi Purkinje hoặc tái cực kéo dài giữa tế bào cơ tim và tế bào M, liên quan đến kết quả điện thế của trương lực cơ ở thành tâm thất Bình thường, sóng U không xuất hiện trên điện tâm đồ.
Trên điện tâm đồ, nếu có, sóng U là một sóng nhỏ xuất hiện sau sóng T; sóng U có thể đảo ngược hoặc nhô cao, nhọn và thường gặp trong nhiều bệnh lý tim mạch Nguyên nhân đi kèm gồm bệnh mạch vành, tăng huyết áp, bệnh van tim, tim bẩm sinh, bệnh lý cơ tim, cường giáp, ngộ độc và rối loạn điện giải.
Khoảng PQ: là thời gian dẫn truyền từ nhĩ đến thất, bình thường từ 0.12 -
0.2 giây, việc kéo dài thể hiện quá trình chậm dẫn truyền, PQ ngắn sẽ gợi ý đến một hội chứng rối loạn nhịp tim là Wolf-Parkinson-White Đoạn ST: ý nghĩa đoạn ST là giai đoạn tái cực thất sớm, thời gian của ST thường không quan trọng bằng hình dạng của nó, bình thường ST nằm chênh lệch lên hoặc chênh xuống khỏi đường cơ sở rất ít Đoạn ST cực kỳ quan trọng trong việc chẩn đoán nhồi máu cơ tim ST được gọi là chênh lệch nếu cao hơn đường cơ sở 1mm ở chuyển đạo chi và hơn 2mm ở chuyển đạo trước ngực ST gọi là chênh xuống khi nằm dưới đường cơ sở hơn 0.5mm Đoạn QT: là thời gian tâm thu điện học của tâm thất, khoảng giá trị bình thường của QT phụ thuộc vào tần số tim, QT kéo dài bất thường có liên quan với tăng nguy cơ loạn nhịp thất, đặc biệt là xoắn đỉnh Gần đây, hội chứng QT ngắn bẩm sinh đã được tìm thấy và có liên quan với việc tăng nguy cơ rung nhĩ và thất kịch phát và dẫn đến đột tử do bệnh tim
Bảng 2.1 Mô tả các ý nghĩa và thông tin thời gian của từng thành phần đặc trưng trong một nhịp tim
Tính năng Mô tả Khoảng thời gian
RR Khoảng thời gian giữa sóng R và sóng R tiếp theo 0.6-1.2 giây
P Xu hướng tăng ngắn hạn của tín hiệu ECG 80 milli giây
PR Đo từ đầu sóng P đến đầu bộ phức hợp QRS 120-200 milli giây QRS
Thường bắt đầu với độ võng xuống của Q, độ cong lên lớn hơn của R và kết thúc bởi sự đi xuống của sóng S
PR Kết nối sóng P và bộ phức hợp QRS 50-120 milli giây Điểm J Điểm kết thúc bộ phức hợp QRS và bắt đầu phân đoạn ST Không áp dụng
ST Kết nối bộ phức hợp QRS và sóng T 80-120 milli giây
T Thường là một dạng sóng tăng lên vừa phải 160 milli giây
ST Được đo từ điểm J đến kết thúc của sóng T 320 milli giây
QT Được đo từ khi bắt đầu bộ phức hợp QRS đến khi kết thúc sóng T 420 milli giây
U Thông thường có biên độ thấp và thường hoàn toàn vắng mặt Không đề cập đến
Chuyển đạo là khái niệm dùng để đo tín hiệu điện tim, được xác định bằng vị trí đặt các điện cực trên cơ thể Có hai loại chuyển đạo là chuyển đạo trực tiếp và chuyển đạo gián tiếp Chuyển đạo trực tiếp là khi điện cực chạm vào cơ tim, và chỉ được dùng khi mở lồng ngực trong phẫu thuật hoặc trên động vật thí nghiệm; đối với người bình thường, người ta dùng chuyển đạo gián tiếp ngoài lồng ngực Chuyển đạo gián tiếp được chia làm ba loại: chuyển đạo song cực chi, chuyển đạo đơn cực chi và chuyển đạo trước tim Hình 2.2 trình bày sơ đồ cơ bản các phương pháp mắc điện cực trên cơ thể người theo chuyển đạo, bao gồm a) sơ đồ mắc chuyển đạo song cực chi, b) sơ đồ mắc chuyển đạo đơn cực chi, và c) vị trí đặt điện cực của chuyển đạo trước tim.
Hình 2.2 Các dạng sơ đồ mắc điện cực trong quá trình thu thập tín hiệu điện tim dùng chuyển đạo gián tiếp
Phương pháp tính nhịp tim từ tín hiệu ECG được ghi trên giấy chuyên dụng, trong đó trục ngang biểu thị thời gian và trục dọc biểu thị điện áp; giấy có lưới gồm ô vuông lớn 5 mm, mỗi ô lớn lại chia thành 25 ô vuông nhỏ 1 mm Với giả thuyết tốc độ ghi ECG cố định ở 25 mm/s, 5 ô vuông lớn tương ứng 1 giây và 300 ô vuông lớn tương ứng 1 phút, nên số đỉnh R xuất hiện trong phức hợp QRS trên 300 ô vuông lớn bằng nhịp tim tính bằng bpm; ví dụ một dải nhịp tim có 60 đỉnh R trong 300 ô vuông lớn cho nhịp tim 60 bpm Vì vậy, cách trực quan để tính nhịp tim từ tín hiệu ECG là đếm tổng số đỉnh R trong 300 ô vuông lớn, số lượng này sẽ cho nhịp tim của bệnh nhân (bpm) Cũng có một phương pháp gần đúng đơn giản hơn: đếm số ô vuông lớn giữa hai đỉnh R và lấy 300 chia cho số ô vuông lớn giữa hai đỉnh R để ước lượng nhịp tim a) Ô vuông lớn có kích thước 5 mm b) Các ô vuông nhỏ có kích thước 1 mm.
Hình 2.3 Giấy chia ô dùng để ghi lại tín hiệu điện tim ECG
Trên giấy ghi ECG, trục tung biểu diễn mức điện áp của tín hiệu điện tim Mỗi ô vuông nhỏ đại diện cho 0.1 mV, nên một ô vuông lớn tương ứng với 0.5 mV Hình 2.4 minh họa mức biên độ điện áp của một ô vuông lớn trên trang giấy in tín hiệu ECG.
Hình 2.4 Cách xác định biên độ và số lượng nhịp tim trên một phút của tín hiệu điện tim được in trên giấy chuyên dụng.
TẬP DỮ LIỆU ĐIỆN TIM ECG
Để phục vụ cho nghiên cứu phân loại bệnh tim, tín hiệu điện tâm đồ (ECG) là yếu tố thiết yếu; trong luận án này, ECG được khai thác từ bộ dữ liệu MIT-BIH ECG Database gồm 4000 tín hiệu long-term Holter thu thập từ năm 1975 đến 1979 tại Phòng Chứng loạn nhịp tim thuộc Bệnh viện Beth Israel, nay là Beth Israel Deaconess Medical Center ở Boston, Massachusetts, Hoa Kỳ Tập dữ liệu này được chia thành hai nhóm: nhóm một gồm 23 trên 48 bản ghi đầu tiên được chọn ngẫu nhiên từ 4000 bộ thu ECG 24 giờ, trong đó 60% là của bệnh nhân nội trú và 40% là của bệnh nhân ngoại trú; nhóm hai gồm 25 trên 48 bản ghi còn lại từ cùng bộ dữ liệu, gồm những nhịp tim ít phổ biến hơn nhưng có các triệu chứng lâm sàng quan trọng Toàn bộ 48 tín hiệu được đo đều với thời lượng trên 30 phút Hình 2.5 trình bày dạng sóng của một đoạn tín hiệu ECG của bệnh nhân mã 117 trong tập dữ liệu MIT-BIH.
Hình 2.5 Dạng sóng tín hiệu ECG của bệnh nhân được đánh số 117 thu thập từ tập dữ liệu MIT-BIH
Trong tập dữ liệu này, các tín hiệu điện tim được đo trong khoảng nửa giờ và có chất lượng đủ để phân tích bởi bác sĩ và các nhà khoa học Một số tín hiệu được chọn do biến đổi ở phức hợp QRS hoặc chất lượng tín hiệu đủ điều kiện để phát hiện rối loạn nhịp tim Danh sách bệnh nhân gồm 25 nam từ 32 đến 89 tuổi và 22 nữ từ 23 đến 89 tuổi Lưu ý, tín hiệu 201 và 202 thuộc cùng một người đàn ông Bảng 2.2 giải thích ý nghĩa định dạng dữ liệu tín hiệu điện tim theo chuẩn MIT Mỗi tín hiệu có ba tập tin với định dạng *.atr, *.dat và *.hea; mỗi định dạng có nội dung riêng biệt nhưng bổ sung cho nhau, hỗ trợ các nhà nghiên cứu phân tích dữ liệu một cách hiệu quả.
Bảng 2.2 Bảng mô tả ý nghĩa của các kiểu định dạng dữ liệu tín hiệu điện tim theo định dạng MIT-BIH
.dat files hea files atr files
MIT Signal files là những tập tin nhị phân chứa các mẫu tín hiệu được số hóa Các tín hiệu này được lưu trữ dưới dạng sóng, nhưng việc giải mã và phân tích đúng đắn phụ thuộc vào các tập tin header tương ứng Thiếu tập tin header, dữ liệu sẽ khó hiểu và khó tái hiện với độ chính xác cao Những tập tin này thường có định dạng nhị phân đặc trưng và được đi kèm với các tập tin header để cung cấp thông tin về cấu trúc dữ liệu, tần số lấy mẫu, độ phân giải và phạm vi tín hiệu.
MIT Header files là những tập tin văn bản ngắn bằng ký tự, có chức năng mô tả nội dung và cấu trúc của các tập tin được liên kết với nó, như dat và atr Chúng ở định dạng dễ đọc, chứa các mục mô tả, siêu dữ liệu và các tham chiếu giữa các phần dữ liệu với nhau, giúp người dùng và phần mềm nhận diện nhanh mối quan hệ giữa các thành phần Định dạng của MIT header cho phép liệt kê tên tập tin liên kết, kích thước, vị trí dữ liệu và các thuộc tính liên quan, từ đó tối ưu hóa quá trình phân tích, tra cứu và xử lý dữ liệu Nhờ đó, header file đóng vai trò như một bản mô tả trung gian giữa các phần dữ liệu và hệ thống quản lý tập tin, giúp quản lý dữ liệu hiệu quả hơn.
MIT Annotation files là các tập tin nhị phân chứa chú thích cho từng nhịp tim tương ứng với tập tin dat Tập tin atr nên được đọc cùng với các tập tin header liên kết của chúng để đảm bảo chú thích được giải thích và ghép nối chính xác Các tập tin này có dạng filename.atr, filename.dat và filename.hea, cho phép liên hệ giữa dữ liệu nhịp tim và các chú thích một cách nhất quán.
Dữ liệu và chú thích trên cơ sở dữ liệu PhysioNet hầu hết được lưu trữ ở định dạng WFDB, gồm hai tiêu chuẩn MIT format và European Data Format (EDF) Trong luận án này, tập dữ liệu MIT-BIH Database được sử dụng ở định dạng MIT format Các bản ghi được số hóa với tần số lấy mẫu 360 Hz (360 mẫu mỗi giây), trên mỗi dây điện cực với độ phân giải ADC 11-bit trên dải điện áp 10 mV Việc gán nhãn các bệnh tim cho mỗi nhịp tim được ít nhất hai bác sĩ chuyên khoa tim độc lập thẩm định; nếu tồn tại bất đồng từ kết quả thẩm định, nó sẽ được giải quyết để đạt được kết quả khách quan cuối cùng Thông tin của tập dữ liệu MIT-BIH DB được trình bày chi tiết như ở bảng 2.3, cụ thể bao gồm mã bệnh nhân, tuổi của bệnh nhân, dây điện cực thứ nhất, dây điện cực thứ hai, giới tính của người được đo, số lượng nhịp tim trong mỗi loại bệnh theo chuẩn ANSI-AAMI EC57-2012 và mã của tín hiệu ECG trong tập dữ liệu này.
Bảng 2.3 Mô tả chi tiết các thông tin trên tập dữ liệu MIT-BIH DB
Đối với tín hiệu ECG từ tập dữ liệu MIT-BIH DB, các loại bệnh tim được gom thành năm nhóm ký hiệu bằng chữ cái N, S, V, F, Q theo chuẩn ANSI-AAMI EC57-2012 Bảng tham chiếu giữa các loại bệnh tim theo MIT-BIH và nhóm theo chuẩn AAMI 2012 được mô tả chi tiết ở bảng 2.4, trong đó nhóm S còn được ký hiệu SVEB và nhóm V ký hiệu VEB Tổng cộng, các nhóm có số lượng mẫu lần lượt là 181022 (N), 5552 (S), 14464 (V), 1604 (F) và 22266 (Q).
Bảng 2.4 Bảng tham chiếu của các loại bệnh tim theo chuẩn MIT-BIH và theo chuẩn ANSI-AAMI EC57-2012
Các loại bệnh tim theo chuẩn
Các loại bệnh tim theo chuẩn MIT-BIH
Normal Beat (N) Left Bundle Branch Block Beat (L) Right Bundle Branch Block Beat (R) Atrial Escap Beat (e)
Nodal (Junctional) Escape Beat (j or NE) Supraventricular ectopic beats
Atrial Premature Beat (A) Aberrated Atrial Premature Beat (a) Nodal (Junctional) Premature Beat (J) Supra-Ventricular Premature Beat (S) Ventricular ectopic beats
Premature Ventricular Contraction Beat (V) Ventricular Escape Beat (E)
Fusion of Ventricular and Normal Beat (F)
Paced Beat (P or /) Fusion of Paced and Normal Beat (f) Unclassificable Beat (Q)
TIỀN XỬ LÝ TÍN HIỆU ĐIỆN TIM
Điện tim có biên độ điện áp rất nhỏ và được đo bằng kỹ thuật gián tiếp - tức đo ngoài da và không có tác động xâm lấn lên cơ thể Vì vậy, tín hiệu ECG sau khi đo ngoài da chứa đựng các thông tin quan trọng nhưng cũng tồn tại nhiều loại nhiễu Sau khi xây dựng bộ dữ liệu, bước tiền xử lý là cần thiết để loại bỏ các thành phần nhiễu không mong muốn trong tín hiệu ECG Các nhiễu của tín hiệu ECG có thể kể tới nhiễu do lệch đường cơ sở (baseline drift), nhiễu do điện áp xoay chiều của nguồn cung cấp (Power Line Interference - PLI), nhiễu do tiếp xúc điện cực không tốt, nhiễu do ảnh hưởng của môi trường xung quanh, nhiễu do trạng thái sức khỏe và tâm trạng của người được đo, và nhiễu do các tác động ngẫu nhiên khác Các thành phần nhiễu này ảnh hưởng rất lớn đến kết quả phân loại bệnh từ tín hiệu điện tim, do đó cần xử lý tiền xử lý hiệu quả để nâng cao độ chính xác và tin cậy của hệ thống chẩn đoán.
Tiền xử lý nhằm loại bỏ các yếu tố nhiễu là bước thiết yếu để nâng cao hiệu suất của bộ phân loại khi làm việc với tín hiệu ECG Trong tiền xử lý tín hiệu ECG, các phương pháp phổ biến được áp dụng để làm sạch dữ liệu và giảm nhiễu, nổi bật nhất là sử dụng bộ lọc thông thấp Butterworth để giới hạn băng thông và làm mịn tín hiệu.
Theo các nghiên cứu [21], các phương pháp lọc tín hiệu ECG bao gồm bộ lọc thông thấp hữu hạn FIR [22], bộ lọc thông cao [23, 24] và bộ lọc Kalman [25] Để xác định đường cơ sở của tín hiệu ECG, các phương pháp phổ biến được sử dụng là bộ lọc trung vị [26-28] và bộ lọc thông cao [29] Tuy nhiên, việc lựa chọn bộ lọc phù hợp và đạt hiệu quả cao nhất vẫn là một thách thức lớn và chưa có câu trả lời chính xác.
Gần đây, nhiều phương pháp lọc nhiễu cho tín hiệu ECG đã được ứng dụng, bao gồm bộ lọc FIR, IIR, wavelet, bộ lọc thích nghi và các loại lọc khác; mỗi lọc áp dụng cho tín hiệu ECG đều có đặc tính riêng và mang lại hiệu quả lọc nhiễu khác nhau Trong [33], Jacek Piskorowski đã đề xuất một bộ lọc IIR hai bậc với dải lọc chặn Q-varying để loại bỏ nhiễu lưới điện của tín hiệu ECG, với ý tưởng là thay vì dùng hệ số chất lượng Q cố định, hệ số Q sẽ thay đổi theo thời gian để tăng hiệu quả lọc Kết quả cho thấy hiệu quả lọc khi Q thay đổi là tốt hơn so với Q cố định Trong khi đó, Vivek Joshi và các cộng sự [34] đề xuất một bộ lọc thích nghi sử dụng tối ưu hóa theo kiểu bầy đàn để loại bỏ nhiễu của tín hiệu ECG; phương pháp được đánh giá bằng hai tiêu chí SNR và MSE, với kết quả cho thấy SNR được cải thiện 19% và MSE giảm 99%.
Như đã trình bày ở trên, đã có nhiều phương pháp được áp dụng để lọc nhiễu của tín hiệu điện tim, trong đó biến đổi wavelet với các bộ lọc thông thấp và thông cao cũng đã được áp dụng để lọc bỏ nhiễu và artifact trên tín hiệu điện tim [35-37] Điểm mạnh của biến đổi wavelet là có thể xác định các hệ số xấp xỉ và các hệ số chi tiết liên quan đến tần số của tín hiệu Hơn nữa, phép biến đổi wavelet có thể được sử dụng với nhiều hàm wavelet khác nhau tùy thuộc vào loại tín hiệu Trong [38], Supriya Goel và các cộng sự đã áp dụng năm hàm wavelet khác nhau gồm Daubechies, Coiflet, Haar, Biorthogonal, và Symmlet để lọc nhiễu của tín hiệu điện tim Cụ thể, họ wavelet Daubechies được sử dụng gồm db1 đến db10 cho lọc nhiễu và thu được hiệu suất tốt nhất
Trong [39], Atul và các cộng sự đã dùng một bộ lọc cửa sổ vi phân hàm số Alexander để lọc bỏ nhiễu của tập tín hiệu điện tim MIT-BIH ECG và giá trị SNR được tính cho đánh giá hiệu quả lọc nhiễu của phương pháp đề xuất Cụ thể, kết quả lọc nhiễu thể hiện rằng giá trị SNR là 19.609 dB cho tập tín hiệu điện tim MIT-BIH ECG, với mã bệnh nhân được sử dụng là 234 Trong [18], Yang Xu và các cộng sự đã đề xuất một phương pháp lọc nhiễu và hiệu chỉnh đường cơ sở trên tín hiệu điện tim Cụ thể, phương pháp phân rã chế độ thực nghiệm tổng thể hoàn chỉnh cho tín hiệu nhiễu thích nghi được đề xuất để lọc các thành phần nhiễu ngẫu nhiên trên tín hiệu điện tim Với phương pháp lọc nhiễu được đề xuất, giá trị MSE được tính cho tín hiệu của mã bệnh nhân 109 và 203 trong tập tín hiệu điện tim MIT-BIH DB lần lược là 0.0196 và 0.0284 Tuy nhiên, trong nghiên cứu này thì các thành phần nhiễu khác như nhiễu điện cơ không được nghiên cứu và loại bỏ
Mỗi tín hiệu điện tim thu được chứa nhiều nhịp tim, và trong các tập dữ liệu nghiên cứu bệnh tim bác sĩ thường gán nhãn bệnh theo từng nhịp tim Để phân loại bệnh tim, tín hiệu điện tim được tách thành các nhịp tim riêng biệt; quá trình tách nhịp tim bắt đầu bằng việc xác định vị trí đỉnh R của mỗi nhịp tim và sau đó lấy một số mẫu ở phía trước và phía sau đỉnh R để tạo thành một nhịp tim Số lượng mẫu được chọn quyết định độ dài của nhịp tim, do đó một nhịp tim có thể có chiều dài khác nhau Có nhiều phương pháp xác định vị trí đỉnh R, trong đó các kỹ thuật như Pan-Tompkins, xử lý tín hiệu và ngưỡng cắt, cùng với các thuật toán tương tự được áp dụng để nhận diện đỉnh R một cách nhanh chóng và ổn định.
R được sử dụng phổ biến nhất là phương pháp Pan-Tompkins được đề xuất bởi Jiapu Pan và Willis J Tompkins [40]
Để phân loại bệnh tim một cách hiệu quả, tín hiệu ECG được tách thành từng nhịp tim nhằm trích đặc trưng và đánh giá các đặc tính liên quan đến nhịp tim; sau quá trình lọc nhiễu, tập tín hiệu ECG được chia thành các tín hiệu nhịp tim riêng biệt để tăng khả năng phân loại Các nhịp tim này sẽ được sử dụng để trích đặc trưng và phân loại bệnh tim nhằm nâng cao hiệu suất phân loại Trong một số nghiên cứu, tín hiệu có thể được giữ nguyên mà không lọc nhiễu để đánh giá ảnh hưởng của nhiễu; tuy nhiên, hầu hết các hệ thống phân loại bệnh tim đều xử lý ECG qua lọc nhiễu nhằm thu được hiệu suất phân loại cao hơn.
TRÍCH ĐẶC TRƯNG VÀ GIẢM CHIỀU TÍN HIỆU ĐIỆN TIM
Sau khi tiến hành tiền xử lý, tín hiệu ECG được trích đặc trưng nhằm phục vụ cho việc phân loại bệnh tim Đây là bước khó khăn nhất và ảnh hưởng nhiều nhất tới độ chính xác của bộ phân loại Với từng loại dữ liệu khác nhau, phương pháp trích đặc trưng cũng phải được điều chỉnh phù hợp; sự biến đổi lớn của tín hiệu ECG cũng tác động tới lựa chọn phương pháp trích đặc trưng Việc chọn đúng phương pháp trích đặc trưng giúp thu được các thành phần đặc trưng của ECG tốt nhất, từ đó nâng cao hiệu suất phân loại Nhờ sự phát triển của lĩnh vực máy học và đặc biệt là các phương pháp học sâu, người ta có thể thiết kế hệ thống cho máy tự học các đặc trưng và tích hợp bộ phân loại vào một mạng nơ-ron, làm cho quá trình trích đặc trưng dễ dàng và hiệu quả hơn.
Trích đặc trưng tín hiệu bằng phương pháp thủ công vẫn đóng vai trò quan trọng trong hệ thống phân loại ECG Ngoài trích đặc trưng, việc giảm chiều dữ liệu cũng cần được áp dụng nhằm thu giữ gần như đầy đủ thông tin tín hiệu nhưng với số chiều giảm xuống đáng kể so với tín hiệu gốc Việc giảm chiều giúp hệ thống phân loại diễn ra nhanh hơn, giảm khối lượng tính toán mà vẫn đảm bảo hiệu suất Nhiều phương pháp trích đặc trưng đã được áp dụng kết hợp với giảm chiều tín hiệu ECG, trong đó phân tích thành phần chính PCA là ví dụ tiêu biểu [41].
42], biến đổi wavelet [43-45], phân tích thành phần độc lập [46], kết hợp kernel với thuật toán PCA [10, 47, 48], và một số phương pháp trích đặc trưng khác [49-52]
Trong một nghiên cứu khác, ngưỡng thích nghi kết hợp với phân tích thành phần chính được áp dụng để trích xuất các đặc trưng từ tín hiệu ECG Cụ thể, nhóm của Ricardo Rodriguez-Jorge và các đồng sự đã dùng biến đổi Hilbert và ngưỡng thích nghi để phát hiện phức hợp QRS, tiếp đó phân tích thành phần chính (PCA) được sử dụng để trích xuất các đặc trưng quan trọng trên tín hiệu nhịp tim Nghiên cứu này dùng 19 hồ sơ bệnh nhân từ tập dữ liệu MIT-BIH ECG để đánh giá hiệu quả của phương pháp đề xuất Kết quả thí nghiệm cho thấy phương pháp đạt giá trị dự đoán dương cho phát hiện phức hợp QRS là 99.71% và độ nhạy đạt 96.28%.
Phương pháp trích đặc trưng bằng biến đổi wavelet đa phân giải hoặc sự kết hợp với các phép biến đổi khác đã được nghiên cứu và áp dụng cho trích đặc trưng tín hiệu nhịp tim Trong nghiên cứu của Qin et al [54], biến đổi wavelet đa phân giải được trình bày như một công cụ hiệu quả để trích đặc trưng tín hiệu nhịp tim Các đặc trưng được trích ở cả hai miền thời gian và tần số, và dữ liệu đặc trưng được giảm chiều bằng phân tích thành phần chính PCA Véc-tơ đặc trưng có 12 thành phần được phân loại bằng bộ phân loại SVM Hiệu suất phân loại bệnh tim được đánh giá trong hai trường hợp: dữ liệu huấn luyện và kiểm tra giống nhau và dữ liệu huấn luyện với dữ liệu kiểm tra khác nhau, lần lượt đạt 99.70% và 81.47%.
2.4.1 Phương pháp biến đổi wavelet
Biến đổi wavelet là một thuật toán được ứng dụng rộng rãi trong xử lý tín hiệu nói chung và xử lý tín hiệu ECG nói riêng Trong phép biến đổi wavelet, tín hiệu được phân tích cả ở miền thời gian và miền tần số, cho phép nắm bắt đặc trưng tín hiệu ở nhiều mức tần số khác nhau Thuật toán này cũng được dùng để lọc nhiễu cho tín hiệu ECG, giúp cải thiện chất lượng tín hiệu Trong nghiên cứu của Yang Xu và các cộng sự được đề cập trong [18], họ đề xuất một phương pháp kết hợp bộ lọc thích nghi và bộ lọc wavelet có ngưỡng nhằm lọc nhiễu cho tín hiệu ECG.
Trong nghiên cứu này, nhiễu trong tín hiệu ECG được phân tích và phân tách thành hai thành phần: tần số cao và tần số thấp, nhằm loại bỏ nhiễu một cách hiệu quả Quá trình phân tích tần số cho phép nhận diện các yếu tố gây nhiễu ở các dải tần khác nhau và loại bỏ chúng mà không làm sai lệch các đặc trưng của tín hiệu ECG Việc tách thành phần tần số cao và thấp giúp cải thiện chất lượng tín hiệu ECG và tăng độ tin cậy của phân tích.
Phương pháp biến đổi wavelet do Dengyong Zhang và các cộng sự đề xuất nhằm lọc nhiễu trên tín hiệu điện tâm đồ (ECG) Tín hiệu ECG được phân rã thành các thành phần sóng con ở tần số cao và tần số thấp bằng phép biến đổi wavelet, từ đó loại bỏ nhiễu mà vẫn giữ lại các đặc trưng tín hiệu quan trọng.
Phương pháp ngưỡng mềm được kết hợp trên các thành phần tần số nhằm loại bỏ nhiễu trên tín hiệu điện tim, sau đó các thành phần sóng con sau khi lọc nhiễu được khôi phục thành tín hiệu điện tim Để nâng cao hiệu quả lọc nhiễu, tín hiệu sau khôi phục còn được áp dụng bộ lọc làm trơn nhằm làm mịn tín hiệu điện tim Hiệu quả của phương pháp được đánh giá dựa trên tỷ số tín hiệu trên nhiễu (SNR) và sai số toàn phương trung bình (MSE) Tập dữ liệu điện tim MIT-BIH được sử dụng để đánh giá hiệu quả của phương pháp lọc nhiễu được đề xuất Kết quả lọc nhiễu dựa trên phép biến đổi wavelet cho thấy hiệu quả khá tốt.
Thuật toán phân rã bằng wavelet là một ứng dụng của phép biến đổi wavelet, nơi tín hiệu được đưa qua các bộ lọc thông thấp và thông cao để thu được các thành phần tín hiệu có tần số khác nhau; trong nghiên cứu [45], Ritu Singh và các cộng sự đề xuất áp dụng phương pháp biến đổi wavelet kết hợp với các bộ phân loại khác nhau nhằm khảo sát độ chính xác của bộ phân loại bệnh tim; cụ thể, nghiên cứu này xem xét 4 họ wavelet là Daubechies, Symlet, Coiflet và Biorthogonal để trích các đặc trưng của tín hiệu nhịp tim; tín hiệu nhịp tim được phân rã thành các thành phần tín hiệu có tần số khác nhau bằng các hàm wavelet kể trên, và các thành phần tín hiệu này được sử dụng như các đặc trưng của bệnh tim; nghiên cứu này chỉ phân loại hai loại nhịp tim là có bệnh hoặc không có bệnh và độ chính xác thu được trong trường hợp này là rất tốt; tuy nhiên, ở phương pháp được đề xuất thì tín hiệu sau khi khôi phục còn phải tiếp tục qua một bộ lọc làm trơn, đây là điểm hạn chế của nghiên cứu này.
Phương pháp biến đổi wavelet, nhờ khả năng phân tích tín hiệu ở cả miền thời gian và miền tần số, được dùng như một bước tiền xử lý để trích đặc trưng tín hiệu ECG Tao Wang và các cộng sự đề xuất kết hợp biến đổi wavelet với mạng nơ-ron tích chập (CNN) nhằm phân loại các bệnh tim từ tập dữ liệu ECG MIT-BIH Cách tiếp cận này sử dụng biến đổi wavelet liên tục để biến tín hiệu ECG một chiều thành hình ảnh thể hiện mối quan hệ giữa thời gian và tần số, sau đó hình ảnh được đưa vào CNN để trích xuất đặc trưng và phân loại bệnh Với cấu trúc CNN 18 lớp, phương pháp này phân loại 4 loại bệnh tim từ tập dữ liệu MIT-BIH và đạt độ chính xác 98.74%.
2.4.2 Phương pháp phân tích thành phần chính
Phân tích thành phần chính (PCA) là công cụ phân tích dữ liệu được sử dụng rộng rãi nhằm trích xuất các đặc trưng chính của tín hiệu và từ đó giảm chiều dữ liệu Ý tưởng cốt lõi của PCA là nhận diện và giữ lại các đặc trưng quan trọng nhất, đồng thời loại bỏ những thành phần mang ít thông tin để dữ liệu trở nên gọn hơn mà vẫn bảo toàn nhiều nhất thông tin cần thiết từ tín hiệu gốc Khi áp dụng PCA, dữ liệu ở miền không gian gốc được dùng để xây dựng ma trận hiệp phương sai, từ đó tính các trị riêng và véc tơ riêng; dựa vào các trị riêng, số lượng véc tơ riêng được chọn sao cho tổng luỹ tích của các trị riêng được giải thích đạt ngưỡng mong muốn, tạo nên tập đặc trưng chính Kết quả là dữ liệu sau khi giảm chiều có số chiều ít đi đáng kể nhưng vẫn giữ được phần lớn thông tin của tín hiệu ban đầu.
Trong xử lý tín hiệu ECG nhằm phân loại các loại bệnh tim, phân tích thành phần chính PCA đã được áp dụng rộng rãi Nghiên cứu [57] của Hongqiang Li và các đồng nghiệp đề xuất phương pháp trích đặc trưng kết hợp giữa PCA và kernel ICA để khai thác đặc trưng đặc hiệu cho các loại bệnh tim trong tín hiệu ECG Các đặc trưng này sau đó được đưa vào bộ phân loại dựa trên máy vector hỗ trợ (SVM) để phân loại các loại bệnh tim Tập dữ liệu điện tim MIT-BIH được dùng để đánh giá độ chính xác của hệ thống trích đặc trưng và phân loại bệnh tim được đề xuất Kết quả cho thấy độ chính xác phân loại đạt 97.78% cho bài toán phân loại 5 loại bệnh tim.
Trong một nghiên cứu khác về việc ứng dụng phân tích thành phần chính (PCA) để trích đặc trưng và giảm chiều của tín hiệu điện tim, Jose Luis Rodriguez-Sotelo và cộng sự đề xuất dùng PCA để phân cụm các loại bệnh tim Cụ thể, họ xây dựng các đặc trưng của bệnh tim bao gồm khoảng cách giữa hai đỉnh R, các hệ số xấp xỉ và các hệ số chi tiết sau khi phân tích wavelet, cùng với đặc trưng hình thái của phức hợp QRS Phương pháp PCA được áp dụng trên các đặc trưng này nhằm trích xuất các thành phần chính và phân cụm các loại bệnh tim từ tín hiệu ECG Kết quả phân cụm cho thấy hiệu quả phân loại các loại bệnh tim được cải thiện, đạt 97.4% độ chính xác cho bài toán phân loại 5 loại bệnh tim trên tập dữ liệu ECG MIT-BIH.
Genlang Chen và các cộng sự đề xuất phương pháp trích đặc trưng kết hợp với phân tích thành phần chính nhằm lựa chọn đặc trưng cho tín hiệu nhịp tim Phương pháp trích đặc trưng dựa trên biến đổi wavelet được kết hợp với các thông số như giá trị điện áp lớn nhất, nhỏ nhất và giá trị trung bình của mỗi nhịp tim để hình thành 10 đặc trưng cho các loại bệnh tim Sau đó, phân tích thành phần chính được áp dụng để giảm chiều của các đặc trưng này Để phân loại các loại bệnh tim từ các đặc trưng đã trích, một bộ phân loại kết hợp giữa rừng ngẫu nhiên và mạng nơ-ron truyền thẳng nhiều lớp được sử dụng Kết quả cho thấy độ chính xác phân loại đạt 99,3% Với những ưu điểm này, phương pháp phân tích thành phần chính sẽ được sử dụng và cách trích xuất đặc trưng bằng phương pháp này sẽ được trình bày chi tiết ở chương 4.