Tổng quan về ứng dụng AI - X-quang phổi trong bệnh lao Có nhiều phương pháp trong lĩnh vực AI đã được sử dụng trong các bài toán hỗ trợ việc khám chữa bệnh và chẩn đoán bệnh, tuy nhiên
Trang 1Biểu B1-2a-TMĐTCN
08/2017/TT-BKHCN
THUYẾT MINH
ĐỀ TÀI NGHIÊN CỨU ỨNG DỤNG
VÀ PHÁT TRIỂN CÔNG NGHỆ CẤP QUỐC GIA 1
I THÔNG TIN CHUNG VỀ ĐỀ TÀI:
sơ trúng tuyển)
Nghiên cứu xây dựng hệ thống hỗ trợ chẩn đoán và dự
báo dịch tễ địa không gian (geo-spatial epidemiology)
bệnh lao phổi bằng ảnh X-quang ngực ở Việt Nam
2 Thời gian thực hiện: 36 tháng 3 Cấp quản lý
(Từ tháng 12/2019 đến tháng 12/2022) Quốc gia ý Bộ
Tỉnh Cơ sở
4 Tổng kinh phí thực hiện: 5.625 triệu đồng, trong đó:
- Từ nguồn ngoài ngân sách nhà
nước
5 Đề nghị phương thức khoán chi:
Khoán đến sản phẩm cuối cùng Khoán từng phần, trong đó:
- Kinh phí khoán: 5.005 triệu đồng
- Kinh phí không khoán: 620 triệu đồng
6
Thuộc Chương trình (Ghi rõ tên chương trình, nếu có): Chương trình trọng điểm
cấp quốc gia giai đoạn đến năm 2025 “Hỗ trợ nghiên cứu, phát triển và ứng dụng công
nghệ của công nghiệp 4.0”, Mã số: KC-4.0/19-25
Thuộc dự án KH&CN
Độc lập
Khác
7 Lĩnh vực khoa học
Tự nhiên; Nông nghiệp;
Kỹ thuật và công nghệ; Y, dược
1 Bản Thuyết minh đề tài này dùng cho hoạt động nghiên cứu ứng dụng và phát triển công nghệ thuộc 4 lĩnh vực khoa học nêu tại mục 7 của Thuyết minh Thuyết minh được trình bày và in trên khổ A4
X
Trang 28 Chủ nhiệm đề tài
Họ và tên: Nguyễn Viết Nhung
Ngày, tháng, năm sinh: 01/06/1962 Giới tính: Nam
Học hàm, học vị/ Trình độ chuyên môn: PGS.TS.BS
Chức danh khoa học: Nghiên cứu viên chính
Chức vụ: Giám đốc Bệnh viện Phổi Trung ương, Chủ nhiệm Chương trình Chống Lao quốc gia, Chủ tịch Hội Phổi Việt Nam, Trưởng Bộ môn Lao và Bệnh Phổi – Đại học Y Hà Nội
Điện thoại: 0912507993
Tổ chức: Bệnh viện Phổi Trung ương
Tổ chức: 024.38326249 Mobile: 0912507993
E-mail: vietnhung@yahoo.com
Tên tổ chức đang công tác: Bệnh viện Phổi Trung ương
Địa chỉ tổ chức: 463 Hoàng Hoa Thám, Ba Đình, Hà Nội
9 Thư ký khoa học của đề tài:
Họ và tên: Bùi Mỹ Hạnh
Ngày, tháng, năm sinh: 07/09/1973 Giới tính: Nữ
Học hàm, học vị/ Trình độ chuyên môn: PGS.TS.BS Giảng viên cao cấp
Chức danh khoa học: Nghiên cứu viên chính
Chức vụ: Giảng viên cao cấp, Bộ môn Lao và Bệnh phổi, Giám đốc Trung tâm Phát triển chương trình đào tạo và Tư vấn nhân lực y tế, Trường Đại học Y Hà Nội; Trưởng khoa Thăm dò chức năng, Trưởng đơn vị Nghiên cứu khoa học và Hợp tác quốc tế, Bệnh viện Đại học Y Hà Nội
Trang 3Website: https://bvptw.org/
Địa chỉ: 463 Hoàng Hoa Thám, Ba Đình, Hà Nội
Họ và tên thủ trưởng tổ chức: Nguyễn Viết Nhung
Số tài khoản: 95271056530 tại Kho bạc Nhà nước Ba Đình Hà Nội
Tên cơ quan chủ quản đề tài: Bộ Khoa học và Công nghệ
11 Các tổ chức phối hợp chính thực hiện đề tài (nếu có):
1 Tổ chức 1 :
Tên cơ quan chủ quản: Trường Đại học Y Hà Nội
Điện thoại: (+84 4) 3852 3798
Địa chỉ: Số 01, Tôn Thất Tùng, Đống Đa, Hà Nội
Họ và tên thủ trưởng tổ chức: Tạ Thành Văn
Số tài khoản: 9527.1.1057280 tại Kho bạc Nhà nước Hà Nội
2 Tổ chức 2 :
Tên cơ quan chủ quản: Viện công nghệ thông tin Đại học Quốc gia Hà Nội
Điện thoại: (024) 37547347
Địa chỉ: E3, 144 Xuân Thủy, Cầu GiấyHà Nội
Họ và tên thủ trưởng tổ chức: Đỗ Năng Toàn
Số tài khoản: 22010000675377
Ngân hàng: BIDV chi nhánh Thăng Long
12 Cán bộ thực hiện đề tài
(Ghi những người có đóng góp khoa học và thực hiện những nội dung chính thuộc tổ chức chủ
trì và tổ chức phối hợp tham gia thực hiện đề tài Kỹ thuật viên, nhân viên hỗ trợ lập danh sách theo mẫu này có xác nhận của tổ chức chủ trì và gửi kèm theo hồ sơ khi đăng ký):
TT học hàm học vị Họ và tên, Chức danh thực hiện đề tài2 Tổ chức công tác
1 PGS.TS Nguyễn Viết Nhung Chủ nhiệm
Bệnh viện Phổi Trung
ương,
Bộ môn Lao-Bệnh Phổi
2 PGS.TS Bùi Mỹ Hạnh Thư kí khoa học Bộ môn Lao-Bệnh phổi
2 Theo quy định tại bảng 1 Điểm b Khoản 1 Điều 7 thông tư liên tịch số 55/2015/TTLT-BTC-BKHCN ngày 22/4/2015 hướng dẫn định mức xây dựng, phân bổ dự toán và quyết toán kinh phí đối với nhiệm
vụ KH&CN có sử dụng ngân sách nhà nước
Trang 4Trường ĐHYHN
3 TS Cung Văn Công Thành viên thực hiện chính Bệnh viện Phổi Trung ương
4 TS Nguyễn Bình Hòa Thành viên thực hiện chính Bệnh viện Phổi Trung ương
5 TS Nguyễn Kim Cương Thành viên thực hiện chính Bộ môn Lao-Bệnh phổi
8 ThS Nguyễn Hữu Chính Thành viên thực hiện chính Viện dinh dưỡng quốc gia
9 ThS Trần Tiến Hưng Thành viên thực hiện chính Bảo hiểm xã hội Việt Nam
10 PGS.TS Đỗ Năng Toàn Thành viên thực hiện
Trang 5II MỤC TIÊU, NỘI DUNG KH&CN VÀ PHƯƠNG ÁN TỔ CHỨC THỰC HIỆN ĐỀ TÀI
13 Mục tiêu của đề tài (Bám sát và cụ thể hoá định hướng mục tiêu theo đặt hàng)
13.1 Mục tiêu chung
1 Xây dựng được cơ sở dữ liệu ảnh X-quang số về bệnh lao phổi ở Việt Nam;
2 Phát triển phần mềm hỗ trợ chẩn đoán và phần mềm dự báo dịch tễ địa không gian spatial epidemiology) bệnh lao phổi bằng ảnh X-quang ngực ở Việt Nam;
(geo-3 Triển khai ứng dụng tại một số cơ sở y tế các tuyến
13.2 Mục tiêu cụ thể:
1 Xây dựng được cơ sở dữ liệu lớn cho trên 30.000 ảnh X-quang ngực theo chuẩn DICOM cho bệnh nhân lao phổi đã được gán nhãn phân bố theo tuổi, giới, nghề nghiệp, dân tộc tại các vùng sinh thái ở Việt Nam;
2 Xây dựng được phần mềm học sâu sử dụng cơ sở dữ liệu đã được gán nhãn với độ chính xác trên 95%, có khả năng hỗ trợ chẩn đoán bệnh lao phổi ở Việt Nam bằng ảnh X-quang ngực với độ nhạy và độ đặc hiệu tối thiểu 90%;
3 Xác định các yếu tố nguy cơ theo không gian và thời gian (geo-spatial epidemiology), xây dựng cơ sở dữ liệu địa lý không gian về các yếu tố nguy cơ và xây dựng mô hình
dự báo tỷ suất mắc bệnh lao ở Việt Nam
4 Xây dựng phần mềm dự báo dịch tễ địa không gian bệnh lao phổi tại Việt Nam
5 Triển khai, đánh giá phần mềm học sâu hỗ trợ chẩn đoán bệnh lao phổi ở Việt Nam bằng ảnh X-quang ngực tại Bệnh viện Phổi Trung ương, và một số cơ sở y tế các tuyến khác
6 Triển khai, đánh giá phần mềm dự báo dịch tễ địa không gian bệnh lao phổi tại Bệnh viện Phổi Trung Ương và một số cơ sở y tế các tuyến
14 Tình trạng đề tài
Mới
Kế tiếp hướng nghiên cứu của chính nhóm tác giả
Kế tiếp nghiên cứu của người khác
Trang 615 Tổng quan tình hình nghiên cứu, luận giải về mục tiêu và những nội dung nghiên cứu của đề tài
15.1 Đánh giá tổng quan tình hình nghiên cứu thuộc lĩnh vực của đề tài
Ngoài nước (Phân tích đánh giá được những công trình nghiên cứu có liên quan và những kết
quả nghiên cứu mới nhất trong lĩnh vực nghiên cứu của đề tài; nêu được những bước tiến về trình độ KH&CN của những kết quả nghiên cứu đó)
Theo báo cáo của Tổ chức Y tế thế giới năm 2018 (TCYTTG - WHO Report 2018 - Global Tuberculosis Control), mặc dù đã đạt được một số thành tựu đáng kể trong công tác chống lao trong thời gian qua, tuy nhiên bệnh lao vẫn đang tiếp tục là một trong các bệnh ảnh hưởng lớn đến sức khoẻ cộng đồng trên toàn cầu TCYTTG ước tính năm 2017 trên toàn cầu có khoảng
10 triệu người mới mắc lao hàng năm (khoảng 9-11 triệu); 9% trong số mắc lao có đồng nhiễm HIV Bệnh lao là nguyên nhân gây tử vong đứng hàng thứ hai trong các bệnh nhiễm trùng với khoảng 1,3 triệu người tử vong do lao, và có thêm khoảng 300.000 ca tử vong do đồng nhiễm lao/HIV Tình hình dịch tễ lao kháng thuốc đang có diễn biến phức tạp và đã xuất hiện ở hầu hết các quốc gia Năm 2017 trên toàn cầu ước tính tỷ lệ mắc lao đa kháng thuốc là 3,5% trong
số người bệnh mới và là 18% trong số người bệnh điều trị lại
Xu hướng dịch tễ bệnh lao trên toàn cầu nói chung đang có chiều hướng giảm với tỷ lệ mới mắc giảm trong nhiều năm trở lại đây với tốc độ giảm khoảng 2%/năm Trong kế hoạch chiến lược kết thúc bệnh lao đã được ban hành, TCYTTG đã đưa ra mục tiêu phát triển thiên niên kỷ trên toàn cầu đến năm 2020 giảm 20% số người bệnh lao mới mắc và 35% số người
tử vong vì lao với năm 2015, đến năm 2025 sẽ giảm tương ứng là 50% và 75% Như vậy, tốc
độ giảm mới mắc sẽ cần phải tăng lên từ 4-5% mỗi năm vào năm 2020 và tăng lên 10% vào năm 2025 Hiện nay, ước tính mục tiêu này có thể đạt được ở một số khu vực trên thế giới, tuy nhiên rất có thể sẽ khó đạt được ở khu vực châu Phi vì liên quan đến tình hình dịch tễ HIV cao
Mặc dù có rất nhiều dữ liệu hữu ích từ việc phát hiện, dự phòng, kiểm tra và giám sát lâm sàng bệnh lao; việc chia sẻ kịp thời dữ liệu chất lượng cao với các nhà hoạch định và nghiên cứu chính sách, để định hướng chính sách, thực hành lâm sàng và nghiên cứu trong tương lai vẫn còn thiếu một hạ tầng và cách thức mang tính tự động, thường quy Chẩn đoán để điều trị nhanh chóng và chính xác và hiệu quả cũng như đảm bảo duy trì kết quả điều trị tốt để từ đó ngăn ngừa lây lan được coi là một trong những mục tiêu chiến lược để nhanh chóng chấm dứt bệnh lao Tuy nhiên, hiện tại có nhiều hạn chế và việc tiếp cận với chẩn đoán lao và việc áp dụng chúng vẫn còn là thách thức ở những nước thu nhập thấp và trung bình Ước tính năm
2017 có tới 36% trong số 10 triệu ca mới mắc bệnh lao không được chẩn đoán hoặc thông báo cho các hệ thống y tế Phần lớn trong gần 4 triệu người này là những người mắc lao được điều trị muộn, điều trị dưới mức tối ưu hoặc không được điều trị dẫn đến việc lây truyền bệnh lao
“Một trong hai người bệnh lao đáng lẽ có thể dễ dàng được cứu sống thì đang chết dần ngày hôm nay, 2018, vì không được chẩn đoán hoặc chẩn đoán muộn, bỏ điều trị, không dùng đúng thuốc hoặc không nhận được hỗ trợ cần thiết để hoàn thành điều trị lao Điều này là hoàn toàn không thể chấp nhận vì đây là điều hiển nhiên mà bất cứ ai cũng có thể hy vọng nhận được
Trang 7trong sức khỏe toàn cầu.” Giáo sư Madhukar Pai, Giám đốc của Trung tâm bệnh Lao Quốc tế McGill chia sẻ tại một cuộc họp cấp cao của Liên Hợp Quốc về bệnh lao Đầu tư vào loại bỏ bệnh lao có tỷ lệ lợi ích/chi phí cao nhất trong số tất cả các cơ hội y tế công trên toàn cầu: giảm tỷ lệ mắc lao lên 90% và tử vong lên 95% ước tính mang lại 43 đô la lợi ích đối với mỗi
đô la chi tiêu
Với những tiến bộ vượt bậc trong những năm gần đây trong lĩnh vực AI, ngày càng nhận thấy lợi ích của việc áp dụng AI trong việc phát triển các công cụ hổ trợ việc chăm sóc sức khỏe, đặc biệt là ở những nơi nghèo tài nguyên, nơi cuộc chiến toàn cầu với bệnh lao sẽ được chiến đấu
15.1 Tổng quan về ứng dụng AI - X-quang phổi trong bệnh lao
Có nhiều phương pháp trong lĩnh vực AI đã được sử dụng trong các bài toán hỗ trợ việc khám chữa bệnh và chẩn đoán bệnh, tuy nhiên hầu như tất cả các nghiên cứu không có sự liên thông
về bộ dữ liệu cho tất cả các quy trình sàng lọc, chẩn đoán, điều trị, phát hiện các đa kháng thuốc cũng như lập được bản đồ dịch tễ địa không gian trong theo dõi, giám sát lao tại cộng đồng
Dữ liệu có từ chụp X-quang ngực (phổi) (một thăm dò chẩn đoán hình ảnh) có giá trị trong chẩn đoán bệnh lao phổi đã được nghiên cứu nhiều nhất trong lĩnh vực AI Trong vài năm trở lại đây, các nhóm nghiên cứu trên toàn thế giới đã chứng minh rằng các kỹ thuật AI có khả năng phát hiện bệnh lao bằng cách sử dụng dữ liệu về X-quang ngực Đặc biệt các nước như Hoa Kỳ, Hà Lan, Brazil, Hàn Quốc, Trung quốc đã và đang nghiên cứu phát triển về những vấn đề này Các hệ thống sử dụng kỹ thuật của AI cho phép hỗ trợ bác sĩ trong việc xác nhận tổn thương của Lao trên ảnh chụp X-quang ngực (phổi), và sử dụng mô phỏng trực quan để
giải thích về dự đoán của nó về kết quả đề xuất
Trang 8Công nghệ AI cho việc mô phỏng bằng thuốc nhuộm kháng axit tự động với việc sử dụng
bộ chuyển đổi camera kính hiển vi trên điện thoại thông minh trong các khu vực có nguồn lực thấp đã cho thấy kết quả rất tốt
Trị liệu quan sát trực tiếp (Directly Observed Therapy - DOT) bằng AI: DOT là một chiến lược được khuyến nghị để kiểm soát bệnh lao và từ lâu đã trở thành trụ cột cho CTCLQG Năm 2017, Liệu pháp quan sát trực tiếp bằng video (Video Directly Observed Therapy - VDOT) đã được thử nghiệm tại Hà Nội và đã được chứng minh là một phương pháp hỗ trợ tuân thủ điều trị khả thi và chấp nhận được ở những người bệnh được điều trị ở cả cấp trung ương và cấp huyện (địa phương) của hệ thống y tế Việt Nam Việc sử dụng công nghệ AI có thể cải thiện hơn nữa cho chiến lược VDOT bằng cách tự động phát hiện chế độ ăn uống hoặc tuân thủ điều trị Điều này có thể giúp giảm chi phí thực hiện chiến lược VDOT bằng cách loại bỏ nhu cầu cần người giám sát, cũng như cải thiện quyền riêng tư của người bệnh vì không
có video nào được ghi lại và truyền đi Công nghệ như vậy đã được AICure.com - một công
ty ở Mỹ chứng minh
Trang 9Nguồn trích dẫn từ https://aicure.com/
Việc sử dụng trí tuệ nhân tạo (AI) cho y học gần đây đã thu hút nhiều sự chú ý nhờ những tiến bộ trong công nghệ nghiên cứu chuyên sâu trong việc sử dụng AI để phân tích chẩn đoán các loại hình ảnh khác nhau, chủ yếu thông qua mạng nơ-ron tích chập, một loại công nghệ nghiên cứu chuyên sâu được đề cập đến như tầm nhìn máy tính của Nhật Bản Xác nhận lâm sàng các công nghệ AI có thể được thực hiện ở các cấp độ khác nhau về hiệu quả: hiệu suất chẩn đoán, ảnh hưởng đến kết quả của người bệnh và hiệu quả xã hội xem xét lợi ích chi phí
và hiệu quả chi phí Việc xác nhận bên ngoài được khuyến nghị sử dụng các bộ dữ liệu có kích thước phù hợp được thu thập từ tuyển chọn người bệnh tại các tổ chức khác ngoài những
cơ sở cung cấp dữ liệu đào tạo theo cách thể hiện đầy đủ phổ biểu hiện (nghĩa là, tất cả các biến thể có liên quan trong nhân khẩu học và tình trạng bệnh) trong môi trường lâm sàng thực nơi AI sẽ được áp dụng Hơn nữa, sử dụng dữ liệu từ nhiều tổ chức bên ngoài rất quan trọng đối với việc xác thực để xác minh khả năng thuật toán có thể khái quát hóa qua sự biến đổi dự kiến trong một loạt các hệ thống bệnh viện Các mô hình AI toán học / thống kê phức tạp như vậy, các thuật toán học sâu phân tích hình ảnh y tế cần một lượng lớn dữ liệu để đào tạo thuật toán; sản xuất và chú thích độ lớn của dữ liệu hình ảnh y tế này đặc biệt tốn nhiều tài nguyên
và khó khăn Do đó, các cá nhân phát triển các thuật toán AI như vậy có thể dựa vào bất kỳ
dữ liệu nào có sẵn (về mặt phương pháp được gọi là dữ liệu kiểm soát trường hợp thuận tiện), mặc dù chúng có thể dễ bị sai lệch lựa chọn và tỷ lệ mắc người bệnh tạo cũng như có khả năng không thể hiện tốt các thiết lập lâm sàng trong thế giới thực Hiệu suất của thuật toán phụ thuộc rất nhiều vào dữ liệu đào tạo của nó, nên có một rủi ro thực sự là thuật toán AI có thể không hoạt động tốt trong thực tế ở thế giới thực và thuật toán được đào tạo tại một tổ chức cung cấp đầu ra không chính xác khi áp dụng cho dữ liệu tại một tổ chức khác
Để xây dựng hệ thống hỗ trợ chẩn đoán bệnh lao phổi bằng ảnh chụp X-quang ngực, nội dung công việc đầu tiên là phải xây dựng hệ thống thu thập dữ liệu và gán nhãn dữ liệu Hiện tại các bộ dữ liệu mở trên thế giới về ảnh chụp X-quang ngực liên quan đến bệnh lao phổi đang rất ít Đa phần các bộ dữ liệu này đều có số lượng mẫu khá nhỏ và chủ yếu lấy từ dữ liệu người nước ngoài Các phương pháp học sâu khi áp dụng lên các bộ dữ liệu này thường dễ bị hiện
Trang 10tượng học quá khớp (overfitting) dẫn tới chẩn đoán không hiệu quả với dữ liệu ảnh mới Hơn nữa, các mô hình học được dễ có sự sai lệch (bias) khi hoạt động chính xác hơn với người ngoại quốc nhưng lại kém hơn khi áp dụng với người Việt Nam Vì vậy nội dung thu thập và gán nhãn dữ liệu ảnh X-quang ngực cho người Việt Nam là rất quan trọng, quyết định sự thành công của hệ thống chẩn đoán Các kỹ thuật tiên tiến để làm sạch dữ liệu, tăng cường dữ liệu cũng sẽ được sử dụng trong pha này
Sau khi đã có bộ dữ liệu đầy đủ và được gán nhãn, nội dung công việc tiếp theo là xây dựng các mô hình học sâu hiệu quả để nhận dạng ảnh lao phổi Hiện tại trên thế giới các mô hình phân loại tốt nhất như SENet, NASNet hay EfficientNet chưa được ứng dụng trong dữ liệu ảnh y tế Vì vậy bên cạnh khai thác và cải tiến các mô hình cũ hơn như VGG, GoogleNet, ResNet, đề tài cũng nghiên cứu áp dụng các kiến trúc mạng tiên tiến nhất để cải thiện độ chính xác khi chẩn đoán bệnh lao phổi Trong phần này các phương pháp tối ưu, các phương pháp lai có thể được áp dụng để cùng hướng đến mục tiêu xây dựng mô hình học tối ưu nhất có thể Cuối cùng sau khi đã xây dựng các mô hình chẩn đoán bệnh lao phổi hiệu quả, nội dung tiếp theo là tối ưu hóa các mô hình để giảm bộ nhớ và tăng tốc độ tính toán Nội dung sẽ nghiên cứu các kỹ thuật thưa hóa khác nhau như dùng chuẩn l0, chuẩn Lasso, group Lasso, ElasticNet hay các kỹ thuật bayes như dropout biến phân Sau khi tối ưu hóa, tiếp theo là các kỹ thuật cắt tỉa kết nối, điều chỉnh các tham số trong mạng và mã hóa tham số để giảm không gian lưu trữ
và giảm chi phí tính toán khi sử dụng mô hình để suy diễn
15.2 Geospatial AI Epidemiology: Dịch tễ địa không gian sử dụng AI
Một cách tổng quát, lĩnh vực y tế thông minh (health intelligence) có thể được mô tả là các ứng dụng của AI để hỗ trợ trong việc khám và chữa bệnh Các ứng dụng ở cấp độ cộng đồng thông qua các chuyên ngành về sức khỏe môi trường, dịch tễ học, di truyền học, khoa học xã hội và hành vi và các bệnh truyền nhiễm Ngược lại, các ứng dụng cấp độ cá nhân có thể hướng đến y học chính xác, hoặc quản lý bệnh xem xét sự biến đổi của từng cá nhân trong di truyền, môi trường và lối sống Bất kể quy mô mục tiêu của quần thể hoặc cá nhân, vị trí hoặc địa điểm… là một cân nhắc quan trọng trong trí thông minh y tế Các địa điểm sống, làm việc
và dành thời gian có liên quan đến các yếu tố, bao gồm nhưng không giới hạn như môi trường, phơi nhiễm môi trường và các yếu tố quyết định xã hội, có thể ảnh hưởng đến sức khỏe, hiểu
rõ hơn các yếu tố nguy cơ gây bệnh và xác định các mục tiêu mới cho các nỗ lực phòng ngừa Trí thông minh nhân tạo không gian địa lý (GeoAI) là một ngành khoa học mới nổi kết hợp những đổi mới trong khoa học không gian, phương pháp trí tuệ nhân tạo trong học máy, học sâu, khai thác dữ liệu và tính toán hiệu năng cao để trích xuất kiến thức từ dữ liệu lớn về không gian Khoa học không gian cung cấp các công cụ và công nghệ cho phép hiểu, phân tích và hình dung các hiện tượng trong thế giới thực theo vị trí của chúng [2] Mục đích của nghiên cứu là tập trung vào công nghệ AI kết hợp vị trí để dùng thông tin diễn biến thực để hỗ trợ các vấn đề trong y tế Các ứng dụng GeoAI phổ biến ở cấp độ quần thể và cá nhân là sử dụng các nguồn dữ liệu lớn mới về không gian như phương tiện xã hội, hồ sơ sức khỏe điện tử, do thám vệ tinh và cảm biến cá nhân để thúc đẩy khoa học về sức khỏe cộng đồng (đặc biệt là
Trang 11trong bối cảnh của 'các thành phố khỏe mạnh thông minh') và y học chính xác một cách tiềm năng, tạo ra những cơ hội mới để trả lời toàn diện hơn các câu hỏi thường được giải quyết trong các lĩnh vực này cũng như các cơ hội duy nhất để trả lời các câu hỏi mới, và mới nổi Trong dịch tễ học, GeoAI đã được sử dụng để mô tả và phân tích sự phân bố không gian của các bệnh và để nghiên cứu ảnh hưởng của các yếu tố dựa trên vị trí đến kết quả bệnh Ví
dụ, để tạo thuận lợi cho việc tạo ra giả thuyết liên quan đến căn nguyên của đẻ non, học máy (thuật toán K-means clustering) được sử dụng để xác định mô hình không gian tuổi thai khi sinh cho 145 triệu ca sinh ở hơn 3000 quận ở Hoa Kỳ từ năm 1971 đến 2008 cho tập tin thống
kê sức khỏe Trong một nghiên cứu khác ở Bờ Biển Ngà của Châu Phi, các nhà nghiên cứu nhằm mục đích hiểu rõ hơn về yếu tố quyết định tỷ lệ nhiễm virus suy giảm miễn dịch ở người (HIV) bằng cách sử dụng máy học (hồi quy véc tơ hỗ trợ) để trích xuất dữ liệu di động và dữ liệu kết nối từ dữ liệu điện thoại di động được mã hóa Những đặc điểm được trích xuất này được phân tích liên quan đến tỷ lệ lưu hành HIV, nơi các tác giả nghiên cứu phát hiện ra rằng các yếu tố, như khu vực không gian được người dùng điện thoại và người di cư nói chung, có liên quan đến tỷ lệ hiện mắc HIV [32]
Hơn nữa, nghiên cứu dịch tễ học trong tương lai có thể khai thác các nguồn dữ liệu lớn về không gian mới nổi để kiểm tra các câu hỏi nghiên cứu về căn nguyên bệnh, có khả năng cung cấp những hiểu biết mới về các yếu tố nguy cơ mới Ví dụ, cảm biến cá nhân thu thập dữ liệu bằng cách sử dụng các cảm biến được nhúng trong điện thoại di động cũng như thông qua các thiết bị đeo như Fitbits [35] Năng lượng không gian là một lĩnh vực tập trung vào việc thu thập dữ liệu độ phân giải không gian cao về năng lượng vị trí và thời gian phù hợp từ GPS, cảm biến gia tốc và GIS để xác định các yếu tố dựa trên không gian có thể liên quan đến việc không hoạt động thể chất và béo phì [36] GeoAI có thể được sử dụng để xử lý và phân tích các dữ liệu dựa trên vị trí này để xác định loại hoạt động nào tại thời điểm nhất định và phơi nhiễm tại các địa điểm cụ thể cho các loại người khác nhau có liên quan đến kết quả sức khỏe Các nguồn dữ liệu lớn không gian mới khác bao gồm thông tin từ các dịch vụ chia sẻ đi xe như Uber và Lyft Có khoảng 5,5 triệu chuyến đi Uber và 1 triệu chuyến đi Lyft được hoàn thành mỗi ngày [37] Địa điểm đón và trả khách là một khía cạnh quan trọng của việc chia sẻ
đi xe vì nó liên quan đến việc có thể được sử dụng để giải quyết các câu hỏi nghiên cứu dịch
tễ học liên quan đến chấn thương Một số nghiên cứu cho thấy các khu vực được đặc trưng bởi việc sử dụng ứng dụng sử dụng xe chung cao hơn có thể liên quan đến tỷ lệ tai nạn liên quan đến giao thông thấp hơn[38] hay việc cung cấp thực phẩm tích hợp dịch vụ sử dụng xe chung (ví dụ: Uber Eats) cũng có thể cung cấp những hiểu biết thú vị về vai trò tiềm năng của
nó trong việc cải thiện các hành vi ngồi nhiều và béo phì ở trẻ em [39]
Trong khoa học xã hội và hành vi, GeoAI đã được sử dụng để giúp xác định các yếu tố quyết định xã hội và hành vi của sức khỏe cũng như tiến hành các can thiệp bằng thông tin định vị
Hồ sơ sức khỏe điện tử (EHRs) là một nguồn dữ liệu lớn có giá trị EHR cho phép liên kết dữ liệu không gian với các biến địa lý như Mã ZIP khi địa chỉ người bệnh được kiểm tra và cập nhật thường xuyên cho mục đích thanh toán [42] Ví dụ, phân tích bệnh án điện tử từ Hệ thống
Y tế Đại học Duke và Trung tâm Y tế Cộng đồng Lincoln ở Hoa Kỳ đã sử dụng máy học để
Trang 12xác định xem tình trạng kinh tế xã hội cấp độ khu phố có cải thiện dự đoán nguy cơ về kết quả sức khỏe cấp cứu cả ngoại trú và điều trị nội trú [43] Cục điều tra dân số Hoa Kỳ Dữ liệu khảo sát cộng đồng Mỹ đã được sử dụng để xác định tình trạng kinh tế xã hội cấp khu phố bằng cách tính toán chỉ số tình trạng kinh tế xã hội và chất lượng chăm sóc sức khỏe Một nghiên cứu khác đã sử dụng học máy để thực hiện can thiệp cho bệnh trầm cảm Một ứng dụng điện thoại di động đã được phát triển bằng cách sử dụng máy học để dự đoán tâm trạng, cảm xúc, trạng thái nhận thức / động lực của người bệnh, hoạt động, bối cảnh môi trường và bối cảnh xã hội dựa trên hơn 30 cảm biến điện thoại [44] Học sâu cũng đã được sử dụng để xác định các yếu tố như thu nhập, sự giàu có, giáo dục dự đoán kết quả sức khỏe bao gồm huyết
áp tâm thu, cơ thể chỉ số khối lượng, chu vi vòng eo và độ dài telomere trong nghiên cứu về sức khỏe người cao tuổi[45]
Học máy đã được sử dụng để dự báo sốt xuất huyết ở Trung Quốc bằng cách sử dụng dữ liệu
về khí hậu, các trường hợp sốt xuất huyết hàng tuần và hàng đợi tìm kiếm của Yahoo [53] Xác nhận cho thấy dịch bệnh trong 12 tuần trước và đỉnh điểm của đợt bùng phát lớn năm
2014 đã được dự báo chính xác Một nghiên cứu khác đã phát triển một mô hình học máy có tên là FINDER để phát hiện các bệnh liên quan đến thực phẩm bằng cách sử dụng dữ liệu tìm kiếm và ẩn danh trên web của Google, ước tính tỷ lệ những người đã ghé thăm một nhà hàng
cụ thể và sau đó đã tìm kiếm các thuật ngữ về ngộ độc thực phẩm (để xác định các nhà hàng
đó có khả năng không an toàn) [54]
Một ứng dụng tiềm năng khác của GeoAI cho y học chính xác là thông qua địa kỹ thuật, được
sử dụng để mô tả xem xét tầm quan trọng của tiền sử trong chẩn đoán và điều trị bệnh [60] Các bác sĩ lâm sàng có thể được cung cấp thông tin về phơi nhiễm môi trường của người bệnh, điều này có thể giúp các bác sĩ lâm sàng xác định các yếu tố môi trường có thể ảnh hưởng đến sức khỏe của người bệnh Các bác sĩ lâm sàng (có quyền truy cập vào lịch sử người bệnh nội trú) cung cấp cho người bệnh thông tin về phơi nhiễm môi trường tiềm ẩn đối với các yếu tố nguy cơ môi trường dựa trên nơi họ sống và làm việc và những phơi nhiễm môi trường này
có thể được lấy từ công nghệ GeoAI Tuy nhiên, các rào cản cho các ứng dụng như vậy bao gồm khả năng chấp nhận lâm sàng, đặc biệt là việc phiên dịch y học chính xác sang chăm sóc lâm sàng và chính sách y tế nói chung đã bị tụt hậu so với nhịp độ khám phá khoa học [40] Xét nghiệm di truyền có thể dùng để theo dõi và cải thiện sức khỏe cá nhân trong nghiên cứu của GxE phát hiện ra tính nhạy cảm gen đối với các bệnh cụ thể liên quan đến phơi nhiễm môi trường tại địa điểm có thể gây tổn hại đặc biệt đến sức khỏe mỗi cá nhân [62]
Vi khuẩn Mycobacterium tuberculosis thường gặp trong một hộ gia đình hoặc cộng đồng nhỏ
vì thời gian tiếp xúc kéo dài đủ để việc lây nhiễm xảy ra, tạo ra tiềm năng cho các cụm cục bộ phát triển [1] Tuy nhiên, các cụm lao không gian địa lý không phải lúc nào cũng do sự lây truyền từ người sang người đang diễn ra mà còn có thể là do tái kích hoạt nhiễm trùng tiềm ẩn
ở một số người đã bị nhiễm lao trước đây [1, 2] Phân tích không gian và xác định các khu vực có tỷ lệ lao (cụm) cao, tiếp theo là đặc tính của các yếu tố nguy cơ liên quan trong các
Trang 13cụm này, đã được quan tâm với mục tiêu để kiểm soát lao cũng như tăng cường sử dụng các công cụ kiểm soát lao hiện có [3, 4]
Lao khác với các bệnh truyền nhiễm khác theo một số cách có khả năng ảnh hưởng đến cụm không gian rõ ràng Ví dụ, độ trễ dài và thời gian không thường xuyên kéo dài của nó cho phép di chuyển dân số đáng kể (ví dụ sự di chuyển nơi ở của những người mới nhiễm lao) [5]
Do đó, người nhiễm lao ở một khu vực này có thể tiến triển thành bệnh lao ở một khu vực hoàn toàn khác, do đó, các trường hợp có thể không nhất thiết chỉ ra sự lây truyền mạnh mà
có thể phản ánh tập hợp các nhóm quần thể có nguy cơ mắc bệnh cao hơn, chẳng hạn như người di cư [6] Tương tự như vậy, việc lây nhiễm lao xảy ra từ nơi làm việc và các địa điểm
tụ họp khác có thể bị quy kết sai do phơi nhiễm dân cư, vì chỉ một thông tin cư trú của cá nhân được ghi lại chính xác trên các tài liệu giám sát bệnh lao trong nhiều môi trường [7, 8] Xác định tính không đồng nhất trong phân bố không gian của các trường hợp nhiễm lao và mắc lao và mô tả các tác nhân kiểm soát có thể giúp các nhà hoạch định chính sách, cũng như Chương trình Chống lao Quốc gia lập kế hoạch và có hoạt động phù hợp, kịp thời nhằm kiểm soát tình hình dịch tễ bệnh lao [9]
Phân tích không gian được tiến hành phổ biến nhất trên dữ liệu cho các loại bệnh lao, sau đó chỉ là lao phổi đơn thuần và lao phổi dương tính Phân tích không gian của lao kháng thuốc
và lao đa kháng thuốc rộng rãi đã được báo cáo trong 15 nghiên cứu Các nghiên cứu trước đó
có xu hướng mô tả trực quan, trong khi các nghiên cứu trong 2 thập kỉ qua thường kết hợp phát hiện cụm và dự đoán rủi ro Các thang đo không gian phổ biến bao gồm điều tra dân số, quận, mã bưu chính, khu phố, khu vực, khu vự y tế, đô thị, phường…
Bảng 2 Các lĩnh vực ứng dụng của dịch tễ học không gian địa lí trong lao
Lĩnh vực ứng dụng phương
pháp không gian
Phương pháp sử dụng
Phân bố điểm nóng lao theo
không gian và thời gian
Bản đồ chấm, bản đồ tỷ lệ, bản đồ chuyên đề, Moran’s I, GetisOrd thống kê, Besag chỉ số khu phố gần nhất và thống kê Newel, hàm số k, thống kê quét không gian Các yếu tố nguy cơ Mô hình Bayesian, mô hình có điều kiện, mô hình hồi
quy (có hoặc không bao gồm các điều khoản không gian ), Hồi quy theo trọng số địa lý, mô hình tự phát có điều kiện, mô hình hỗn hợp, mô hình không gian chậm Theo dõi xu hướng theo
không gian
Bản đồ xu hướng tạm thời
Đánh giá can thiệp Bản đồ khoảng cách, bản đồ mật độ hạt n ân
Rào cản chăm sóc lao Bản đồ tý lệ, bản đồ điểm, bản đồ thời gian di chuyển,
Bản đồ khoảng cách Hiệu suất chương trình lao Bản đồ ( thời gian phát hiện )
Tỷ lệ mắc lao liên quan đến
HIV
Bản đồ tỷ lệ, bản đồ điểm, thông kê quét không gian
Trang 14Kết quả điều trị lao Bayes theo kinh nghiệm không gian làm mịn, Bản đồ
mật độ hạt nhân, thống kế quét không gian, Hồi quy không gian
Tử vong liên quan đến
lao/HIV đồng nhiễm Bản đồ tỷ lệ, bản đồ chuyên đề, Moran I và hồi quy không gian
Truyền bệnh Bản đồ chấm( cài đặt tập hợp ), Bản đồ chấm ( trường
hợp ), Phân cụm không gian địa lý và phương pháp kiểu gen
Phương pháp luận Thống kê quét không gian
Phát hiện dịch lao Thống kê quét không gian
Ước tính tỷ lệ Mô hình dựa trên địa lý
Trình điều khiển lao Hàm số k
Bảng 2 cho thấy Các lĩnh vực ứng dụng của dịch tễ học không gian địa lí trong nghiên cứu bệnh lao bao gồm xác định chỉ số khu phố gần nhất, mô hình tự phát có điều kiện, mô hình hồi quy theo trọng số địa lý, phân tích thành phần chính, HIV, MDR-TB lao đa kháng thuốc Phạm vi của các phương pháp không gian được sử dụng để trực quan hóa các mẫu, khám phá các cụm không gian tìm điểm nóng và xác định các yếu tố nguy cơ cho việc phân loại, dự đoán rủi ro
Trực quan hóa dữ liệu
Trực quan hóa dữ liệu là kỹ thuật được áp dụng nhất quán nhất để trình bày phân bố bệnh lao và/hoặc các mẫu yếu tố nguy cơ về mặt không gian trong đó tỷ lệ mắc bệnh lao là chỉ số phổ biến nhất, theo sau là bản đồ sự kiện, Bản đồ mật độ hạt nhân dựa trên tỷ lệ mắc bệnh tiêu chuẩn hóa
Nhận dạng cụm không gian (điểm nóng ): Sử dụng phương pháp xác định cụm không gian với thống kê quét không gian của Kulldorff, thử nghiệm Moran cục bộ… cho thấy tính không đồng nhất trên toàn khu vực được đánh giá thường xuyên
Phân tích thời gian
Trong phân tích không gian của bệnh lao, cửa sổ thời gian là một chiều không gian quan trọng ảnh hưởng đến mô hình không gian của bệnh lao Vì bệnh lao là căn bệnh tương đối hiếm gặp nếu xét về tỷ lệ mắc và có thời gian ủ bệnh dài, việc phát hiện các cụm không gian
rõ ràng đòi hỏi một quy mô thời gian dài hơn so với các bệnh truyền nhiễm cấp tính có thể hình thành các cụm không gian trong vài ngày kể từ khi bắt đầu bùng phát Do đó các nghiên cứu được đưa vào dựa trên các trường hợp được tính toán trong khoảng thời gian thường từ 1-25 năm (thông thường là 5 năm)
Tương quan với các yếu tố xã hội và môi trường
Theo Tổ chức Y tế Thế giới và nhiều nghiên cứu đã cho thất bệnh lao có liên quan chặt chẽ với nhiều yếu tố xã hội và môi trường Điều tra tình hình hiện mắc lao toàn quốc lần thứ
Trang 15nhất tại Việt Nam cho thấy tỷ lệ hiện mắc lao cao gấp 2.5 lần trong người nghèo Bệnh lao đi đôi với sự nghèo đói Bệnh lao là bệnh lây truyền qua đường hô hấp do hít phải các hạt khí dung trong không khí có chứa vi khuẩn lao, các hạt khí dung có chứa vi khuẩn lao được sinh
ra khi người mắc lao phổi trong giai đoạn tiến triển ho, khạc, hắt hơi (hạt khí dung có đường kính khoảng 1 – 5 micromet bay lơ lửng trong không khí khoảng từ vài giờ đến 24 giờ) Các yếu tố môi trường như không gian chật hẹp; thông khí không đầy đủ; tái lưu thông không khí
có chứa các hạt khí dung chứa vi khuẩn lao là một trong những yếu tố nguy cơ làm lây nhiễm; lan truyền bệnh lao
Bên cạnh đó, nhiều nghiên cứu cũng cho thấy mối liên quan của tỷ lệ mắc lao với các yếu
tố xã hội và môi trường như trình độ học vấn; nghề nghiệp; chủng tộc; di cư; hút thuốc; uống rượu; khí hậu; độ cao; ô nhiễm không khí; tình hình kinh tế - xã hội; tỷ lệ nghèo đói và thất nghiệp; … cũng như tình hình dịch tễ của một số bệnh liên quan như HIV; Đái tháo đường; Các mô hình quan sát không gian của bệnh lao và mối liên hệ với các khu vực nghèo đói, nhà ở quá tải và không chuẩn, dân tộc thiểu số, mật độ dân số, tình trạng giáo dục thấp, khả năng tiếp cận chăm sóc sức khỏe cần được xác định tại các khu vực của nước ta
Phân tích không gian - thời gian để phát hiện dịch lao
Các nghiên cứu báo cáo việc áp dụng phương pháp không gian trong việc xác định sớm dịch lao không có nhiều Các nghiên cứu về bệnh lao trong không gian sử dụng dữ liệu giám sát theo phương pháp hồi cứu ở Hoa Kỳ đã phát hiện ra rằng thống kê quét không gian và các phương pháp khác có thể phát hiện ra những đợt bùng phát hàng tháng trước khi các cơ quan thẩm quyền địa phương nhận thức được vấn đề Tuy nhiên vì các điểm tập trung bệnh lao theo không gian thời gian có thể là do quá trình lan truyền hoặc tái bùng phát đang diễn ra Việc tạo ký tự cho các trình điều khiển dẫn đến việc phân cụm không gian là rất cần thiết Các phát hiện từ các nghiên cứu so sánh tính kịp thời và chính xác của các cụm thời gian trong việc xác định các ổ dịch lao thay đôi theo độ phân giải không gian và dân số
Phân tích không gian của nguồn lây nhiễm lao
Các phương pháp không gian cũng được sử dụng để xác định vai trò của các hộ gia đình
và các cơ sở tập trung (ví dụ: địa điểm tập trung xã hội, trường học) về nguy cơ lây truyền bệnh lao (Bảng 1) Vai trò của hộ gia đình được xác định bằng cách nhiễm chéo trẻ em và bệnh lao ở tuổi vị thành niên hoặc bệnh lao với người trưởng thành cho thấy tầm quan trọng của phơi nhiễm trong gia đình giảm theo độ tuổi của trẻ, như bệnh lao hoặc nhiễm trùng có liên quan đến phơi nhiễm bệnh lao ở người lớn ở trẻ nhỏ nhưng không phải là thanh thiếu niên
Các chế độ, điều kiện cộng đồng làm tăng nguy cơ lây truyền đã được xác định bằng nhiều
kỹ thuật bao gồm liên kết các trường hợp bệnh lao với các tụ điểm xã hội [53] và lập bản đồ phân phối không khí vòng tròn (RAV) [54] (bao gồm phân loại các kiểu này dựa trên trên nguyên tắc truyền bệnh lao [55]) Những phương pháp này xác định các trường học và các địa điểm tập hợp xã hội là khu vực có nguy cơ cao
Trang 16Xác định kiểm soát lây truyền địa phương
Sự lây truyền gần đây là một cơ chế quan trọng thúc đẩy dịch tễ học bệnh lao tại địa phương trong các môi trường có gánh nặng cao [56] Các cụm không gian địa lý có thể phản ánh nguy
cơ mắc bệnh tăng lên do sự gần gũi về mặt địa lý, có thể tương ứng với sự lây truyền gần đây hoặc kích hoạt lại nhiễm trùng lao tiềm ẩn trong một tập hợp các cá nhân bị nhiễm bệnh ở nơi khác hoặc cả hai [57] Hai cơ chế được xem là thúc đẩy dịch tễ học lao tại chỗ được nghiên cứu theo ba cách sau
Kết hợp các cụm không gian với phân cụm đoàn hệ: phân cụm bệnh lao có thể xảy ra do lây truyền đang diễn ra hoặc do tái kích hoạt nhiễm trùng tiềm ẩn giữa các nhóm phụ có nguy
cơ cao do các đặc điểm chung như quốc gia sinh ra đơn thuần thay vì mạng truyền dẫn chung, một hiện tượng được gọi là phân nhóm chung Phân tích cụm đoàn hệ được sử dụng để phân tích các nhóm dân số có nguy cơ cao được lựa chọn cho các can thiệp có mục tiêu dựa trên tỉ
lệ mắc lao tương đôi mà họ phải chịu Đường cong Lorenz là một công cụ trực quan đơn giản
để so sánh phân cụm(bất bình đẳng) trong nhóm phụ quan tâm giữa các khu vực và theo thời gian Một nghiên cứu kết hợp phân tích cụm(nhóm sinh) như vậy sử dụng đường cong bất đẳng thức Lorenz với phân tích cụm không gian [32] cho thấy sự định vị của các loại cụm này, thấy sự định vị của cả truyền và kích hoạt lại Các cụm không gian giữa những người sinh ra ở nước ngoài có diện tích quá lớn so với các cụm trong số những người sinh ra tại đại phương phù hợp với việc truyền trực tiếp từ người sang người Ngoài ra mô hình không gian cũng được áp dụng cho các vai trò khác nhau của truyền từ tái kích hoạtbằng cách đánh giá sự phụ thuộc không gian Sự hiện diện của sự phụ thuộc không gian đã được thực hiện để chỉ ra
sự lây truyền , trong khi sự vắng mặt của nó được coi là tái kích hoạt khồng đặc hiệu [58]
Sử dụng các phương pháp không gian để thông báo các can thiệp sức khỏe cộng đồng Ngoài việc sử dụng mô tả sự phân chia theo không gian và các yếu tố quyết định về bệnh lao, các phương pháp không gian đã được sử dụng để thông báo các can thiệp về sức khỏe cộng đồng liên quan đến bệnh lao Trong các nghiên cứu này, các phương pháp phân tích không gian đã được chứng minh là có hiệu quả và được quan tâm tronghướng dẫn các can thiệp về sức khỏe cộng đồng, mặc dù ứng dụng của nó đối với chăm sóc bệnh lao chưa thực
sự được nghiên cứu và chứng minh một cách rõ ràng Ví dụ, các kỹ thuật phân tích không gian đã được sử dụng để xác định các địa điểm có mật độ mắc bệnh lao cao (điểm nóng) Sau
đó, khám sàng lọc bệnh lao tại cộng đồng đã được tiến hành, và tần suất thực hiện khám sàng lọc được so sánh với việc cung cấp dịch vụ thường xuyên Việc khám sàng lọc theo hướng dẫn của GIS đã được chứng minh góp phần cải thiện đáng kể việc phát hiện những người bị nhiễm lao tiềm ẩn và các bệnh truyền nhiễm khác [73] Tương tự, một nghiên cứu từ Nam Phi
đã nhấn mạnh tiềm năng sử dụng GIS để thúc đẩy liệu pháp DOTS dựa vào cộng đồng bằng cách định vị và liên kết các người bệnh lao với các địa điểm giám sát gần nhất của họ, mặc dù việc triển khai theo phương pháp này không được báo cáo [74]
Tiềm năng của các phương pháp không gian được sử dụng để phát hiện sớm dịch lao cũng
đã được mô tả, mặc dù những phát hiện này rất đa dạng dựa trên dân số [29] Phân tích cụm
Trang 17không gian sử dụng dữ liệu ở độ phân giải địa lý cao hơn sẽ cải thiện hiệu suất của phương pháp trong phát hiện cụm [26]
Hầu hết các nghiên cứu được xem xét là từ các bộ phận thu thập cao, có thể phản ánh xu hướng xuất bản hoặc trọng tâm của các nỗ lực nghiên cứu trên các cài đặt đó Trong các cài đặt phổ biến, việc sử dụng các phương pháp không gian hạn chế hơn có thể phản ánh sự thiếu quyền truy cập vào tài nguyên ( ví dụ: dữ liệu tham chiếu địa lý và các gói phần mềm không gian ) hoặc không đủ chuyên môn trong các cài đặt này Tuy nhiên, chính các cài đặt truyền dẫn cao này sẽ đạt được nhiều nhất từ sự hiểu biết được cải thiện về các mô hình không gian của bệnh lao và cả các cài đặt này, trong đó phân cụm không gian địa lý có thể là quan trọng nhất về mặt dịch tễ học
Trong nước (Phân tích, đánh giá tình hình nghiên cứu trong nước thuộc lĩnh vực nghiên cứu
của đề tài, đặc biệt phải nêu cụ thể được những kết quả KH&CN liên quan đến đề tài mà các cán bộ tham gia đề tài đã thực hiện Nếu có các đề tài cùng bản chất đã và đang được thực hiện ở cấp khác, nơi khác thì phải giải trình rõ các nội dung kỹ thuật liên quan đến đề tài này; Nếu phát hiện có đề tài đang tiến hành mà đề tài này có thể phối hợp nghiên cứu được thì cần ghi rõ Tên đề tài, Tên Chủ nhiệm đề tài và cơ quan chủ trì đề tài đó)
Việt nam hiện vẫn là nước có gánh nặng bệnh lao cao, đứng thứ 16 trong 30 nước có số người bệnh lao cao nhất trên toàn cầu, đồng thời đứng thứ 15 trong số 30 nước có gánh nặng bệnh lao kháng đa thuốc cao nhất thế giới (báo cáo WHO 2018) Dựa trên số liệu phát hiện – điều trị của CTCL trong giai đoạn 2000-2018 và kết quả điều tra tình hình hiện mắc lao toàn quốc năm 2017-2018, tại Hội thảo phân tích tình hình dịch tễ bệnh lao tại Việt nam tháng 3 năm 2019, các chuyên gia của TCYTTG phối hợp với CTCL đã ước tính tỷ lệ hiện mắc lao tại Việt Nam giai đoạn 2007-2017 giảm khoảng 3,8% hàng năm; tỷ lệ lao mới mắc giảm khoảng 3% hàng năm và tỷ lệ tử vong do lao giảm khoảng 4% hàng năm Những thuận lợi của chương trình chống lao quốc gia bao gồm: (1) CTCL vẫn duy trì mục tiêu triển khai công tác chống lao tại 100% số quận huyện và 100% số xã, phường Tỷ lệ dân số được chương trình chống lao tiếp cận đạt 100%.; (2) Mạng lưới chống lao tiếp tục được mở rộng và củng cố Hiện nay 48/63 tỉnh, thành trên toàn quốc đã thành lập Bệnh viện Phổi, Bệnh viện lao và bệnh phổi CTCL đã tiếp tục triển khai các hoạt động phát triển mạng lưới phối hợp với các đối tác như: Bộ Công an; Cục phòng chống HIV/AIDS; WHO; KNCV; CDC: URC; CHAI, các bệnh viện đa khoa tuyến trung ương, tuyến tỉnh và nhiều đối tác khác Đặc biệt trong giai đoạn 2018-2020, CTCL có thêm các đối tác mới chính thức trở thành những đơn vị viện trợ phụ (SRs) cùng tham gia vào dự án QTC và công tác chống lao như Bộ Lao động Thương binh Xã hội, Cục Y tế và Cục 10 thuộc Bộ Công an (3)Hoạt động phát hiện: trong năm 2018, số liệu phát hiện của CTCLQG có xu hướng giảm về số người bệnh lao các thể (3657 người bệnh)
Số người bệnh lao mới có bằng chứng vi khuẩn học giảm so với năm 2017 (1051 người bệnh) Tuy nhiên, về mặt chỉ tiêu, CTCLQG đã hoàn thành với việc vượt chỉ tiêu 100% số người bệnh mới và tái phát được phát hiện (4) Hoạt động điều trị: tỷ lệ điều trị khỏi người bệnh lao phổi AFB dương tính mới được duy trì ở mức cao (87,2%) đạt mục tiêu của WHO đề ra là
>85% tuy nhiên chưa đạt được mục tiêu của CTCLQG là >90% Tỷ lệ âm hóa đờm sau 2(3)
Trang 18tháng điều trị của người bệnh mới cũng được duy trì ở mức cao và ổn định là 88,7%.(5)Duy trì và tiếp tục triển khai hệ thống thu thập, quản lý thông tin, báo cáo trên internet từ tuyến tỉnh và mở rộng triển khai ở trên 857 huyện và các điểm tương đương
Trong nước hiện này có duy nhất Bệnh viện Phổi Quốc gia đã tiên phong thử nghiệm ứng dụng AI tại Việt Nam thông qua thử nghiệm phát hiện sớm bệnh lao bằng AI X-quang ngực
Về kết quả thu được đối với các ứng dụng công nghệ GIS trong kiểm soát bệnh dịch đã có một số công trình của các tác giả trong nước Thành phố Hồ Chí Minh, Cục Y tế dự phòng cũng có những thành tựu ban đầu về cổng thông tin y tế trong kiểm soát 37 bệnh dịch, mới có
2 công trình nghiên cứu về ứng dụng GIS cho lao Tuy nhiên các công trình này mới bắt đầu
ở mức trực quan hóa tỷ lệ mắc lao cũng như mối liên quan với một vài điểm dữ liệu về mức thu nhập tại một tỉnh Chưa có công trình nào nghiên cứu một cách toàn diện về việc tìm ra
mô hình dự báo và kiểm soát lao trên toàn quốc từ các lớp dữ liệu thực của toàn bộ chương trình chống lao quốc gia bao gồm cả dữ liệu lâm sàng, cận lâm sàng, các chiến lược điều trị, theo dõi và giám sát người bệnh để đảm bảo mục tiêu cam kết chấm dứt bệnh lao vào 2030
15.2 Luận giải về việc đặt ra mục tiêu và những nội dung cần nghiên cứu của đề tài
(Trên cơ sở đánh giá tình hình nghiên cứu trong và ngoài nước, phân tích những công trình nghiên cứu có liên quan, những kết quả mới nhất trong lĩnh vực nghiên cứu đề tài, đánh giá những khác biệt về trình độ KH&CN trong nước và thế giới, những vấn đề đã được giải quyết, cần nêu rõ những vấn đề còn tồn tại, chỉ ra những hạn chế cụ thể, từ đó nêu được hướng giải quyết mới - luận giải và cụ thể hoá mục tiêu đặt ra của đề tài và những nội dung cần thực hiện trong đề tài để đạt được mục tiêu)
Dù đã được chương trình chống lao kiểm soát nhưng diễn biến gây dịch diễn biến ngày càng phức tạp, một vụ dịch ở bất cứ nơi nào trên thế giới chỉ cần vài giờ đã có thể trở thành mối đe dọa cho một khu vực khác và thậm chí cho toàn thế giới Giám sát lao là một phần của NTP
và hệ thống thông tin y tế với mục tiêu và hình thức khác nhau Tại Việt Nam, theo số liệu thống kê về các ca mắc lao cho thấy bệnh lao tuy được kiểm soát nhưng vẫn luôn là vấn đề y
tế nghiêm trọng ở Việt Nam do có những khó khăn phải đối mặt không ít như:
Ø Dịch tễ lao ở Việt nam còn cao, xếp thứ 16 trong 30 nước có gánh nặng người bệnh lao cao trên thế giới và xếp thứ 15 trong số 30 nước có gánh nặng bệnh lao kháng đa thuốc cao nhất trên toàn cầu
Ø Chưa tầm soát hết các đối tượng nghi MDR, tỷ lệ người được xét nghiệm GeneXpert trong
số nghi MDR còn hạn chế tại nhiều địa phương Đặc biệt việc mở rộng diện tầm soát tới nhóm AFB (+) mới có thể là nguyên nhân làm giảm tỷ lệ được xét nghiệm GeneXpert trong một số nhóm ưu tiên khác có nguy cơ kháng thuốc cao hơn tại một số địa phương
Tỷ lệ điều trị thành công chỉ ở mức 68%, chưa đạt được chỉ tiêu 76% như kế hoạch
Ø Sự hợp tác để phát hiện lao trẻ em giữa CTCLQG và các cơ sở nhi khoa ở tỉnh và huyện chưa thường xuyên và chưa hiệu quả Địa bàn triển khai rộng, thiếu cán bộ cả về số lượng
và năng lực
Trang 19Ø Tỷ lệ bệnh lao, lao kháng đa thuốc, HIV trong trại giam cao, công tác phát hiện còn thấp
do thiếu nguồn nhân lực có chất lượng; chưa sử dụng hiệu quả trang thiết bị chẩn đoán và điều trị lao,
Ø Thay đổi mô hình tổ chức y tế tại tuyến tỉnh, huyện có ảnh hưởng không nhỏ tới CTCL như thay đổi cán bộ làm công tác chống lao, đơn vị mới chưa ổn định nên việc triển khai hoạt động CTCL gặp khó khăn, tâm lý cán bộ làm công tác chống lao không ổn định…
Nhằm chấm dứt bệnh lao trên toàn cầu cũng như tại Việt Nam, cần có sự phát triển của các công cụ mới để xác định các yếu tố nguy cơ quyết định đến tình hình dịch tễ bệnh lao và các khu vực có tình hình dịch tễ bệnh lao cao (điểm nóng), xây dựng hệ thống giám sát tình hình dịch tễ bệnh lao và giám sát các yếu tố rủi ro dựa trên vị trí Tích hợp GIS, thống kê không gian và phần mềm dự báo dịch tễ địa không gian mang lại hiệu quả phương pháp tiếp cận đa ngành, nhằm xác định các điểm nóng dịch tễ bệnh lao có ý nghĩa thống kê và để xác định mối quan hệ giữa các yếu tố môi trường và kinh tế xã hội và tỷ lệ mắc lao sẽ cung cấp các thông tin cực kỳ hữu ích cho các nhà hoạch định chính sách và Chương trình Chống lao Quốc gia nhằm xây dựng các kế hoạch kiểm soát dịch bệnh lao và có các hoạt động phù hợp cho các khu vực khác nhau trên toàn quốc, như phân bổ ngân sách; tăng cường truyền thông cho những người sống ở khu vực có nguy cơ cao và tăng cường hoạt động sàng lọc; phát hiện chủ động nhằm phát hiện kịp thời; sớm để cắt bỏ nguồn lây; …
Do vậy, chúng tôi tôi đề xuất “Nghiên cứu xây dựng hệ thống hỗ trợ chẩn đoán và dự báo dịch
tễ địa không gian (geo-spatial epidemiology) bệnh lao phổi bằng ảnh X-quang ngực ở Việt Nam’’ nhằm:
- Xây dựng được cơ sở dữ liệu ảnh X-quang ngực kỹ thuật số về bệnh lao phổi ở Việt Nam;
Trang 20- Phát triển phần mềm học sâu hỗ trợ chẩn đoán và phần mềm dự báo dịch tễ địa không gian (geo-spatial epidemiology) bệnh lao phổi bằng ảnh X-quang ngực ở Việt Nam;
- Triển khai ứng dụng tại một số cơ sở y tế các tuyến
Khi triển khai cả 2 hệ thống tích hợp và đồng bộ sẽ hỗ trợ chẩn đoán nhanh và chính xác tại cộng đồng đồng thời có thể kiểm soát, giám sát chủ động tình trạng mắc lao, mối liên quan mắc lao với các yếu tố kinh tế, xã hội, địa lý, môi trường… Người dùng có thể xem thông tin diễn biến bệnh dịch tại địa phương mình đang cư trú hoặc tất cả các địa phương khác trên cả nước Ngoài ra, hệ thống còn cung cấp các thông tin về cách phòng tránh lây lan bệnh dịch, tính chất mật độ nguy hiểm của các bệnh dịch đang diễn biến phức tạp
16 Liệt kê danh mục các công trình nghiên cứu, tài liệu có liên quan đến đề tài đã trích dẫn khi đánh giá tổng quan
(Tên công trình, tác giả, nơi và năm công bố, chỉ nêu những danh mục đã được trích dẫn để luận giải cho sự cần thiết nghiên cứu đề tài)
1 The Economist Intelligence Unit It’s time to End Drug-Resistant Tuberculosis, 2019
2 Doong Wook Kim, MD1, Hye Young Jang, MD2, Kyung Won Kim, MD, PhD2, Youngbin Shin, MS2, Seong Ho Park, MD, PhD2 Design Characteristics of Studies Reporting the Performance of Artificial Intelligence Algorithms for Diagnostic Analysis of Medical Images: Results from Recently Published Papers Korean J Radiol 2019;20(3):405-410
3 Tang A, Tam R, Cadrin-Chênevert A, Guest W, Chong J, Barfett J, et al.; Canadian Association of Radiologists (CAR) Artificial Intelligence Working Group Canadian Association of Radiologists white paper on artificial intelligence in radiology Can Assoc Radiol J 2018;69:120-135
4 Chartrand G, Cheng PM, Vorontsov E, Drozdzal M, Turcotte S, Pal CJ, et al Deep learning: a primer for radiologists Radiographics 2017;37:2113-2131
5 Paras lakhani, Baskaran Sundaran Deep Learning at Chest Radiography: Automated classification of Pulmonary Tuberculosis by using Convolutional Neural Networks Radiology 2018
6 Bhalla AS, Goyal A, Guleria R, Gupta AK Chest tuberculosis: Radiological review
and imaging recommendations Indian J Radiol Imaging 2015;25(3):213–225
7 Melendez J, Sánchez CI, Philipsen RH et al An automated tuberculosis screening strategy combining X-ray-based computer-aided detection and clinical information Sci Rep 2016;6:25265
8 Hoog AH, Meme HK, van Deutekom H et al High sensitivity of chest radiograph reading
by clinical officers in a tuberculosis prevalence survey Int J Tuberc Lung Dis
11 Jaeger S, Karargyris A, Candemir S et al Automatic tuberculosis screening using
Trang 21chest radiographs IEEE Trans Med Imaging 2014;33(2):233–245
12 Melendez; Hogeweg,L; Sánchez,Cl; Philipsen,R.H.H.M; Aldridge, R.W; Hayward, A.C; Abubakar,l; Van Ginneken,B; Story, A Accuracy of an automated system for tuberculosis detection on chest radiographs in high-risk screening Int J TuberC Lung Dis,2018
13 Hogeweg L, Mol C, de Jong PA, Dawson R, Ayles H, van Ginneken B (2010) Fusion of local and global detection systems to detect tuberculosis in chest radiographs Med Image Comput Comput Assist Interv 13(Pt 3):650–657
14 Maduskar P, Muyoyeta M, Ayles H, Hogeweg L, Peters-Bax L, van Ginneken B (2013) Detection of tuberculosis using digital chest radiography: automated reading versus interpretation by clinical officers Int J Tuberc Lung Dis 17(12):1613–1620
15 Lee JG, Jun S, Cho YW, Lee H, Kim GB, Seo JB, et al Deep learning in medical imaging: general overview Korean J Radiol 2017;18:570-584
16 Yamashita R, Nishio M, Do RKG, Togashi K Convolutional neural networks: an overview and application in radiology Insights Imaging 2018;9:611-629
17 Chartrand G, Cheng PM, Vorontsov E, Drozdzal M, Turcotte S, Pal CJ, et al Deep learning: a primer for radiologists Radiographics 2017;37:2113-2131
18 Choy G, Khalilzadeh O, Michalski M, Do S, Samir AE, Pianykh OS, et al Current applications and future impact of machine learning in radiology Radiology 2018;288:318-
328
19 SFR-IA Group; CERF; French Radiology Community Artificial intelligence and medical imaging 2018: French Radiology Community white paper Diagn Interv Imaging 2018;99:727- 742
20 Greaves F, Joshi I, Campbell M, Roberts S, Patel N, Powell J What is an appropriate level
of evidence for a digital health intervention? Lancet 2019;392:2665-2667
21 Maddox TM, Rumsfeld JS, Payne PRO Questions for artificial intelligence in health care JAMA 2019;321:31-32
22 Park SH, Kressel HY Connecting technological innovation in artificial intelligence to world medical practice through rigorous clinical validation: what peer-reviewed medical journals could do J Korean Med Sci 2018;33:e152
real-23 Park SH, Han K Methodologic guide for evaluating clinical performance and effect of artificial intelligence technology for medical diagnosis and prediction Radiology 2018;286:800-809
24 Thornbury JR The efficacy of diagnostic imaging Med Decis Making 1991;11:88-94
25 England JR, Cheng PM Artificial intelligence for medical image analysis: a guide for authors and reviewers AJR Am J Roentgenol 2018 Dec 17 [Epub ahead of print] https://doi org/10.2214/AJR.18.20490
26 Park SH Diagnostic case-control versus diagnostic cohort studies for clinical validation of artificial intelligence algorithm performance Radiology 2019;290:272-273
27 Verma A, Schwartzman K, Behr MA, Zwerling A, Allard R, Rochefort CM, Buckeridge
DL Accuracy of prospective space-time surveillance in detecting tuberculosis transmission Spatial Spatio-Temp Epidemiol 2014;8:47-1
28 Middelkoop K, Bekker LG, Morrow C, Lee N, Wood R Decreasing household contribution to TB transmission with age: a retrospective geographic analysis of young
Trang 22people in a South African township BMC Infect Dis 2014; 14:221-8
29 Higgs BW, Mohtashemi M, Grinsdale J, Kawamura LM Early detection of tuberculosis outbreaks among the San Francisco homeless: trade-offs between spatial resolution and temporal scale
30 40 Jafari-Koshki T, Arsang-Jang S, Raei M Applying spatiotemporal models to study risk
of smear-positive tuberculosis in Iran, 2001-2012 Int J Tuber Lung Dis
2015;19(4):469-38
31 Jenkins HE, Plesca V, Ciobanu A, Crudu V, Galusca I, Soltan V, Serbulenco A, Zignol M, Dadu A, Dara M, et al Assessing spatial heterogeneity of multidrug-resistant tuberculosis
in a high-burden country Eur Respir J 2013; 42(5):1291-41
32 Harling G, Castro MC A spatial analysis of social and economic determinants of tuberculosis in Brazil Health Place 2014;25:56-44
33 Chan-Yeung M, Yeh AGO, Tam CM, Kam KM, Leung CC, Yew WW, Lam CW demographic and geographic indicators and distribution of tuberculosis in Hong Kong: a spatial analysis Int J Tuber Lung Dis 2005; 9(12):1320-47
Socio-34 Patterson B, Morrow CD, Kohls D, Deignan C, Ginsburg S, Wood R Mapping sites of high TB transmission risk: integrating the shared air and social behaviour of TB cases and adolescents in a South African township Sci Total Environ 2017;05-54
35 Ng IC, Wen TH, Wang JY, Fang CT Spatial dependency of tuberculosis incidence in Taiwan PLoS One 2012;7(11)-58
36 Richardson M, van Lill SW, van der Spuy GD, Munch Z, Booysen CN, Beyers N, van Helden PD, Warren RM Historic and recent events contribute to the disease dynamics of Beijing-like Mycobacterium tuberculosis isolates in a high incidence region Int J Tuber Lung Dis 2002;6(11):1001-72
37 Manjourides J, Lin HH, Shin S, Jeffery C, Contreras C, Cruz JS, Jave O, Yagui M, Asencios L, Pagano M, et al Identifying multidrug resistant tuberculosis transmission hotspots using routinely collected data Tuberculosis 2012; 92(3):273-75
38 Feske ML, Teeter LD, Musser JM, Graviss EA Including the third dimension: a spatial analysis of TB cases in Houston Harris County Tuberculosis 2011; 91(SUPPL 1):S24-
93
39 Tuite AR, Guthrie JL, Alexander DC, Whelan MS, Lee B, Lam K, Ma J, Fisman DN, Jamieson FB Epidemiological evaluation of spatiotemporal and genotypic clustering of Mycobacterium tuberculosis in Ontario, Canada Int J Tuber Lung Dis 2013;17(10):1322-
94
40 Yamamura M, de Freitas IM, Santo Neto M, Chiaravalloti Neto F, Popolin MA, Arroyo
LH, Rodrigues LB, Crispim JA, Arcencio RA Spatial analysis of avoidable hospitalizations due to tuberculosis in Ribeirao Preto, SP, Brazil (2006-2012) Rev Saude Publica 2016(50):20-152
41 Santos Neto M, Yamamura M, Garcia MC, Popolin MP, Rodrigues LB, Chiaravalloti Neto
F, Fronteira I, Arcencio RA Pulmonary tuberculosis in Sao Luis, State of Maranhao, Brazil: space and space-time risk clusters for death (2008-2012) Rev Soc Bras Med Trop 2015;48(1):69-155
42 Sousa P, Oliveira A, Gomes M, Gaio AR, Duarte R Longitudinal clustering of tuberculosis
Trang 23incidence and predictors for the time profiles: the impact of HIV Int J Tuber Lung Dis 2016;20(8):1027-176
43 Herrero MB, Arrossi S, Ramos S, Braga JU Spatial analysis of the tuberculosis treatment dropout, Buenos Aires, Argentina Rev Saude Publica 2015;49-179
44 Alene KA, Viney K, McBryde ES, Clements ACA, 2017 Spatiotemporal transmission and socio-climatic factors related to paediatric tuberculosis in north-western Ethiopia Geospat Health 12:342
45 Jacob BJ, Krapp F, Ponce M, Gottuzzo E, Griffith DA, Novak RJ, 2010 Accounting for autocorrelation in multi-drug resistant tuberculosis predictors using a set of parsimonious orthogonal eigenvectors aggregated in geographic space Geospat Health 4:201
46 Khan AA, 1986 Two simple methods of spatial analysis and their applications in oriented health services research Am J Public Health 76:1207
location-47 Chanda E, Coleman M, Kleinschmidt I, Hemingway J, Hamainza B, Masaninga F, Kapata P, Baboo KS, Dürrheim DN, Coleman M: Impact assessment of malaria vector control using routine surveillance data in Zambia: implications for monitoring and evaluation Malar J 2012, 11:437
Chanda-48 Wei W, Yuan-Yuan J, Ci Y, Ahan A, Ming-Qin C Local spatial variations analysis of smear-positive tuberculosis in Xinjiang using Geographically Weighted Regression model BMC Public Health 2016 Oct 6;16(1):1058
49 Nhung NV, Hoa NB, Khanh PH, Hennig C Tuberculosis case notification data in Viet Nam, 2007 to 2012 Western Pac Surveill Response J 2015 Feb 9;6(1):7-14
50 HEI Collaborative Working Group on Air Pollution, Poverty, and Health in Ho Chi Minh City, Le TG, Ngo L, Mehta S, Do VD, Thach TQ, Vu XD, Nguyen DT, Cohen A
51 Wubuli A, Xue F, Jiang D, Yao X, Upur H, Wushouer Q Socio-Demographic Predictors and Distribution of Pulmonary Tuberculosis (TB) in Xinjiang, China: A Spatial Analysis PLoS One 2015 Dec 7;10(12):
52 Kistemann T, Munzinger A, Dangendorf F Spatial patterns of tuberculosis incidence in Cologne (Germany) Soc Sci Med 2002 Jul;55(1):7-19 PubMed PMID:
53 Bui LV, Mor Z, Chemtob D, Ha ST, Levine H Use of Geographically Weighted Poisson Regression to examine the effect of distance on Tuberculosis incidence: A case study in Nam Dinh, Vietnam PLoS One 2018 Nov 12;13(11)
54 Vo LNQ, Vu TN, Nguyen HT, Truong TT, Khuu CM, Pham PQ, Nguyen LH, Le GT, Creswell J Optimizing community screening for tuberculosis: Spatial analysis of localized case finding from door-to-door screening for TB in an urban district of Ho Chi Minh City, Viet Nam PLoS One 2018 Dec 18;13(12)
55 Hoa NB, Tiemersma EW, Sy DN, Nhung NV, Gebhard A, Borgdorff MW, Cobelens FG Household expenditure and tuberculosis prevalence in VietNam: prediction by a set of household indicators Int J Tuberc Lung Dis 2011 Jan;15(1):32-7
56 MacPherson P, Khundi M, Nliwasa M, Choko AT, Phiri VK, Webb EL, Dodd PJ, Cohen
T, Harris R, Corbett EL Disparities in access to diagnosis and care in Blantyre, Malawi, identified through enhanced tuberculosis surveillance and spatial analysis BMC Med
2019 Jan 29;17(1):21
57 Shaweno D, Trauer JM, Denholm JT, McBryde ES A novel Bayesian geospatia method
Trang 24for estimating tuberculosis incidence reveals many missed TB cases in Ethiopia BMC Infect Dis 2017 Oct 2;17(1):662
58 Said K, Hella J, Mhalu G, Chiryankubi M, Masika E, Maroa T, Mhimbira F Kapalata N, Fenner L Diagnostic delay and associated factors among patients with pulmonary tuberculosis in Dar es Salaam, Tanzania Infect Dis Poverty 2017 Mar 24;6(1):64
59 Mahara G, Yang K, Chen S, Wang W, Guo X Socio-Economic Predictors and Distribution
of Tuberculosis Incidence in Beijing, China: A Study Using a Combination of Spatial Statistics and GIS Technology Med Sci (Basel) 2018 Mar
60 Lo HY, Yang SL, Chou P, Chuang JH, Chiang CY Completeness and timeliness of tuberculosis notification in Taiwan BMC Public Health 2011 Dec 12;11:915
61 Tipayamongkholgul M, Podang J, Siri S Spatial analysis of social determinants for tuberculosis in Thailand J Med Assoc Thai 2013 Dec;96 Suppl
62 Yeh YP, Chang HJ, Yang J, Chang SH, Suo J, Chen TH Incidence of tuberculosis in mountain areas and surrounding townships: dose-response relationship by geographic analysis Ann Epidemiol 2005 Aug;15(7):526-32
63 Alvarez-Hernández G, Lara-Valencia F, Reyes-Castro PA, Rascón-Pacheco RA An analysis of spatial and socio-economic determinants of tuberculosis in Hermosillo, Mexico, 2000-2006 Int J Tuberc Lung Dis 2010 Jun;14(6):708-13
64 Sun W, Gong J, Zhou J, Zhao Y, Tan J, Ibrahim AN, Zhou Y A spatial, social and environmental study of tuberculosis in China using statistical and GIS technology Int J Environ Res Public Health 2015 Jan 27;12(2):1425-48
65 Maciel EL, Pan W, Dietze R, Peres RL, Vinhas SA, Ribeiro FK, Palaci M, Rodrigues RR, Zandonade E, Golub JE Spatial patterns of pulmonary tuberculosis incidence and their relationship to socio-economic status in Vitoria, Brazil Int Tuberc Lung Dis 2010 Nov;14(11):1395-402
66 McLaren ZM, Schnippel K, Sharp A A Data-Driven Evaluation of the Stop TB Global Partnership Strategy of Targeting Key Populations at Greater Risk for Tuberculosis PLoS One 2016 Oct 12;11(10):
67 Noppert GA, Wilson ML, Clarke P, Ye W, Davidson P, Yang Z Race and nativity are major determinants of tuberculosis in the U.S.: evidence of health disparities in tuberculosis incidence in Michigan, 2004-2012 BMC Public Health 2017 Jun 2;17(1):538
68 Roth D, Otterstatter M, Wong J, Cook V, Johnston J, Mak S Identification of spatial and cohort clustering of tuberculosis using surveillance data from British Columbia, Canada, 1990-2013 Soc Sci Med 2016 Nov;168:214-222
69 Kuupiel D, Adu KM, Apiribu F, Bawontuo V, Adogboba DA, Ali KT, Thompson TP Geographic accessibility to public health facilities providing tuberculosis testing services at point-of-care in the upper east region, Ghana BMC Public Health 2019
Mashamba-70 Noppert GA, Yang Z, Clarke P, Ye W, Davidson P, Wilson ML Individual- and neighborhood-level contextual factors are associated with Mycobacterium tuberculosis transmission: genotypic clustering of cases in Michigan, 2004-2012 Ann Epidemiol 2017 Jun;27(6):371-376.e5 doi: 10.1016/j.annepidem.2017.05.009
71 Kolifarhood G, Khorasani-Zavareh D, Salarilak S, Shoghli A, Khosravi N Spatial and spatial determinants of successful tuberculosis treatment outcomes: An implication of
Trang 25non-Geographical Information Systems in health policy-making in a developing country J Epidemiol Glob Health 2015 Sep;5(3):221-30
72 Beiranvand R, Karimi A, Delpisheh A, Sayehmiri K, Soleimani S, Ghalavandi S Correlation Assessment of Climate and Geographic Distribution of Tuberculosis Using Geographical Information System (GIS) Iran J Public Health 2016 Jan;45(1):86-93
73 Hagiya H, Koyama T, Zamami Y, Minato Y, Tatebe Y, Mikami N, Teratani Y, Amsalu E, Liu M, Li Q, Wang X, Tao L, Liu X, Luo Y, Yang X, Zhang Y, Li W, Li X, Wang W, Guo
X Spatial-temporal analysis of tuberculosis in the geriatric population of China: An analysis based on the Bayesian conditional autoregressive model Arch Gerontol Geriatr
76 Kakchapati S, Choonpradub C, Lim A Spatial and temporal variations intuberculosis incidence, Nepal Southeast Asian J Trop Med Public Health 2014 Jan;45(1):95-102 PubMed PMID: 24964658
77 Zhang Y, Wang XL, Feng T, Fang CZ Analysis of spatial-temporal distribution and influencing factors of pulmonary tuberculosis in China, during 2008-2015 Epidemiol Infect 2018 Oct 10:1-9
78 Amsalu E, Liu M, Li Q, Wang X, Tao L, Liu X, Luo Y, Yang X, Zhang Y, Li W, Li X, Wang W, Guo X Spatial-temporal analysis of tuberculosis in the geriatric population of China: An analysis based on the Bayesian conditional autoregressive model Arch Gerontol Geriatr 2019 Jul - Aug;83:328-337
79 Li XX, Wang LX, Zhang H, Jiang SW, Fang Q, Chen JX, Zhou XN Spatial variations of pulmonary tuberculosis prevalence co-impacted by socio-economic and geographic factors
in People's Republic of China, 2010 BMC Public Health 2014 Mar 17;14:257 doi: 10.1186/1471-2458-14-257
80 Wang L, Chen L Spatiotemporal dataset on Chinese population distribution and its driving factors from 1949 to 2013 Sci Data 2016 Jul 5;3:160047
81 WHO Report 2018 - Global Tuberculosis Control
82 Nguyen Viet Nhung Expert urges to maintain sustaniable outcomes in TB prevention and control, Nhan Dan online, June 2019
Trang 2617 Nội dung nghiên cứu khoa học và triển khai thực nghiệm của đề tài và phương án thực hiện
(Liệt kê và mô tả chi tiết những công việc của từng nội dung nghiên cứu và triển khai thực nghiệm phù hợp cần thực hiện để giải quyết các vấn đề và tạo ra sản phẩm theo đặt hàng, kèm theo nhu cầu về nhân lực, trong đó chỉ rõ những nội dung mới, những nội dung kế thừa kết quả nghiên cứu của các đề tài trước đó, dự kiến những nội dung có tính rủi ro và giải pháp khắc phục – nếu có; nội dung thuê chuyên gia trong, ngoài nước thực hiện nếu có không kê khai ở mục này, sẽ được kê khai ở mục 21)
Nội dung 1: Xây dựng Bộ cơ sở dữ liệu 30.000 ảnh X-quang ngực theo chuẩn DICOM
đã được gán nhãn về bệnh lao phổi phân bố theo tuổi, giới, nghề nghiệp, dân tộc tại 8 vùng sinh thái ở Việt Nam
Hoạt động 1.1: Nghiên cứu tổng quan hệ thống hỗ trợ chẩn đoán lao phổi dựa vào Quang
X-Công việc 1.1 1 Nghiên cứu tổng quan về bệnh lao phổi, phân tích và đánh giá các phương pháp hiện có về chẩn đoán bệnh lao phổi tại Việt Nam và Thế giới
Công việc 1.1.2 Nghiên cứu lựa chọn đối tượng nghiên cứu và phương pháp thu thập dữ liệu liên quan tới bệnh nhân lao phổi
Công việc 1.1.3 Nghiên cứu phân tích các đặc trưng về dữ liệu ảnh X-quang phổi và phương pháp thu nhận dữ liệu ảnh X-quang theo chuẩn DICOM từ các thiết bị X-quang
Công việc 1.1.4 Nghiên cứu lựa chọn công nghệ thu nhận, kỹ thuật phân tích và xử lý dữ liệu lớn về ảnh X-quang
Công việc 1.1.5 Nghiên cứu đánh giá và tổng hợp các tập dữ liệu ảnh X-quang hỗ trợ nghiên cứu bệnh lao phổi
Công việc 1.1.6 Nghiên cứu đánh giá và lựa chọn phương pháp tích hợp học tích cực trong
hỗ trợ gán nhãn ảnh
Hoạt động 1.2: Nghiên cứu xây dựng Bộ cơ sở dữ liệu 30.000 ảnh X-quang ngực theo chuẩn DICOM đã được gán nhãn về bệnh lao phổi phân bố theo tuổi, giới, nghề nghiệp, dân tộc tại 8 vùng sinh thái ở Việt Nam
Công việc 1.2.1 Nghiên cứu xây dựng cấu trúc cơ sở dữ liệu, bộ công cụ thu nhận, xử lý
và gán nhãn ảnh X-quang
Công việc 1.2.1.1 Nghiên cứu xây dựng cấu trúc cơ sở dữ liệu lưu trữ dữ liệu ảnh X-quang
và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc trên máy chủ
Công việc 1.2.1.2 Nghiên cứu xây dựng bộ công cụ kết nối với thiết bị X-quang chẩn đoán
để thu nhận dữ liệu ảnh X-quang theo chuẩn DICOM
Công việc 1.2.1.3 Nghiên cứu các giải pháp phân phối và kiểm soát chất lượng gán nhãn ảnh Công việc 1.2.1.4 Nghiên cứu, phân tích yêu cầu công cụ hỗ trợ gán nhãn ảnh X-quang Công việc 1.2.1.5 Thiết kế lược đồ CSDL lưu trữ ảnh chụp X-quang, nhãn, thông tin thuộc tính về thời gian, người gán nhãn, và các thông tin về ảnh X-quang
Trang 27Công việc 1.2.1.6 Thiết kế, xây dựng nhóm chức năng xuất/nhập dữ liệu có nhãn phục vụ bài toán xây dựng mô hình
Công việc 1.2.1.7 Thiết kế, xây dựng nhóm chức năng gán nhãn ảnh X-quang
Công việc 1.2.1.8 Thiết kế, xây dựng nhóm chức năng tích hợp học tích cực để tăng năng xuất gán nhãn ảnh X-quang
Công việc 1.2.1.9 Thiết kế, xây dựng nhóm chức năng phân phối ảnh X-quang cho nhiều người dùng gán nhãn
Công việc.12.1.10 Thiết kế, xây dựng nhóm chức năng kiểm soát chất lượng nhãn
Công việc 1.2.1.11 Nghiên cứu xây dựng bộ công cụ phần mềm thu thập dữ liệu ảnh quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi
X-Công việc 1.2.1.12 Nghiên cứu xây dựng bộ công cụ phần mềm chuẩn hóa, lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi
Công việc 1.2.2 Thu thập dữ liệu ảnh X-quang ngực trên 30.000 bệnh nhân lao phổi, chuẩn hóa, lọc nhiễu và gán nhãn tại 8 vùng sinh thái của Việt Nam
Công việc 1.2.2.1 Xây dựng các Quy trình chuẩn (SOP), hướng dẫn thu thập, lưu trữ, chuẩn hóa, lọc nhiễu, gán nhãn dữ liệu ảnh X-quang của bệnh nhân lao phổi
Công việc 1.2.2.2 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Đông Bắc
Công việc 1.2.2.3 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Tây Bắc
Công việc 1.2.2.4 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Đồng bằng sông Hồng Công việc 1.2.2.5 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Bắc Trung bộ
Công việc 1.2.2.6 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Nam Trung bộ
Công việc 1.2.2.7 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Tây Nguyên
Công việc 1.2.2.8 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Đông Nam bộ
Công việc 1.2.2.9 Nghiên cứu thu thập dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Tây Nam Bộ
Công việc 1.2.2.10 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Tây Bắc
Trang 28Công việc 1.2.2.11 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Đông Bắc
Công việc 1.2.2.12 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Đồng bằng sông Hồng
Công việc 1.2.2.13 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Bắc Trung bộ
Công việc 1.2.2.14 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Nam Trung bộ
Công việc 1.2.2.15 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Tây Nguyên
Công việc 1.2.2.16 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Đông Nam bộ
Công việc 1.2.2.17 Chuẩn hóa dữ liệu ảnh X-quang và các thông tin liên quan gồm tuổi, giới tính, nghề nghiệp, dân tộc của bệnh nhân lao phổi tại vùng Tây Nam Bộ
Công việc 1.2.2.18 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Tây Bắc
Công việc 1.2.2.19 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Đông Bắc
Công việc 1.2.2.20 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Đồng bằng sông Hồng
Công việc 1.2.2.21 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Bắc Trung bộ
Công việc 1.2.2.22 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Nam Trung bộ
Công việc 1.2.2.23 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Tây Nguyên
Công việc 1.2.2.24 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Đông Nam bộ
Công việc 1.2.2.25 Lọc nhiễu và gán nhãn cho dữ liệu ảnh X-quang của bệnh nhân lao phổi tại vùng Tây Nam Bộ
Nội dung 2 : Nghiên cứu xây dựng phần mềm học sâu hỗ trợ chẩn đoán bệnh lao phổi ở Việt Nam bằng ảnh X-quang ngực
Công việc 2.1 Nghiên cứu một số công cụ trí tuệ nhân tạo áp dụng cho Hệ hỗ trợ chẩn đoán bệnh tật
Trang 29Công việc 2.2: Nghiên cứu một số công cụ trí tuệ nhân tạo áp dụng cho Hệ hỗ trợ chẩn đoán lao phổi
Công việc 2.3: Nghiên cứu một số phần mềm học sâu hỗ trợ chẩn đoán bệnh tật dựa vào phim X-quang
Công việc 2.4: Nghiên cứu một số phần mềm học sâu hỗ trợ chẩn đoán lao phổi dựa vào phim X-quang ngực
Công việc 2.5 Xây dựng các SOP, hướng dẫn thực hiện các kỹ thuật thao tác với ảnh X-quang ngực gốc và ảnh tiền xử lý, cấu hình và cài đặt máy tính và máy chủ chuyên dụng, bảo trì- bảo dưỡng hệ thống, các vấn đề an toàn- bảo mật hệ thống
Công việc 2.6: Xây dựng hướng dẫn sử dụng phần mềm học sâu hỗ trợ chẩn đoán lao phổi dựa trên ảnh X-Quang phổi
Công việc 2.7: Xây dựng mô hình học sâu trên cơ sở dữ liệu ảnh X-Quang ngực
Công việc 2.8: Dùng máy tính chuyên dụng, áp dụng thuật toán trí tuệ nhân tạo, mô hình học sâu, huấn luyện cho máy học 30.000 ảnh X-quang ngực đã gán nhãn để đạt được độ chính xác trên 95%
Công việc 2.9 Xây dựng phần mềm học sâu hỗ trợ chẩn đoán lao phổi dựa trên ảnh X-quang ngực
Công việc 2.10: Nghiên cứu mối liên quan một số triệu chứng lâm sàng, hình ảnh X-quang máy chẩn đoán
Nội dung 3: Xác định các yếu tố nguy cơ theo không gian và thời gian (geo-spatial epidemiology), xây dựng cơ sở dữ liệu địa lý không gian về các yếu tố nguy cơ và xây dựng mô hình dự báo tỷ suất mắc bệnh lao ở Việt Nam
Hoạt động 3.1: Xác định các yếu tố nguy cơ theo không gian và thời gian (geo-spatial epidemiology)
Công việc 3.1.1 Nghiên cứu tổng quan dự báo dịch tễ địa không gian bệnh lao phổi trên thế giới và Việt nam
Công việc 3.1.2 Nghiên cứu tổng quan các yếu tố nguy cơ ảnh hưởng tới khả năng mắc lao phổi theo không gian và thời gian
Hoạt động 3.2: Xây dựng cơ sở dữ liệu địa không gian về các yếu tố nguy cơ
Công việc 3.2.1 Khảo sát, lựa chọn và đánh giá khả năng thu thập các dữ liệu sẽ sử dụng từ nhiều nguồn khác nhau
Công việc 3.2.2 Nghiên cứu, chọn lựa hệ quản trị cơ sở dữ liệu (HQTCSDL) phù hợp để lưu trữ dữ liệu đa nguồn
Công việc 3.2.3 Thiết kế cơ sở dữ liệu và cài đặt HQTCSDL lưu trữ dữ liệu đa nguồn
Công việc 3.2.4 Xây dựng các SOP, hướng dẫn thực hiện thu thập dữ liệu và chuẩn hóa, kết nối, tổ chức, lưu trữ, sao lưu, phục hồi các cơ sở dữ liệu và hướng dẫn kết nối cơ sở dữ liệu
Trang 30Công việc 3.2.5 Thu thập thông tin ca bệnh từ hệ thống thông tin điện tử giám sát bệnh lao (VITIMES) của Chương trình chống lao quốc gia (CTCLQG)
Công việc 3.2.6 Thu thập thông tin ca bệnh từ hệ thống phần mềm quản lý bệnh viện (HIS – Hospital Information System) (bao gồm các thông tin hành chính, các chỉ định lâm sàng, cận lâm sàng, triệu chứng, tiền sử bệnh … )
Công việc 3.2.7 Thu thập các số liệu khác liên quan đến tình hình kinh tế xã hội, xã hội, lao động, khi hậu, dịch tễ
Công việc 3.2.8 Thu thập các dữ liệu không gian liên quan
Công việc 3.2.9 Chuẩn hóa các bộ dữ liệu đa nguồn
Công việc 3.2.10 Kết nối các bộ dữ liệu đa nguồn
Hoạt động 3.3: Xây dựng mô hình dự báo tỷ suất mắc bệnh lao ở Việt Nam
Công việc 3.3.1 Đánh giá và lựa chọn các thuật toán trí tuệ nhân tạo sẽ sử dụng để xây dựng
mô hình
Công việc 3.3.2 Xây dựng các quy trình chuẩn, hướng dẫn thực hiện xây dựng và hiệu chỉnh
mô hình dự báo tỷ suất mắc bệnh lao phổi tại Việt Nam
Công việc 3.3.3 Xây dựng mô hình dự báo tỷ suất mắc bệnh lao phổi tại Việt Nam dựa vào bộ
dữ liệu huấn luyện (training- data)
Công việc 3.3.4 Hiệu chỉnh và nâng cao độ chính xác của mô hình dự báo tỷ suất mắc bệnh lao phổi tại Việt Nam trong quá trình huấn luyện máy học dựa vào bộ dữ liệu xác thực chéo (cross-validation data)
Công việc 3.3.5 Đánh giá độ chính xác của mô hình dự báo tỷ suất mắc bệnh lao phổi tại Việt Nam sau quá trình huấn luyện dựa vào bộ dữ liệu kiểm thử (testing- data)
Nội dung 4: Xây dựng phần mềm dự báo dịch tễ địa không gian bệnh lao phổi ở Việt Nam
Công việc 4.1 Nghiên cứu khám phá một số công cụ WebGIS được áp dụng cho hệ chuyên gia hỗ trợ dự báo trên thế giới và tại Việt Nam
Công việc 4.2 Khảo sát nhu cầu sử dụng và xây dựng yêu cầu cho các tính năng của phần mềm dự báo dịch tễ địa không gian cho bệnh lao/ lao phổi tại Việt Nam
Công việc 4.3 Thiết kế giao diện người dùng cho phần mềm dự báo dịch tễ địa không gian cho bệnh lao/ lao phổi tại Việt Nam
Công việc 4.4 Xây dựng phần mềm dự báo dịch tễ địa không gian cho bệnh lao/ bệnh lao phổi tại Việt Nam
Công việc 4.5 Kiểm thử phần mềm
Công việc 4.6 Xây dựng hướng dẫn sử dụng phần mềm dự báo dịch tễ địa không gian cho bệnh lao/ lao phổi tại Việt Nam
Nội dung 5: Triển khai thử nghiệm và đánh giá phần mềm học sâu hỗ trợ chẩn đoán bệnh lao phổi ở Việt Nam bằng ảnh X-quang ngực
Hoạt động 5.1 Triển khai thử nghiệm
Trang 31Công việc 5.1.1: Triển khai thí điểm (8 tỉnh, 8 huyện)
Công việc 5.1.2: Hỗ trợ kỹ thuật từ xa
Hoạt động 5.2 Đánh giá triển khai
Công việc 5.2.1 Xây dựng công cụ đánh giá độ chính xác, độ nhậy, độ đặc hiệu, dự báo âm tính, dự báo dương tính dựa trên bằng chứng vi khuẩn học và lâm sàng
Công việc 5.2.2 Tổng hợp số liệu và đánh giá triển khai thí điểm
Nội dung 6: Triển khai thử nghiệm và đánh giá phần mềm dự báo dịch tễ địa không gian bệnh lao phổi
Hoạt động 6.1 Triển khai thử nghiệm
Công việc 6.1.1: Triển khai thí điểm (8 tỉnh, 8 huyện)
Công việc 6.1.2: Hỗ trợ kỹ thuật
Hoạt động 6.2 Đánh giá triển khai
Công việc 6.2.1: Xây dựng công cụ đánh giá
Công việc 6.2.2: Tổng hợp số liệu và đánh giá triển khai thí điểm
Nội dung 7: Tổng hợp dữ liệu, kết quả nghiên cứu, viết báo cáo tổng kết và bài báo khoa học
18 Cách tiếp cận, phương pháp nghiên cứu, kỹ thuật sử dụng
(Luận cứ rõ cách tiếp cận vấn đề nghiên cứu, thiết kế nghiên cứu, phương pháp nghiên cứu, kỹ thuật sẽ sử dụng gắn với từng nội dung chính của đề tài; so sánh với các phương pháp giải quyết tương tự khác và phân tích để làm rõ được tính mới, tính sáng tạo của đề tài)
Cách tiếp cận: Cách tiếp cận của đề tài có các đặc trưng cơ bản như sau:
Hệ thống nền tảng chủ yếu là các mã nguồn mở: là một cách tiếp cận phổ biến hiện nay, cho phép hệ thống được xây dựng sẽ dễ dàng mở rộng, nâng cấp trong tương lai, đồng thời giúp giảm thời gian và chi phí phát triển hệ thống
Hướng người dùng: đa số các hệ thống được xây dựng đều hướng đến mục tiêu thoả mãn nhu cầu của một/một nhóm người dùng đơn thuần Hệ thống hỗ trợ này trong quá trình phát triển, các yêu cầu của các đối tượng nhiều nhóm người dùng khác nhau(cả bác sĩ, người bệnh, nhà quản lý và người làm chính sách) sẽ luôn được đặt lên hàng đầu, với mục tiêu phải xác định ngày càng rõ các yêu cầu sử dụng, để cuối cùng đáp ứng một cách tốt nhất các yêu cầu
đó
Hướng Quá trình: Hệ thống được xây dựng để có thể cập nhật các dữ liệu được chuẩn hóa,
số hóa và quy trình vận hành chẩn đoánđể thu thập, lưu trữ, phân tích và xử lý dữ liệu lớn Các
dữ liệu chuẩn hóa và quy trình vận hành chẩn đoán làm dữ liệu thu thập ngày càng có chất lượng và máy được học ngày cảng thông minh hơn
Thiết kế nghiên cứu
Trang 32Nội dung 1: Xây dựng Bộ cơ sở dữ liệu 30.000 ảnh X-quang ngực theo chuẩn DICOM đã
được gán nhãn về bệnh lao phổi phân bố theo tuổi, giới, nghề nghiệp, dân tộc tại 8 vùng sinh thái ở Việt Nam
Nội dung 2: Nghiên cứu xây dựng phần mềm học sâu hỗ trợ chẩn đoán bệnh lao phổi ở Việt
Nam bằng ảnh X-quang ngực
Nội dung 3: Xác định các yếu tố nguy cơ theo không gian và thời gian (geo-spatial
epidemiology), xây dựng cơ sở dữ liệu địa lý không gian về các yếu tố nguy cơ và xây dựng
mô hình dự báo tỷ suất mắc bệnh lao ở Việt Nam
Nội dung 4: Xây dựng phần mềm (WebGIS) dự báo tỷ suất mắc bệnh lao ở Việt Nam
Nội dung 5: Triển khai thử nghiệm và đánh giá hiệu suất phần mềm học sâu hỗ trợ chẩn đoán
bệnh lao phổi ở Việt Nam bằng ảnh X-quang ngực
Nội dung 6: Triển khai thử nghiệm và đánh giá hiệu suất phần mềm dự báo dịch tễ địa không
gian (geo-spatial epidemiology)
Nội dung 7: Tổng hợp dữ liệu, kết quả nghiên cứu, viết bài báo
Phương pháp nghiên cứu, kỹ thuật sử dụng:
Đối với các nội dung tổng quan và xây dựng SOP, guideline : Sử dụng phương pháp nghiên cứu tổng hợp và phương pháp định tính kết hợp định lượng để xác định và khẳng định những
dữ liệu, quy trình, thuật toán, công cụ chẩn đoán trong cả mục tiêu chung 1 và mục tiêu chung
2 Đề tài sẽ tiến hành các nghiên cứu phân tích những trường hợp mắc lao với đầy đủ bộ dữ liệu chẩn đoán theo dõi dọc trong 2 năm cùng với những biến số khác để nghiên cứu mối quan
hệ qua lại giữa các thông số này Thông qua đó xác định được những ứng dụng thực tế cơ bản
có cơ sở khoa học thực chứng của AI trong X-Quang cũng như trong dịch tễ học không gian địa lý Đề tài sử dụng kết hợp phương pháp nghiên cứu định tính (Qualitative Research) và phân tích so sánh định tính (Qualitative Comparative Analysis ) Nghiên cứu định tính là một phương pháp điều tra được sử dụng trong nhiều lĩnh vực khoa học khác nhau Phương pháp nghiên cứu định tính điều tra lý do tại sao và làm thế nào trong việc ra quyết định, không chỉ trả lời các câu hỏi cái gì, ở đâu, khi nào Phương pháp so sánh định tính là một kỹ thuật phân tích dữ liệu để rút ra những kết luận hợp lý từ một tập dữ liệu
Về việc xây dựng mô hình học sâu hỗ trợ chẩn đoán bệnh lao phổi ở Việt Nam bằng ảnh quang ngực (AI-X-quang): Thực hiện dựa trên phương pháp nghiên cứu lý thuyết, mô phỏng
X-và chế tạo thử nghiệm Sử dụng các thông số tối ưu đã được tính toán để thực hiện phần cứng
đề xuất, thiết kế chế tạo hệ thống, thử nghiệm hệ thống trong điều kiện thực, hiệu chỉnh các thông số để đạt được tối ưu
Trang 33Về việc xây dựng mô hình dự báo tỷ suất mắc bệnh lao ở Việt Nam (Geo_AI-TB): Phương pháp nghiên cứu dựa trên nghiên cứu lý thuyết, mô phỏng và xây dựng phần mềm thử nghiệm dựa trên công nghệ máy học Yêu cầu kết nối và tương tác giữa mô hình phải được đảm bảo Phát triển mô hình hệ thống thực nghiệm, tiến hành các thực nghiệm kiểm chứng tính năng hệ thống, tính mở của hệ thống, độ an toàn, độ tin cậy, dộ chính xác của mô hình đề xuất
Thu thập yêu cầu: trước khi hệ thống được thiết kế, cần tiến hành nghiên cứu đánh giá các loại yêu cầu chức năng và phi chức năng của người dùng và hệ thống cần được xác định rõ Phương pháp thu thập yêu cầu được sử dụng là theo kịch bản sử dụng, kết hợp mô hình và mô tả chi tiết
Các phương pháp theo từng nội dung nghiên cứu xây dựng phần mềm bao gồm:
Trang 34Nội dung 1: Xây dựng Bộ cơ sở dữ liệu lớn ảnh X-quang bệnh lao phổi
Bộ cơ sở dữ liệu được thu thập trên 30.000 bệnh nhân lao phổi bao gồm kết hợp hồi cứu và tiến cứu trong thời gian từ tháng 12/2019 đến tháng 12/2021 tại 8 vùng sinh thái ở Việt Nam Trong đó:
- Tiêu chuẩn chẩn đoán lao phổi dựa trên tiêu chuẩn vàng là có bằng chứng vi khuẩn xác định bằng phương pháp nuôi cấy định danh hoặc kỹ thuật sinh học phân tử được
Tổ chức Y tế thế giới khuyến cáo như geneXpert
- Phim chụp Xquang ngực kỹ thuật số tiêu chuẩn
- Đảm bảo các trường hợp lao phổi đại diện cho 8 vùng sinh thái: Giai đoạn thí điểm sẽ thu thập ở một số bệnh viện lớn, sau đó thu thập mở rộng sẽ dựa trên hệ thống VITIMES đăng ký các ca bệnh lao trên toàn quốc cho đến đủ 30.000 trường hợp Mỗi năm cả nước có hơn 100.000 ca bệnh lao được chẩn đoán và điều trị như vậy các trường hợp lao phổi được chẩn đoán và gán nhãn vào phim Xquang sẽ có cả các dữ liệu liên quan đến thời gian và không gian bao gồm địa chỉ đến phường xã Dữ liệu này sẽ được làm
ẩn danh theo tiêu chuẩn và là dữ liệu cho nội dung nghiên cứu thứ 2 là xây dựng phần mềm AI dịch tễ địa không gian bệnh lao
- Quá trình gán nhãn được thực hiện có quy trình kiểm soát đảm bảo chất lượng
Nghiên cứu tổng quan hệ thống hỗ trợ chẩn đoán
Nghiên cứu tổng quan về bệnh lao phổi, phân tích và đánh giá các phương pháp hiện có về chẩn đoán bệnh lao phổi tại Việt Nam và Thế giới
Nghiên cứu lựa chọn đối tượng nghiên cứu và phương pháp thu thập dữ liệu liên quan tới bệnh nhân lao phổi
Nghiên cứu phân tích các đặc trưng về dữ liệu ảnh X-quang phổi và phương pháp thu nhận
dữ liệu ảnh X-quang theo chuẩn DICOM từ các thiết bị X-quang
Nghiên cứu lựa chọn công nghệ thu nhận, kỹ thuật phân tích và xử lý dữ liệu lớn về ảnh quang
X-Nghiên cứu đánh giá và tổng hợp các tập dữ liệu ảnh X-quang hỗ trợ nghiên cứu bệnh lao phổi
Nghiên cứu đánh giá và lựa chọn phương pháp tích hợp học tích cực trong hỗ trợ gán nhãn ảnh Khảo sát và đánh giá khả năng thu thập ảnh X-quang bệnh lao phổi phân bố theo tuổi, giới, nghề nghiệp, dân tộc tại các vùng sinh thái ở Việt Nam;
Xây dựng các SOP, hướng dẫn và thực hiện chuẩn hóa và thu thập dữ liệu ảnh X-quang bệnh lao phổi gốc và ảnh để học (bác sĩ khoanh vùng nghi ngờ tổn thương, tiền xử lý ảnh để đạt độ sáng tối, phóng to, thu nhỏ, cắt bỏ các phần không cần thiết)
Xây dựng các SOP, hướng dẫn và thực hiện xây dựng hệ thống lưu trữ và tổ chức dữ liệu ảnh X-quang chuẩn bị cho quá trình xử lý dữ liệu lớn
Xây dựng các SOP, hướng dẫn và thực hiện lựa chọn, chuẩn hóa các ảnh lao phổi đã lựa chọn, lọc dữ liệu, để gán nhãn các phần ảnh đặc trưng cho chẩn đoán Nghiên cứu một số kỹ thuật trích chọn đặc trưng ảnh X-quang bệnh lao phổi
Xây dựng các SOP và hướng dẫn ẩn danh CSDL
Trang 35Phương pháp gán nhãn Xquang ngực của người mắc bệnh lao phổi
Thông thường, nhãn là các thông tin xác định một vật thể Với phim Xquang ngực có thể có nhiều cấp độ nhãn khác nhau, ví dụ nhãn có thể chỉ là tên, tuổi, giới của người được chụp, có thể là triệu chứng, dấu hiệu của phim hoặc cao hơn là tiêu chuẩn vàng chẩn đoán một bệnh của phim đó được dán nhãn
Trong nghiên cứu này của chúng tôi, nhãn được đưa ra là tiêu chuẩn chẩn đoán bệnh lao phổi
có bằng chứng vi khuẩn học xác định bằng kỹ thuật sinh học phân tử (Xpert hoặc tương đương) hoặc nuôi cấy định danh, gọi là tiêu chuẩn vàng
Phim Xquang chuẩn Dicom sẽ được thu thập từ các bệnh viện chuyên khoa lao và bệnh phổi (đã được tập huấn và đại diện cho 8 vùng sinh thái của Việt Nam) và chuyển về Bệnh viện Phổi Trung Ương thông qua hệ thống PACS (Hệ thống lưu trữ và truyền hình ảnh) Những phim X-Quang này có thể thu thập tiến cứu hoặc hồi cứu, được dán nhãn và kết nối với thông tin lâm sàng và vi khuẩn học Ngoài các phim X-Quang của bệnh nhân lao phổi, các phim bình thường hoặc bệnh lý không lao cũng sẽ được thu thập, với số lượng khoảng 3-4 lần số phim
có nhãn lao phổi
Số phim đã được gán nhãn lao phổi và không lao phổi sẽ được lưu trữ tại máy chủ đặt tại bệnh viện phổi và máy chủ dữ liệu thuê của đề tài, đây là nguồn dữ liệu quan trọng phục vụ cho việc xây dựng mô hình học sâu và phần mềm hỗ trợ chẩn đoán bệnh lao phổi bằng phim X-Quang ngực
Nội dung 2: Phát triển hệ thống phần mềm học sâu hỗ trợ chẩn đoán bệnh lao phổi ở Việt Nam bằng ảnh X-quang ngực
Nghiên cứu khám phá một số công cụ trí tuệ nhân tạo (Mô hình và các thư viện frame work)
áp dụng cho Hệ hỗ trợ chẩn đoán
Xây dựng các SOP, hướng dẫn và Thực hiện các kỹ thuật thao tác với ảnh X-quang gốc và ảnh tiền xử lý nạp vào phần mềm có chức năng để cấu hình đến máy chủ có dịch vụ chứa mô hình chẩn đoán: Các hình ảnh được tải lên máy tính có hệ điều hành Linux (Ubuntu 14.04; Canonical, London, Anh) và với khung học sâu Caffe (22), với các phụ thuộc CUDA 7.5 / cuDNN 5.0 (Nvidia Corporation, Santa Clara, Ca-life) để tăng tốc đơn vị xử lý đồ họa Máy tính chứa bộ xử lý Intel i5 3570k 3,4-gHz (Intel, Santa Clara, Calif), 4 dung lượng ổ cứng TB, RAM 32 GB và bộ xử lý đồ họa Nvidia Titan 312 GB hỗ trợ CUDA (Nvidia)
Xây dựng các SOP, hướng dẫn và thực hiện các kỹ thuật làm việc với siêu máy tính huấn luyện máy học chẩn đoán lao
Dùng máy tính chuyên dụng, áp dụng Deep learning, huấn luyện cho máy học các mẫu ảnh đã thu thập được: Hai kiến trúc mạng thần kinh tích chập sâu khác nhau để đánh giá là AlexNet (24) và GoogLeNet (25), bao gồm các mô hình đã được sơ chế và chưa được đào tạo Các sản phẩm mạng tiền xử lý đã được đào tạo trên 1,2 triệu hình ảnh màu hàng ngày từ ImageNet (http://www.image-net.org/) bao gồm 1000 danh mục trước khi học từ X quang ngực trong nghiên cứu này (gọi tắt là sơ bộ) Mạng chưa được đào tạo đã không được đào tạo trước khi chúng được sử dụng (gọi là chưa được đào tạo) Điều này bao gồm AlexNet chưa được đào tạo (Alex-Net-U), AlexNet được đào tạo trước (AlexNet-T), GoogLeNet chưa được đào tạo