1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu tích hợp viễn thám, hệ thông tin địa lý và mô hình khai phá dữ liệu trong đánh giá nguy cơ mắc bệnh sốt rét tại tỉnh đăk nông =

20 78 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 1,53 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

1 ĐẠI HỌC QUỐC GIA HÀ NỘI KẾT QUẢ THỰC HIỆN ĐỀ TÀI KH&CN CẤP ĐẠI HỌC QUỐC GIA Tên đề tài: Nghiên cứu tích hợp Viễn thám, Hệ thông tin địa lý và mô hình khai phá dữ liệu trong đánh giá

Trang 1

1

ĐẠI HỌC QUỐC GIA HÀ NỘI

KẾT QUẢ THỰC HIỆN ĐỀ TÀI KH&CN

CẤP ĐẠI HỌC QUỐC GIA

Tên đề tài: Nghiên cứu tích hợp Viễn thám, Hệ thông tin địa lý và mô hình khai phá dữ liệu trong đánh giá nguy cơ mắc bệnh sốt rét tại tỉnh Đăk Nông

Mã số đề tài: QG.17.20

Chủ nhiệm đề tài: TS Bùi Quang Thành

Hà Nội, 2019

Trang 2

PHẦN I THÔNG TIN CHUNG

1.1 Tên đề tài: Nghiên cứu tích hợp Viễn thám, Hệ thông tin địa lý và mô hình khai phá dữ liệu

trong đánh giá nguy cơ mắc bệnh sốt rét tại tỉnh Đăk Nông

1.2 Mã số: QG.17.20

1.3 Danh sách chủ trì, thành viên tham gia thực hiện đề tài

TT Chức danh, học vị, họ và

1 TS Bùi Quang Thành Đại học KHTN

Điều hành chung, tổ chức thực hiện các nội dung nghiên cứu; Nghiên cứu xác lập cơ sở khoa học về dịch bệnh sốt rét, xây dựng mô hình dự báo, thiết lập WebGIS, đề xuất các giải pháp giảm thiểu nguy cơ mắc bệnh sốt rét

2 ThS Nguyễn Quang Minh Đại học KHTN

Thư kí khoa học; ứng dụng VT-GIS và

mô hình khai phá dữ liệu trong nghiên

cứu nguy cơ mắc bệnh sốt rét

3 ThS Hoàng Tuấn Anh

Nghiên cứu sinh của đề tài; ứng dụng VT-GIS và mô hình khai phá dữ liệu trong nghiên cứu nguy cơ mắc bệnh sốt rét

4 ThS Dương Thị Thủy Đại học KHTN Nghiên cứu các điều kiện tự nhiên, KTXH liên quan đến dịch bệnh sốt rét;

xây dựng CSDL

5 ThS Đỗ Trung Hiếu Đại học KHTN Nghiên cứu các điều kiện tự nhiên, KTXH liên quan đến dịch bệnh sốt rét;

xây dựng CSDL

1.4 Đơn vị chủ trì:

1.5 Thời gian thực hiện:

1.5.1 Theo hợp đồng: từ tháng 02 năm 2017 đến tháng 02 năm 2019

1.5.2 Gia hạn (nếu có): đến tháng… năm…

1.5.3 Thực hiện thực tế: từ tháng 02 năm 2017 đến tháng 02 năm 2019

1.6 Những thay đổi so với thuyết minh ban đầu (nếu có):

(Về mục tiêu, nội dung, phương pháp, kết quả nghiên cứu và tổ chức thực hiện; Nguyên nhân; Ý

kiến của Cơ quan quản lý)

1.7 Tổng kinh phí được phê duyệt của đề tài: 300 triệu đồng

PHẦN II TỔNG QUAN KẾT QUẢ NGHIÊN CỨU

Viết theo cấu trúc một bài báo khoa học tổng quan từ 6-15 trang (báo cáo này sẽ được đăng trên tạp chí khoa học ĐHQGHN sau khi đề tài được nghiệm thu), nội dung gồm các phần:

1 Đặt vấn đề

Bệnh sốt rét hiện nay vẫn còn là một vấn đề sức khoẻ lớn trên thế giới nói chung và tại Việt Nam nói riêng Theo ước tính của Tổ chức Y tế thế giới khoảng 40% dân số thế giới hiện nay đang sống trong vùng có nguy cơ mắc sốt rét (World Health Organization, 2016) Hàng năm có khoảng

Trang 3

350-3

500 triệu người mắc sốt rét và hơn 1 triệu người chết do sốt rét Hiện nay, bất chấp những nỗ lực trong công tác kiểm soát, bệnh sốt rét vẫn còn là một thách thức toàn cầu, đặc biệt ảnh hưởng đến các nhóm dễ bị tổn thương do khả năng tiếp cận các dịch vụ y tế và công tác phòng chống còn hạn chế (Darkoh, Larbi, & Lawer, 2017; Ge et al., 2016) Mặc dù có sự suy giảm về số lượng các ca nhiễm, các khu vực trước đây miễn nhiễm với bệnh hiện đang đối diện với nguy cơ lây nhiễm do sự thay đổi về điều kiện môi trường, các điều kiện kinh tế xã hội, đặc biệt trong bối cảnh biến đổi khí hậu tác động đến tần suất và thời gian xảy ra các hiện tượng khí hậu cực đoan (Zinszer et al., 2012) Tính dễ bị tổn thương của cộng đồng phụ thuộc vào nhiều yếu tố như các yếu tố sinh học, tâm lý học, môi trường, xã hội và các yếu tố kinh tế (Pham Viet Hong, 2014) Các chương trình theo dõi diễn biến bệnh cần nghiên cứu tích hợp các yếu tố đó, mối quan hệ tương hỗ của chúng, cũng như yếu tố không gian và thời gian của chúng

Tại Việt Nam, theo số liệu báo cáo hàng năm của chương trình phòng chống sốt rét Quốc gia nhiều tỉnh có mức độ lưu hành sốt rét cao chủ yếu thuộc khu vực Miền Trung - Tây Nguyên Hầu hết các tỉnh có các xã, huyện có đường biên giới với Lào hoặc Campuchia đều có tỷ lệ bệnh nhân mắc sốt rét cao hơn so với các địa phương khác trong toàn quốc (Thanh et al., 2015) Bệnh sốt rét tuy đã giảm nhưng có nguy cơ quay trở lại lớn Đối tượng dễ mắc bệnh là những người sống ở vùng sâu, vùng xa và đặc biệt là những người dân sống ở vùng biên giới giữa Việt Nam với Lào và Campuchia (Hoang, 2014) Tại các vùng này nguy cơ lan truyền sốt rét tiếp diễn và phức tạp, việc nhiễm bệnh sốt rét chủ yếu thông qua giao lưu tự do nên rất khó khăn trong việc giám sát, phát hiện, điều trị và quản lý bệnh nhân sốt rét

Đối với công tác phòng chống giảm thiểu nguy cơ dịch bệnh, điều cấp thiết cần phải xây dựng một

hệ thống thông tin y tế cộng đồng trong khuôn khổ các chương trình giám sát sức khỏe và thông tin dịch tễ (Q.-T Bui, Nguyen, Pham, Pham, & Tran, 2018; Q T Bui & Pham, 2016) Về mặt kỹ thuật, hiện có một số vấn đề còn tồn tại trong lĩnh vực dịch tễ học liên quan đến việc hiển thị các dữ liệu

về sức khỏe, phân tích xử lý không gian, truyền bá thông tin y tế và chia sẻ thông tin giữa đơn vị quản lý và cộng đồng người dân Một khi nhận biết được các khu vưc dễ bị tổn thương đối với bệnh sốt rét, sẽ hỗ trợ các cán bộ y tế hiểu được các nguyên nhân hình thành và các yếu tố tác động đến việc phân bố các khu vực nhiễm bệnh Việc xác định và đo lường các khu vực dễ bị tổn thương đóng vai trò quan trọng trong việc cung cấp các thông tin sơ bộ ban đầu đến các cán bộ y tế

Việc quản lý phòng tránh sốt rét, trong đó có dự báo nguy cơ mắc bệnh sốt rét đòi hỏi phải có dữ liệu chính xác về không gian và thông tin về thời gian (Guru Balamurugan & N Roy, 2011), trong

đó mô hình tích hợp các phương pháp phân tích không gian đang được sử dụng hiệu quả nhằm đánh giá tính dễ bị tổn thương của xã hội khi đối diện với dịch bệnh Việc quản lý cũng đòi hỏi các giải pháp thích hợp, kết hợp kinh nghiệm ở tất cả các cấp, từ trung ương đến địa phương, có sự tham gia của cộng đồng địa phương và phải được dựa trên dữ liệu có độ chính xác cao Do đó các nhà chức trách và cộng đồng địa phương cần được tiếp cận các dữ liệu về nguy cơ mắc bệnh sốt rét để phục

vụ cho việc dự báo và lên kế hoạch phương án đối phó hiệu quả hơn Bản đồ tính dễ bị tổn thương

do sốt rét gây ra do đó cần phải được xây dựng sẵn phục vụ công tác dự báo các khu vực có nguy cơ cao và công tác phòng chống dịch (Kiang et al., 2006) Việc xác định các khu vực dễ bị tổn thương

do sốt rét có thể đóng góp đáng kể vào việc nâng cao hiệu quả công tác dịch tễ thông qua việc hạn chế di chuyển đến các khu vực dễ bị tác động, hoặc thay đổi các yếu tố gây bệnh

Các thành phần cốt yếu của mô hình đánh giá tổn thương là bản đồ nguy cơ mắc bệnh sốt rét có khả năng dự đoán xác suất của một khu vực phơi nhiễm với sốt rét Mặc dù có rất nhiều công trình liên quan đến các phương pháp dự báo nguy cơ sốt rét (Delmelle, Delmelle, Casas, & Barto, 2010; Ndiath et al., 2015; Palaniy & Masimalai, 2014; Pham Viet Hong, 2014; Zinszer et al., 2015) nhưng chúng rất khác nhau về phương pháp thu thập dữ liệu và phân tích tỷ lệ mắc bệnh cũng như phạm vi ảnh hưởng của nó Việc thành lập bản đồ nguy cơ mắc bệnh sốt rét về bản chất là nghiên cứu các yếu tố tác động đến việc hình thành nên các khu vực có cộng đồng mắc bệnh (Q.-T Bui et al., 2018) Các yếu tố này về bản chất liên quan đến các điều kiện vật lý, địa hình khu vực, điều kiện khí tượng, và các hoạt động kinh tế xã hội của con người (Kiang et al., 2006) Trên cơ sở tổng quan

Trang 4

tài liệu, hiện có nhiều nghiên cứu sử dụng mô hình trí thông minh nhân tạo trong dự báo nguy cơ dịch bệnh được công bố trong các tạp trí khoa học có uy tín Nhìn chung, các hướng nghiên cứu này được chia thành ba hướng chính (1) dựa vào kiến thức chuyên gia (2) Sử dụng viễn thám, GIS (3)

sử dụng các mô hình thống kê kết hợp với chí thông minh nhân tạo, viễn thám và GIS Các hướng nghiên cứu này đều tìm hiểu mối quan hệ giữa các biến độc lập và xây dựng mô hình dự báo nguy

cơ mắc bệnh sốt rét dựa trên tập hợp biến đó

Phần lớn các nghiên cứu gần đây đều theo hướng thứ (1) và (2), trong đó Hệ thông tin địa lý (GIS) được chú ý đến như một công cụ để nhận thức thấu đáo và mường tượng ra trạng thái hiện tại của

sự phát sinh và tái phát sinh các bệnh dịch, đặc biệt là những bệnh dịch do thể truyền (Ge et al., 2016) GIS đang từng bước được WHO đưa vào sử dụng như một công cụ thực hành thông thường như mọi công cụ y tế khác trong việc đối phó với bệnh dịch Dữ liệu viễn thám dùng để phân tích lãnh thổ thông qua tích hợp trên GIS cũng đang đang được sử dụng rộng rãi cho việc nghiên cứu một cách nhanh chóng và chính xác điều kiện môi trường của một vùng xác định

Các mô hình tuyến tính tích hợp viễn thám và GIS trong lập bản đồ nguy cơ sốt rét cũng có những đóng góp về mặt khoa học và thực tiễn Tuy nhiên, các mô hình dự báo truyền thống vẫn cần phải được phát triển hoặc thay thế bằng các phương pháp mạnh mẽ và tự động để giải quyết những hạn chế của của các kỹ thuật này Hiện tại, hướng nghiên cứu thứ (3) đã chứng minh được tính hiệu quả dựa trên cơ sở đánh giá độ chính xác của kết quả dự báo (Q.-T Bui et al., 2018; Ge et al., 2016; Kiang et al., 2006)

Ví dụ, tiếp cận thống kê và các phương pháp phân tích không gian đã được đề xuất trong nghiên cứu của, phân tích thống kê dựa trên chuỗi thời gian (Cheng, Haworth, Anbaroglu, Tanaksaranond,

& Wang, 2014) Tuy nhiên, cách tiếp cận thống kê không giải quyết các cấu trúc phức tạp và phi tuyến tính của mô hình dự báo nguy cơ sốt rét Hiện nay, có nhiều nghiên cứu với xu hướng mới, trong đó kết hợp sử dụng trí thông minh nhân tạo phân tích viễn thám và GIS trong quản lý dự báo rủi ro sốt rét Cụ thể hơn, một số nghiên cứ đã tích hợp mô hình Neural Network, Support Vector Machine, Random Forest (Ch et al., 2014; Palaniy & Masimalai, 2014; Zacarias & Bostr, 2013) và thuật toán tối ưu hóa đom đóm, ứng dụng logic mờ trong nghiên cứu về sốt rét (Buczak et al., 2015) Những nghiên cứu này đã kết luận được tính ưu việt của mô hình so với các mô hình khác dựa trên việc đánh giá độ chính xác của bản đồ kết quả

Nghiên cứu dự báo phân vùng nguy cơ mắc bệnh sốt rét là vấn đề đang hết sức cấp thiết hiện nay trên thế giới và ở Việt Nam do ảnh hưởng của các hiện tượng khí hậu cực đoan (hạn, lũ, sương muối…) gây ra biến đổi khí hậu Đặc biệt tại khu vực Tây nguyên, khu vực sinh sống của các cộng đồng thiểu số, với điều kiện cơ sở hạ tầng còn thiếu và khả năng tiếp cận dịch vụ y tế còn hạn chế (Q.-T Bui et al., 2018; Q T Bui & Pham, 2016; Hoang, 2014) Mặc dù rất nhiều nghiên cứu được tiến hành tại Việt Nam, nhưng chưa có mô hình nào được kiểm chứng, đánh giá độ chính xác dựa trên dữ liệu thu thập ngoài thực địa Do vậy nghiên cứu này tại Đăk Nông có tính thời sự cao và hết sức cần thiết, nhất là trong giai đoạn gần đây có những báo cáo về sự bùng phát dịch sốt rét và sốt xuất huyết tại các tỉnh Tây Nguyên

Có nhiều nguyên nhân được giải thích, nhưng có thể suy luận rằng, các mô hình dự báo nguy cơ sốt rét hiện có chưa đáp ứng được tất cả các yêu cầu Điều này đòi hỏi cần phải nghiên cứu phát triển các mô hình mới, nhằm nâng cao chất lượng phân vùng dự báo nguy cơ mắc bệnh sốt rét Các mô hình trí tuệ nhân tạo và tối ưu hóa đã được nghiên cứu thành công trong nhiều lĩnh vực, tuy nhiên nghiên cứu ứng dụng vào phân vùng sốt rét còn ít Vì vậy sự thành công của đề tài sẽ có ý nghĩa khoa học lớn, là tạo ra hướng mới, cách tiếp cận mới nhằm nâng cao chất lượng dự báo Mô hình có thể nhân rộng ra các khu vực khác

2 Mục tiêu

- Làm rõ đặc điểm điều kiện tự nhiên, kinh tế xã hội và ảnh hưởng của chúng tới nguy cơ mắc bệnh sốt rét ở tỉnh Đăk Nông

Trang 5

5

- Xây dựng mô hình tích hợp Viễn thám, GIS, mô hình khai phá dữ liệu và ứng dụng trong đánh giá nguy cơ mắc bệnh sốt rét tỉnh Đăk Nông

- Đề xuất các giải pháp phòng tránh và giảm thiểu nguy cơ mắc bệnh sốt rét tại tỉnh Đăk Nông

3 Phương pháp nghiên cứu

Bước 1: Thu thập dữ liệu, thành lập cơ sở dữ liệu không gian địa lý cho mô hình dự báo nguy

cơ sốt rét

Mô hình sốt rét sẽ được thực hiện dựa trên một cơ sở dữ liệu không gian địa lý sẽ được thiết lập cho các khu vực nghiên cứu Các dữ liệu sẽ được thu thập từ nhiều nguồn khác nhau, bao gồm (i) ảnh vệ tinh Landsat-8 OLI (có sẵn trực tuyến http://earthexplorer.Usgs.Gov); (ii) Số liệu kinh tế xã hội; (iii) bản đồ địa hình tỷ lệ 1: 50.000; (iv) DEM Aster (v) các điểm có người mắc bệnh; (vi) dữ liệu khí tượng đo tại trạm Những dữ liệu này sẽ được xử lý để xây dựng cơ sở dữ liệu GIS

Các dữ liệu về vị trí phân bố ca mắc, tỷ lệ mắc bệnh được thu thập từ nhiều nguồn khác nhau (Sở y

tế Đăk Nông) Nguồn tư liệu này được sử dụng để tham khảo hỗ trợ cho việc đi thực địa điều tra thu thập dữ liệu bổ xung

Bước 2: Cách tiếp cận mô hình và phát triển của các mô hình dự báo nguy cơ sốt rét

Mặc dù các phương pháp và kỹ thuật khác nhau đã được đề xuất cho dự báo nguy cơ sốt rét Tuy nhiên, do cấu trúc phức tạp và phi tuyến tính của mô hình hóa dịch bệnh, các phương pháp thông thường không có khả năng để thực hiện đầy đủ các yêu cầu của việc dự báo nguy cơ dịch bệnh toàn diện Do đó cần có các nghiên cứu tìm ra các mô hình mới nhằm nâng cao độ chính xác dự báo Mục đích của đề xuất này là nghiên cứu cách cách tiếp cận mô hình mới có để cải thiện khả năng dự đoán các khu vực có nguy cơ mắc bệnh sốt rét Các mô hình trí tuệ nhân tạo mới đã được chứng minh khả năng dự báo với độ chính xác cao hơn các mô hình thông thường trong nghiên cứu dịch bệnh nói chung Do đó nghiên cứu này sẽ tập trung vào các phương pháp trí tuệ nhân tạo mới và các thuật toán tối ưu hóa Các phương pháp trí tuệ nhân tạo khác nhau sẽ được tìm hiểu và nghiên cứu tỉ

mỉ cho mô hình dự báo, như mạng neuron nhân tạo (Artifical neural network), vector hỗ trợ (Support vector machine), hồi quy logic (Kernel logic regression), v.v Mỗi mô hình được đặc trung bởi các tham số riêng biệt Ngoài ra, các phương pháp kết hợp khác (ensemble) sẽ được nghiên cứu như Bagging, AdaBoost, MultiBoost, Random Subspace Thêm vào đó một số mô hình tối ưu hóa

sẽ được sử dụng trong nghiên cứu như Simulated Annealing

Kết hợp với GIS, các mô hình tích hợp mới cho mô hình hóa nguy cơ sốt rét sẽ được phát triển và kết quả được so sánh với các mô hình trước đây Mô hình tối ưu sẽ được lựa chọn để thành lập bản

đồ các khu vực với mức độ nguy cơ mắc bệnh khác nhau

Bước 3: Thành lập bản đồ nguy cơ mắc bệnh sốt rét

Mục tiêu tổng thể của gói công việc này là xây dựng bản đồ nguy cơ sốt rét từ mô hình được lựa

chọn trong Bước 2, lựa chọn các phương pháp phân ngưỡng để xây dựng các mức độ nguy cơ từ

thấp đến cao Đề xuất các giải pháp phòng chống, giảm thiểu nguy cơ mắc bệnh sốt rét

4 Tổng kết kết quả nghiên cứu

4.1 Đặc điểm dịch tễ học sốt rét

4.1.1 Nguồn gốc bệnh và phương thức truyền bệnh

Bệnh sốt rét là một bệnh truyền nhiễm, do ký sinh trùng Plasmodium của người gây lên Bệnh lây theo đường máu, do muỗi Anopheles truyền Bệnh sốt rét lưu hành chủ yếu ở các quốc gia nhiệt đới

và cận nhiệt đới Ký sinh trùng sốt rét (KSTSR) có thể gây nên bệnh sốt rét cho con người ở tất cả các nhóm tuổi (đặc biệt có nguy cơ cao với trẻ em dưới 5 tuổi) và được truyền từ người này sang người khác qua trung gian truyền bệnh là muỗi Anopheles Bộ Y tế và tổ chức Y tế thế giới WHO cũng đưa ra các biện pháp phòng chống sốt rét, đa phần các biện pháp đều liên quan chủ yếu là

Trang 6

ngăn chặn sự truyền bệnh từ muỗi (cụ thể là muỗi Anopheles) trong quá trình hút máu người (Hình 1)

Chu kì sinh sản của muỗi Anopheles gồm 2 giai đoạn: Giai đoạn dưới nước (trứng, bọ gậy, cung quăng) và giai đoạn trên cạn (muỗi trưởng thành) Sự sinh sản của muỗi Anopheles phụ thuộc vào

sự có mặt của các điểm nước như: vũng nước, ao hồ, suối khe, giếng tự nhiên hoặc do con người tạo ra từ các vật dụng chứa nước lâu ngày (chum nước, thùng nước, gáo dừa, hòn non bộ…) Bọ gậy có thể sống được ở nước từ 10oC - 40oC Thời gian phát triển từ trứng đến muỗi trưởng thành ở 20oC là 28 ngày, ở 31oC là 7 ngày Tuổi thọ của muỗi trưởng thành cũng phụ thuộc vào nhiệt độ Trung bình muỗi cái sống được từ 3 - 4 tuần, muỗi đực chỉ sống được vài ngày Độ ẩm tương đối trên 50% là phù hợp với chúng, dưới 50% thì phần lớn muỗi Anopheles bị chết

Hình 1: Chu kỳ của KSTSR trong cơ thể người và muỗi (theo CDC, http://www.dpd.cdc.gov.dpdx) 4.1.2 Đặc điểm bệnh và dịch sốt rét

Thời gian phát triển ký sinh trùng ở người từ khi muỗi đốt (giai đoạn ủ bệnh): Tuỳ thuộc vào loại ký sinh trùng sốt rét: P.falciparum từ 8-12 ngày; P.vivax, P.ovale từ 11-21 ngày; P.malariae từ 21-42 ngày

Người mang ký sinh trùng sốt rét có thể có biểu hiện những triệu chứng lâm sàng điển hình: rét run, nóng, ra mồ hôi và khát nước Cũng có thể biểu hiện bằng những triệu chứng không điển hình: sốt cao, nhức đầu, ớn lạnh, đau toàn thân, nhưng cũng có thể không biểu hiện gì cả đó là trường hợp người mang ký sinh trùng lạnh Tuỳ theo loài ký sinh trùng sốt rét mang trong người mà bệnh nhân sốt mỗi ngày một cơn (P.falciparum), hai ngày một cơn (P.vivax), ba ngày một cơn (P.malariae) cơn sốt thường xuất hiện đúng giờ có tính chu kỳ rõ rệt, ăn khớp với những đợt phát triển của ký sinh trùng sốt rét trong cơ thể người

4.2 Dữ liệu vị trí mẫu bệnh sốt rét

Thông tin về khu vực nhiềm bênh được lấy từ Trung tâm y tế dự phòng, Sở y tế Đăk Nông Dựa trên các báo cáo hàng tuần về số ca mắc bệnh mới, vị trí các ca bệnh được xác định thông qua báo cáo và khảo sát thực địa Tổng cộng vị trí tương đối của 198 ca mắc mới được được sử dung Mục tiêu của nghiên cứu này nhằm tính toán nguy cơ mắc bệnh tại khu vực nghiên cứu trong mối quan

hệ với điều kiện tự nhiên và kinh tế xã hội, từ đó mỗi vị trí không gian sẽ được tính toán giá trị nguy

cơ troing khoang [0 – 1] Trong đó, 0 tương ứng không có nguy cơ và 1 có nguy cơ cao Do đó 198

vị trí xác định có ca mới được gán giá trị 1 và 198 điểm ngẫu nhiên khác (nằm ngoài khu dân cư) tại các vị trí không có ca bệnh được gán giá trị 0 Vị trí khu vực nghiên cứu và vị trí các điểm mẫu thể hiện trong Hình 2

Trang 7

7

Hình 2: Vị trí khu vực nghiên cứu – tỉnh Đăk Nông

4.3 Các yếu tố ảnh hưởng dến dịch bệnh sốt rét

4.3.1 Các yếu tố tự nhiên

Dựa vào định nghĩa của bệnh sốt rét ở trên ta có thể thấy sự tồn tại và phát triển của bệnh dịch dựa trên sinh cảnh của 3 nhân tố chính là con người, vectơ và ký sinh trùng Nghiên cứu từng sinh cảnh của những đối tượng này ta có thể xác định được trạng thái hiện tại cũng như sự phát triển của bệnh trong một cộng đồng xác định

Những sinh cảnh thuận lợi cho sự phát triển của vectơ truyền bệnh sốt rét thường là các loại sinh cảnh rừng (bao gồm rừng rậm, rừng thưa, rừng nhiều tầng, bìa rừng), sinh cảnh đồng bằng ven biển, sinh cảnh savan Yếu tố sinh cảnh có vai trò rất quan trọng trong việc phân bố từng vectơ, ở vùng sinh cảnh có độ che phủ cao, ổn định ít bị tàn phá thì rất thích hợp cho sự tồn tại và phát triển của muỗi Ngược lại, những sinh cảnh bị tàn phá để làm nương rẫy hoặc khai thác lâm sản thì thích hợp cho sự tồn tại và phát triển của quần thể muỗi Các nghiên cứu dịch tễ học cho thấy sinh cảnh cho

sự phát triển của sốt rét tập trung vào 4 nhân tố chính là khí hậu, độ che phủ thực vật, địa hình và thuỷ văn

Nghiên cứu các nhân tố môi trường tự nhiên ảnh hưởng đến bệnh sốt rét thực chất là nghiên cứu các nhân tố đó liên hệ với véc tơ của bệnh Cũng giống như mọi loài sinh vật khác, muỗi Anopheles được đặc trưng bởi một môi trường sống nhất định (hay sinh cảnh) với những giới hạn của nhiệt độ,

độ ẩm, độ cao Do vậy, khi nghiên cứu các yếu tố môi trường này ta có thể phát hiện ra ổ muỗi và những nơi có thể xuất hiện ổ muỗi, từ đó, có biện pháp tiêu diệt và phòng, chống phù hợp

4.3.2 Các yếu tố kinh tế - xã hội

Khi nghiên cứu điều kiện sinh cảnh của con người, tập trung chủ yếu nghiên cứu các điều kiện kinh

tế xã hội, tập quán sinh sống có ảnh hưởng đến sự lan truyền của dịch bệnh Trong đó, bao gồm các yếu tố sau: yếu tố vệ sinh (kiến thức của cộng đồng về sức khoẻ và sử dụng thuốc, kiến thức về vệ sinh phòng dịch), yếu tố chính trị (quy hoạch kinh tế xã hội tại địa phương trong hiện tại và tương lai, sự trợ giúp của chính quyền và các tổ chức), yếu tố kinh tế (bao gồm thu nhập, việc làm và tập quán sinh sống, cơ sở hạ tầng), yếu tố tâm lý, văn hoá (trình độ dân trí, tâm lý dân chúng trước vấn

đề vệ sinh), yếu tố dân số (mật độ, cơ cấu dân số theo độ tuổi, gia tăng dân số tự nhiên và gia tăng

cơ học)

4.4 Xây dựng CSDL các yếu tố ảnh hưởng đến nguy cơ mắc bệnh sốt rét

Dựa trên việc xác định các yếu tố ảnh hưởng đến dịch bệnh sốt rét và cơ sở dữ liệu thu thập được,

đề tài xây dựng 15 lớp thông tin đầu vào để xây dựng bản đồ nguy cơ sốt rét tại tỉnh Đăk Nông (Hình 3) Các lớp thong tin bao gồm (1) Độ cao địa hình – Elevation; (2) Hướng dốc – Aspect; (3)

Trang 8

Độ dốc – Slope; (4) Lượng mưa – Rain; (5) Nhiệt độ - Temperature; (6) Độ ẩm – Humidity; (7) Nhiệt độ bề mặt – Land Surface Temperature (LST); (8) NDMI; (9) NDVI; (10) Gió – Wind; (11) Khoảng cách đến khu dân cư – Distance to residence; (12) Khoảng cách đến đường giao thông – Distance to road; (13) Khoảng cách đến vừng đất ngập nước – Distance to Wetland; (14) Khoảng cách đến sông – Distance to river (15) Khoảng cách đến rừng – Distance to forest Các lớp thông tin được mô tả trong

Trang 9

9

Hình 3: Dữ liệu (biến) sử dụng trong xây dựng bản đồ nguy cơ

Trước khi xây dựng mô hình toán, 15 lớp thông tin được so sánh cặp để đánh giá hệ số tương quan, kết quả đánh giá chỉ đã lọc bỏ 5 biến (do có giá trị tuyệt đối của hệ số tương quan > 0.7) và giữ lại

10 biến để thành lập bản đồ nguy cơ sớt rét Hệ số tương quan giữa 10 biến được sử dụng được thể hiện trong Bảng 1

Bảng 1: Hệ số tương quan giữa các biến

NDVI Aspect DEM Landuse Rain Dist to

Resident

Dist to River

Dist to Road Slope Temp NDVI 1 0.022 -0.048 -0.242 -0.046 0.358 -0.034 0.301 0 0.083

Aspect - 1 0.008 -0.018 0.015 0.013 0.05 -0.008 0 -0.007

Landuse - - - 1 -0.07 -0.374 0.093 -0.232 0 0.035

Rain - - - - 1 -0.148 -0.312 0.041 0 -0.157

Dist to

Resident - - - - - 1 0.01 0.501 0.001 0.048 Dist to

Resident - - - - - - 1 0.06 0 0.263 Dist to

Resident - - - - - - - 1 0.001 0.153 Dist to

Resident - - - - - - - - 1 0 Temp - - - 1

Thông thường các biến số được do ở các đơn vị khác nhau, nên cần được chuẩn hóa về cùng một

đơn vị trước khi xây dựng mô hình Hiện có hai phương pháp chuẩn hóa (a) Phân lớp dựa trên phân

phối tự nhiên của dữ liệu, và gán các khoảng dữ liệu các lớp 1,2,3… Đây là phương pháp chuyển từ

dạng liên tục sang dạng rời rạc Bảng 2 (b) Chuẩn hóa dữ liệu về cùng 1 khoảng từ [0 – 1] sử dụng

công thức

Trong nghiên cứu này, cả 2 phương pháp được sử dụng trong thàn lập bản đồ nguy cơ sốt rét

Bảng 2: Phân lớp các biến sử dụng trong xây dựng bản đồ nguy cơ bằng thuật toán Natural break algorithm

TT Lớp dữ liệu Phân lớp

1 Landuse (Class 1) TTN, (2) SMN, (3) RSX, (4) RPH, (5) RDD, (6) OTC, (7) NTS, (8) NKH, (9)

CSK, 10) CSD, (11) CLN, (12) CHN (13), CDG, (14) CCC

2 Distance to

Residence (m)

(1) 0 - 1,131; (2) 1,132 - 2,880; (3) 2,881 - 4,731; (4) 4,732 - 6,788; (5) 6,789 - 9,051; (6) 9,052 - 11,620; (7) 11,630 - 14,710; (8) 14,720 - 18,920; (9) 18,930 - 26,230

3 Distance to

Road (m)

(1) 0 - 440.2; (2) 440.3 - 1,064; (3) 1,065 - 1,798; (4) 1,799 - 2,641; (5) 2,642 - 3,595; (6) 3,596 - 4,659; (7) 4,660 - 5,833; (8) 5,834 - 7,154; (9) 7,155 - 9,355

4 NDVI (1) -1.06 - -0.433; (2) -0.432 - -0.0101; (3) -0.01 - 0.256;(4) 0.257 – 0.404; (5) 0.405 -

0.514; (6) 0.515 - 0.608; (7) 0.609 - 0.702; (8) 0.703 - 0.796; (9) 0.797 - 0.936

Trang 10

5 Slope (O) (1) 0 - 4.81; (2) 0 - 4.81; (3) 8.66 - 12.3; (4) 12.4 - 15.9; (5) 16 - 19.7; (6) 19.8 - 23.8; (7)

23.9 - 28.4; (8) 28.5 - 34.6; (9) 34.7 - 61

6 Distance to

River (m)

(1) 0 - 165.8; (2) 165.9 - 372.1; (3) 372.2 - 623.6; (4) 623.7 - 944.7; (5) 944.8 - 1,379; (6) 1,380 - 1,977; (7) 1,978 - 2,797; (8) 2,798 - 3,840; (9) 3,841 - 5,974

7 DEM (1) 119 - 388; (2) 389 - 511; (3) 512 - 620; (4) 621 - 729; (5) 730 - 831; (6) 832 - 955; (7)

956 - 1,150; (8) 1,160 - 1,420; (9) 1,430 - 1,970

8 Rain (1) 140.3 - 144.3; (2) 144.4 - 150.5; (3) 150.6 - 157; (4) 157.1 - 162; (5) 162.1 - 167; (6)

162.1 - 167; (7) 172.1 - 176.8; (8) 176.9 - 181.8; (9) 181.9 - 189.4

9 Temp (1) 23.3 – 24.0; (2) 24.1 – 25.0; (3) 25.1 - 26; (4) 26.1 – 27.0; (5) 27.1 – 28.0;

10 Aspect (1) Flat; (2) North; (3) Northeast; (4) East; (5) Southeast; (6) South; (7) Southwest; (8)

West; (9) Northwest (10) North Các yếu tố sau đó được đánh giá dựa trên so sánh với vị trí của các điểm mẫu bệnh thu thập tại thực địa Trọng số được đánh giá bằng thuật toán Information Gain với khoảng giá trị [0 – 1], trong đó

biến số ảnh hưởng lớn có giá trị cao và ngược lại Dựa trên đánh giá (Bảng 3), yếu tố sử dụng đất

(Landuse) có trọng số cao nhất, tiếp theo là khoảng cách đến khu dân cư, đường giao thông và chỉ

số thưc vật NDVI Đánh giá này cho thấy tính tương đồng trong các nghiên cứu trước đây, trong đó tình trạng lan truyền bệnh chịu ảnh hưởng lớn của các yếu tố xã hội và lớp phủ thực vật

Bảng 3: Hệ số tác động của các biến đến nguy cơ sốt rét

Yếu tố (biến) Xếp hạng Yếu tố (biến) Xếp hạng Yếu tố (biến) Xếp hạng

4.5 Thành lập bản đồ nguy cơ sốt rét tại tỉnh Đăk Nông

4.5.1 Bản đồ nguy cơ dựa trên các thuật toán Ensemble

Kết quả thử nghiệm của mô hình được đánh giá thông qua các chỉ số như RMSE, MAE, Kappa và AUC Kết quả thể hiện trong Hình 4 Các chỉ số đánh giá độ chính xác của mô hình tể hiện trong Bảng 4 Trong đó thuật toán Random Subspace có giá trị AUC cao nhất, tiếp sau đó là Adaboost và Bagging

Hình 4: Đường cong ROC và giá trị AUC của các mô hình thử nghiệm Bảng 4: Training results of six models by using ten-fold cross-validation

Classifiers RMSE MAE Kappa Overall Accuracy

Ngày đăng: 09/11/2019, 00:15

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm