Figure 1: Hình ảnh minh họa virus Covid-19 Y tế là một trong những ngành cần đến sự trợ giúp của công nghệ thông tin nhiều nhất, do số lượng dân số gia tăng và tình hình dịch bệnh rất p
Trang 1KHÓA LUẬN TỐT NGHIỆP
XÂY DỰNG ỨNG DỤNG SỔ TAY COVID-19
Building Handbook Covid19 Application
KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM
Trang 2KHÓA LUẬN TỐT NGHIỆP
XÂY DỰNG ỨNG DỤNG SỔ TAY COVID-19
Building Handbook Covid19 Application
KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM
GIẢNG VIÊN HƯỚNG DẪN PGS.TS TRẦN SƠN HẢI ThS HUỲNH NGUYỄN KHẮC HUY
Trang 3THÔNG TIN HỘI ĐỒNG CHẤM KHÓA LUẬN TỐT NGHIỆP
Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số ……… ngày của Hiệu trưởng Trường Đại học Công nghệ Thông tin
1 Chủ tịch
2 Thư ký
3 Ủy viên
4 Ủy viên
Trang 4ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT
NAM Độc Lập - Tự Do - Hạnh Phúc
TP HCM, ngày… tháng… năm……
NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ HƯỚNG DẪN) Tên khóa luận:
XÂY DỰNG ỨNG DỤNG SỔ TAY COVID-19
Th.S Huỳnh Nguyễn Khắc Huy
Đánh giá Khóa luận
1 Về cuốn báo cáo:
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một số nhận xét về hình thức cuốn báo cáo:
Trang 6ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT
NAM Độc Lập - Tự Do - Hạnh Phúc
TP HCM, ngày… tháng… năm……
NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ PHẢN BIỆN)
Tên khóa luận:
XÂY DỰNG ỨNG DỤNG SỔ TAY COVID-19
Đánh giá Khóa luận
1 Về cuốn báo cáo:
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một số nhận xét về hình thức cuốn báo cáo:
Trang 7………
………
………
3 Về chương trình ứng dụng: ………
………
………
………
4 Về thái độ làm việc của sinh viên: ………
………
………
………
Đánh giá chung: ………
………
………
………
Điểm cho sinh viên: Hà Huy Khôi:………/10
Người nhận xét
(Ký tên và ghi rõ họ tên)
Trang 8LỜI CẢM ƠN
Lời đầu tiên, tôi xin gửi lời cảm ơn đến quý Thầy Cô khoa Công Nghệ Phần Mềm đã tận tình giảng dạy, truyền đạt những kiến thức quý báu cho tôi trong thời gian học đại học
và tạo điều kiện cho tôi thực hiện luận văn này
Cảm ơn PGS.TS Trần Sơn Hải và ThS Huỳnh Nguyễn Khắc Huy, những người đã trực tiếp hướng dẫn khóa luận Trong quá trình thực hiện, thầy đã tận tình hướng dẫn, giúp tôi giải quyết các vấn đề nảy sinh trong quá trình làm đề tài
Cuối cùng, tôi xin được gửi lời cảm ơn tới gia đình là những người động viên và hỗ trợ giúp tôi những lúc khó khăn Mặc dù tôi đã nỗ lực hết sức để hoàn thành luận văn, song vẫn không thể tránh khỏi những thiếu sót Vì vậy, tôi rất mong nhận được những đóng góp quý báu của quý Thầy Cô và các bạn
Xin chân thành cảm ơn
Trang 9LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của tôi Các số liệu và kết quả nêu bên trong luận văn là trung thực và chưa từng được công bố trong bất kỳ công trình nào khác, ngoại trừ các tài liệu tham khảo
TP Hồ Chí Minh, tháng … năm 2021
Hà Huy Khôi
Trang 10MỤC LỤC
CHƯƠNG 1 TỔNG QUAN 2
1.1 Động lực nghiên cứu 2
1.2 Mục tiêu đề tài 4
1.3 Đối tượng và phạm vi nghiên cứu 4
1.4 Các tính năng nổi bật 5
CHƯƠNG 2 GIỚI THIỆU CÔNG NGHỆ 6
2.1 ReactJs 6
2.2 React Native 8
2.3 Firestore database 9
2.4 Google Cloud API 11
CHƯƠNG 3 MÔ HÌNH LIGHTGBM 13
3.1 Giới thiệu mục đích của bài toán và phương pháp tiếp cận 14
3.2 Cấu trúc mô hình và cơ chế dự đoán của mô hình 16
CHƯƠNG 4 ỨNG DỤNG SỔ TAY COVID-19 17
4.1 Phân tích, thiết kế ứng dụng 17
4.1.1 Mô tả nghiệp vụ 17
4.1.2 Use case 17
4.1.3 Sơ đồ tuần tự 19
4.1.4 Sơ đồ lớp 24
4.1.5 Sơ đồ trạng thái 26
4.1.6 Sơ đồ thành phần 27
4.1.7 Thiết kế giao diện 28
4.2 Thực hiện 42
CHƯƠNG 5 TỔNG KẾT VÀ HƯỚNG PHÁT TRIỂN 43
Kết quả đạt được 43
Trang 115.1 Thuận lợi và khó khăn 44
5.1.1 Thuận lợi 44
5.1.2 Khó khăn 44
5.2 Hướng phát triển 44
TÀI LIỆU THAM KHẢO 45
Bài báo khoa học 45
Mã nguồn mở 47
Tài liệu khác: 47
Trang 12DANH MỤC TỪ TIẾNG ANH
Machine Learning Học máy
API Application Programming Interface – phương thức trung gian kết
nối các ứng dụng với server Mapping Ánh xạ từ 𝐴∗ → 𝐵∗ với 𝑓: 𝐴 → 𝐵
Histogram Đồ thị biểu thị phân phối màu của ảnh
GAN Generative Adversarial Network, mạng đối nghịch tạo sinh CNN Convolutional Neural Network mạng neural tích chập
Model collapse Mô hình sụp đổ Fake image do Generator sinh ra giống hệt nhau
khi generator tìm ra một điểm dữ liệu đặc biệt mà tại điểm đó discriminator không thể phân biệt được Toàn bộ mô hình không phát triển mặc dù tiếp tục training
Loss function Hàm tính độ lỗi của mô hình
Metric Số liệu đánh giá mô hình
SUP Least upper bound, cận trên nhỏ nhất
Fine - tuning Quy trình đánh giả, thử nghiệm và tìm kiếm và lặp lại cho đến khi
tìm được hyperparameter tối ưu
Trang 13DANH MỤC BẢNG, HÌNH VẼ
Hình ảnh minh họa virus Covid-19 2
Hình 2.1: ReactJs 6
Hình 2.2: React Native 8
Hình 2.3: Cloud Firestore 10
Hình 2.4: Google Cloud Platform 12
Hình 4.1: Sơ đồ Use case 18
Hình 4.2 Sơ đồ tuần tự Use case “Quản lý bài đăng” 19
Hình 4.3 Sơ đồ tuần tự Use case “Chuẩn đoán tỉ lệ mắc bệnh” 21
Hình 4.4 Sơ đồ tuần tự Use case “Thêm thể loại bài đăng” 22
Hình 4.5 Sơ đồ lớp của ứng dụng 24
Hình 4.6 Sơ đồ trạng thái Use case “Tạo mới bài đăng” 26
Hình 4.7 Sơ đồ trạng thái Use case “Chuẩn đoán bệnh theo triệu chứng” 27
Hình 4.8 Sơ đồ các thành phần trong ứng dụng 27
Hình 4.9 Sơ đồ các màn hình của ứng dụng 28
Hình 4.10 Màn hình khởi động của ứng dụng 29
Hình 4.11 Thông điệp 5K của Bộ y tế được trình bày dưới dạng onboarding page 33
Hình 4.12 Màn hình trang chủ 34
Hình 4.13 Top 10 quốc gia chịu ảnh hưởng nặng nhất 35
Hình 4.14 Biểu đồ về thông tin dịch bệnh ở Việt Nam 36
Hình 4.15 Trang tin tức của ứng dụng 37
Hình 4.16 Bản đồ của ứng dụng 38
Hình 4.17 Trang đăng nhập của web quản lý ứng dụng 39
Hình 4.18 Màn hình chính của web quản lý 39
Hình 4.19 Thông tin chi tiết của bài đăng 40
Hình 4.20 Form nhập thêm bài đăng 40
Hình 4.21 Form chỉnh sửa bài đăng 41
Hình 4.22 Màn hình hiển thị danh sách thể loại 41
Hình 4.23 Màn hình hiển thị form them thể loại 41
Hình 4.24 Màn hình hiển thị form chỉnh sửa thể loại 42
Trang 14TÓM TẮT KHÓA LUẬN Khóa luận Xây dựng sổ tay Covid gồm 05 chương:
Chương 1: Giới thiệu về đề tài, động lực nghiên cứu, mục tiêu đề tài Đối
tượng và phạm vi nghiên cứu, đưa ra những tính năng mới so với các ứng dụng khác
Chương 2: Trình bày các kiến thức nền tảng liên quan đến ứng dụng Chương 3: Trình bày chi tiết kiến thức, áp dụng máy học và công nghệ liên
quan đến ứng dụng
Chương 4: Trình bày chi tiết quy trình xây dựng hệ thống, từ xác định và
phân tích yêu cầu bài toán cho đến xây dựng CSDL, cuối cùng là xây dựng giao diện cho ứng dụng
Chương 5: Kết luận, rút ra được các ưu nhược điểm của ứng dụng và
hướng phát triển trong tương lai
Trang 15CHƯƠNG 1 TỔNG QUAN
1.1 Động lực nghiên cứu
Covid-19 gây ra rất nhiều ảnh hưởng đến toàn thế giới nói chung và đến các quốc gia nói riêng Nó không chỉ khiến hàng trăm triệu người phải thiệt mạng mà còn ảnh hưởng rất lớn đến kinh tế, chính trị,… Việc cung cấp cho người dùng những thông tin chính xác nhất, cần thiết nhất cho mọi người cách phòng tránh, cách bảo vệ mình khỏi dịch bệnh là hết sức cần thiết
Figure 1: Hình ảnh minh họa virus Covid-19
Y tế là một trong những ngành cần đến sự trợ giúp của công nghệ thông tin nhiều nhất,
do số lượng dân số gia tăng và tình hình dịch bệnh rất phức tạp, trong khi số lượng bác
sĩ, y tá không tăng theo nên không thể đáp ứng nhu cầu xã hội, thì việc tạo ra ứng dụng giúp di động cho các bác sĩ, y tá có thể cung cấp được thông tin dịch bệnh, truy vết dịch tễ cho người dân được thực hiện nhanh hơn, giải phóng được sức lao động của các bác sĩ, y tá
Trang 16Điện thoại di động đang trở thành một vật dụng không thể thiếu đối với cuộc sống hiện đại ngày nay, mỗi người ai cũng sẽ cố gắng có cho mình một chiếc “dế yêu” để sử dụng Vì vậy, việc tạo ra một ứng dụng di động sẽ giúp cho việc sử dụng được dễ dàng, tiện lợi hơn cho người dùng
Chính vì những lí do đó, mà tôi quyết định làm đề tài tốt nghiệp: “Ứng dụng sổ tay Covid-19
Trang 171.2 Mục tiêu đề tài
Mục tiêu đề tài là tạo ra một ứng dụng di động cho người dùng sử dụng Sử dụng các API có sẵn để lấy số liệu, sử dụng model LGBM để train mô hình chuẩn đoán khả năng nhiễm bệnh thông qua các triệu chứng, sử dụng firebase để lưu trữ dữ liệu như cái bài đăng, luôn cập nhật liên tục để giúp người dùng luôn được tiếp cận thông tin một cách nhanh chóng nhất
1.3 Đối tượng và phạm vi nghiên cứu
Khoá luận này hướng đến nghiên cứu các đối tượng sau:
− Các công nghệ:
+ Front-end: ReactJs (admin page), React Native (client side)
+ Back-end: Flask (Dùng để gọi API model)
+ Database: Firestore database
+ Mô hình Lightgbm
+ IDE: Visual Studio Code, Android Studio
− Đối tượng trong phạm vị đề tài hướng đến:
+ Tất cả những ai đã, đang và sẽ sử dụng thiết bị di động
Khóa luận hướng đến phạm vi nghiên cứu sau:
Phạm vi môi trường: Mobile đối với Client, Web đối với Admin
Phạm vi chức năng:
− Đối với client:
+ Cung cấp cho người dùng mọi thông tin cần thiết về Covid-19 trên thế giới
nói chung và Việt Nam nói riêng thông qua số liệu & biểu đồ
+ Cung cấp cho mọi người những thông tin chính xác nhất, đầy đủ nhất
+ Chuẩn đoán tỷ lệ nhiễm bệnh dựa vào các thông tin mà người dùng cung
Trang 18cấp
+ Tìm các trung tâm y tế, bệnh viện gần nhất dựa vào vị trí của người dùng
− Đối với Admin:
+ Cung cấp cho người quản lý có thể quản lý bài đăng
+ Cung cấp cho người quản lý thể loại bài đăng
− Thêm vào trang tin tức
− Tích hợp Google Cloud API vào trong ứng dụng
− Áp dụng máy học vào ứng dụng để chuẩn đoán nhiễm bệnh
Trang 19CHƯƠNG 2 GIỚI THIỆU CÔNG NGHỆ
2.1 ReactJs
Figure 2: Hình 2.1: ReactJs
React là thư viện JavaScript phổ biến nhất để xây dựng giao diện người dùng (UI) Nó cho tốc độ phản hồi tuyệt vời khi user nhập liệu bằng cách sử dụng phương pháp mới
để render trang web
Components của công cụ này được phát triển bởi Facebook Nó được ra mắt như một công cụ JavaScript mã nguồn mở vào năm 2013
Ở ứng dụng này, ReactJs sẽ đóng vai trò để thiết kế admin page
Một số lợi ích khi sử dụng ReactJs:
1 Dễ sử dụng:
React là một thư viện GUI nguồn mở JavaScript tập trung vào một điều cụ thể; hoàn thành nhiệm vụ UI hiệu quả Nó được phân loại thành kiểu “V” trong mô
Trang 20hình MVC (Model-View-Controller)
Bởi vì sử dụng Javascript, nên nếu như bạn đã có sẵn cho mình kiến thức về js thì sẽ không có gì khó khăn khi bạn làm quen với ReactJs
2 Viết component dễ dàng hơn:
React component dễ viết hơn vì nó sử dụng JSX, mở rộng cú pháp tùy chọn cho JavaScript cho phép bạn kết hợp HTML với JavaScript
JSX là một sự pha trộn tuyệt vời của JavaScript và HTML Nó làm rõ toàn bộ quá trình viết cấu trúc trang web Ngoài ra, phần mở rộng cũng giúp render nhiều lựa chọn dễ dàng hơn
JSX có thể không là phần mở rộng cú pháp phổ biến nhất, nhưng nó được chứng minh
là hiệu quả trong việc phát triển components đặc biệt hoặc các ứng dụng có khối lượng lớn
3 Hiệu suất tốt hơn với Virtual DOM:
React sẽ cập nhật hiệu quả quá trình DOM (Document Object Model – Mô hình đối tượng tài liệu) Như bạn có thể biết, quá trình này có thể gây ra nhiều thất vọng trong các dự án ứng dụng dựa trên web May mắn là React sử dụng virtual DOMs, vì vậy bạn
có thể tránh được vấn đề này
Công cụ cho phép bạn xây dựng các virtual DOMs và host chúng trong bộ nhớ Nhờ vậy, mỗi khi có sự thay đổi trong DOM thực tế, thì virtual sẽ thay đổi ngay lập tức
Hệ thống này sẽ ngăn DOM thực tế để buộc các bản cập nhật được liên tục Do đó, tốc
độ của ứng dụng sẽ không bị gián đoạn
4 Thân thiện với SEO:
React cho phép bạn tạo giao diện người dùng có thể được truy cập trên các công cụ tìm kiếm khác nhau Tính năng này là một lợi thế rất lớn vì không phải tất cả các khung JavaScript đều thân thiện với SEO
Trang 21Ngoài ra, vì React có thể tăng tốc quá trình của ứng dụng nên có thể cải thiện kết quả SEO Cuối cùng tốc độ web đóng một vai trò quan trọng trong tối ưu hóa SEO
Tuy nhiên, bạn cần lưu ý rằng React chỉ là một thư viện JavaScript Nghĩa là nó không thể tự làm mọi thứ Sử dụng các thư viện bổ sung có thể cần thiết cho các mục tiêu quản lý, định tuyến và tương tác
2.2 React Native
React Native là một framework do công ty công nghệ nổi tiếng Facebook phát triển nhằm mục đích giải quyết bài toán hiệu năng của Hybrid và bài toán chi phí khi mà phải viết nhiều loại ngôn ngữ native cho từng nền tảng di động
Figure 3: Hình 2.2: React Native
Trang 22Hybrid App là gì?
Hybrid App là sự kết hợp giữa ứng dụng Web và ứng dụng mobile Tức là chúng vừa
có thể cài đặt lên điện thoại người dùng giống như là những ứng dụng Native bình thường và bạn có thể tìm thấy chúng trên chợ ứng dụng nhưng khó có thể nhận ra đâu
là ứng dụng Native và đâu là ứng dụng Hybrid thường thì người dùng sẽ không để ý quá nhiều
Ưu và nhược điểm của React Native:
Ưu điểm:
1 Hiệu quả về mặt thời gian khi mà bạn muốn phát triển một ứng dụng nhanh chóng
2 Hiệu năng tương đối ổn định
3 Ứng dụng tin cậy và ổn định
4 Xây dựng cho nhiều hệ điều hành khác nhau với ít native code nhất
5 Trải nghiệm người dùng tốt hơn là hybrid app
6 Cộng đồng phát triển mạnh
Nhược điểm:
1 Vẫn đòi hỏi native code
2 Hiệu năng sẽ thấp hơn với app thuần native code
3 Khả năng tùy biến cũng không thực sự tốt đối với một vài module
4 Bảo mật không cao do dựa trên JS
2.3 Cloud Firestore
Cloud Firestore là cơ sở dữ liệu mới của Firebase phát triển dành cho ứng dụng di động Nó là sự kế thừa của Realtime Database với mô hình dữ liệu mới và trực quan hơn Cloud Firestore phong phú hơn, nhanh hơn và có khả năng mở rộng siêu việt hơn
so với Realtime Database
Giống như Firebase Realtime Database, nó giúp dữ liệu của bạn đồng bộ hóa trên các ứng dụng client thông qua việc đăng ký realtime và cung cấp hỗ trợ ngoại tuyến cho thiết bị di động và web
Trang 23Figure 4: Hình 2.3: Cloud Firestore
Tính năng chính của Cloud Firestore:
1 Tính linh hoạt: Cloud Firestore hỗ trợ các cấu trúc dữ liệu linh hoạt, phân
cấp dữ liệu Lưu trữ dữ liệu của bạn trong các document , được tổ chức
thành các collection Các document có thể chứa các đối tượng phức tạp
2 Truy vấn tượng trưng: Bạn có thể sử dụng các truy vấn để truy xuất các
document riêng lẻ hoặc để truy xuất tất cả các document trong collection
khớp với các tham số truy vấn của bạn Các truy vấn của bạn có thể bao
gồm nhiều bộ lọc, kết hợp giữa bộ lọc và sắp xếp
3 Cập nhật thời gian thực: Cloud Firestore sử dụng đồng bộ hóa dữ liệu để
cập nhật dữ liệu trên mọi thiết bị được kết nối Nó cũng được thiết kế để
thực hiện các truy vấn tìm nạp một lần
4 Hỗ trợ offline: Cloud Firestore lưu trữ dữ liệu tại local, vì vậy ứng dụng có
thể viết, đọc, nghe và truy vấn dữ liệu ngay cả khi thiết bị ngoại tuyến Khi
thiết bị trở lại trực tuyến, Cloud Firestore sẽ đồng bộ hóa mọi thay đổi cục
bộ lên Cloud Firestore
Trang 245 Khả năng mở rộng: Mang đến khả năng từ Google Cloud Platform thiết kế
để sử dụng cơ sở dữ liệu khó khăn nhất từ các ứng dụng lớn nhất thế giới
Cách hoạt động của firestore database:
Cloud Firestore là một cơ sở dữ liệu NoQuery được lưu trữ trên đám mây mà các ứng dụng IOS, Android, Web có thể truy cập trực tiếp thông qua SDK.Cloud Firestore cũng
có sẵn trong Node.js, Java, Python và Go SDKs, REST và RPC APIs
Được tổ chức theo mô hình dữ liệu NoQuery của Cloud Firestore, dữ liệu lưu trong các document ánh xạ tới các giá trị Các document này được lưu trữ trong các collection cho bạn tổ chức dữ liệu và thực hiện truy vấn
Bảo vệ quyền truy cập vào dữ liệu của bạn trong Cloud Firestore với Firebase Authentication cho Android, iOS và JavaScript hoặc nhận dạng và quản lý truy cập (IAM)
2.4 Google Cloud API
Google Cloud hay còn gọi là Google Cloud Platform (GCP) chính là một nền tảng của
kỹ thuật điện toán đám mây cho phép các cá nhân, tổ chức, các doanh nghiệp, các cơ quan có thể xây dựng, phát triển, và hoạt động các ứng dụng của mình trên hệ thống phần mềm do google tạo ra Các ứng dụng rất phổ biến hiện nay được mọi người sử dụng rất nhiều như: Trình duyệt Chrome, ứng dụng bản đồ Google Map, Google Apps, kênh Youtube…
Google Cloud cung cấp tất cả các giải pháp quản lý cho doanh nghiệp, giúp doanh nghiệp có thể phát triển hệ thống công nghệ của mình một cách chính xác, hiện đại Bên cạnh đó, GC còn giúp người dùng và doanh nghiệp giải quyết các vấn đề như: Developer (phát triển), Management (Quản lý), Computer Engine, Mobile, Storage, Big Data…
Một điểm khác biệt nữa mà GC mang lại so với các dịch vụ đám mây khác đó chính là
hệ thống DataCenter luôn ổn định và có độ bảo mật dữ liệu cực cao, giúp bảo vệ dữ
Trang 25liệu người dùng và khách hàng trước sự dòm ngó và xâm nhập trái phép của các hacker công nghệ
Figure 5: Hình 2.4: Google Cloud Platform
Google Cloud cung cấp những sản phẩm chính sau đây:
1 Big Data: BigQuery, Cloud Dataproc, Cloud Dataflow…
2 Services: Translate API, Prediction API…
3 Storage: Cloud Storage, Cloud Datastore, Cloud SQL…
4 Compute: App Engine, Compute Engine, …
Trang 26CHƯƠNG 3 MÔ HÌNH LIGHTGBM
Đại dịch virus corona năm 2019 (COVID-19) do SARV-CoV-2 gây ra là mối đe dọa nghiêm trọng và khẩn cấp đối với sức khỏe của toàn thế giới Đợt bùng phát vào đầu tháng 12 năm 2019 ở tỉnh Hồ Bắc của Trung Quốc đã lan rộng ra toàn thế giới Tính đến tháng 10 năm 2020, tổng số bệnh nhân được xác nhận mắc bệnh đã vượt quá 180.000.000 ở hơn 180 quốc gia, mặc dù số người mắc bệnh có lẽ cao hơn nhiều Hơn 3.000.000 người đã chết vì COVID-19
Tầm soát hiệu quả cho phép chẩn đoán COVID-19 nhanh chóng và hiệu quả, đồng thời
có thể giảm nhẹ gánh nặng cho hệ thống chăm sóc sức khỏe Các mô hình dự đoán kết hợp một số tính năng để ước tính nguy cơ lây nhiễm đã được phát triển, với hy vọng hỗ trợ nhân viên y tế trên toàn thế giới trong việc phân loại bệnh nhân, đặc biệt trong bối cảnh nguồn lực chăm sóc sức khỏe hạn chế Bộ Y tế Israel đã công bố công khai dữ liệu của tất cả các cá nhân đã được xét nghiệm SARS-CoV-2 thông qua xét nghiệm RT-PCR của một miếng gạc mũi họng11 Trong những tháng đầu tiên của đại dịch COVID-19 ở Israel, tất cả các xét nghiệm chẩn đoán COVID-19 trong phòng thí nghiệm đều được thực hiện theo các tiêu chí do Bộ Y tế Israel xác định Mặc dù có thể thay đổi, các tiêu chí được thực hiện trong thời gian nghiên cứu bao gồm sự hiện diện
và mức độ nghiêm trọng của các triệu chứng lâm sàng, khả năng tiếp xúc với những cá nhân được xác nhận có COVID-19, các khu vực địa lý nhất định và nguy cơ biến chứng nếu bị nhiễm Tất cả các trường hợp COVID-19 âm tính và dương tính, tập dữ liệu này đã được xác nhận thông qua xét nghiệm RT-PCR11
Do đó, tôi đề xuất một mô hình học máy dự đoán nhiễm trùng SARS-CoV-2 dương tính trong xét nghiệm RT-PCR bằng cách hỏi tám câu hỏi cơ bản Mô hình được đào tạo dựa trên dữ liệu của tất cả các cá nhân ở Israel đã được kiểm tra SARS-CoV-2
Trang 27trong những tháng đầu tiên của đại dịch COVID-19 Do đó, mô hình của chúng tôi có thể được triển khai trên toàn cầu nhằm sàng lọc hiệu quả và ưu tiên xét nghiệm vi rút trong dân số nói chung
3.1 Giới thiệu mục đích của bài toán và phương pháp tiếp cận
Dựa trên mục đích của ứng dụng, cần phải có chức năng chẩn đoán và dự đoán tỉ lệ nhiễm bệnh của bệnh nhân khi tiếp nhận thông tin về các triệu chứng Để giải quyết cho bài toán dự đoán, tập trung nghiên cứu và áp dụng các phương pháp học máy (machine learning) với mục tiêu tạo ra một mô hình có thể trả về xác suất nhiễm bệnh khi nhận vào các triệu chứng
Các cơ chế gây bệnh của SARS-Cov-2, các triệu chứng liên quan là chủ đề của nhiều nghiên cứu đang diễn ra Mô hình tôi xây dựng cung cấp sàng lọc xét nghiệm COVID-
19 ban đầu dựa trên các dấu hiệu và triệu chứng lâm sàng đơn giản
Bộ Y tế Israel đã công bố công khai dữ liệu về những cá nhân được xét nghiệm CoV-2 thông qua xét nghiệm RT-PCR của một mẫu tăm bông mũi họng Bộ dữ liệu chứa các bản ghi ban đầu, hàng ngày, của tất cả những người dân đã được kiểm tra COVID-19 trên toàn quốc Ngoài ngày và kết quả xét nghiệm, có nhiều thông tin khác nhau, bao gồm các triệu chứng lâm sàng, giới tính và dấu hiệu nhị phân về việc liệu cá nhân được xét nghiệm có từ 60 tuổi trở lên hay không Dựa trên những dữ liệu này, tôi
SARS-đã phát triển một mô hình dự đoán kết quả xét nghiệm COVID-19 bằng cách sử dụng tám đặc điểm nhị phân: giới tính, 60 tuổi trở lên, tiếp xúc đã biết với người bị nhiễm bệnh và năm triệu chứng lâm sàng ban đầu và kết quả trả về sẽ là tỉ lệ phần trăm nhiễm COVID-19
Trang 28Sau quá trình nghiên cứu, tôi nhận ra bài toán có thể được giải quyết bởi các thuật toán học máy khác nhau và phổ biến hiện nay như hồi quy logic (logistic regression), cây quyết định (decision tree), naiva bayes, mạng noron nhân tạo (natural network),…
Trang 293.2 Cấu trúc mô hình và cơ chế dự đoán của mô hình
Bảng 3.1 Đặc điểm của mô hình và các triệu chứng được sử dụng trong mô hình
Mô hình được huấn luyện trên tập dữ liệu bao gồm 99.232 mẫu, trong đó có 90.839 mẫu
âm tính (nagative) và 8393 mẫu dương tính (positive) Có tất cả bao gồm 8 đặc điểm bao gồm giới tính (nam, nũ), số tuổi trên 60 (true, false), tiếp xúc với người bị nhiễm bệnh
(true, false) và 5 triệu chứng lâm sàng ban đầu (ho, cảm cúm, đau họng, khó thở và đau
đầu)
Dữ liệu sẽ được chuẩn hóa từ dạng text sang một mảng số thực để đưa vào mô hình (Ví
dụ, tương ứng với bộ dữ liệu (nam, trên 60: true, ho: true, cảm cúm: true, đau họng: true, khó thở: true, đau đầu: true) sẽ được chuẩn hóa thành [0.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0])
Trang 30CHƯƠNG 4 ỨNG DỤNG SỔ TAY COVID-19
4.1 Phân tích, thiết kế ứng dụng
4.1.1 Mô tả nghiệp vụ
Ứng dụng cho phép người dùng xem thống kê, biểu đồ dịch bệnh trên thế giới, các quốc gia Cho phép người dùng chuẩn đoán tỉ lệ mắc bệnh cũng như xem các tin tức, bài đăng của bộ y tế hay công văn của các địa phương Ngoài ra, ứng dụng cho phép sử dụng vị trí của người dùng để tìm các bệnh viện, trung tâm y tế gần nhất và hiển thị thông tin của bệnh viện, trung tâm y tế đó nếu người dùng cần giải đáp hoặc thắc mắc
4.1.2 Use case