1. Trang chủ
  2. » Cao đẳng - Đại học

Khóa luận tốt nghiệp phân loại COVID 19 từ hình ảnh x quang bằng máy học

92 53 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 92
Dung lượng 4,92 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

• Mục tiêu: − Thực hiện khảo sát các phương pháp máy học cho bài toán phân loại COVID-19 trên ảnh X-quang.. Trong bài báo cáo này, tôi đã tiến hành khảo sát các phương pháp máy học k-Ne

Trang 1

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

KHOA CÔNG NGHỆ PHẦN MỀM

VÕ THỊ MỘT

KHÓA LUẬN TỐT NGHIỆP

PHÂN LOẠI COVID-19 TỪ HÌNH ẢNH X-QUANG BẰNG

MÁY HỌC

Classification of Coronavirus (COVID-19) from X-ray images using

Machine learning

KỸ SƯ KỸ THUẬT PHẦN MỀM

Trang 2

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

KHOA CÔNG NGHỆ PHẦN MỀM

VÕ THỊ MỘT – 16520756

KHÓA LUẬN TỐT NGHIỆP

PHÂN LOẠI COVID-19 TỪ HÌNH ẢNH X-QUANG BẰNG

Trang 3

THÔNG TIN HỘI ĐỒNG CHẤM KHÓA LUẬN TỐT NGHIỆP

Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số ……… ngày ……… của Hiệu trưởng Trường Đại học Công nghệ Thông tin

Trang 4

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC

CÔNG NGHỆ THÔNG TIN

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc Lập - Tự Do - Hạnh Phúc

TP HCM, ngày… tháng… năm……

NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP

(CỦA CÁN BỘ HƯỚNG DẪN/PHẢN BIỆN)

Tên khóa luận:

PHÂN LOẠI COVID-19 TỪ HÌNH ẢNH X-QUANG BẰNG MÁY HỌC

Đánh giá Khóa luận

1 Về cuốn báo cáo:

Số bảng số liệu _ Số hình vẽ

Số tài liệu tham khảo _ Sản phẩm

Một số nhận xét về hình thức cuốn báo cáo:

Trang 5

xếp loại Giỏi/ Khá/ Trung bình

Điểm từng sinh viên:

<Tên sinh viên 1>:……… /10

<Tên sinh viên 2>:……… /10

Người nhận xét

(Ký tên và ghi rõ họ tên)

Trang 6

LỜI CẢM ƠN

Tôi xin chân thành cảm ơn Ban giám hiệu nhà trường, quý thầy cô khoa Công nghệ phần mềm cũng như quý thầy cô khoa Khoa học máy tính trường Đại học Công nghệ Thông tin, đã tạo điều kiện và hỗ trợ nhiệt tình để tôi hoàn thành tốt

đề tài này

Tôi xin gửi lời biết ơn và sự kính trọng sâu sắc đến TS Nguyễn Tấn Trần Minh Khang và Ths Võ Duy Nguyên, đã nhiệt tình chỉ dạy, định hướng nghiên cứu trong suốt quá trình thực hiện khóa luận

Cuối cùng tôi xin cảm ơn đến gia đình, bạn bè, và những người thân đã quan tâm động viên và đóng góp ý kiến giúp đỡ tôi hoàn thành đề tài nghiên cứu này Quá trình làm khóa luận đã cho tôi thêm nhiều kiến thức bổ ích từ thực tiễn, những kinh nghiệm và kĩ năng về về học tập và nghiên cứu Và đây chính là những hành trang vững chắc cho sự nghiệp trong tương lai Từ đó để tôi học hỏi và rút kinh nghiệm cho quá trình làm việc sau này của mình

Một lần nữa xin gửi đến thầy cô, bạn bè, người thân lời cảm ơn chân thành

và tốt đẹp nhất!

Tp Hồ Chí Minh, ngày … tháng … năm 2021

Võ Thị Một

Trang 7

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ

ĐỀ CƯƠNG CHI TIẾT

Tên đề tài: Phân loại COVID-19 từ hình ảnh X-quang bằng máy học

Cán bộ hướng dẫn: TS.Nguyễn Tấn Trần Minh Khang

Thời gian thực hiện: Từ ngày 07/09/2020 đến ngày 27/12/2020

Sinh viên thực hiện:

Võ Thị Một: 16520756

Nội dung đề tài:

• Thực trạng: COVID-19 là một bệnh đường hô hấp cấp tính ở người được phát hiện vào

năm 2019, gây ra bởi vi-rút SARS-CoV-2 và chưa từng được xác định trong quá khứ Coronavirus là một họ virus lớn gây bệnh ở bệnh nhân từ cảm lạnh thông thường đến các hội chứng hô hấp tiến triển như Middle East Resporatory Syndrone (MERS-COV) và Severe Acute Respiratory Syndrone (SARS-COVS) Thế giới đang bị ảnh hưởng, nhiều người chết, nhiều quốc gia tuyên bố tình trạng khẩn cấp Việc phát hiện tình trạng bệnh sớm sẽ có ích cho quá trình điều trị của bệnh nhân Một giải pháp hữu hiệu được đề xuất giúp các bác sĩ có thể sàng lọc lâm sàng các trường hợp nhiễm bệnh là chẩn đoán bệnh

thông qua ảnh chụp X-quang

• Mục tiêu:

− Thực hiện khảo sát các phương pháp máy học cho bài toán phân loại COVID-19 trên ảnh X-quang Từ đó, có những lựa chọn phù hợp trong quá trình nghiên cứu và thực nghiệm trong quá trình phát hiện bệnh COVID-19

− Xây dựng ứng dụng chẩn đoán bệnh COVID-19 giúp hỗ trợ bác sĩ trong quá trình

sàng lọc lâm sàng các trường hợp nhiễm bệnh thông qua ảnh chụp X-quang

• Phương pháp thực hiện:

− Tổng hợp bộ dữ liệu X-quang từ nhiều nguồn dữ liệu được công bố từ các bài báo

Trang 8

− Phân tích và thống kê các kết quả thực nghiệm

− Xây dựng ứng dụng phân loại COVID-19

• Kết quả mong đợi:

− Hoàn thành việc khảo sát phân loại ảnh COVID-19 trên các phương pháp máy học

đã chọn Dựa trên kết quả thực nghiệm, chọn ra phương pháp phù hợp để làm cơ sở

xây dựng một ứng dụng phân loại COVID-19 trên ảnh X-quang

− Hoàn thành một ứng dụng phân loại hoạt động tốt với đầy đủ các chức năng đã được đề ra Ứng dụng có giao diện và chức năng thân thiện, giúp cho người dùng

cảm thấy thuận tiện trong việc sử dụng

Kế hoạch thực hiện: (thời gian thực hiện trong 16 tuần)

Phase 1: Khảo sát phân loại ảnh COVID-19 trên các phương

1 Sprint 1: Phân tích tìm hiểu các phương pháp thực hiện 07/09/2020 – 15/09/2020

1.1

- Phân tích đề tài

- Tìm hiểu các bài báo liên quan đến đề tài

- Tình hình nhiễm bệnh COVID-19 trong nước và trên thế

Trang 9

2.1

- Tìm hiểu thông tin về các bộ dữ liệu là ảnh chụp X-quang

COVID-19 trên các nguồn uy tín và đã được công bố

- Thống kê dữ liệu được gán nhãn đầy đủ ở từng thư mục

- Hoàn thành bộ dữ liệu tổng hợp COVID-19 hoàn chỉnh

4

Sprint 4: Khảo sát các phương pháp máy học phân loại

4.1

- Thực nghiệm các phương pháp phân loại đã tìm hiều để

phân loại ảnh COVID-19

- Thống kê và đánh giá kết quả thực nghiệm

Phase 2: Xây dựng ứng dụng chẩn đoán bệnh COVID-19 16/11/2020 – 27/12/2020

5

Sprint 5: Phân tích xây dựng các chức năng cho ứng

5.1 Phân tích yêu cầu cho ứng dụng

5.2 Hoàn thành các sơ đồ thể hiện các chức năng chính cho ứng

Trang 10

7 Sprint 7: Thiết kế cơ sở dữ liệu 03/12/2020 – 10/12/2020

7.1 Thiết kế cơ sở dữ liệu

7.2 Tìm hiểu các hệ quản trị cơ sở dữ liệu phù hợp với ứng

dụng

8 Sprint 8: Thực hiện xây dựng ứng dụng phân loại COVID19 trên các thiết bị di động, máy tính bảng 11/12/2020 – 27/12/2020

8.1 Tiến hành xây dựng ứng dụng với các chức năng cơ bản sử

dụng công nghệ và phương pháp đã tìm hiểu

8.2 Kiểm thử, sửa lỗi và hoàn thành ứng dụng

Xác nhận của CBHD

(Ký tên và ghi rõ họ tên)

Nguyễn Tấn Trần Minh Khang

TP HCM, ngày 29 tháng 09 năm 2020 Sinh viên

(Ký tên và ghi rõ họ tên)

Võ Thị Một

Trang 11

MỤC LỤC

Chương 1 TỔNG QUAN ĐỀ TÀI 2

1.1 Đặt vấn đề 2

1.2 Giới thiệu bài toán 7

1.3 Đối tượng và phạm vi nghiên cứu 8

1.3.1 Đối tượng nghiên cứu 8

1.3.2 Phạm vi nghiên cứu 8

1.4 Thách thức bài toán 8

1.5 Ý nghĩa của đề tài 9

1.5.1 Ý nghĩa khoa học 9

1.5.2 Ý nghĩa thực tiễn 9

1.6 Bố cục khóa luận 10

Chương 2 CÁC NGHIÊN CỨU LIÊN QUAN VÀ HƯỚNG TIẾP CẬN 11

2.1 Bài toán phân lớp 11

2.2 Đặc trưng 15

2.3 Rút trích đặc trưng 16

2.4 Kiến trúc mạng học sâu 17

2.5 Các phương pháp phân lớp 18

2.5.1 k-Nearest-Neighbours 18

2.5.2 Support vector machines (SVM) 19

2.5.3 Logistic regression 21

2.6 Các phương pháp biểu diễn đặc trưng 22

2.6.1 Đặc trưng ảnh 22

2.6.2 Đặc trưng kết cấu Haralick 22

Trang 12

2.6.3 Đặc trưng học sâu 24

2.6.3.1 VGG16 24

2.6.3.2 Inception-Resnet-V2 25

Chương 3 Mô tả bộ dữ liệu COVID-19 27

3.1.1 Cấu trúc bộ dữ liệu 27

3.1.2 Nguồn thu thập dữ liệu 31

Chương 4 THỰC NGHIỆM CÁC PHƯƠNG PHÁP MÁY HỌC TRÊN BỘ DỮ LIỆU COVID-19 32

4.1 Độ đo dánh giá 32

4.1 Kiến trúc hệ thống phân loại 33

4.2 Kết quả thực nghiệm 35

Chương 5 XÂY DỰNG ỨNG DỤNG DEMO PHÁT HIỆN COVID-19 39

5.1 Python 39

5.2 Flask framework 40

5.3 ReactJS 41

5.4 Phân tích thiết kế ứng dụng demo 42

5.4.1 Mô tả nghiệp vụ ứng dụng 42

5.4.2 Các chức năng chính 43

5.4.3 Thiết kế sơ đồ use case 44

5.4.4 Thiết kế sơ đồ tuần tự 48

5.4.5 Thiết kế sơ đồ hoạt động 52

5.4.6 Thiết kế sơ đồ lớp 54

5.5 Giao diện ứng dụng demo phân loại COVID-19 trên ảnh X-quang phổi 58

5.5.1 Màn hình hiển thị danh sách bệnh nhân 58

Trang 13

5.5.2 Màn hình thêm mới bệnh nhân 59

5.5.3 Màn hình hiển thị chế độ view ảnh 60

5.5.4 Màn hình hiển thị thông tin ảnh và kết quả chẩn đoán 63

Chương 6 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 64

6.1 Kết luận 64

6.2 Hướng phát triển 65

TÀI LIỆU THAM KHẢO 66

PHỤ LỤC 69

Trang 14

DANH MỤC HÌNH

Hình 1.1 Hiện trạng COVID-19 đang lan rộng trên toàn thế giới (Coronavirus

Disease (COVID-19) Situation Reports, [1] 2

Hình 1.2 Bản đồ các tỉnh và thành phố theo số ca nhiễm COVID-19 được xác nhận (tính đến ngày 03 tháng 01 năm 2021) [4] 3

Hình 1.3 Bài toán phân loại COVID-19 7

Hình 2.1 Minh hoạ cấu trúc của bài toán phân lớp [10] 15

Hình 2.2 Kiến trúc của một Convolution Neural Network [11] 17

Hình 2.3 Minh họa phương pháp k-Nearest-Neighbours [19] 19

Hình 2.4 Minh họa thuật toán SVM [20] 19

Hình 2.5 So sánh sự khác nhau của 2 thuật toán Linear Regression và Logistic Regression [20] 21

Hình 2.6 Ảnh minh họa đặc trưng kết cấu Haralick [23] 23

Hình 2.7 Kiến trúc mạng VGG16 [25] 25

Hình 2.8 Kiến trúc mạng Inception-Resnet-V2 [26] 25

Hình 3.1 Dữ liệu ảnh X-quang được gán nhãn với kết quả chẩn đoán bệnh 27

Hình 3.2 Dữ liệu ảnh X-quang được gán nhãn với kết quả chẩn đoán bệnh 27

Hình 4.1 Kiến trúc hệ thống phân loại hình ảnh COVID-19 33

Hình 4.2 Biểu diễn kết quả sử dụng Confusion matrix 38

Hình 5.1 Sơ đồ Use case phân loại bệnh COVID-19 44

Hình 5.2 Sơ đồ use case quản lý danh sách bệnh nhân 46

Hình 5.3 Sơ đồ tuần tự hiển thị danh sách bệnh nhân 48

Hình 5.4 Sơ đồ tuần tự thêm mới bệnh nhân 49

Hình 5.5 Sơ đồ tuần tự cập nhật thông tin bệnh nhân 50

Hình 5.6 Sơ đồ tuần tự phân loại tình COVID-19 51

Hình 5.7 Sơ đồ hoạt động phân thêm mới bệnh nhân 52

Hình 5.8 Sơ đồ tuần tự phân loại tình trạng bệnh COVID-19 53

Hình 5.9 Sơ đồ lớp của ứng dụng demo phát hiện COVID-19 54

Trang 15

Hình 5.10 Màn hình hiển thị danh sách bệnh nhân tìm kiếm theo các trường thông

tin 58

Hình 5.11 Màn hình hiển thị thêm mới bệnh nhân 59

Hình 5.12 Màn hình hiển thị chế độ view ảnh với các chức năng tương tác trên ảnh 60

Hình 5.13 Thanh công cụ với các chức năng tương tác với ảnh y khoa 61

Hình 5.14 Phần hiển thị thông tin ảnh thông tin bện 62

Hình 5.15 Màn hình hiển thị thông tin ảnh và kết quả chẩn đoán 63

Trang 16

DANH MỤC BẢNG

Bảng 3.1 Giải thích nhãn ứng với tình trạng bệnh trên bộ dữ liệu: 28

Bảng 4.1 Kết quả thực nghiệm sử dụng phương pháp k-NN với độ đo Cosine 35

Bảng 4.2 Kết quả thực nghiệm sử dụng phương pháp k-NN với độ đo Minkowski 36 Bảng 4.3 Kết quả thực nghiệm sử dụng phương pháp SVM 37

Bảng 4.4 Kết quả thực nghiệm sử dụng phương pháp Logistic Regression 37

Bảng 5.1 Thống kê, phân tích các chức năng của ứng dụng demo 43

Bảng 5.2 Đặc tả use case phân loại COVID-19 44

Bảng 5.3 đặc tả use case quản lý thông tin bệnh nhân 46

Bảng 5.4 Đặc tả lớp Image 55

Bảng 5.5 Đặc tả lớp Patient 56

Bảng 5.6 Đặc tả lớp Test 57

Bảng 5.7 Bảng mô tả chức năng màn hình hiển thị chế độ view 60

Bảng 5.8 Mô tả chức năng chú thích và tương tác với hình ảnh 61

Trang 17

DANH MỤC TỪ VIẾT TẮT

CNN Convolutional network

COVID-19 Coronavirus - nhiễm COVID-19

MERS Hội chứng hô hấp Trung Đông

k-NN học k-Nearest-Neighbours (k-NN), (), Logistic Regression SVM SupportVector Machines

MERS-COV MiddleEast Resporatory Syndrone

SARS-COVS Severe AcuteRespiratory Syndrone

NORMAL Bình thường

PNEUMONIA Viêm phổi thông thường

UI User Interface – giao diện người dùng

Trang 18

19 sử dụng ảnh X-quang phổi Trong bài báo cáo này, tôi đã tiến hành khảo sát các phương pháp máy học k-Nearest-Neighbours (k-NN), Support Vector Machines (SVM), Logistic Regression cho bài toán phân loại bệnh COVID-19 gồm ba nhãn

dữ liệu: COVID-19, PNEUMONIA, NORMAL Các phương pháp này sử dụng các đặc trưng đặc biệt để thực hiện huấn luyện gồm: đặc trưng từ ảnh (xem mỗi ảnh là một vector đặc trưng), đặc trưng kết cấu Haralick và các đặc trưng được rút trích từ

mô hình học sâu như: VGG16, Inception-Resnet-V2 Các thử nghiệm được tiến hành trên bộ dữ liệu do tôi chuẩn bị gồm 3423 ảnh X-quang ngực là kết quả chụp và kiểm định bởi các bác sĩ y khoa Tôi thực hiện phân tích đánh giá so sánh các kết quả thực theo từng phương pháp

Dựa trên kết quả nghiên cứu và thực nghiệm, tôi tìm hiểu và sử dụng FLASK framework, kết hợp với Reactjs để xây đựng một demo nhỏ với dạng website giúp hiển thị hóa kết quả của quá trình thực nghiệm

Trang 19

MỞ ĐẦU

COVID-19 [1] đã gây ra hơn 90 triệu ca lây nhiễm và gần 2 triệu người chết trên toàn thế giới1 Đồng thời trở thành đại dịch toàn cầu gây ra những ảnh hưởng, thiệt hại về sức khỏe con người, các hệ lụy về kinh tế xã hội cho nhân loại Tổ chức

y tế thế giới WHO cảnh báo mức độ nguy hiểm của COVID-19 đạt mức báo động,

là mối đoe dọa của hầu hết các quốc gia trên thế giới

COVID-19 được định nghĩa là một bệnh đường hô hấp cấp tính ở người được phát hiện vào năm 2019, gây ra bởi vi-rút SARS-CoV-2 [2] chưa từng được xác định trong quá khứ Coronavirus là một họ virus lớn gây bệnh ở bệnh nhân từ cảm lạnh thông thường đến các hội chứng hô hấp tiến triển như MiddleEast Resporatory Syndrone (MERS-COV) và Severe AcuteRespiratory Syndrone (SARS-COVS) Thế giới đang bị ảnh hưởng, nhiều người chết, nhiều quốc gia tuyên bố tình trạng khẩn cấp Hầu hết những người bị nhiễm COVID -19 đều có các triệu chứng về đường hô hấp từ nhẹ đến trung bình Một số trường hợp khác có triệu chứng bệnh khi đã mắc bệnh viêm phổi từ trước

Một giải pháp hữu hiệu được đề xuất giúp các bác sĩ có thể sàng lọc lâm sàng các trường hợp nhiễm bệnh là chẩn đoán bệnh thông qua sàng lọc ảnh chụp X-quang Có nhiều nghiên cứu phát hiện COVID -19 trên ảnh X-quang với kết quả cao Tuy nhiên hầu hết được thực nghiệm trên bộ dữ liệu khá nhỏ Điều này đã thúc đẩy tôi thu thập các bộ dữ liệu chụp X-quang ngực với mong muốn tăng tính đa dạng dữ liệu và độ chính xác cho quá trình dự đoán kết quả phân loại hình ảnh trên các nguồn khác nhau Bộ dữ liệu có tổng số ảnh là 3423, trong đó có 1517 ảnh nhãn NORMAL, 1467 ảnh PNEUMONIA và 439 ảnh COVID-19

1 Theo thống kê của Worldometers.info, tính đến 8 giờ ngày 13-1 (giờ Việt Nam), thế giới ghi nhận 91.988.471 ca nhiễm virus SARS-CoV-2, trong đó có 1.968.622 ca tử vong và hơn 65,8 triệu ca đã hoàn toàn bình phục

Trang 20

Chương 1 TỔNG QUAN ĐỀ TÀI

1.1 Đặt vấn đề

Bối cảnh xuất hiện dịch bệnh COVID-19

Đại dịch COVID-19 [1] là một đại dịch bệnh truyền nhiễm với tác nhân là virus SARS-CoV-2, đang diễn ra trên phạm vi toàn cầu và được phát hiện lần đầu tiên tại thành phố Vũ Hán, tỉnh Hồ Bắc, Trung Quốc vào tháng 12/2019 Ở Việt Nam ghi nhận trường hợp nhiễm COVID-19 đầu tiên vào ngày 23 tháng 1 năm

2020, gồm hai bệnh nhân người Trung Quốc được nhập viện tại bệnh viện Chợ Rẫy, thành phố Hồ Chí Minh

Theo số liệu thống kê, đến ngày 2 tháng 1 năm 2021, tổng số ca nhiễm COVID-19 trên toàn cầu là hơn 84 triệu ca, trong đó có hơn 1,8 triệu người thiệt mạng Dịch bệnh đến nay xuất hiện và lây lan ở 218 quốc gia và vùng lãnh thổ Các nước cũng ghi nhận hơn 59 triệu bệnh nhân được điều trị khỏi, số ca nguy kịch hiện là hơn 22 triệu ca và hơn 106 ngìn ca đang điều trị tích cực Thế giới có tới 120 quốc gia và vùng lãnh thổ ghi nhận ca COVID-19 mới [2]; 83 quốc gia/vùng lãnh thổ có các ca tử vong vì đại dịch

> 1,000,000 500,001 – 1,000,000 50,001 – 500,000 5,001 – 50,000

1 – 5,0000

No Reported Data Not Applicable

Hình 1.1 Hiện trạng COVID-19 đang lan rộng trên toàn thế giới (Coronavirus

Disease (COVID-19) Situation Reports, [1]

Trang 21

1–9 10-99 100-299 trên 300

Hình 1.2 Bản đồ các tỉnh và thành phố theo số ca nhiễm COVID-19 được xác nhận (tính đến ngày 03 tháng 01 năm 2021) [4]

Thông tin về đặc điểm bệnh COVID-19

Nói một cách cụ thể, Virus Corona là một họ virus lớn thường lây nhiễm cho động vật nhưng đôi khi chúng có thể tiến hóa và lây sang người Hầu hết những người mắc bệnh COVID-19 sẽ gặp các triệu chứng từ nhẹ đến trung bình

và hồi phục mà không cần phải điều trị đặc biệt Khi virus xâm nhập vào cơ thể,

nó xâm nhập vào một số tế bào và chiếm lấy bộ máy tế bào (gây tổn thương viêm đặc hiệu ở đường hô hấp), đồng thời virus chuyển hướng bộ máy đó để phục vụ cho nó, tạo ra virus mới và nhiễm tiếp người khác Vi-rút gây bệnh COVID-19 chủ yếu lây truyền qua các giọt bắn văng ra khi người nhiễm bệnh ho, hắt hơi hoặc thở ra Những giọt bắn này quá nặng nên không thể bay lơ lửng trong không khí và nhanh chóng rơi xuống sàn nhà hoặc các bề mặt Bất cứ ai có thể bị nhiễm bệnh khi hít phải vi-rút nếu đang ở gần người nhiễm COVID-19 hoặc chạm vào

bề mặt có vi-rút, rồi lại chạm vào mắt, mũi hoặc miệng

Trang 22

Có 7 loại virus Corona [3], trong đó, 4 loại không nguy hiểm là 229E, NL63, OC43 và HKU1; hai loại khác là Hội chứng hô hấp Trung Đông (MERS)

và Hội chứng hô hấp cấp tính nặng (SARS), nguy hiểm hơn và từng gây ra đại dịch toàn cầu

Những người mắc bệnh COVID-19 đã có một loạt các triệu chứng được báo cáo - từ các triệu chứng nhẹ đến bệnh nghiêm trọng Các triệu chứng có thể xuất hiện 2-14 ngày sau khi phơi nhiễm với vi-rút Những người có các triệu chứng này có thể nhiễm COVID-19: Sốt hoặc ớn lạnh, ho, hụt hơi hoặc khó thở, mệt mỏi, đau cơ hoặc đau người, đau đầu, mất vị giác hoặc khứu giá, đau họng, gạt mũi hoặc chảy nước mũi, buồn nôn hoặc nôn mửa, tiêu chảy

Những ảnh hưởng của COVID-19 đối với xã hội, con người, kinh tế

Sự bùng phát của dịch bệnh COVID-19 trên thế giới và quay trở lại tại Việt Nam mà chưa có vắc-xin điều trị được sản xuất hàng loạt buộc các quốc gia phải sử dụng các biện pháp như giãn cách xã hội, đeo khẩu trang nơi công cộng, rửa tay thường xuyên, tuyên truyền nâng cao nhận thức cho người dân để hạn chế

sự lây lan của dịch bệnh

Mặc dù còn rất nhiều điều chưa tường tận về virus gây bệnh COVID-19 hiện đang hoành hành trên toàn cầu nhưng có một sự thật mà chúng ta đều chắc chắn: COVID-19 có thể tác động sâu rộng lên các cơ quan trong cơ thể con người [4]:

• Hủy hoại phổi: Đối với hầu hết trường hợp đã xác nhận, phổi là nơi COVID-19 tác động đầu tiên (do tiếp xúc gần với các giọt bắn từ người nhiễm bệnh) và cũng là bộ phận bị tàn phá mạnh nhất Virus SARS-CoV-

2 cũng tương tự như virus cúm – chúng gây ra bệnh về đường hô hấp Các triệu chứng coronavirus chủng mới ban đầu là sốt, ho, hắt hơi, sau đó

có thể tiến triển thành viêm phổi cấp tính

• Các vấn đề về tim mạch: Các chuyên gia nước ngoài cho biết COVID-19 cũng có thể ảnh hưởng đến tim và mạch máu như làm nhịp tim không

Trang 23

đều, tim bơm không đủ máu đến các mô hoặc gây huyết áp thấp và cần dùng thuốc Tuy nhiên, cho đến nay vẫn chưa có cơ sở để khẳng định COVID-19 gây hại trực tiếp cho tim

• Tổn thương gan: Khi virus lây lan từ hệ hô hấp, gan thường là bộ phận cuối chịu tổn thương Dấu hiệu tổn thương gan được ghi nhận trong các trường hợp mắc COVID-19 thường nhẹ nhưng vẫn có ca tổn thương gan nghiêm trọng hơn, thậm chí là suy gan

Trật tự và hoạt động kinh tế thế giới thay đổi mạnh mẽ do hầu hết các quốc gia đang trải qua thời kỳ cách ly tại nhà, giãn cách xã hội và thậm chí đóng cửa quốc gia [4] Đại dịch COVID-19 gây ra khủng hoảng sức khỏe cộng đồng, khủng hoảng kinh tế và sinh kế, hiện nay nhiều nền kinh tế lớn đang rơi vào suy thoái nghiêm trọng Giống như hầu hết nền kinh tế trên thế giới, Việt Nam bị ảnh hưởng do sự bùng phát của dịch bệnh, các ngành công nghiệp tư nhân bị thiếu hụt nguồn nguyên liệu cung ứng và đối mặt với nguy cơ dừng sản xuất Dịch COVID-19 còn ảnh hưởng đến nhiều ngành kinh tế bao gồm hàng hải, hậu cần hay các lĩnh vực phân phối, bán lẻ trong nước Nhiều doanh nghiệp, các hộ kinh doanh gặp khó khăn Ngành hàng không bị ảnh hưởng nặng nề, nhiều chuyến bay

bị hủy bỏ, lượng khách du lịch đến Việt Nam sụt giảm

Các quy trình xét nghiệm chẩn đoán COVID-19

Vào ngày 19 tháng 3 năm 2020, WHO đã công bố một hướng dẫn tạm thời

về các xét nghiệm đối với những người nghi ngờ mắc bệnh do coronavirus (COVID-19) (WHO 2020) Gần đây, nhiều cập nhật toàn diện về các kỹ thuật xét nghiệm trong chẩn đoán SARS-CoV-2 cũng đã được công bố (Chen 2020, Loeffelholz 2020) [4]

Xét nghiệm cận lâm sàng:

• Số lượng bạch cầu trong máu có thể bình thường hoặc giảm; số lượng bạch cầu lympho thường giảm, đặc biệt nhóm diễn biến nặng

Trang 24

• Protein C phản ứng (CRP) bình thường hoặc tăng, procalcitonin (PCT) thường bình thường hoặc tăng nhẹ Một số trường hợp có thể tăng nhẹ ALT, AST, CK, LDH

• Trong các trường hợp diễn biến nặng có các biểu hiện suy chức năng các cơ quan, rối loạn đông máu, tăng D-dimer, rối loạn điện giải và toan kiềm.3X-quang và chụp cắt lớp (CT) phổi

• Ở giai đoạn sớm hoặc chỉ viêm đường hô hấp trên, hình ảnh X-quang bình thường

• Khi có viêm phổi, tổn thương thường ở hai bên với dấu hiệu viêm phổi kẽ hoặc đám mờ (hoặc kính mờ) lan tỏa, ở ngoại vi hay thùy dưới Tổn thương

có thể tiến triển nhanh trong ARDS Ít khi gặp dấu hiệu tạo hang hay tràn dịch, tràn khí màng phổi

4 Xét nghiệm khẳng định căn nguyên

Phát hiện SARS-CoV-2 bằng kỹ thuật real-time RT-PCR hoặc giải trình tự gene từ các mẫu bệnh phẩm

Trang 25

1.2 Giới thiệu bài toán

Bài toán: Phân loại COVID-19 trên ảnh X-quang phổi Trong bài toán này tôi đã thực hiện phân loại ảnh thể hiện tình trạng bệnh của bệnh nhân

Đầu vào của bài toán: Ảnh chụp X-quang phổi

Đầu ra của bài toán: Kết quả phân loại gồm ba nhãn ứng với tình trạng bệnh:

COVID-19 (nhiễm COVID-19), NORMAL (Bình thường), PNEUMONIA (viêm phổi thông thường)

Hình 1.3 Bài toán phân loại COVID-19

Mục đích nghiên cứu: Khảo sát các phương pháp máy học để phân loại ảnh

COVID-19, có thể có những cơ sở và nhận định khi sử dụng các phương pháp này

Mục đích nghiên cứu cụ thể: Nghiên cứu tìm hiểu về các bộ dữ liệu COVID-19,

các bộ dữ liệu liên quan đến ảnh y khoa Các bộ dữ liệu ảnh chụp X-quang phổi và não để phân tích và nghiên cứu

Tìm hiểu tình trạng bệnh về viêm phổi (Pneumonia) và tình trạng nhiễm

COVID-19 dựa trên ảnh X-quang phổi ở người

Thử nghiệm các giá trị và đặc trưng trên từng phương pháp phân rút trích đặc trưng khác nhau trên bộ dữ liệu COVID-19 đã tổng hợp từ Kaggle để có đánh giá và lựa chọn phù hợp trong việc lựa chọn các phương pháp để thực nghiệm Cụ thể,

Trang 26

nghiên cứu các đặc trưng ảnh, đặc trưng ảnh y khoa Haralick Các mô hình học sâu đạt “state of the art” tại các cuộc thi về phân loại ảnh Tiến hành rút trưng đặc trưng

từ các mô hình này Áp dụng các phương pháp máy học để phân loại bệnh

COVID-19 trên ảnh X-quang phổi Support Vector Machine [5], k-Nearest-Neighbours [6] Logistic Regression [7]

1.3 Đối tượng và phạm vi nghiên cứu

1.3.1 Đối tượng nghiên cứu

Ảnh chụp X-quang phổi được tổng hợp từ Kaggle Các bộ dữ liệu này được công bố từ các trường đại học, các nghiên cứu, các kho ảnh y khoa và từ bệnh viện

Bộ dữ liệu được gán các nhãn được giám định bởi các bác sĩ y khoa thể hiện tình trạng bệnh của bệnh nhân bao gồm: COVID-19 (tình trạng nhiễm COVID-19), PNEUMONIA (tình trạng viêm phổi thông thường), NORMAL (tình trạng bình thường)

1.3.2 Phạm vi nghiên cứu

Phạm vi nghiên cứu được áp dụng cho dữ liệu ảnh X-quang phổi ở mức độ thử nghiệm Trên quy mô đánh giá kết quả thực nghiệm, so sánh sự ảnh hưởng và khác nhau khi sự dụng các phương pháp máy học và các đặc trưng học sâu

Toàn bộ quá trình nghiên cứu được thực hiện tại phòng E10.8 trường Đại học Công nghệ Thông tin – Đại học quốc gia thành phố Hồ Chí Minh, khu phố 6, phường Linh Trung, quận Thủ Đức, tp.HCM

1.4 Thách thức bài toán

Nhiều bộ dữ liệu khi sử dụng phải đảm bảo quyền riếng tư về mặt pháp lý của bệnh nhân Có những bộ dữ liệu vì lý do bản quyền nên không công bố, điều này dẫn đến lượng dữ liệu ảnh y khoa được thu thập không nhiều

Thiếu hụt dữ liệu: Nguồn dữ liệu chụp X-quang phổi không nhiều và rời rạc Một số bộ dữ liệu xuấn hiện sự trùng lắp

Trang 27

Tính xác minh của dữ liệu: Việc xác định chính xác nhãn dữ liệu cần có các yếu tố về ngữ cảnh và các thông tin bệnh nhân, đồng thời đòi hỏi bác sĩ phải có trình độ chuyên môn cao

Phân loại bênh trên hình ảnh X-quang Phân loại bênh dựa trên hình ảnh chỉ mang tính hỗ trợ không mang tính quyết định

1.5 Ý nghĩa của đề tài

1.5.1 Ý nghĩa khoa học

Tổng hợp được các bộ dữ liệu chụp X-quang phổi từ Kaggle Tìm hiểu được các đặc trưng được ứng dụng trong phân loại ảnh y khoa Sử dụng các mô hình học sâu đào tạo trước để rút trích đặc trưng ảnh Đánh giá các phương pháp máy học, so sánh được các yếu tố ảnh hưởng chất lượng của model phân loại

Kết quả thực nghiệm trên các phương pháp máy học mang lại góc nhìn tổng quan trên từng phương diện khác nhau Từ đó tạo cơ sở cho việc lựa chọn thực nghiệm các phương pháp cho những nghiên cứu về phân loại trên ảnh y khoa

Tuy ứng dụng của bài toán phân loại COVID-19 trên ảnh y khoa trong nghiên cứu chỉ dừng lại trong phạm vi thực nghiệm, khảo sát Song, phần nào hổ trợ các bác sĩ sàng lọc lâm sàng trên quá trình chẩn đoán COVID-19

Thông qua nghiên cứu trong đề tài này đã cho thấy được các hướng phát hiện

và vai trò quan trọng của máy học trong việc chẩn đoán bệnh trên ảnh x-quang

1.5.2 Ý nghĩa thực tiễn

COVID-19 là mối đoe dọa của toàn cầu bởi sự lây lan và những hậu quả nặng nề do nó mang lại Với những diễn biến phức tạp của dịch bệnh, các công tác xét nghiệm chẩn đoán bệnh đóng vai trò vô cùng quan trọng ảnh hưởng đến việc cách ly và điều trị cho bệnh nhân Do đó, thông qua đề tài này, thể hiện tính ứng dụng cao khi sử dụng phân loại COVID-19 trong việc sàng lọc và phát hiện bệnh Với bài toán phân loại trên ảnh X-quang đã thể hiện mỗi quan tâm của nghiên cứu khoa học đến lĩnh vực y khoa và sức khỏe cộng đồng

Trang 28

1.6 Bố cục khóa luận

Khóa luận bao gồm 7 chương, nội dung chính từng chương như sau:

Chương 1: Tổng quan đề tài

Chương 2: Cơ sở lý thuyết

Chương 3: Nghiên cứu thực nghiệm

Chương 4: Kết quả và thảo luận

Chương 5: Xây dựng ứng dụng Demo phát hiện COVID-19 trên ảnh X-quang Chương 6: Kết luận

Chương 7: Hướng phát triển

Trang 29

Chương 2 CÁC NGHIÊN CỨU LIÊN QUAN VÀ HƯỚNG TIẾP CẬN

2.1 Bài toán phân lớp

Bài toán phân lớp thuộc loại học giám sát (supervised learning) [9] Ở bài toán này ta thực hiện phân loại một tập dữ liệu (có cấu trúc hoặc không có cấu trúc) thành một hoặc nhiều lớp nhất định nhờ vào một mô hình phân loại Mô hình này xây dựng trước trên một tập dữ liệu có nhãn (còn được gọi là tập huấn luyện)

Các loại learner trong phân lớp:

Lazy Learner: Chỉ thực hiện lưu trữ dữ liệu huấn luyện và đợi cho đến khi ta đưa dữ liệu ở tập kiểm tra vào (test) Ở kiểu learner này, sẽ sử dụng các dữ liệu có tính tương đồng nhiều nhất trong dữ liệu huấn luyện đã được lưu trữ Do vậy, so với Eager Learners, Lazy Learner mất nhiều thời gian dự đoán hơn Ví dụ: k-Nearest-Neighbor, Case-Based Reasoning

Eager Learner: Xây dựng mô hình phân loại dựa trên dữ liệu huấn luyện trước khi sử dụng dữ liệu kiểm tra Eager Learner xây dựng kiến trúc chung và rõ ràng về hàm mục tiêu Nó phải có khả năng cam kết một giả thuyết duy nhất sẽ hoạt động cho toàn bộ không gian Do đó, mất nhiều thời gian đào tạo và ít thời gian hơn

Trang 30

• Dự đoán tin cậy (Churn prediction): Churn hoặc không churn

• Dự đoán chuyển đổi: Mua hoặc không mua

Thông thường, các nhiệm vụ phân loại nhị phân liên quan đến một lớp là trạng thái bình thường và một lớp khác là trạng thái bất thường Lớp cho trạng thái bình thường được gán nhãn lớp 0 và lớp có trạng thái bất thường được gán nhãn lớp

1 Người ta thường lập mô hình nhiệm vụ phân loại nhị phân với một mô hình dự đoán phân phối xác suất Bernoulli cho mỗi ví dụ

Phân phối Bernoulli là một phân phối xác suất rời rạc bao gồm trường hợp một sự kiện sẽ có kết quả nhị phân là 0 hoặc 1 Đối với phân loại, điều này có nghĩa

là mô hình dự đoán xác suất của một ví dụ thuộc loại 1 hoặc trạng thái bất thường

Các thuật toán phổ biến có thể được sử dụng để phân loại nhị phân bao gồm:

• Hồi quy logistic

• k-Những người hàng xóm gần nhất

• Cây quyết định

• Máy vector hỗ trợ

• Naive Bayes

Multi-Class Classification: Phân loại nhiều lớp đề cập đến các nhiệm vụ phân loại

có nhiều hơn hai lớp

Ví dụ:

• Phân loại khuôn mặt

• Phân loại loài thực vật

Trang 31

trong số hàng nghìn hoặc hàng chục nghìn khuôn mặt trong hệ thống nhận dạng khuôn mặt Các vấn đề liên quan đến dự đoán một chuỗi từ, chẳng hạn như mô hình dịch văn bản, cũng có thể được coi là một kiểu phân loại nhiều lớp đặc biệt Mỗi từ trong chuỗi các từ được dự đoán liên quan đến sự phân loại nhiều lớp trong đó kích thước của từ vựng xác định số lượng các lớp có thể được dự đoán và có thể có kích thước hàng chục hoặc hàng trăm nghìn từ

Người ta thường lập mô hình nhiệm vụ phân loại nhiều lớp với một mô hình

dự đoán phân phối xác suất Multinoulli cho mỗi ví dụ

Phân phối Multinoulli là một phân phối xác suất rời rạc bao hàm trường hợp một sự kiện sẽ có kết quả phân loại, ví dụ: K trong {1, 2, 3,…, K} Đối với phân loại, điều này có nghĩa là mô hình dự đoán xác suất của một ví dụ thuộc về mỗi lớp Nhiều thuật toán được sử dụng để phân loại nhị phân có thể được sử dụng để phân loại nhiều lớp Các thuật toán phổ biến có thể được sử dụng để phân loại nhiều lớp bao gồm:

Các thuật toán được thiết kế để phân loại nhị phân có thể được điều chỉnh để

sử dụng cho các bài toán nhiều lớp Điều này liên quan đến việc sử dụng chiến lược kết hợp nhiều mô hình phân loại nhị phân cho mỗi lớp so với tất cả các lớp khác (được gọi là một so với phần còn lại) hoặc một mô hình cho mỗi cặp lớp (được gọi

Trang 32

Các thuật toán phân loại nhị phân có thể sử dụng các chiến lược này để phân loại nhiều lớp bao gồm:

• Logistic Regression

• Support Vector Machine

Multi-Label Classification: Đề cập đến các nhiệm vụ phân loại có hai hoặc nhiều

nhãn lớp, trong đó một hoặc nhiều nhãn lớp có thể được dự đoán cho mỗi sample

Không giống như phân loại nhị phân và phân loại nhiều lớp, trong đó một nhãn lớp duy nhất được dự đoán cho mỗi sample Người ta thường mô hình hóa các nhiệm vụ phân loại nhiều nhãn với một mô hình dự đoán nhiều đầu ra, với mỗi đầu

ra được dự đoán là phân phối xác suất Bernoulli Đây thực chất là một mô hình tạo

ra nhiều dự đoán phân loại nhị phân cho mỗi sample

Các thuật toán phân loại được sử dụng để phân loại nhị phân hoặc đa lớp không thể được sử dụng trực tiếp để phân loại multi-label Có thể sử dụng các phiên bản chuyên biệt của thuật toán phân loại tiêu chuẩn, được gọi là multi-label của thuật toán, bao gồm:

• Multi-label Decision Trees

• Multi-label Random Forests

• Multi-label Gradient Boosting

Imbalanced Classification: Phân loại không cân bằng đề cập đến các nhiệm vụ

phân loại trong đó số lượng ví dụ trong mỗi lớp được phân phối không đồng đều Thông thường, các nhiệm vụ phân loại không cân bằng là các phân loại nhị phân trong đó phần lớn các ví dụ trong tập dữ liệu huấn luyện thuộc về lớp bình thường

và một số ít các ví dụ thuộc lớp bất thường

Ví dụ:

• Fraud detection

• Outlier detection

Trang 33

• Medical diagnostic tests

Hình 2.1 Minh hoạ cấu trúc của bài toán phân lớp [10]

2.2 Đặc trưng

Trong thị giác máy tính và xử lý hình ảnh, đặc trưng là một phần thông tin về nội dung của hình ảnh [8]; thường là về việc một vùng nhất định của hình ảnh có các thuộc tính nhất định hay không Các đặc trưng có thể là các cấu trúc cụ thể trong ảnh như điểm, cạnh hoặc đối tượng Đặc trưng cũng có thể là kết quả của hoạt động chung vùng lân cận hoặc rút trích đặc trưng được áp dụng cho hình ảnh Các đặc trưng liên quan đến chuyển động trong chuỗi hình ảnh hoặc các hình dạng được xác định theo đường cong hoặc ranh giới giữa các vùng hình ảnh khác nhau

Nói rộng hơn, đặc trưng là bất kỳ phần thông tin nào có liên quan đến việc giải quyết công việc tính toán liên quan đến một ứng dụng nhất định Điều này cũng giống như đặc trưng trong học máy và nhận dạng mẫu nói chung, mặc dù xử lý hình ảnh có một tập hợp các thành phần rất phức tạp

Đặc điểm hình ảnh cụ thể, được xác định theo cấu trúc cụ thể trong dữ liệu hình ảnh, thường có thể được biểu diễn theo những cách khác nhau Ví dụ, một cạnh có thể được biểu diễn dưới dạng một biến boolean trong mỗi điểm ảnh mô tả liệu một cạnh có hiện diện tại điểm đó hay không Ngoài ra, thay vào đó, chúng ta

có thể sử dụng một biểu diễn cung cấp một thước đo độ chắc chắn thay vì một tuyên

bố boolean về sự tồn tại của cạnh và kết hợp điều này với thông tin về hướng của cạnh Tương tự, màu của một vùng cụ thể có thể được biểu diễn dưới dạng màu trung bình (ba vô hướng) hoặc biểu đồ màu (ba chức năng)

Trang 34

Khi một hệ thống thị giác máy tính hoặc thuật toán thị giác máy tính được thiết kế, việc lựa chọn biểu diễn đặc trưng có thể là một vấn đề quan trọng Trong một số trường hợp, mức độ chi tiết cao hơn trong mô tả của một đặc trưng có thể cần thiết để giải quyết vấn đề, nhưng điều này phải trả giá là phải xử lý nhiều dữ liệu hơn và xử lý đòi hỏi nhiều hơn

2.3 Rút trích đặc trưng

Trong học máy và thống kê, trích chọn đặc trưng (hay còn gọi bằng nhiều cụm từ như trích chọn đặc tính, lựa chọn đặc trưng, lựa chọn thuộc tính, chọn lọc đặc trưng Là một quá trình chọn lọc một tập con chứa các thuộc tính liên quan để

sử dụng trong quá trình xây dựng mô hình

Trong khai phá dữ liệu thì phương pháp trích chọn đóng một vai trò quan trọng trong tiền xử lý số liệu Hướng tiếp cận này làm tăng hiệu năng thu nhận tri thức trong các ngành như tin sinh, xử lý dữ liệu web, xử lý tiếng nói, hình ảnh với đặc tính là có rất nhiều thuộc tích (vài trăm cho đến vài trăm ngàn thuộc tính) nhưng thường chỉ có một số lượng tương đối nhỏ các mẫu dùng để huấn luyện (thường là vài trăm) Phương pháp trích chọn sẽ giúp giảm kích cỡ của không gian dữ liệu, loại

bỏ những thuộc tính không liên quan và những thuộc tính nhiễu Phương pháp này

có ảnh hưởng ngay lập tức đến các ứng dụng như tăng tốc độ của thuật toán khai phá dữ liệu, cải thiện chất lượng dữ liệu và vì vậy tăng hiệu suất khai phá dữ liệu, kiểm soát được kết quả của thuật toán Phương pháp này đã được giới thiệu từ những năm 1970 trong các tài liệu về xác suất thống kê, học máy và khai phá dữ liệu Những năm trở lại đây, do nhu cầu giảm chiều số liệu ngày càng cao nên có rất nhiều các nghiên cứu về lựa chọn thuộc tính, lĩnh vực này phát triển mạnh mẽ cả về chiều rộng lẫn chiều sâu

Về cơ bản việc rút trích các thuộc tính đặc trưng bao gồm hai phần là xây dựng các thuộc tính và lựa chọn các thuộc tính đặc trưng Xây dựng bộ các thuộc tính là một công việc rất quan trọng trong việc xử lý số liệu Khi xây dựng dữ liệu chúng ta cần phải đảm bảo không để mất nhiều thông tin quá cũng như không quá

Trang 35

tốn kém về mặt chi phí Phần thứ hai có mục tiêu tìm ra những thuộc tính đại diện cho đối tượng, loại bỏ những thuộc tính thừa và gây nhiễu nhằm tăng hiệu suất của các thuật toán khai phá dữ liệu

2.4 Kiến trúc mạng học sâu

Convolution Neural Network (CNN)

Hình 2.2 Kiến trúc của một Convolution Neural Network [11]

Convolution Neural Network là một trong những mô hình dạng deep learning tiên tiến được sử dụng rộng rãi Thường được dùng trong lĩnh vực phát hiện đối tượng (object) thông qua ảnh

Cấu trúc của CNN gồm vòng lặp các tầng Convolution, tầng Activation (ReLU), tầng Pooling và tầng Fully Connected

Tầng Convolution

Convolution được sử dụng đầu tiên trong xử lý tín hiệu số, nhờ vào nguyên

lý biến đối thông tin, các nhà khoa học đã áp dụng kỹ thuật này vào xử lý ảnh và video số Đầu vào của tầng này có dạng như một bức ảnh chứ không có dạng vector như neural network, cụ thể một bước ảnh sau khi số hóa có dạn ma trận width x height x depth ( widthL số lượng điểm ảnh trên chiều rộng, height: số lượng điểm ảnh trên chiều cao depthL số lượng kênh chẳng hạn như RGB có 2 kênh đại diện cho mức độ của 3 màu Đỏ, Lục, Lam), Mỗi giá trị của ma trận tương đương với một điểm ản(pixel), 0 là màu đen, 1 là màu trắng( nếu là ảnh grayscale thì giá trị biến thiên từ 0=>255) Tầng Convolution là tầng cốt lõi của mạng CNN

Trang 36

Tầng Pooling:

Mục đích của tầng này rất đơn giản, nó làm giảm số chiều hyperparameter

mà ta cần phải tính toán, từ đó giảm thời gian tính toán, tránh overfitting Loại pooling ta thường gặp nhất là max pooling, lấy giá trị lớn nhất trong một pooling window Pooling hoạt động gần giống với Convolution, nó cũng có 1 cửa sổ trượt gọi là pooling window, cửa sổ này trượt qua từng giá trị của ma trận dữ liệu đầu vào (thường là các feature map trong convolution Al layer), chọn ra một giá trị từ các giá trị nằm trong cửa sổ trượt (với max pooling ta sẽ lấy giá trị lớn nhất)

Dạng phổ biến nhất của max pooling là filter với kích thước 2x2 và stride=2 Sau khi pooling, một hình ảnh sẽ có khoản một phần tư số điểm ảnh so với lúc bắt đầu Vì nó giữ các các giá trị lớn nhất từ mỗi cửa sổ, nó sẽ bảo toàn tính khớp của mỗi feature bên trong cửa sổ Nghĩa là nó không quan tâm quá nhiều về vị trí chính xác các nơi feature khớp, miễn là nó khớp ở chỗ nào đó trong cửa sổ Kết quả là CNN có thể tìm xem liệu một feature có nằm trong hình ảnh mà không cần nó nằm

2.5 Các phương pháp phân lớp

2.5.1 k-Nearest-Neighbours

k-NN là một phương pháp phân loại không tham số được sử dụng để phân loại và hồi quy Trong quá trình huấn luyện, thuật toán này không học từ dữ liệu

Trang 37

huấn luyện nên nó được xếp vào loại lười học (lazy learning) Mọi tính toán được thực hiện khi cần dự đoán kết quả của dữ liệu mới k-NN hoạt động bằng cách tìm khoảng cách giữa truy vấn và tất cả các mẫu (sample) trong tập dữ liệu, sau đó chọn

số k điểm dữ liệu gần với truy vấn nhất Tiến hành bỏ phiếu cho nhãn xuất hiện nhiều nhất (trong trường hợp phân loại) hoặc số trung bình các nhãn (trong trường hợp hồi quy) Để áp dụng k-NN một cách hiệu quả, chúng ta cần chọn một giá trị k thích hợp, và sự thành công của việc phân loại phụ thuộc rất nhiều vào giá trị này

Hình 2.3 Minh họa phương pháp k-Nearest-Neighbours [19]

2.5.2 Support vector machines (SVM)

Hình 2.4 Minh họa thuật toán SVM [20]

SVM là một thuật toán học giám sát có thể được sử dụng cho cả phân loại hoặc hồi quy Một cách cụ thể, SVM hỗ trợ việc tạo ra một siêu phẳng hoặc tập hợp các siêu phẳng trong một không gian có số chiều hữu hạn hoặc vô hạn Kết quả phân loại đạt kết quả tốt nhất khi siêu phẳng có khoảng cách lớn nhất đến điểm dữ

Trang 38

liệu huấn luyện gần nhất của bất kỳ lớp nào (khoảng cách biên) Mục đích của phương pháp SVM là tìm ra khoảng cách biên lớn nhất

Độ đo khoảng cách:

Khoảng cách Cosine

Khoảng cách cosine được tính theo công thức (4)

Trong đó:

N là kích thước của 2 vector x, y (số lượng thuộc tính, số lượng đặc trưng)

vec-tor x và y là 2 điểm dữ liệu

Trang 39

p = 1, số liệu của Minkowski trả về giá trị của độ đo Manhattan

p = 2, số liệu của Minkowski trả về giá trị của độ đo Euclidean

p = ∞, số liệu của Minkowski trả về giá trị của độ đo Chebychev

Hàm Sigmoid :

Trong đó:

• s (z) = 0 đến 1 (ước tính xác suất)

Trang 40

• z = phương trình dự đoán, ví dụ: mx + b

• e = logarit tư nhiên

2.6 Các phương pháp biểu diễn đặc trưng

2.6.1 Đặc trưng ảnh

Đặc trưng ảnh là một phần thông tin về nội dung của hình ảnh; thường là về việc một vùng nhất định của hình ảnh có các thuộc tính nhất định hay không Đặc trưng có thể là các cấu trúc cụ thể trong ảnh như điểm, cạnh hoặc đối tượng Nó cũng có thể là kết quả của hoạt động vùng lân cận chung hoặc phát hiện đặc trưng được áp dụng cho hình ảnh Tất cả các đặc trưng có thể được phân loại thô thành các đặc trưng cấp thấp và các đặc trưng cấp cao Các đặc trưng cấp thấp có thể được trích xuất trực tiếp từ ảnh gốc, trong khi trích xuất các đặc trưng cấp cao phải dựa trên các đặc trưng cấp thấp Trong nghiên cứu này, tôi muốn chuyển đổi dữ liệu thô (hình ảnh) thành một vectơ đặc trưng để máy có thể hiểu được các thông tin và tính chất của hình ảnh Các vector đặc trưng này được tạo ra bằng cách sử dụng biểu diễn thu nhỏ thay vì kích thước đầy đủ của ảnh đầu vào

2.6.2 Đặc trưng kết cấu Haralick

Các đặc trưng kết cấu Haralick là các bộ mô tả kết cấu phổ biến trong phân tích hình ảnh Các đặc trưng này được tính toán từ Ma trận đồng xuất hiện mức xám (GLCM) [22] Ma trận này đếm sự đồng xuất hiện của các mức xám lân cận trong hình ảnh Để tính toán các đặc trưng Haralick, mức xám của hình ảnh được giảm xuống, một quá trình được gọi là lượng tử hóa (quantization) Mục đích của công việc này là phát triển các đặc trưng Haralick luôn không đổi với số lượng mức xám lượng tử hóa GLCM sử dụng khái niệm liền kề trong hình ảnh Ý tưởng chính là nó tìm kiếm các cặp giá trị pixel liền kề xuất hiện trong một hình ảnh và tiếp tục lưu lại

nó trên toàn bộ hình ảnh

Ngày đăng: 05/09/2021, 20:50

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w