1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu các mô hình học máy với dữ liệu y tế và ứng dụng trong sàng lọc bệnh tiểu đường

63 35 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 63
Dung lượng 1,55 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nghiên cứu các mô hình học máy với dữ liệu y tế và ứng dụng trong sàng lọc bệnh tiểu đường Nghiên cứu các mô hình học máy với dữ liệu y tế và ứng dụng trong sàng lọc bệnh tiểu đường Nghiên cứu các mô hình học máy với dữ liệu y tế và ứng dụng trong sàng lọc bệnh tiểu đường luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

Giảng viên hướng dẫn: TS Phạm Ngọc Hưng

Trang 2

L ỜI CAM ĐOAN

Những kiến thức trình bày trong luận văn là do tôi tìm hiểu, nghiên

cứu và trình bày theo những kiến thức tổng hợp của cá nhân Kết quả nghiên cứu trong luận văn này chưa từng được công bố tại bất kỳ công trình nào khác Trong quá trình làm luận văn, tôi có tham khảo các tài liệu

có liên quan và đã ghi rõ nguồn tài liệu tham khảo Tôi xin cam đoan đây là công trình nghiên cứu của tôi và không sao chép của bất kỳ ai

Tôi xin chịu hoàn toàn trách nhiệm, nếu sai, tôi xin chịu mọi hình

thức kỷ luật theo quy định

Hà Nội, ngày 1 tháng 10 năm 2020

Học viên

Trần Khoa Bách

Trang 3

Cuối cùng tôi xin gửi lời cám ơn đến gia đình, bạn bè và những người đã luôn bên tôi, động viên và khuyến khích tôi trong quá trình thực hiện đề tài nghiên cứu của mình

Học viên

Trần Khoa Bách

Trang 4

M ỤC LỤC

MỤC LỤC 3

DANH MỤC CÁC CHỮ VIẾT TẮT 5

DANH MỤC CÁC BẢNG 6

DANH MỤC HÌNH VẼ 7

CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI 8

1.1 Tổng quan về đề tài 8

1.1.1 Lý do chọn đề tài 8

1.1.2 Mục tiêu và nhiệm vụ nghiên cứu 9

1.1.3 Đối tượng và phạm vi nghiên cứu 9

1.1.4 Phương pháp nghiên cứu 9

1.1.5 Ý nghĩa khoa học và thực tiễn 10

1.1.6 Bố cục luận văn 10

1.2 Tổng quan về học máy 11

1.3 Ứng dụng học máy trong y học 13

1.3.1 Ứng dụng học máy trong tiên lượng, chẩn đoán bệnh 14

1.3.2 Ứng dụng học máy trong nghiên cứu phát triển thuốc 15

1.3.3 Ứng dụng học máy trong điều trị bệnh 15

1.3.4 Ứng dụng học máy trong dự đoán dịch bệnh 16

1.3.5 Một số khó khăn của việc áp dụng học máy trong y học 15

CHƯƠNG 2 NGHIÊN CỨU CÁC MÔ HÌNH HỌC MÁY 16

VỚI DỮ LIỆU Y TẾ 18

2.1 Phân loại mô hình học máy 18

2.2 Ứng dụng học máy trong y tế 19

2.2.1 Học máy với dữ liệu bệnh án điện tử 19

2.2.2 Học máy với dữ liệu ảnh y tế 20

2.3 Một số mô hình học máy điển hình 21

2.3.1 Hồi quy Logistic - Logistic regression 21

2.3.2 Máy vector hỗ trợ - Support Vector Machine (SVM) 25

2.3.3 Cây quyết định – Decision Tree 31

2.3.4 Rừng ngẫu nhiên - Random Forest 33

2.4 Một số mô hình học máy nâng cao 35

2.4.1 Học sâu rộng - Wide Deep Learning 35

2.4.2 XGBoost 38

Trang 5

2.5 Đánh giá hiệu năng mô hình học máy 40

2.5.1 Ma trận nhầm lẫn 40

2.5.2 Các thang đo hiệu năng của học máy 41

2.5.3 Đường cong ROC 42

2.5.4 Ví dụ 43

CHƯƠNG 3 ĐÁNH GIÁ CÁC MÔ HÌNH HỌC MÁY 39

TRONG SÀNG LỌC BỆNH TIỂU ĐƯỜNG 44

3.1 Giới thiệu chung về bệnh tiểu đường 45

3.2 Bài toán chẩn đoán bệnh tiểu đường 46

3.2.1 Giới thiệu bài toán 46

3.2.2 Mục tiêu bài toán 46

3.2.3 Dữ liệu đầu vào 46

3.2.4 Chọn lọc dữ liệu 48

3.2.5 Trực quan hóa dữ liệu 50

3.2.6 Tiền xử lý dữ liệu 52

3.2.7 Phương pháp phân lớp 53

3.2.8 Một số ảnh lập trình minh họa 55

3.2.9 Thí nghiệm và đánh giá kết quả 56

CHƯƠNG 4 KẾT LUẬN 58

4.1 Kết luận chung 58

4.2 Kết quả đạt được 58

4.3 Định hướng tiếp theo 58

TÀI LIỆU THAM KHẢO 59

Trang 6

DANH M ỤC CÁC CHỮ VIẾT TẮT

STT Tên viết tắt Tên đầy đủ Tiếng Việt

1 AI Artificial Intelligence Trí tuệ nhân tạo

2 AUC Area Under Curve Khu vực dưới đường cong

3 BMI Body Mass Index Chỉ số khối cơ thể

4 DT Decision Tree Cây quyết định

5 FN False Negative Âm tính giả

6 FP False Positive Âm tính thật

7 GPU Graphics Processing Unit Bộ xử lý đồ họa

8 ID3 Iterative Dichotomiser 3 Thuật toán ID3

9 ILSVRC ImageNet Large-Scale Visual

Recognition Challenge

Thử thách nhận dạng hình ảnh quy mô lớn ImageNet

10 LR Logistic Regression Hồi quy Logistic

11 NHANES National Health and Nutrition

Examination Survey

Khảo sát Kiểm tra Sức khỏe

và Dinh dưỡng Quốc gia

12 NPV Negative Predictive Value Giá trị chẩn đoán âm tính

13 PPV Positive Predictive Value Giá trị chẩn đoán dương

tính

14 RF Random Forest Rừng ngẫu nhiên

15 ROC Receiver Operating

Characteristic

Đặc trưng hoạt động của bộ thu nhận

16 SVM Support Vector Machine Máy vectơ hỗ trợ

17 TN True Negative Dương tính giả

18 TP True Positive Dương tính thật

19 XGBoost,

XGB Extreme Gradient Boosting Siêu tăng cường độ dốc

Trang 7

DANH M ỤC CÁC BẢNG

Bảng 2.1 Ma trận nhầm lẫn mô tả kết quả dự đoán người mắc bệnh 43 Bảng 3.1 Mô tả thông tin của các trường dữ liệu đã chọn 50 Bảng 3.2 Bảng thông số hiệu năng của các mô hình 56

Trang 8

DANH M ỤC HÌNH VẼ

Hình 1.1 Sự khác biệt giữa học sâu, học máy và trí tuệ nhân tạo [1] 13

Hình 1.2 Ảnh scan của võng mạc trên mắt thông qua Google Deep Mind [2] 14

Hình 1.3 Ảnh scan cơ thể bệnh nhân thông qua phần mềm Aidoc [9] 16

Hình 1.4 Ứng dụng Promed-mail giúp chẩn đoán dịch bệnh [10] 17

Hình 2.1 Dữ liệu được phân loại bằng mô hình hồi quy logistic [1] 22

Hình 2.2 Hai lớp được phân chia sao cho khoảng cách đạt giá trị lớn nhất [1] 26

Hình 2.3 Tập dữ liệu được ánh xạ thông qua phương pháp Kernel [1] 28

Hình 2.4 Mô hình cây quyết định [1] 31

Hình 2.5 Đồ thị Entropy [1] 32

Hình 2.6 Mô hình cây quyết định [1] 34

Hình 2.7 Mô hình sâu và rộng [14] 35

Hình 2.8 Hiệu suất của bộ thư viện XGB so với các bộ thư viện khác 39

Hình 2.9 Đồ thị đường cong ROC của một mô hình học máy [1] 42

Hình 3.1 Bộ dữ liệu NHANES dưới dạng file Excel 47

Hình 3.2 Thông tin về trường dữ liệu trên trang chủ NHANES 47

Hình 3.3 Quy trình sàng lọc và đánh dấu người bị tiểu đường 48

Hình 3.4 Phân bố tập dữ liệu theo các thuộc tính được quan sát 52

Hình 3.5 Biểu đồ thể hiện dữ liệu bài toán mất cân bằng 53

Hình 3.6 Mô hình kỹ thuật Easy Ensemble chia đều bộ dữ liệu 54

Hình 3.7 Mô hình mô tả trình tự thực hiện việc chẩn đoán bệnh tiểu đường 54

Hình 3.8 Import các bộ thư viện sử dụng 55

Hình 3.9 Chẩn đoán người bị tiểu đường qua mô hình SVM 56

Hình 3.10 Đồ thị đường cong ROC của các mô hình sử dụng 57

Hình 3.11 Biểu đồ điểm quan trọng thông qua mô hình cây quyết định 57

Trang 9

CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI

1.1 Tổng quan về đề tài

1.1.1 Lý do ch ọn đề tài

Học máy (machine learning) đang đóng một vai trò cực kì quan trọng trong cuộc cách mạng công nghiệp 4.0, nó đã thúc đẩy sự phát triển rất nhiều ngành, trong đó có ngành y tế cũng được thúc đẩy mạnh mẽ Phân tích dữ liệu lớn bằng học máy mang lại lợi thế đáng kể cho việc đồng hóa

và đánh giá một lượng lớn dữ liệu chăm sóc sức khỏe phức tạp Ưu điểm

của học máy bao gồm tính linh hoạt và khả năng mở rộng so với các phương pháp thống kê sinh học truyền thống, việc này giúp học máy có thể triển khai cho nhiều nhiệm vụ khác nhau, ví dụ như phân tầng rủi ro, chẩn đoán, phân loại và dự đoán tỷ lệ sống Một ưu điểm khác của mô hình học máy là khả năng phân tích các loại dữ liệu khác nhau như hồ sơ y tế, dữ liệu nhân khẩu học, dữ liệu xét nghiệm y tế, dữ liệu hình ảnh và áp dụng chúng vào các tiên lượng, chẩn đoán về nguy cơ mắc bệnh, phương pháp điều trị thích hợp Mặc dù có những ưu điểm này, việc áp dụng học máy trong y tế vẫn gặp nhiều khó khăn vì công việc thu thập dữ liệu bệnh nhân

là không dễ dàng, nếu không có sự cho phép của bệnh nhân thì việc sử dụng dữ liệu của bệnh nhân đó cho bất cứ mục đích gì đều sẽ vi phạm pháp luật

Tại Việt Nam, việc áp dụng học máy trong việc chẩn đoán bệnh đã được áp dụng thành công trong y tế, điển hình là phương pháp chẩn đoán bệnh qua hình ảnh với tỉ lệ chính xác cao của các bệnh viện lớn như bệnh viện Việt Nam Cuba, bệnh viện Quân Y 103, bệnh viện Vinmec, Tuy nhiên, vì việc thu thập dữ liệu còn khó khăn bao gồm sự cần cho phép của

bệnh nhân và sự đồng ý chia sẻ giữa các bệnh viện nên việc áp dụng học máy chưa được rộng rãi trong các bệnh viện khác

Trang 10

Việc áp dụng học máy, trí tuệ nhân tạo đóng góp to lớn vào việc hỗ trợ bác sỹ, chuyên gia trong chẩn đoán, điều trị bệnh Luận văn này thực hiện một đề tài nghiên cứu về các mô hình học máy ứng dụng trong y học với các dạng dữ liệu y tế khác nhau và thử nghiệm với một bài toán cụ thể

là sàng lọc bệnh tiểu đường

1.1.2 Mục tiêu và nhiệm vụ nghiên cứu

Qua nghiên cứu các mô hình học máy và ứng dụng trong chẩn đoán bệnh với dữ liệu y tế, lập trình chương trình thực nghiệm với bộ dữ liệu thực,

một số kết quả đạt được như sau:

o Nắm được bản chất học máy và các mô hình học máy

o Hiểu được tính thực tế của học máy tới nền y tế thông qua các ứng dụng học máy

o Áp dụng mô hình học máy để xây dựng phần mềm chẩn đoán bệnh nhân có bị tiểu đường hay không trên bộ dữ liệu thực

o Rút ra được độ thực tiễn và ý nghĩa khoa học của việc áp dụng học máy vào trong ứng dụng chẩn đoán bệnh với dữ liệu y tế

1.1.3 Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu:

o Kiến thức về học máy bao gồm phương pháp và ứng dụng thực tế

o Kiến thức chung về bệnh tiểu đường

Phạm vi nghiên cứu: Áp dụng các mô hình học máy để xây dựng chương trình chẩn đoán bệnh tiểu đường

1.1.4 Phương pháp nghiên cứu

Nghiên cứu lý thuyết:

Nghiên cứu khảo sát học máy và những ứng dụng của học máy trong chẩn đoán bệnh dựa trên dữ liệu y tế từ các nguồn tài liệu như giáo trình, bài giảng, báo cáo khoa học, … để chọn những mô hình học máy phù hợp

với việc sàng lọc bệnh nhân bị tiểu đường Tìm hiểu các ứng dụng dùng mô

Trang 11

hình học máy đã được phát minh có công dụng chuẩn đoán bệnh dựa trên

dữ liệu y tế

Nghiên cứu thực nghiệm:

+ Nghiên cứu bộ dữ liệu từ bộ Khảo sát Kiểm tra Sức khỏe và Dinh dưỡng Quốc gia (National Health and Nutrition Examination Survey, tên viết tắt là NHANES) Hoa Kì để phục vụ cho bài toán sàng lọc người bị bệnh tiểu đường

+ Nghiên cứu thí nghiệm, cài đặt, đánh giá mô hình học máy, thông qua ngôn ngữ lập trình Python, trên nền tảng Google Colaboratory

và sử dụng bộ thư viện SKLearn

1.1.5 Ý nghĩa khoa học và thực tiễn

Ứng dụng chẩn đoán bệnh bằng phương pháp học máy sẽ giúp người dân có khả năng tự theo dõi, từ đó chăm sóc sức khỏe, phòng ngừa bệnh tốt hơn trong tương lai thông qua các thiết bị y tế xách tay và các app ứng dụng giúp theo dõi chỉ số sức khỏe, chẩn đoán bệnh Ngoài ra, việc thu thập

dữ liệu từ bệnh nhân sẽ phục vụ cho các nghiên cứu khám phá thêm những thông tin mới về bệnh và sức khỏe người dân nói chung Do vậy việc nghiên cứu này có ý nghĩa khoa học và thực tiễn cao

1.1.6 Bố cục luận văn

Luận văn gồm 4 chương với các nội dung cơ bản sau:

Chương 1: Giới thiệu đề tài

Giới thiệu tổng quan về luận văn, bao gồm lý do chọn đề tài, mục tiêu, nhiệm vụ, đối tượng, phạm vi, phương pháp nghiên cứu, ý nghĩa khoa

học và thực tiễn Tiếp theo là giới thiệu những kiến thức cơ bản về học máy

bao gồm khái niệm, đặc thù, lợi ích cơ bản của học máy Cuối cùng là giới thiệu những ứng dụng của học máy được áp dụng trong ngành y tế và một

số khó khăn trong việc áp dụng học máy trong ngành y tế

Trang 12

Chương 2: Nghiên c ứu các mô hình học máy với dữ liệu y tế

Giới thiệu chung về những loại mô hình học máy nói chung Tiếp theo là giới thiệu chi tiết những ứng dụng mô hình học máy dùng trong y

tế Sau đó là giới thiệu một số mô hình học máy điển hình, nâng cao Cuối cùng là là giới thiệu phương pháp đánh giá hiệu năng của học máy

Chương 3: Đánh giá các mô hình học máy trong sàng lọc bệnh tiểu đường

Giới thiệu những kiến thức cơ bản về bệnh tiểu đường bao gồm khái

niệm, đặc thù, những ảnh hưởng của bệnh tiểu đường Tiếp theo là giới thiệu bài toán bao gồm bộ mục tiêu của bài toán, dữ liệu đầu vào, chọn lọc

dữ liệu, trực quan hóa dữ liệu, tiền xử lý dữ liệu, phương pháp xử lý bài toán Và cuối cùng là kết quả thí nghiệm thu được và đánh giá kết quả

Nhờ khả năng áp dụng những kiến thức đã qua huấn luyện từ các bộ

dữ liệu cực kì lớn, học máy có thể nhanh chóng xử lý các dữ liệu thông tin khác nhau để thực hiện các mục đích khác nhau, ví dụ như nhận dạng hình ảnh, hội thoại, giọng nói, vật thể, phiên dịch, dự đoán kết quả thông qua các

dữ liệu đã có, và rất nhiều công dụng khác

Vào giữa thế kỉ 20, học máy đã bắt đầu những bước đi đầu tiên dưới các hình thức sơ khai và nhiệm vụ đơn giản Đến đầu thế kỉ 21, nhiều nhà doanh nghiệp, chính phủ đã nhận ra tiềm năng to lớn của học máy và chú trọng đầu tư quỹ vào mảng học máy Kèm theo sự phát triển mạnh mẽ của

Trang 13

phần cứng, đặc biệt là GPU (Graphics processing unit – Bộ xử lý đồ họa) nên học máy đã có những bước đi xa vào thời điểm này

Học máy thường được sử dụng khi bài toán đặt ra có một công việc hoặc một vấn đề phức tạp liên quan đến một lượng lớn dữ liệu và nhiều

biến dữ liệu phải xử lý, nhưng hiện tại không có công thức hoặc phương trình nào để giải quyết vấn đề phức tạp đó Những trường hợp dưới là ví dụ

mà học máy sẽ rất thuận lợi trong việc giải quyết khó khăn:

o Những quy tắc và kết quả cần kiểm tra quá đặc biệt và phức tạp Ví dụ:

Nhận diện khuôn mặt và đoạn hội thoại

o Những nguyên tắc thường xuyên thay đổi của một công việc Ví dụ: phát hiện gian lận từ hồ sơ giao dịch

o Bản chất của dữ liệu thông tin thường xuyên thay đổi và chương trình

cần thích ứng những thay đổi đó Ví dụ: giao dịch tự động, dự báo nhu

cầu năng lượng và dự đoán xu hướng mua sắm

Phân biệt giữa học máy, học sâu (Deep learning) và trí tuệ nhân tạo (Artificial intelligence):

o Trí tuệ nhân tạo: là bất kỳ kỹ thuật nào cho phép máy tính bắt chước hành vi giống con người bằng cách sử dụng logic, quy tắc nếu-thì hoặc phương pháp học máy (bao gồm cả học sâu)

o Học máy: là một tập hợp con của trí tuệ nhân tạo, bao gồm các kỹ thuật thống kê trừu tượng cho phép máy móc cải thiện chất lượng các công

việc nhờ sự tích lũy kinh nghiệm Mảng học máy chứa mảng học sâu

o Học sâu: là tập hợp con của học máy bao gồm các mô hình cho phép

phần mềm tự huấn luyện để thực hiện các tác vụ, chẳng hạn như thực hiện nhận dạng giọng nói và hình ảnh bằng cách dùng mô hình mạng nơ-ron nhiều lớp xử lý một lượng lớn dữ liệu

Trang 14

Hình 1.1 Sự khác biệt giữa học sâu, học máy và trí tuệ nhân tạo [1] Cho đến ngày nay, học máy đã và đang ảnh hưởng các lĩnh vực khác nhau Học máy đã ảnh hưởng tới chính phủ thông qua việc phát triển khoa

học, giáo dục, y tế, … Nó đặc biệt ảnh hưởng rất lớn tới các doanh nghiệp, gồm các lĩnh vực quan trọng như nghiên cứu sản phẩm, marketing, truyền thông, chăm sóc khách hàng, kiểm toán, lập trình và rất nhiều lĩnh vực khác

Tuy rằng học máy đã đem tới rất nhiều tiềm năng phát triển nhưng cũng vì thế mà mang tới những rủi ro cao trong bảo mật Các trí tuệ nhân tạo ngày nay đang được huấn luyện thông qua học máy để có thể bẻ khóa bảo mật và vượt tường lửa của các hệ thống, phần mềm bảo mật để lấy cắp các dữ liệu, thông tin Ngoài ra, việc phát triển của học máy cũng sẽ mang

tới việc rất nhiều người sẽ bị mất việc trong tương lai, vì học máy và trí tuệ nhân tạo sẽ thực hiện công việc hiệu quả và nhanh hơn con người gấp triệu lần bình thường

1.3 Ứng dụng học máy trong y học

Thông qua những phát triển vượt bậc của công nghệ thông tin, ngành y tế cũng đã có những bước tiến mạnh mẽ nhờ sự tiếp nhận và hưởng lợi rất nhiều từ những tiến bộ công nghệ Ngày nay, học máy hiện đang đóng một vai trò quan trọng trong nhiều lĩnh vực liên quan đến sức khỏe nhằm hướng

Trang 15

tới các nghiên cứu, khám phá mới về con người, bệnh tật, phát triển thuốc

và từ đó có thể chăm sóc sức khỏe con người tốt hơn

1.3.1 Ứng dụng học máy trong tiên lượng, chẩn đoán bệnh

Với mục tiêu là giúp người dân có thể tự theo dõi, chăm sóc sức khỏe

tốt hơn, các nhà nghiên cứu khám phá thêm những kiến thức mới và giảm

tải áp lực cho y tế nói chung ở tương lai, học máy đã được áp dụng nhiều trong y tế thông qua các ứng dụng phần mềm

Những ứng dụng thực tế trong lĩnh vực chẩn đoán bệnh:

o Nhờ sự hợp tác phát triển của IBM Watson Health và Quest Diagnostics, vào tháng 10 năm 2016 sản phẩm IBM Watson Genomics đã được ra đời [2] Ứng dụng này có mục tiêu tạo ra những bước tiến mới trong y học chính xác thông qua cách tích hợp tính toán

nhận thức và giải trình tự bộ gen

o Một sản phẩm của Google có tên DeepMind Health đã hợp tác phát triển nhiều bệnh viện ở Châu Âu, với mục tiêu phát triển công nghệ giúp giải quyết tình trạng thoái hóa điểm vàng ở mắt bị lão hóa [3]

o Năm 2017, trung tâm y tế của trường đại học Stanford đã cho ra mắt

một ứng dụng giúp phân loại ung thư da trên hình ảnh bằng cách học sâu [4]

Hình 1.2 Ảnh scan của võng mạc trên mắt thông qua Google Deep

Mind [2]

Trang 16

1.3.2 Ứng dụng học máy trong nghiên cứu phát triển thuốc

Việc sử dụng máy học trong khám phá thuốc sơ bộ (giai đoạn đầu) đã

hỗ trợ nhiều công việc khác nhau, từ việc sàng lọc ban đầu các hợp chất thuốc đến tỷ lệ thành công dự đoán dựa trên các yếu tố sinh học

Ứng dụng thực tế trong lĩnh vực nghiên cứu phát triển thuốc:

o Dự án Hanover của Microsoft đã sử dụng công nghệ học máy trong nhiều nghiên cứu, bao gồm cả sự hợp tác với Viện Ung thư Hiệp sĩ (Knight Cancer Institute) để phát triển công nghệ trí tuệ nhân tạo để điều trị chính xác bệnh ung thư [5] Trọng tâm hiện tại của dự án là phát triển phương pháp tiếp cận cá nhân hóa việc kết hợp thuốc cho bệnh Bạch cầu cấp tính dòng tủy

o Hiệp hội Hoàng gia Anh cũng đã nhắc đến sự giúp đỡ của học máy trong sản xuất sinh học của ngành dược phẩm [6] Dữ liệu từ quá trình

thử nghiệm hoặc sản xuất đã giúp các nhà sản xuất dược phẩm giảm

thời gian cần thiết để sản xuất thuốc, dẫn đến giảm chi phí và cải thiện khả năng nhân rộng

1.3.3 Ứng dụng học máy trong điều trị bệnh

Nhờ các mô hình máy học mà phương pháp điều trị bệnh có khả năng phát hiện sự khác biệt giữa các mô khỏe mạnh và tế bào khỏe mạnh, giúp điều trị hiệu quả hơn

Ứng dụng thực tế trong lĩnh vực điều trị bệnh:

o Hãng Aidoc đã cung cấp một phần mềm giúp các bác sĩ phát hiện

những bất thường cấp tính trên cơ thể bệnh nhân và tăng tốc độ phát

hiện bằng thị giác máy tính[7]

o Công ty Aidence đã cho ra mắt một phần mềm có tên Veye Chest, nó

có thể giúp các bác sĩ phát hiện, theo dõi và báo cáo về các nốt mờ

phổi đơn độc thông qua hình ảnh trên máy [8] Theo báo cáo công ty, chiếc máy này đã được huấn luyện trên 45.000 bộ dữ liệu và được các bác sĩ kiểm chứng

Trang 17

o Công ty Arterys đã cung cấp một phần mềm có tên gọi là ArterysAI

Mô hình học máy của phần mềm đã được huấn luyện để tập trung vào việc phát hiện các bất thường ở tim, phổi và gan [9] Phần mềm này có thể giúp các bác sĩ nhìn thấy và hiểu rõ hơn về trái tim của bệnh nhân

mà không cần đến các phương pháp nội soi hay bức xạ, nhờ vậy mà

có thể giảm đáng kể thời gian bác sĩ cần để quét ảnh bệnh nhân

Hình 1.3 Ảnh scan cơ thể bệnh nhân thông qua phần mềm Aidoc [9]

1.3.4 Ứng dụng học máy trong dự đoán dịch bệnh

Công nghệ học máy và trí tuệ nhân tạo cũng đang được áp dụng để giám sát và dự đoán các đợt bùng phát dịch bệnh trên khắp thế giới, dựa trên những dữ liệu thu thập các nguồn khác nhau bao gồm vệ tinh, thông tin lịch sử trên web, các thông tin truyền thông xã hội theo thời gian thực Ví

dụ như mô hình máy vectơ hỗ trợ và mạng nơ-ron nhân tạo đã được sử

dụng để dự đoán các đợt bùng phát bệnh sốt rét, có tính đến các dữ liệu như nhiệt độ, lượng mưa trung bình hàng tháng, tổng số ca dương tính và các điểm dữ liệu khác

Ứng dụng ProMED-mail là một ví dụ điển hình Chương trình này có khả năng báo cáo dựa trên internet để theo dõi các bệnh mới nổi và cung

cấp các báo cáo bùng phát trong thời gian thực [10]:

Trang 18

Hình 1.4 Ứng dụng ProMED-mail giúp chẩn đoán dịch bệnh [10]

1.3.5 Một số khó khăn của việc áp dụng học máy trong y học

Trong cuộc đua ứng dụng công nghệ ML vào dược phẩm và y học, vẫn còn những thách thức lớn cần giải quyết:

o Các dữ liệu thông tin cá nhân liên quan bệnh án đều cần sự cho phép

của bệnh nhân mới được dùng để làm nghiên cứu Vì vậy, sự hợp tác của người dân là rất cần thiết để có thể có nguồn dữ liệu thực và từ đó

áp dụng phương pháp học máy một cách thành công

o Cần có những nghiên cứu khoa học kỹ lưỡng về bệnh để có thể chọn

lọc dữ liệu trước khi áp dụng phương pháp học máy Việc này sẽ giúp tránh gặp những kết quả phi logic, không khoa học và dẫn đến tỉ lệ dự đoán không chính xác trong nhiều trường hợp

o Việc chia nhỏ “kho chứa dữ liệu” và khuyến khích “chế độ xem tập trung vào dữ liệu” (tức là nhìn thấy giá trị trong việc chia sẻ và tích hợp

dữ liệu) giữa các lĩnh vực là điều rất quan trọng trong việc giúp chuyển đổi tư duy của ngành theo hướng nắm bắt và nhìn thấy giá trị trong những thay đổi gia tăng dài hạn Các công ty dược phẩm từ trước đến nay thường do dự trong việc thực hiện các thay đổi hoặc hỗ trợ các sáng kiến nghiên cứu, trừ khi có giá trị tiền tệ tức thời và đáng kể

Trang 19

C HƯƠNG 2 NGHIÊN CỨU CÁC

Việc phân biệt mô hình học máy sẽ giúp cho việc xác định mô hình phù

hợp với bài toán một cách dễ dàng hơn và giải quyết bài toán một cách hiệu

quả hơn Trong học máy có 4 nhóm học máy chính bao gồm:

Học có giám sát (Supervised learning) là mô hình dự đoán kết quả đầu

ra của một dữ liệu mới dựa trên các bộ dữ liệu đầy đủ thông tin đầu vào

và đầu ra [1] Học có giám sát là nhóm phổ biến nhất trong các mô hình

học máy

Học không giám sát (Unsupervised Learning): là mô hình mà chúng ta không biết được đầu ra mà chỉ có dữ liệu đầu vào [1] Mô hình học không giám sát sẽ dựa vào cấu trúc thông tin của dữ liệu để thực hiện

một công việc nào đó, ví dụ như phân nhóm (clustering) hoặc giảm số chiều của dữ liệu (dimension reduction) để phục vụ các mục đích khác nhau, ví dụ như thuận tiện trong việc lưu trữ và tính toán

Học bán giám sát (Semi-Supervised Learning): Đối với bài toán khi chúng có một lượng lớn dữ liệu nhưng chỉ có một phần trong chúng được gán nhãn được gọi là học bán giám sát [1] Bài toán dạng này thuộc nhóm này nằm giữa hai nhóm đã nêu bên trên

- Học tăng cường (Reinforcement Learning): là các bài toán giúp cho một

hệ thống tự động có thể xác định hành vi dựa trên những thông tin từ hoàn cảnh để đạt được lợi ích cao nhất [1] Học củng cố chủ yếu được

áp dụng vào trò chơi khi các thuật toán cần xác định nước đi tiếp theo

để đạt được điểm số cao nhất

Trong y tế, các loại học máy giám sát, không giám sát và bán giáp sát được

áp dụng nhiều nhất Với học máy giám sát và bán giám sát, chúng được sử dụng để nhận dạng, chẩn đoán bệnh Còn với học không giám sát, chúng thường được dùng trong thị giác máy tính và y học chính xác

Trang 20

2.2.1 H ọc máy với dữ liệu bệnh án điện tử

Hệ thống hồ sơ sức khỏe điện tử (Electronic Health Record) là hồ sơ lưu trữ dữ liệu dưới dạng dữ liệu số, dữ liệu gồm các thông tin liên quan đến tổng thể thông tin sức khỏe của mỗi cá nhân (bao gồm thông tin nhân khẩu học, chẩn đoán, thuốc, xét nghiệm và kết quả trong phòng thí nghiệm, hình ảnh y tế, ghi chú lâm sàng, ) [11] Với mục đích chính của hồ sơ sức

khỏe điện tử là để cải thiện hiệu quả và dễ dàng tiếp cận của các hệ thống y

tế, nó đã được tìm thấy rất nhiều ứng dụng trong dịch tễ học Đặc biệt, hệ

thống hồ sơ sức khỏe điện tử đã được sử dụng rất nhiều mục đích khác nhau và đóng góp cho y tế nhiều hỗ trợ quan trọng, ví dụ như phân nhóm bệnh và bệnh nhân, dự đoán bệnh, và hỗ trợ quyết định lâm sàng,…

Những đánh giá, phân tích ban đầu của hồ sơ sức khỏe điện tử chỉ là

những kĩ thuật đơn giản dựa trên các kỹ thuật thống kê truyền thống [12] Tuy nhiên, với sự phát triển của công nghệ thông tin và học máy, các mô hình học máy như hồi quy logistic, máy vectơ hỗ trợ, và rừng ngẫu nhiên cũng đã được sử dụng để khai thác và đưa ra các kết quả dự đoán đáng tin

cậy thông qua dữ liệu của hồ sơ sức khỏe điện tử Mặc dù các ứng dụng y

tế có nhu cầu về tính đơn giản và khả năng diễn giải của các mô hình thống

kê như vậy, nhưng điểm yếu của những mô hình học máy gồm việc xử lý thông tin dữ liệu chiều cao, sự phụ thuộc vào nhiều giả định trong cả thống

kê và cấu trúc, việc yêu cầu các loại thông tin dữ liệu được làm thủ công (được hướng dẫn bởi người có lĩnh vực chuyên môn) làm cho việc sử dụng học máy để phân tích toàn diện dữ liệu hồ sơ sức khỏe điện tử là kém thực

Trang 21

tế Để giảm bớt những điểm yếu này, người ta cần phải phân tích toàn bộ tiền sử bệnh của mỗi cá nhân (tức là một chuỗi dữ liệu đa phương thức và hỗn hợp, được đóng gói trong các khoảng thời gian không đều đặn), và từ

đó sử dụng các kỹ thuật mô hình có thể khám phá và tính đến các tương tác phi tuyến phức tạp giữa các biến

Trong thập kỷ vừa qua, học sâu đã có những tác động sâu sắc tới một loạt các ứng dụng, bao gồm xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói, thị giác máy tính và học tăng cường Kết quả là, trong những năm gần đây, lĩnh vực tin học y tế đã có sự phát triển trong việc sử dụng học sâu cho nhiều nhiệm vụ khác nhau Ví dụ như trong việc nghiên cứu phân tích gen, học sâu đã giúp xác định các biến thể di truyền phổ biến chính xác hơn so với các phương pháp thông thường, mở ra những hướng đi mới trong nghiên cứu gen và khám phá thuốc cho y học

2.2.2 H ọc máy với dữ liệu ảnh y tế

Học sâu đã vươn lên vị trí nổi bật trong thị giác máy tính khi mô hình học máy mạng nơ-ron bắt đầu vượt trội hơn các phương pháp khác trên một

số tiêu chuẩn phân tích hình ảnh cấu hình cao Nổi tiếng nhất đó là trong

thử thách nhận dạng hình ảnh quy mô lớn ImageNet (ImageNet Scale Visual Recognition Challenge, viết tắt là ILSVRC) vào năm 2012 [13] khi mô hình học sâu (mạng nơ-ron tích tụ) đã giảm một nửa tỷ lệ lỗi của lỗi gặp nhiều đứng thứ hai trong nhiệm vụ phân loại hình ảnh Việc cho phép máy tính nhận dạng các đối tượng trong hình ảnh tự nhiên trước đó được cho là một nhiệm vụ rất khó khăn, tuy nhiên các mạng nơ-ron phức

Large-hợp đã vượt qua cả hiệu suất của con người trong cuộc thi ILSVRC và đã thành công trong nhiệm vụ cơ bản của việc phân loại trong cuộc thi ILSVRC, đó là có lỗi tỷ lệ gần với tỷ lệ Bayes Kỹ thuật học sâu đã trở thành tiêu chuẩn thực tế cho nhiều vấn đề về thị giác máy tính

Mô hình mạng nơ-ron nhân tạo rất linh hoạt, có thể mô hình hóa và giải quyết các vấn đề phức tạp, nhưng chúng cũng khó và rất tốn kém về tính

Trang 22

toán để thực hiện việc huấn luyện Điều này đã làm gây nhiều khó khăn và giảm tiện ích thực tế của chúng Nhưng hiện tại, mạng nơ-ron nhân tạo vẫn

là một trong những phương pháp thống trị trong học máy và được nghiên cứu chuyên sâu nhất Sự thay đổi này là nhờ sự phát triển của dữ liệu lớn,

bộ xử lý mạnh mẽ cho các tính toán song song (đặc biệt là bộ xử lý đồ hoạ GPU), một số tinh chỉnh quan trọng đối với các thuật toán đã được sử dụng

để xây dựng và huấn luyện mạng nơ-ron

Nhờ có sự phát triển của học sâu trong việc phân loại hình ảnh mà y tế

đã có những bước phải triển lớn Ví dụ như việc phát hiện và phân loại ung thư da, vú, phổi, tim,… và chữa trị bệnh chính xác hơn nhờ áp dụng học sâu trên những ảnh chụp, quét trên cơ thể người

2.3 M ột số mô hình học máy điển hình

Mỗi mô hình có một phương thức, giả định khác nhau để mô tả bài toán

để từ đó xác định hướng giải quyết Việc nắm rõ bản chất các mô hình là hoàn toàn cần thiết để có thể xác định mô hình phù hợp và giải quyết bài toán một cách hiệu quả

2.3.1 H ồi quy Logistic - Logistic regression

Định nghĩa

Hồi quy Logistic là một mô hình học máy có giám sát được sử dụng khá phổ biến [1] Mặc dù có chứa từ “hồi quy” nhưng mục đích chính của mô hình này lại dùng để phân loại dữ liệu

Phương pháp hồi quy logistic sử dụng mô hình hồi quy nhằm dự đoán giá trị đầu ra y ứng với một véc-tơ đầu vào x Công việc của mô hình là phân loại các đầu vào x vào các nhóm y tương ứng

Trang 23

Hình 2.1 Dữ liệu được phân loại bằng mô hình hồi quy Logistic [1]

Mô hình thu ật toán:

Bằng phương pháp thống kê, ta sẽ khả năng một đầu vào x nằm vào một nhóm y0 là p(y0∣x) Khi đó, theo công thức xác suất hậu nghiệm ta có:

P(𝑦𝑦0|x) =P(x|𝑦𝑦𝑃𝑃(𝑥𝑥)0)𝑃𝑃(𝑦𝑦0) = P(x|𝑦𝑦0)𝑃𝑃(𝑦𝑦0)

P(x|𝑦𝑦0)𝑃𝑃(𝑦𝑦0) + P(x|𝑦𝑦1)𝑃𝑃(𝑦𝑦1) (2.1)Đặt:

𝑎𝑎 = 𝑙𝑙𝑙𝑙P(x|𝑦𝑦0)𝑃𝑃(𝑦𝑦0)

P(x|𝑦𝑦1)𝑃𝑃(𝑦𝑦1) (2.2)

Từ đó, ta có

P(𝑦𝑦0|x) = 1 + exp (−𝑎𝑎) = 𝜎𝜎1 (𝑎𝑎) (2.3)

Đồ thị hàm sigmoid σ(a) sẽ có hình dạng chữ S bị chặn 2 đầu

Theo hình vẽ, ta có thể viết lại phương trình thành:

P(𝑦𝑦0|x) = 1 + exp (−𝑎𝑎) = 𝜎𝜎1 (𝑤𝑤𝑇𝑇𝑥𝑥) (2.4)

Với x là thuộc tính đầu vào và w là trọng số tương ứng của dữ liệu

Trang 24

Sau khi có được công thức tính xác suất, ta có thể sử dụng một ngưỡng ϵ∈[0,1] để quyết định nhóm tương ứng

(2.6)

Trong đó

o m là kích thước của bộ dữ liệu

o y(i) là lớp tương ứng của dữ liệu thứ i của bộ dữ liệu

o 𝜎𝜎(𝑖𝑖) = 𝜎𝜎�𝑤𝑤𝑇𝑇𝑥𝑥(𝑖𝑖)� là xác suất tương ứng sau khi tính với mô hình cho

dữ liệu thứ i

Để có thể tối ưu hàm J(w), có hai phương pháp hay được dùng đó là phương pháp Gradient Descent và phương pháp Newton-Raphson

Phương pháp Gradient Descent

Ta sẽ tối ưu hàm J(w) ta sẽ đạo hàm của hàm log của công thức trên:

𝑥𝑥𝑗𝑗(𝑖𝑖)

= 𝑚𝑚 �(𝜎𝜎 �𝑤𝑤1 𝑇𝑇𝑥𝑥(𝑗𝑗)(𝑖𝑖)�

𝑚𝑚 𝑖𝑖=1

Trang 25

= 1

m XT(σ − y) (2.9) Sau khi đạo hàm của hàm sigmoid, ta được:

= m � X1 TX

m i=1

o Hồi quy logistic ít bị overfit

o Hồi quy logistic không chỉ đưa ra thước đo mức độ liên quan của một yếu tố dự đoán (kích thước hệ số) mà còn cả hướng liên kết của nó (tích

cực hoặc tiêu cực)

Trang 26

o Hồi quy logistic dễ thực hiện hơn, dễ hiểu hơn và rất hiệu quả để huấn luyện

Nhược điểm

o Hạn chế chính của hồi quy logistic là giả định về độ tuyến tính giữa

biến phụ thuộc và các biến độc lập Trong dữ liệu thực, đa số dữ liệu sẽ

là một mớ hỗn độn và dữ liệu hiếm khi có thể phân tách tuyến tính

o Có khả năng bị overfit khi có nhiều thuộc tính dữ liệu

o Hồi quy logistic chỉ có thể được sử dụng để dự đoán các chức năng rời

rạc Do đó, biến phụ thuộc của hồi quy logistic bị hạn chế trong tập số

rời rạc Bản thân hạn chế này là có vấn đề, vì nó cấm đoán trước dữ liệu liên tục

2.3.2 Máy vectơ hỗ trợ - Support Vector Machine (SVM)

Định nghĩa

Mô hình SVM (viết tắt của Support Vector Machine, dịch là máy vectơ hỗ

trợ) là một mô hình học máy có giám sát được sử dụng rất phổ biến ngày nay trong các bài toán phân lớp hay hồi qui [1]

Mô hình thu ật toán SVM:

Giả sử rằng tồn tại hai lớp khác nhau, và trong hai lớp đó gồm các điểm trong không gian nhiều chiều Mục tiêu của phương pháp SVM là tìm ra

một siêu mặt phẳng phân chia hai lớp đó, tức là tìm ra một siêu mặt phẳng sao cho mỗi phía mặt phẳng là một lớp khác nhau

Giả sử vẽ được đường phân tách (với không gian 2 chiều thì mặt phẳng này

là một đường phân tách), đường phân tách này có phương trình:

𝑤𝑤𝑇𝑇𝑥𝑥 + 𝑏𝑏 = 0 (2.13) Khi đó, dấu của hàm ước lượng này sẽ có thể viết dưới dạng:

𝐻𝐻 = {𝑥𝑥 ⟼ 𝑠𝑠𝑙𝑙𝑙𝑙(𝑤𝑤𝑇𝑇𝑥𝑥 + 𝑏𝑏); 𝑤𝑤 ∈ 𝑅𝑅𝑁𝑁, 𝑏𝑏 ∈ 𝑅𝑅} (2.14)

H sẽ thể hiện điểm dữ liệu x nằm ở cụm dữ liệu nào

Trang 27

Sẽ có thể có nhiều mặt phân tách thoả mãn được việc này Nên mặt nằm vừa khít giữa 2 cụm dữ liệu sao cho nằm xa các tập dữ liệu nhất sẽ là mặt tốt nhất

Hình 2.2 Hai lớp được phân chia sao cho khoảng cách đạt giá trị lớn

nhất [1]

Để xác định mặt phẳng kẹp giữa đó, đầu tiên ta cần phải xác định được 2 mặt biên gốc như 2 đường nét đứt ở trên Ta có thể xác định các điểm dữ liệu gần với mặt biên gốc này nhất bằng:

Trang 28

Ta sẽ cần thiết lập thông số tính khoảng cách đó bằng phép lấy độ rộng biên từ mặt biên gốc tới mặt phân tách cần tìm:

𝜌𝜌 = 𝑚𝑚𝑚𝑚𝑙𝑙|𝑤𝑤𝑡𝑡𝑥𝑥 + 𝑏𝑏|

||𝑤𝑤|| =

1

||𝑤𝑤|| (2.18)Bài toán của ta bây giờ sẽ là cần xác định w và b sao cho ρ đạt lớn nhất và các

điểm dữ liệu thỏa mãn:

𝑦𝑦𝑖𝑖(𝑤𝑤𝑡𝑡𝑥𝑥𝑖𝑖 + 𝑏𝑏) ≥ 1 (2.19)

ρ đạt lớn nhất đồng nghĩa với việc giá trị ∥w∥ đạt nhỏ nhất Tức là:

(w, b) = arg min𝑤𝑤,𝑏𝑏 12 ||𝑤𝑤||2 (2.20)

𝑦𝑦𝑖𝑖(𝑤𝑤𝑡𝑡𝑥𝑥𝑖𝑖 + 𝑏𝑏) ≥ 1 𝑣𝑣ớ𝑚𝑚 𝑚𝑚 ∈ [1, 𝑚𝑚] (2.21)

Với m là số lượng các điểm dữ liệu (xi , yi)

Sử dụng phương pháp nhân tử Lagrange, ta sẽ giải được bài toán này

Khi đó, ta sẽ cần tìm các giá trị λ như sau:

λ = arg max

λ � λ𝑖𝑖

𝑚𝑚 𝑖𝑖=1

−12 � λ𝑖𝑖λ𝑗𝑗y𝑖𝑖y𝑗𝑗x𝑖𝑖x𝑗𝑗

𝑚𝑚 𝑖𝑖,𝑗𝑗=1

(2.22)

λ𝑖𝑖 ≥ 0 ∧ � λ𝑖𝑖y𝑖𝑖 = 0 𝑣𝑣ớ𝑚𝑚 𝑚𝑚 ∈ [1, 𝑚𝑚]

𝑚𝑚 𝑖𝑖=1

Trang 29

𝑏𝑏 = |𝑆𝑆| � �y1 𝑖𝑖 − � λ𝑗𝑗y𝑗𝑗x𝑗𝑗x𝑖𝑖

𝑚𝑚 𝑗𝑗=1

𝑖𝑖∈𝑆𝑆

(2.26) Lúc đó, một điểm dữ liệu mới sẽ được phân loại dựa theo:

ℎ(𝑥𝑥) = 𝑠𝑠𝑙𝑙𝑙𝑙 �� λ𝑖𝑖y𝑖𝑖x𝑖𝑖𝑡𝑡𝑥𝑥 + 𝑏𝑏

𝑚𝑚 𝑖𝑖=1

� (2.27)

Như vậy, chỉ cần các điểm véc tơ hỗ trợ trên đường biên gốc là ta có thể ước lượng được các tham số tối ưu cho bài toán Việc này sẽ tạo thuận lợi khi tính toán và giúp phương pháp này tiết kiệm được tài nguyên thực thi

Tuy nhiên, với dữ liệu thực tế phức tạp và hai lớp đan xen lẫn nhau, việc tìm ra

mặt phân cách gần như là không thể Khi đó, qua phương pháp kernel (hạt nhân) ta sẽ cần sử dụng hàm cơ bản Φ(x) để tạo đặc trưng cho tập dữ liệu

nhằm nâng được chiều của dữ liệu ban đầu Dùng các hàm cơ bản này, ta có thể tạo các mặt cong phân tách cho phù hợp với các điểm dữ liệu không phân tách tuyến tính

Hình 2.3 Tập dữ liệu được ánh xạ thông qua phương pháp kernel [1]

Khi đó tối ưu biên mềm được viết dưới dạng:

λ = arg max

λ � λ𝑖𝑖

𝑚𝑚 𝑖𝑖=1

−12 � λ𝑖𝑖λ𝑗𝑗y𝑖𝑖y𝑗𝑗

𝑚𝑚 𝑖𝑖,𝑗𝑗=1

Φ(x𝑖𝑖)𝑡𝑡Φ�x𝑗𝑗� (2.28)

Trang 30

0 ≤ λ𝑖𝑖 ≤ C ∧ � λ𝑖𝑖y𝑖𝑖 = 0 𝑣𝑣ớ𝑚𝑚 𝑚𝑚 ∈ [1, 𝑚𝑚]

𝑚𝑚 𝑖𝑖=1

(2.29) Đặt hàm Kernel

−12 � λ𝑖𝑖λ𝑗𝑗y𝑖𝑖y𝑗𝑗

𝑚𝑚 𝑖𝑖,𝑗𝑗=1

𝐾𝐾�x𝑖𝑖, 𝑥𝑥𝑗𝑗� (2.31)

0 ≤ λ𝑖𝑖 ≤ C ∧ � λ𝑖𝑖y𝑖𝑖 = 0 𝑣𝑣ớ𝑚𝑚 𝑚𝑚 ∈ [1, 𝑚𝑚] (2.32)

𝑚𝑚 𝑖𝑖=1

Lúc đó, tham số tương ứng sẽ là

𝑤𝑤 = � λ𝑖𝑖y𝑖𝑖Φ�x𝑗𝑗�

𝑚𝑚 𝑖𝑖=1

(2.33)

𝑏𝑏 = |𝑆𝑆| � �y1 𝑖𝑖 − � λ𝑗𝑗y𝑗𝑗𝐾𝐾�x𝑖𝑖, 𝑥𝑥𝑗𝑗�

𝑚𝑚 𝑗𝑗=1

𝑖𝑖∈𝑆𝑆

for xi 𝑤𝑤𝑚𝑚𝑤𝑤ℎ 0 < λ𝑖𝑖 < 𝐶𝐶 (2.34) Điểm dữ liệu mới được phân lớp với

ℎ(𝑥𝑥) = 𝑠𝑠𝑙𝑙𝑙𝑙 �� λ𝑖𝑖y𝑖𝑖Φ(x𝑖𝑖)𝑡𝑡Φ(x) + 𝑏𝑏

𝑚𝑚 𝑖𝑖=1

= 𝑠𝑠𝑙𝑙𝑙𝑙 �� λ𝑖𝑖y𝑖𝑖𝐾𝐾(x𝑖𝑖, 𝑥𝑥) + 𝑏𝑏

𝑚𝑚 𝑖𝑖=1

� (2.35)

Như vậy, để có thể tính tích vô hướng giữa các điểm dữ liệu trong không gian

mới, ta chỉ cần dùng hàm Kernel K(xi , xj) là có thể ước lượng được một điểm

mới nằm trong phân lớp nào

Khi làm việc người ta thường chọn một hàm Kernel thông dụng sau:

o Đa thức - Polynomial Kernels:

Trang 31

o Tiết kiệm bộ nhớ: Vì chỉ có một tập con của các điểm được sử dụng trong cả hai quá trình huấn luyện và quá trình ra quyết định thực tế nên chỉ có những điểm cần thiết mới được lưu trữ trong bộ nhớ khi ra quyết dịnh

o Tính linh hoạt: Khả năng áp dụng Kernel mới tạo nên sự linh động giữa các phương pháp tuyến tính và phi tuyến tính Và từ đó khiến cho

hiệu năng phân loại lớn hơn

Ngày đăng: 01/05/2021, 08:20

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w