Các nội dung nghiên cứu trong đề tài“ Phát hiện và khoanh vùng ung thư thận bằng phương pháp deep learning ” của tôi là trung thực và chưa công bố dướ i bất k ỳ hình thức nào trước đây
Trang 1BỘ LAO ĐỘNG - THƯƠNG BINH VÀ XÃ HỘI
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
PHÁT HIỆN VÀ KHOANH VÙNG UNG THƯ THẬN BẰNG
KỸ THUẬT DEEP LEARNING
Vĩnh Long- Năm 2022
Trang 2BỘ LAO ĐỘNG - THƯƠNG BINH VÀ XÃ HỘI
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
PHÁT HIỆN VÀ KHOANH VÙNG UNG THƯ THẬN BẰNG
KỸ THUẬT DEEP LEARNING
Vĩnh Long- Năm 2022
Trang 3i
LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt đượ c trong luận văn là sản phẩm của riêng cá nhân, không sao chép lại của ngườ i khác Trong toàn bộ nội dung của luận văn, những điều
đượ c trình bày hoặc là của cá nhân hoặc là đượ c tổng hợ p từ nhiều nguồn tài liệu Tất
cả các tài liệu tham khảo đều có xuất xứ rõ ràng và đượ c trích dẫn hợp pháp Đây là
công trình nghiên cứu của cá nhân tôi và đượ c sự hướ ng dẫn thực hiện của Tiến sĩ
Phan Anh Cang Các nội dung nghiên cứu trong đề tài“ Phát hiện và khoanh vùng
ung thư thận bằng phương pháp deep learning ” của tôi là trung thực và chưa công
bố dướ i bất k ỳ hình thức nào trước đây và dựa trên một số tài liệu, đề tài trướ c Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức k ỷ luật theo quy định cho lờ i
cam đoan của mình.
Người thực hiện đề tài
Lê Duy Linh
Trang 4MỤC LỤC
LỜI CAM ĐOAN i
MỤC LỤC ii
LỜI CẢM ƠN v
DANH MỤC CÁC CHỮ VIẾT TẮT vi
DANH MỤC CÁC BẢNG vii
DANH MỤC HÌNH ẢNH viii
MỞ ĐẦU 1
CHƯƠNG 1: CƠ SỞ KHOA HỌC CỦA ĐỀ TÀI 4
1.1 Giới thiệu 4
1.2 Lý do chọn đề tài 4
1.3 Cơ sở lý luận 5
1.4 Cơ sở thực tiễn 6
1.5 Nghiên cứu liên quan 6
1.6 Vấn đề đặt ra 6
1.7 Hướng giải quyết 7
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 8
2.1 Bệnh ung thư thận 8
2.1.1 Ung thư thận 8
2.1.2 Nguyên nhân gây bệnh 8
2.1.3 Ung thư thận và các giai đoạn phát triển 9
2.1.4 Cách thức gây bệnh 10
2.1.5 Dấu hiệu và triệu chứng 10
2.1.6 Phương pháp điều trị 12
2.1.7.Phương pháp chuẩn đoán 13
2.2 Tổng quan về trí tuệ nhân tạo 16
2.2.1 Khái niệm 16
2.2.2 Một số công nghệ Trí tuệ nhân tạo phổ biến 17
2.2.3 Ứng dụng của trí tuệ nhân tạo trong cuộc sống hiện nay 17
Trang 5iii
2.3 Machine learning 20
2.3.1 Khái niệm Machine Learning 21
2.3.2 Machine learning Workflow 21
2.3.3 Phân loại Machine learning 22
2.3.4 Một số khái niệm cơ bản 23
2.3.5 Ứng dụng của Machine learning 24
2.4 Deep learning 25
2.4.1 Khái niệm Deep Learning 25
2.4.3 Các ưu điểm nổi bật của Deep Learning 25
2.4.2 Cách thức hoạt động của Deep Learning 26
2.4.4 Ứng dụng của Deep Learning 27
2.5.Mạng học sâu và vai trò 28
2.5.1 Vai trò của học sâu trong phát hiện và dự đoán 28
2.5.2 Mạng nơ -ron tích chập CNN 29
2.5.3 Transfer Learning 35
2.5.4 Kiến trúc mạng ResNet và các chỉ số đánh giá 37
2.5.5 Kiến trúc mạng Unet và các chỉ số đánh giá: 40
2.6 Công cụ xây dựng 41
2.6.1 Sử dụng Google Colab kết hợp với các thư viện máy học để xây dựng và huấn luyện các mô hình Deep Learning 41
2.6.2 Sử dụng Tensorflow để xây dựng mô hình Deep Learning 43
2.6.3 Sử dụng Keras API để triển khai và đào tạo mô hình Deep Learning 44
CHƯƠNG 3: PHƯƠNG PHÁP ĐỀ XUẤT 46
3.1 Mô hình đề xuất 46
3.1.1 Kiến trúc đề xuất phát hiện khoanh vùng tổn thương thận do ung thư 46
3.1.2 Mô hình Unet phát hiện và phân vùng khối u dựa trên dấu hiệu tổn thương thận 47
3.1.3 Mô hình Resnet phát hiện khối u dựa trên dấu hiệu tổn thương thận 47
Trang 63.2 Pha tiền xử lý và tăng cường dữ liệu 47
3.2.2 Tăng cường dữ liệu áp dụng phương pháp Flip images 47
3.2.3 Tăng cường dữ liệu áp dụng phương pháp rotation images 48
3.2.4 Tăng cường dữ liệu áp dụng phương pháp crop images 48
3.2.5 Tăng cường dữ liệu áp dụng phương pháp resize images 48
3.3 Pha huấn luyện mô hình 49
3.4 Pha phân loại 49
CHƯƠNG 4: KẾT QUẢ 50
4.1.Môi trường thực nghiệm 50
4.2 Kịch bản và tham số huấn luyện 50
4.2.1 Kịch bản 1: 50
4.2.2 Kịch bản 2: 51
4.3 K ết quả huấn luyện 51
4.3.1 Độ chính xác 51
4.3.2 Độ mất mác(Loss) 52
4.3.4 Thời gian huấn luyện 53
4.4 Kết quả kiểm thử và hình ảnh 53
CHƯƠNG 5: KẾT LUẬN – HƯỚNG PHÁT TRIỂN 55
5.1 Kết luận 55
5.2 Hướng phát triển 55
TÀI LIỆU THAM KHẢO 56
PHỤ LỤC 58
Trang 7v
LỜI CẢM ƠN
Trước hết em xin bày tỏ lòng biết ơn đối với tất cả các thầy cô trong Khoa Côngnghệ thông tin-Trường Đại học Sư Phạm Kỹ Thuật Vĩnh Long Đặc biệt nhất là thầyPhan Anh Cang, những người đã dành cho em rất nhiều thời gian quý báu, trực tiếphướng dẫn tận tình giúp đỡ, chỉ bảo và góp ý cho em trong suốt quá trình làm đề tàikhóa luận tốt nghiệp này.
Em xin chân thành cảm ơn các thầy cô tham gia giảng dạy và truyền đạt nhữngkiến thức quý báu về học tập cũng như về cuộc sống trong suốt thời gian em học tậptại trường, đã đọc và phản biện bài báo cáo của em, giúp em hiểu rõ hơn các vấn đề
mà mình nghiên cứu.
Tuy có nhiều cố gắng trong quá trình học tập cũng như trong quá trình làm đề tàikhóa luận nhưng không thể tránh khỏi những thiếu sót, em rất mong được sự góp ýquý báu của tất cả các thầy, cô cũng như tất cả các bạn để kết quả của em được hoànthiện ngày một tốt hơn.
Cuối cùng chúng em xin kính chúc quý thầy, cô dồi dào sức khỏe và thành côngtrong sự nghiệp cao quý.
Một lần nữa, em xin chân thành cảm ơn!
Vĩnh Long, ngày21 tháng 12năm 2022
Lê Duy Linh
Trang 9vii
DANH MỤC CÁC BẢNG
Bảng 2.1 Phân loại TNM 15
Bảng 2.2 Bảng chuẩn đoán ung thư theo TNM 16
Bảng 2.3 Cấu hình phần cứng do Google Colab cung cấ p 41
Bảng 4.1 Thông số môi trườ ng huấn luyện……… …….50
Bảng 4.2 Thông số k ịch bản 1 51
Bảng 4.3 Thông số k ịch bản 2 51
Bảng 4.4 Bảng so sánh và lựa chọn mô hình 51
Bảng 4.5 Thờ i gian huấn luyện 51
Trang 10DANH MỤC HÌNH ẢNH
Hình 2 1Ảnh so sánh giữa thận bình thườ ng và thận bị ung thư 8
Hình 2 2 Các giai đoạn phát triển của ung thư thận 10
Hình 2.3 Machine Learning Workflow 21
Hình 2.4 Minh họa về Supervised learning 22
Hình 2.5 Minh họa vể Unsupervised learning 23
Hình 2.6 Deep Learning 25
Hình 2.7 Ví dụ về cửa sổ trượ t 30
Hình 2.8 Ví dụ về mô hình CNN 31
Hình 2.9 Tạo ra Neuronẩn đầu tiên 32
Hình 2.10 Dịch filter qua phải 32
Hình 2.11 Các hidden layer 33
Hình 2.12 Max-pooling 34
Hình 2.13 Convolutional Neural Network 34
Hình 2.14 Fully Connected 35
Hình 2.15 Transfer Learning 36
Hình 2 16 So sánh độ chính xác và thờ i gian huấn luyện khi áp dụng và không áp dụng transfer learning 36
Hình 2.21 Thông số cấu hình mạng VGG-16 37
Hình 2.22 Cộng tr ực tiếp đầu vào của khối vớ i nhánh còn lại trong khối Identity block 38
Hình 2.23 Kiến trúc Resnet bao gồm 2 khối đặc trưng là khối tích chậ p (Conv block) và khối xác định (Identity block) 38
Hình 2.24 Kiến trúc tổng quan của Resnet 39
Hình 2.25 Kiến trúc mạng Unet 40
Hình 3.1 mô hình đề xuất phát hiện ung thư thận dựa trênảnh chụ p CT 46 Hình 3.2 Mô hình Unet đề xuất 47
Hình 3.3 Mô hình resnet đề xuất 47
Hình 3.4 Tăng cườ ngảnh bằng phương pháp Flipimage 47
Hình 3.5 Tăng cườ ngảnh bằng phương pháp rotation 48
Hình 3.6 Tăng cườ ngảnh bằng phương pháp crop 48
Hình 3.7 Tăng cườ ngảnh bằng phương pháp resize images 48
Trang 11ix
Hình 3.8 Thông số huấn luyện đượ c cải thiện sau mỗi epoch 49
Hình 4.1 Độ chính xác cho mô hình phân đoạn………51
Hình 4.2 k ết quả mô hình dự đoán mạng unet 54
Hình 4.3 K ết quả mô hình dự đoán mạng Resnet 54
Trang 12Ung thư thậncó thể được chia ra 5 loại: Ung thư thận tế bàosáng (ccRCC), Ung
thư nhú thận (pRCC), Ung thư thận kỵ màu (Chromophobe RCC, chRCC),Oncocytom thận, Ung thư ống góp Bellini Tỷ lệ ung thư tế bào sáng (ccRCC) chiếmđến 70-80% ở các trường hợp Căn bệnh này đứng ở vị trí thứ hai ở trong số nhữngcăn bệnh ác tính của hệ tiết niệu. Trong quá trình phát triển, khối u thận sẽ lớn dần, phá vỡ bao thận và xâm lấn vào lớp mỡ quanh thận và các cơ quan lân cận Tế bàoung thư cũng có thể di căn tới các cơ quan xa như gan, phổi, não, xương, Các tế bàoung thư thận sẽ di căn theo hướng các đường bạch huyết và cả tĩnh mạch Theo tuyếnđường bạch huyết, các tế bào ung thư thận sẽ di căn vào trong các hạch ở vùng thắtlưng, các động mạch chủ và đến những hạch sau phúc mạc, bụng và cả trung thất Cónhiều trường hợp, chúng còn di căn đến thượng đòn, nách và vùng cổ.
Trong hai mươi năm qua, số trườ ng hợp ung thư thận tăng nhẹ, nhưng tỷ lệ sống
sót cũng đã tăng lên Nhờ những tiến bộ về hìnhảnh học như siêu âm và công nghệ
chụ p cắt lớ p vi tính hỗ tr ợ chẩn đoán chính xác, ngày càng có nhiều trườ ng hợ p ung
thư thận đượ c phát hiệnở giai đoạn sớ m
Từ những tổn hại trên, cần có một giải pháp giúp các bác sĩ chẩn đoánchính xác
hơn về bệnh ung thư thận này, việc thực hiện đề tài“Phát hiện và khoanh vùng ung
Trang 132
thư thận bằng k ỹ thuật deep learning” là cần thiết, nhằm tạo nhiều thuận lợ i cho
các bác sĩ trong quá trình phân tích và điều tr ị.
2 MỤC TIÊU NGHIÊN CỨU
-Thu thập dữ liệu hình ảnh y khoa liên quan đến bệnh ung thư thận.
-Tìm hiểu đặc điểm tổn thương của thận dokhối u hay do loại ung thư thận khác gây ra.
-Tìm hiểu các mô hình mạng dùng để phân tích và nhận dạng như Densenet, Unet, Resnet.
-Phát hiện và khoanh vùng tổn thương ở thận doung thư thận theo các mô hình Deep Learning và các tập dữ liệu đã thu thập.
3 ĐỐI TƯỢNG NGHIÊN CỨU
-Các ảnh chụp cắt lớp CT về bệnh thận dokhối u vàcác loại ung thư thận khác gây racho bệnh nhân bệnh nhân.
- Cáctập dữ liệu và cácmô hình học sâu.
4 PHẠM VI NGHIÊN CỨU
-Đề tài nghiên cứu về phương pháp phát hiện và khoanh vùng tổn thương phổidựa vào nghiên cứu và các dữ liệu khoa học được công bố.
-Phân loại tổn thương phổi do virus corona và các loại virus khác gây ra
- Nghiên cứu một số mạng như:Resnet, Unet.
5 PHƯƠNG PHÁP NGHIÊN CỨU
-Phương pháp lý thuyết: Tìm hiểu, phân tích các vấn đề liên quan về các loạiung thư thậnvà những nghiên cứu khoa học liên quan về đề tài
-Phương pháp thực nghiệm đề tài: Xây dựng lập trình bằng ngôn ngữ lập trìnhchuyên về AI là Python kết hợp với các thư viện đã được phát triển và nguồn mở.
6 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
-Tập hợp dữ liệu ảnh CT.
-Phân loại và khoanh vùng tự động tổn thương phổi do bệnh ung thư thận gây ra.
-Đề xuất cải tiến, so sánh đánh giá giữa các mô hình.
-So sánh đánh giá một số phương pháp:U-net, resnet.
Trang 147 CẤU TRÚC CỦA KHÓA LUẬN Trong quyển báo cáo khóa luận bao gồm những nội dung được trình bày từ cơ
sở lý thuyết, nguyên cứu liên quan, phương pháp đề xuất và kết quả thực nhiệmđược trình bày vào các chương theo bố cục sau:
Mở đầu: Trình bày nội dung tính cấp thiết đề tài, mục tiêu, phạm vi, phương pháp
và ý nghĩa thực hiện của đề tài
CHƯƠNG 1 - CƠ SỞ KHOA HỌC CỦA ĐỀ TÀI: Trình bày nội dung về bệnhung thư thận, cơ sở phát hiện, khoanh vùng ung thư thận trên ảnh CT.
CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT: Trình bày nội dung về cơ sở lý thuyết được
sử dụng trong các phương pháp được đề xuất
CHƯƠNG 3 - PHƯƠNG PHÁP ĐỀ XUẤT: Trình bày công việc cụ thể từng pha
xử lý được thực hiện từ kiến trúc đề xuất Môi trường thực nghiệm và phương pháp
đề xuất cũng được trình bày ở chương này
CHƯƠNG 4 - KẾT QUẢ THỰC NGHIỆM: Trình bày kết quả thực nghiệm đạtđược.
CHƯƠNG 5 – KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN: Trình bày tóm tắt về kếtquả đạt được, những đóng góp cũng như hướng phát triển tiếp theo sau khi thực hiện
đề tài.
Trang 154
CHƯƠNG 1: CƠ SỞ KHOA HỌC CỦA ĐỀ TÀI
1.1 Giới thiệu Ung thư thận là một loại ung thư tiết niệu bắt đầu ở một hoặc cả hai quảthận. Trong giai đoạn đầu, nó có thể không biểu hiện bất kỳ triệu chứng đáng chú ý
nào.Khi ung thư tiến triển, bệnh nhân sẽ bắt đầu nhận thấy các triệu chứng của bệnhung thư thận. Tuy nhiên, nhiều trong số các triệu chứng này cũng liên quan đến một
số tình trạng tiết niệu rất phổ biến. Điều quan trọng là các cá nhân có bất kỳ triệuchứng bất thường nào được đánh giá để xác định nguyên nhân gốc rễ của họ và nhậnđược phương pháp điều trị thích hợp. Ung thư thận là sự phát triển ác tính các tế bào,hình thành một khối u trong thận Cũng cần lưu ý rằng, không phải bất kỳ một khối
u thận nào cũng ác tính Một số trường hợp có thể là u lành tính, không phải ung thư.Ung thư thận là một danh từ chung Có nhiều biến thể khối u ác tính trong thận vàcác giai đoạn của bệnh Điều trị phụ thuộc vào đặc điểm của khối u và kinh nghiệm
chuyên môn.
Ung thư thận bắt đầu khi những tế bào khỏe mạnh tại một hay cả hai thận thayđổi, phát triển ngoài tầm kiểm soát, tạo thành một khối gọi là khối u vỏ thận Khối unày có thể là ác tính hay lành tính Khối u ác tính là ung thư, có thể phát triển và lansang những bộ phận khác của cơ thể Có nhiều biến thể của khối u ác tính trong thận
và những giai đoạn của bệnh Việc điều trị phụ thuộc vào đặc điểm của khối u và kinhnghiệm chuyên môn của bác sĩ.
Thận là cơ quan hình hạt đậu nằm ở hai bên phía sau thành bụng, có chức nănglọc máu tạo nước tiểu Thận cũng rất quan trọng đối với các quá trình khác trong cơthể, bao gồm điều chỉnh huyết áp, cân bằng nước và điện giải, sản xuất các tế bàomáu, và giữ cho xương của bạn khỏe mạnh.
1.2 Lý do chọn đề tài Ung thư thận là một trong 10 loại ung thư phổ biến nhất ở cả nam và nữ. Nhưngcác triệu chứng thường không xuất hiện cho đến giai đoạn sau hoặc cho đến khi khối
u lớn Ung thư thận thường được chẩn đoán ở những người trên 60 tuổi Nó thườngđược tìm thấy một cách tình cờ trong các cuộc kiểm tra hình ảnh thông thường. Theo
GLOBOCAN 2018 ung thư thận ở Việt Nam đứng thứ hai trong ung thư hệ tiết niệu
và đứng thứ 17 trong các bệnh ung thư chung, số ca mắc mới hàng năm là 2,394 ca.
Trang 16Bệnh gặp ở các nước Bắc Âu nhiều hơn ở châu Phi và châu Á Bệnh có xu hướngtăng dần trong những năm gần đây Có khoảng 90% các khối u thận là u ác tính trong
đó ung thư biểu mô tế bào sáng chiếm 80% Các yếu tố nguy cơ như hội chứng VonHippel Lindau, đột biến mất đoạn ở nhánh ngắn nhiễm sắc thể số 3 Một số yếu tốkhác được xác định có liên quan như hút thuốc, tăng huyết áp, béo phì. Ung thư thận bao gồm ung thư tế bào thận, sarcoma thận và u lympho thận nguyên phát. Trong đó,
ung thư tế bào thận (Renal Cell Carcinoma-RCC) chiếm tới hơn 90% các trường hợp
Mặc khác, X-Quangvà chụp CT đã và đang được áp dụng rộng rãi tại các địa phương trong việc phát hiện một số bệnh lý Đặc biệt, CT cho ta thấy hình chụp của
cơ thể theo dạng mặt cắt, một khối 3 chiều, thể hiện trên những mặt phẳng hai chiều.Mỗi một hình ảnh là tập hợp bởi nhiều tia X-rays, bắn đi từ nhiều hướng khác nhauvòng quanh cơ thể.Do đó, việc thực hiện ý tưởng “Phát hiện và khoanh vùng ung thưthận bằng kỹ thuật deep learning” sẽ góp phần giúp các y bác sĩ có những chẩn đoánđiều trị bệnh kịp thời đối với những bệnh nhân đã có tổn thương thận do ung thư thận
gây ra, từ đó giảm bớt gánh nặng cho ngành y tế, hạn chế sự tổn thất cho bệnh nhân.
1.3 Cơ sở lý luận Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếpthu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ nghĩa của các loại
dữ liệu Hiện nay Deep Learning được ứng dụng trong rất nhiều nhiều lĩnh vực.
Thuật toán Deep Learning được tạo thành từ Artificial Neural Networks với cáclayers ẩn, dựa trên mạng thần kinh nơ -ron sinh học Deep Natural Networks có thểđược sử dụng để mô phỏng các mối quan hệ phức tạp phi tuyến tính trong cả giámsát (tập dữ liệu được sử dụng để dự đoán kết quả sau này) và không giám sát (gomnhóm và tìm ra các mẫu mới và khác thường trong dữ liệu). Deep Learning có độchính xác cao, có thể học sâu rộng và đạt được độ chính xác ở mức công nhận vôcùng cao Điều này sẽ đảm bảo cho thiết bị điện tử tiêu dùng có thể đáp ứng đượcmọi nhu cầu cũng như mong đợi từ phía người dùng. Dù mới phát triển nhưng cáckiến trúc Deep Learning có thể mô hình hoá một cách tự động các mối quan hệ phituyến phức tạp của dữ liệu Do đó các kỹ thuật Deep Learning có thể hoạt động với
dữ liệu thô mà không cần thông qua các bước trích xuất đặc trưng thủ công, phứctạp, chỉ phù hợp với từng vấn đề nhỏ Có nhiều kiến trúc Deep Learning như mạng
nơ -ron tích chập (Convolutional Neural Network), Deep Belief Network, Deep
Trang 17quanđể phân loại và phân vùng bệnhung thư thận trên môi trường Google Colab
với mô hình mạngU-net.
1.4 Cơ sở thực tiễn Hình ảnhCTđã và đang được áp dụng rộng rãi trong việc phát hiện một số bệnh
lý, nhưng rất khó để phân biệt khối u doung thư gây ra với một số căn nguyên khác.Việc lý giải các hình ảnh thường gặp nhiều sai lầm do kinh nghiệm, cảm giác hoặc
do nhận thức cá nhân Vì thế khi phân tích, các bác sĩ phải luôn kết hợp với đặc điểm
và biểu hiện lâm sàng để đưa ra chẩn đoán chính xác Ngoài ra, Deep Learning ứngdụng trong lĩnh vực y tế đã ghi nhận được nhiều nghiên cứu mang đến những kếtquả khả quan Đó là tiền để thực hiện nghiên cứu phát hiện bệnh ung thư dựa trêndấu hiệu tổn thương thận.
1.5 Nghiên cứu liên quan Trong bài báo “Kidney tumor segmentation using an ensembling multi-stage deep learning approach A contribution to the KiTS19 challenge”[14]năm 2019 củanhóm tác giả Gianmarco Santini , No´emie Moreau and Mathieu Rubeaux Trong
nghiên cứu này, nhóm tác giả giới thiệu đã thuật toán để thực hiện phát hiện khối uthận từ tập dữ liệu từ cuộc thi KITS19 Trong nghiên cứu này, nhóm đã thực hiệntách thận và khối u thông qua mô hình resnet với tỉ lệ 96% nhận diện thành côngthận và 76% nhận diện thành công khối u.
Trong bài báo “KiTS19 Challenge Segmentation ” năm 2019 của tác giả yi Chin Tsai, Yung-Nien Sun đến từ đại học quốc gia Thành Công, Đài Loan Trong bài nghiên cứu này, tác giả đã đề xuất giải pháp dựa trên kiến trúc mạng resunet để
-có thể phân đoạn thận từ ROI(vùng trung tâm) Và sau đó triết xuất thận bằng mạngDenseUnet để tách được thận và phân đoạn khối u Với những kiến trúc mạng trênđạt được tỉ lệ 96% nhận diện thành công thận và 75% tỉ lệ nhận diện thành công khối
u.
1.6 Vấn đề đặt ra Nghiên cứu và phát triển đề tài “Phát hiện và khoanh vùng ung thư thận bằng kỹ
Trang 18thuật deep learning” nhằm mục đích:
-Phát hiện tổn thương và khoanh vùng tổn thương do khối u gây ra.
-Tinh chỉnh mô hình đạt độ chínhxác cao.
1.7 Hướng giải quyết
Để thực hiện các mục đích được đề ra ở phần vấn đề đặt ra cần tiến hành:
-Tìm hiểu về bệnh ung thư thận.
-Tìm hiểu về những nghiên cứu liên quan về tổn thương thận dokhối u gây ra.
-Thu thập tập dữ liệu về CT ảnh chụp thận.
-Xây dựng mô hình Deep Leaning để phát hiện tổn thương thận dokhối u.
Trang 198
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Bệnh ung thư thận 2.1.1 Ung thư thận Ung thư thận là sự phát triển ác tính các tế bào, hình thành một khối u trong thận.Cũng cần lưu ý rằng, không phải bất kỳ một khối u thận nào cũng ác tính Một sốtrường hợp có thể là u lành tính, không phải ung thư Ung thư thận là một danh từchung Có nhiều biến thể khối u ác tính trong thận và các giai đoạn của bệnh Điềutrị phụ thuộc vào đặc điểm của khối u và kinh nghiệm chuyên môn.
Ung thư thận bao gồm ung thư tế bào thận, sarcoma thận và u lympho thậnnguyên phát trong đó ung thư tế bào thận (Renal Cell Carcinoma-RCC) chiếm tớihơn 90% các trường hợp, nên trong bài này chỉ đề cập nội dung ung thư tế bào thận.Ung thư tế bào thận đứng hàng thứ 2 trong các bệnh ác tính hệ tiết niệu và chiếm 1-
2% toàn bộ các loại ung thư ở người lớn Bệnh thường xuất hiện ở người lớn trên 40tuổi, với tỉ lệ nam gấp 2 lần so với nữ giới.
Hình 2.1. Ảnh so sánh giữa thận bình thường và thận bị ung thư
2.1.2 Nguyên nhân gây bệnh Nguyên nhân gây ung thư thận chưa được khẳng định, tuy nhiên có nhiều yếu tốnguy cơ đã được chứng minh có thể dẫn tới ung thư thận như:
Hút thuốc lá: Đây là một trong những yếu tố có nguy cơ cao gây nên ung thưthận Trung bình, có đến khoảng 30% nam giới và khoảng 24% nữ giới khihút nhiều thuốc lá thì đều mắc phải căn bệnh quái ác này.
Trang 20 Người hút thuốc với thời gian càng dài và số lượng cao thì nguy cơ mắc bệnh
sẽ càng tăng.
Có hơn 4.000 loại độc tố được tìm thấy ở bên trong khói thuốc Những độc tốnày có thể gây nên những ảnh hưởng đến DNA của những tế bào Benzo (a) pyrene có trong thuốc lá là một chất có thể làm xuất hiện các tổn thương gen
P53 -đóng vai trò mã hóa đối với các protein P53 Loại protein này có nhiệm
vụ bảo vệ những tế bào bên trong cơ thể kháng lại ung thư.
Những cacbua hydro thơm đa vòng có thể kể đến như 3' - 5' benzo - pyrene
cũng được xem là có ảnh hưởng đến nguyên nhân khởi phát của căn bệnh này. Nhiều nghiên cứu đã chỉ ra rằng, những người làm việc có tiếp xúc với nhữnghóa chất này có tỷ lệ mắc bệnh khá cao, điển hình như công nhân nghề in, hóachất, công nhân nhuộm hoặc những người thường xuyên tiếp xúc với xăngdầu.
Yếu tố di truyền: Bệnh có khả năng khởi phát ở nhiều người trong cùng mộtgia đình Những đối tượng bị khuyết một đoạn ở NST 3 hoặc chuyển vị củacác NST 3 và NST 8 cũng sẽ có tỷ lệ mắc ung thư thận khá cao.
2.1.3 Ung thư thận và các giai đoạn phát triển
Giai đoạn đầu
Nếu pháthiện ungthư thận ở giaiđoạn này,người bệnh cóthể điều trị bệnh thành công, kéo dài thời giansống thêm 5năm, 10năm. Tuy nhiên,rất ít bệnh nhân ung
thư thận pháthiện mình bị ungthư giaiđoạn đầu.
Giaiđoạn 2
Ở giaiđoạn 2,khối u có kíchthước lớn hơn khoảng 7cm trongthận. Tế bào ung
thư chưa lây lanđến cáchạch bạch huyết hoặc các cơ quan khácgần đó. Bácsĩ có
thể cắt bỏ một phần thận bị ungthư hoặc cắt bỏ toàn bộ quả thận.
Giaiđoạn 3
Ở giaiđoạn 3, bệnh ungthư thậnđã pháttriển cáctế bào ungthư đã xâmlấn vào
tĩnh mạch thận, xâmlấn lớp mỡ quanhthận nhưng không ra ngoài cân hận (Gerota’s fascia), cóthể đã xâmlấn cáchạch bạch huyết lâncận quanhthận, chưa xâmlấn vào
tuyến thận.
Giaiđoạn 4
Bệnh nhân bị ung thư thận giaiđoạn cuối , cáctế bào ung thư đã xâmlấn vào
Trang 2110
tuyến thượng thận, lan rộng ra ngoài vùng Gerotađến cáchạch bạch huyết ở xa và cáccơ quan khác Giaiđoạn ungthư thận dicăn thường phức tạp và nguyhiểm. Các
phương pháp điều trị cho bệnh nhânhiện naytập trung vàoviệc giảm nhẹ cáctriệu
chứng vàhạn chế sự dicăn của khối u.
Hình 2.2.Các giai đoạn phát triển của ung thư thận
não.
2.1.5 Dấu hiệu và triệu chứng
Tiểu ra máu
Tiểu ra máu là một trong những triệu chứng ung thư thận giai đoạn cuối, tuy
thấy nước tiểu sẫm màu hơn bình thường, có thể màu hồng hoặc có màu đỏ như máu.Tuy nhiên, có máu trong nước tiểu không có nghĩa là bạn đã mắc bệnh ung thư thận
Vì vậy, nếu xuất hiện triệu chứng này, hãy đi khám bác sĩ để tìm ra nguyên nhânchính xác và điều trị phù hợp.
Trang 22 Đau thắt lưng hoặc một bên hông Đau thắt lưng hoặc có cảm giác bị chèn ép ở lưng hoặc một bên hông, ngay dướixương sườn mà không phải do chấn thương cũng có thể là dấu hiệu ung thư thận. Nguyên nhân là do khối u thận phát triển lớn hơn và gây áp lực ở hai bên xương sườn,
do đó gây đau nhức, khó chịu.
Bạn có thể cảm thấy như bị sưng hoặc có một khối u ở bên cạnh hoặc lưng dưới
có thể được xem là một trong những dấu hiệu ung thư thận không nên bỏ qua.
Mệt mỏikéo dài hay cảm giác không được khỏe có thể thực sự là một dấu hiệuung thư thận mà bạn nên cảnh giác Tốt hơn hết là bạn nên đi khám bác sĩ càng sớmcàng tốt để tìm nguyên nhân gây mệt mỏi kéo dài và điều trị kịp thời.
Chán ăn, sụt cân
Thận đóng vai trò quan trọng trong bộ máy tiêu hóa, ảnh hưởng đến khả năng hấpthụ và tiêu hóa thức ăn Nếu mắc ung thư thận thì chức năng thận sẽ bị ảnh hưởngnghiêm trọng Do vậy, người bệnh có thể cảm thấy chán ăn, ăn không ngon miệng và
sụt cân không rõ nguyên do.
Sốt Sốt không phải do nhiễm trùng, cảm lạnh hoặc cúm đơn thuần và liên tục tái phát
có thể là triệu chứng ung thư thận.
Các khối u ác tính trong thận có thể dẫn tới thiếu máu (số lượng tế bào hồng cầu
2.1.6 Phân loại ung thư thận Các khối u thận được phân loại theo giai đoạn, loại phụ và mức độ ác tính của tế bào khối u Ba yếu tố này là cơ sở để bạn có thể đưa ra lộ trình điều trị.
Hệ thống đánh giá giai đoạn
Giai đoạn khối u cho biết mức độ tiến triển của khối u và có di căn hay không,trong các hạch bạch huyết hoặc các cơ quan khác.
Trang 2312
Phân loại giai đoạn khối u thận dựa trên sự lan rộng của khối u và các hạch bạchhuyết (TNM) Bác sĩ tiết niệu đánh giá kích thước và sự xâm lấn của khối u (T) vàxác định mức độ tiến triển dựa trên 4 giai đoạn Các hạch bạch huyết bị ảnh hưởng(N) hoặc ung thư đã lan sang bất kỳ bộ phận nào khác của cơ thể (M) cũng được kiểmtra Nếu khối u thận di căn, chúng thường lan đến phổi, hoặc đến xương hoặc não.
Phân loại khối u
Bên cạnh giai đoạn, phân loại của khối u thận là quan trọng Loại khối u đượcxác định bởi nhà nghiên cứu bệnh học và quy trình này được gọi là phân tích mô bệnhhọc Chuyên gia bệnh học sẽ xem dưới kính hiển vi mô khối u được lấy trong sinh
thiết hoặc sau phẫu thuật Sinh thiết thận không phải là một thủ thuật tiêu chuẩn trongchẩn đoán ung thư thận Trong hầu hết các trường hợp, người bệnh không thể biếtloại khối u trước khi phẫu thuật.
Khối u thận có nhiều loại khác nhau, thường gặp nhất là ung thư biểu mô tế bàothận Trong số này, hầu hết là loại ung thư biểu mô tế bào sáng.
“Nếu bạn được chẩn đoán với một khối u thận hiếm gặp, bác sĩ sẽ cung cấp thôngtin chi tiết về các phương pháp điều trị khác nhau Những điều trị này có thể khác vớiliệu pháp điều trị các loại ung thư thận thường gặp Tại BVĐK Tâm Anh, các lựachọn điều trị được thảo luận bởi một nhóm chuyên gia đa chuyên khoa, để tìm ra cáchthức điều trị tốt nhất cho người bệnh”, ThS.BS Nguyễn Tân Cương cho biết.
Nang thận
Một vài khối u trong thận không phải dạng đặc mà là nang thận, đây là những túichứa đầy dịch trong thận và dễ dàng nhận ra trên phim chụp CT Nếu là nang thận cókhả năng ác tính, những nang này cần được loại bỏ bằng phẫu thuật.
Phân loại Fuhrman
Thành phần thứ ba của phân loại là đánh giá mức độ ác tính của các tế bào khối
u Phân loại nhân Fuhrman là hệ thống được sử dụng phổ biến nhất để xác định điều
2.1.7 Phương pháp điều trị Nếu bệnh nhân có chẩn đoán ung thư thận khu trú, bác sĩ của có thể khuyên nênđiều trị ung thư bằng các phương pháp sau:
Trang 24 Cắt bỏ một phần thận;
Cắt thận triệt căn;
Theo dõi chủ động;
Hủy u bằng sóng vô tuyến hoặc áp lạnh.
Mỗi phương pháp đều có ưu điểm và nhược điểm Tùy vào tình trạng cụ thể của bạn mà lựa chọn phương pháp điều trị phù hợp.
Nếu bạn được chẩn đoán ung thư thận tiến triển tại chỗ, bác sĩ có thể đề nghị cắtthận triệt căn hoặc tắc mạch.
Khối u thận có thể di căn đến các cơ quan khác hoặc các hạch Đây được gọi là bệnh di căn Trong bệnh di căn, khối u thận được gọi là khối u nguyên phát và cáckhối u ở các cơ quan khác được gọi là di căn Bác sĩ có thể đề nghị điều trị bệnh dicăn bằng phẫu thuật, thường kết hợp với liệu pháp kháng sinh mạch, còn được gọi làliệu pháp nhắm trúng đích Trong một số ít trường hợp, liệu pháp miễn dịch cũng cóthể được sử dụng Để điều trị di căn, xạ trị có thể được đề nghị.
Nói chung, bệnh di căn không thể chữa khỏi Việc điều trị của bệnh di căn nhằmmục đích giảm kích thước của khối u và di căn Điều này sẽ cho người bệnh cơ hộisống lâu hơn và có ít triệu chứng hơn.
Đôi khi, người bệnh không thể phục hồi sau điều trị ung thư thận Khi điều trịkhông còn thành công, người bệnh có thể được đề nghị chăm sóc giảm nhẹ để sốngthoải mái hơn Chăm sóc giảm nhẹ là một khái niệm chăm sóc với mục tiêu tối ưuhóa chất lượng cuộc sống của người bệnh nếu không thể khỏi bệnh.
2.1.8 Phương pháp chuẩn đoánHiện nay để chuẩn đoán cho việc phát hiện bệnh ung thư thận, bác sĩ hoặc chuyênviên sẽ sử dụng nhiều biện phápchuẩn đoán y học hạt nhân, các xét nghiệm lâm sàn
và cận lâm sàn Đối với lâm sàn, các triệu chứng Đái máu toàn bãi, đái buốt, Đaulưng, có khối u ở bụng, sụt cân, thiếu máu, sốt, có thể âm thầm không triệu chứng.
Giai đoạn muộn khi đã có di căn, trên lâm sàng có các triệu chứng của di căn tùy vịtrí, giai đoạn bệnh. Còn đối với cận lâm sàn, Ngày nay với sự phát triển của y họccùng công tác khám sức khỏe định kỳ, ung thư thận thường được phát hiện tình cờ
Trang 2514
qua các phương tiện chẩn đoán hình ảnh Chỉ có 10% bệnh nhân đến khám vì tamchứng cổ điển bao gồm nổi khối vùng mạng sườn, đau thắt lưng và đái máu.
Các xét nghiệm chẩn đoán hình ảnh: Siêu âm thận: khối u đặc, thâm nhiễm phá
vỡ bao thận, xâm lấm mỡ quanh thận, có thể thấy huyết khối tĩnh mạch thận Chụpcắt lớp vi tính, cộng hưởng từ, khối u đặc ít ngấm thuốc hơn nhu mô thận lành, đánhgiá tình trạng tổ chức u thâm nhiễm xung quanh, hạch, di căn tiểu khung ổ bụng, cóthể thấy huyết khối tĩnh mạch thận, tĩnh mạch chủ dưới.
Các k ỹ thuật chẩn đoán y học hạt nhân:
Xạ hình thận chức năng bằng máy SPECT, SPECT/CT với 99m Tc-DTPA:
có thể thấy thay đổi pha mạch, pha tiết, pha bài xuất của từng thận tùy theo vị trí,kích thước, số lượng khối u thận Xạ hình thận đánh giá chức năng từng thận riêng rẽgiúp lên kế hoạch phẫu thuật.
Xạ hình thận hình thể bằng máy SPECT, SPECT/CT với 99m Tc-DMSA: thấyhình ảnh ổ khuyết ở thận nhưng cần phân biệt với nang thận và các khối u thận khác.
Xạ hình xương bằng máy SPECT, SPECT/CT với 99m Tc-MDP để đánh giá tổnthương di căn xương, chẩn đoán giai đoạn bệnh trước điều trị, theo dõi đáp ứng điềutrị, đánh giá tái phát và di căn Ung thư thận hay di căn ở cột sống, xương sườn, xươngchậu, xương sọ
Chụp PET/CT với 18 F-FDG trước điều trị để chẩn đoán u nguyên phát, chẩnđoán giai đoạn bệnh; chụp sau điều trị để theo dõi đáp ứng điều trị, đánh giá tái phát
và di căn; mô phỏng lập kế hoạch xạ trị Chụp PET/CT: ít giá trị chẩn đoán với u thậnnguyên phát Có giá trị phát hiện các tổn thương di căn: thường gặp ở phổi, gan, hạch
Xét nghiệm sinh hóa nước tiểu.
Xét nghiệm định lượng LDH, calci huyết.
Trang 26 Xét nghiệm chất chỉ điểm khối u (tumor marker): CEA, BTA (bladder tumorantigen) tăng cao trong một số trường hợp Có giá trị theo dõi đáp ứng điều trị, pháthiện bệnh tái phát, di căn xa.
Xét nghiệm đột biến gen: mlH1, MSH2, MSH6, PMS2, EPCAM, PTEN,
TP53, VLH
Giải trình tự nhiều gen.
Chẩn đoán xác định dựa trên lâm sàng và cận lâm sàng trong đó chẩn đoán mô bệnh học mang tính chất quyết định.
T 2 U có đường kính lớn nhất hơn 7cm, khu trú trong thận
trong thận
T 3 U xâm nhập vào tĩnh mạch lớn hay mô quanh thận nhưng không
ra khỏi cân Gerota và không xâm lấn vào tuyến thượng thận cùng
bên
thận hay mô quanh thận hay mô mỡ xoang thận nhưng còn chưaxâm nhập cân Gerota
mạch thận.
T 4 U xâm nhập ra ngoài cân Gerota hoặc xâm lấn tuyến thượng thận
cùng bên.
Trang 28-Trí thông minh nhân tạo là một trong những ngành trọng yếu của tin học, liênquan đến cách cư xử, sự học hỏi và khả năng thích ứng thông mình của máy móc màchúng ta không ngờ.
2.2.2 Một số công nghệ Trí tuệ nhân tạo phổ biến
1 Công nghệ AI phản ứng Đây là loại có khả năng phân tích những động thái khả thi nhất của chính mình
và của đối thủ, từ đó đưa ra được những giải pháp tối ưu nhất
Ví dụ của công nghệ AI phản ứng là Deep Blue Đây là một chương trình chơi cờvua tự động, được tạo ra bởi IBM, với khả năng xác định các nước cờ cũng như dựđoán những bước đi tiếp theo của đối thủ
2 Công nghệ AI với bộ nhớ hạn chế
Đây là loại có khả năng sử dụng những kinh nghiệm trong quá khứ để đưa ranhững quyết định trong tương lai Công nghệ AI này thường kết hợp với cảm biếnmôi trường xung quanh nhằm mục đích dự đoán những trường hợp có thể xảy ra vàđưa ra quyết định tốt nhất cho thiết bị.
3 Lý thuyết trí tuệ nhân tạoĐây là loại có thể học hỏi cũng như tự suy nghĩ, sau đó áp dụng những gì họcđược để thực hiện một việc cụ thể Hiện nay, công nghệ AI này vẫn chưa trở thànhmột phương án khả thi
4 Tự nhận thức Chúng có khả năng tự nhận thức về bản thân, có ý thức và hành xử như con ngườivậy Thậm chí, chúng còn có thể bộc lộ cảm xúc cũng như hiểu được những cảm xúc.Đây được xem là bước phát triển cao nhất của công nghệ AI cho đến thời điểm hiệntại, thế nhưng công nghệ này vẫn chưa khả thi.
2.2.3 Ứ ng dụng của trí tuệ nhân tạo trong cuộc sống hiện nayỨng dụng trí tuệ nhân tạo ở Việt Nam cũng như trên toàn cầu là vô cùng quantrọng Lợi ích cũng như vai trò của trí tuệ nhân tạo vô cùng rộng khắp ở nhiều lĩnhvực, ngành nghề như:
2.2.3.1.Vai trò của trí tuệ nhân tạo trong y tế
AI trong robots y học: Các ứng dụng của công nghệ AI y tế cũng bao gồm cácrobot và thiết bị y tế hỗ trợ Ví dụ, robot điện thoại có thể tạo điều kiện giao tiếp giữa
Trang 2918
bệnh nhân với các chuyên gia y tế; thiết bị đi bộ hỗ trợ có thể giúp điều phối đi, đứnghoặc ngồi; và robot giống như động vật có thể giao tiếp và xác định bệnh nhân Robotcũng có thể được sử dụng trong phẫu thuật với tư cách là trợ lý bác sĩ phẫu thuật, hệthống phẫu thuật da Vinci là một trong những hệ thống phẫu thuật robot được sử dụng phổ biến nhất.
Hệ thống khai thác dữ liệu bệnh nhân và các nguồn dữ liệu có sẵn khác để tạothành một giả thuyết, sau đó nó đưa ra một lược đồ chấm điểm tin cậy.
AI trong ra quyết định lâm sàng: Với sự phát triển nhanh chóng của công nghệ,lượng thông tin mới từ các công trìnhnghiên cứu ngày càng nhiều vànhanh hơn.Hiện nay, lượng thông tin y khoa đã tăng gấp đôi cứ sau mỗi 3 năm Ước tính rằngnếu một bác sĩ muốn cập nhật toàn bộ thông tin y khoa thì phải đọc 29 giờ mỗi ngày. Ngoài ra, nguồn dữ liệu lớn (big data), bao gồm các dữ liệu từ hồ sơ sức khoẻ điện tử
lối sống là những nguồn dữ liệu sẽ không có ích nếu không được phân tích toàn
diện. Giải pháp duy nhất để có thể tiếp cận và sử dụng khối lượng thông tin khổng lồtrong lĩnh vực y tế đó là sử dụng công nghệ trí tuệ nhân tạo (Artificial Intelligence –
AI) IBM Watson là một trong những hệ thống hàng đầu hỗ trợ chăm sóc sức khỏe bằng AI, giúp các bác sĩ đưa ra quyết định hiệu quả Với khả năng máy học (machinelearning) và khả năng xử lý ngôn ngữ tự nhiên, hệ thống này giúp các bác sĩ xem xét
hồ sơ sức khoẻ điện tử của bệnh nhân và cập nhật thông tin hướng dẫn điều trị từ cáccông trình nghiên cứu y khoa Một nghiên cứu mù đôi đã so sánh các quyết định củahội đồng các chuyên gia ung thư với quyết định của trí tuệ nhân tạo từ hệ thống ungthư Watson Kết quả cho thấy 90% các khuyến nghị mà hệ thống đưa ra là phù hợpvới các khuyến nghị của hội đồng các chuyên gia, nhưng hệ thống chỉ mất 40 giây đểhoàn tất quy trình.
AI trong chẩn đoán: Lỗi chẩn đoán là một mối đe dọa nghiêm trọng đối với chấtlượng và an toàn trong chăm sóc sức khỏe Tại Mỹ, ước tính tỷ lệ lỗi chẩn đoán ngoạitrú là 5,08% tương đương 12 triệu người mỗi năm Khoảng một nửa trong số các lỗinày là có khả năng gây hại Công nghệ AI đã được sử dụng để cải thiện chất lượngchẩn đoán, đặc biệt là trong X quang AI dựa trên nguồn dữ liệu 129.450 hình ảnhlâm sàng để chẩn đoán bệnh ngoài da, kết quả đã chứng minh rằng hệ thống này có
Trang 30thể phân loại ung thư da ở mức tương đương với các bác sĩ da liễu Một thuật toándựa trên hình ảnh cộng hưởng từ của chuyển động tim cho phép dự đoán chính xáckết quả bệnh nhân bị tăng áp phổi; một phương pháp phân loại nhịp tự động trong phân tích điện tâm đồ liên tục (ECGs) ở những bệnh nhân mắc bệnh nghiêm trọng.Một nghiên cứu khác đã xem xét các kết quả đầy hứa hẹn sử dụng AI trong hình ảnhđột quỵ và cho rằng công nghệ AI có thể đóng một vai trò quan trọng trong việc quản
và tích hợp bởi công nghệ AI.
2.2.3.2 Vai trò quan trọng của trí tuệ nhân tạo trong kinh doanh
Riêng trong lĩnh vực kinh doanh, trí tuệ nhân tạo AI góp phần mang đến nhữngtrải nghiệm tốt hơn cho hệ thống khách hàng Thông qua việc thu thập cũng như phântích dữ liệu, trí tuệ AI có thể nắm bắt thông tin cũng như hành vi sử dụng dịch vụ củakhách hàng, từ đó mang lại những giải pháp hữu ích trong kinh doanh
Còn với lĩnh vực truyền thông, trí tuệ nhân tạo trong marketing đóng vai trò quantrọng, góp phần làm thay đổi những cách thức tiếp cận với khách hàng mục tiêu Vớinhững ưu điểm của công nghệ AI, các công ty, tổ chức có thể triển khai những chiếndịch quảng cáo đúng thời điểm, đúng khách hàng mục tiêu dựa trên những phân tíchchính xác về nhân khẩu học, thói quen, hành vi và nhu cầu.
Tự động hóa quá trình robot đang được áp dụng cho các nhiệm vụ lặp đi lặp lạithường được thực hiện bởi con người
Các thuật toán Machine Learning đang được tích hợp vào các nền tảng phân tích
và CRM để khám phá thông tin về cách phục vụ khách hàng tốt hơn Chatbots đãđược kết hợp vào các trang web để cung cấp dịch vụ ngay lập tức cho khách hàng
Tự động hóa các vị trí công việc cũng đã trở thành một điểm nói chuyện giữa các họcgiả và các nhà phân tích.
2.2.3.3 Ứng dụng của trí tuệ nhân tạo trong giáo dục
Trí tuệ nhân tạo đã tạo nên những thay đổi lớn trong ngành giáo dục hiện nay Cụthể hơn, phải kể đến:
Trang 31-Trí tuệ nhân tạo thay thế con người bởi còn có khả năng theo dõi sự tiến bộ củahọc sinh để từ đó đưa ra những thông báo đến với các giáo viên khi phát hiện ra nhiềuvấn đề đối với kết quả học tập của học sinh.
-Trí tuệ nhân tạo cung cấp nhiều dữ liệu bổ ích để giúp các sinh viên lựa chọnđược những khóa học tốt nhất cho mình.
2.2.3.4 Ứng dụng của trí tuệ nhân tạo trong tài chính
AI trong các ứng dụng tài chính cá nhân, như Mint hoặc Turbo Tax, đang phá vỡcác tổ chức tài chính
Các ứng dụng như thu thập dữ liệu cá nhân và cung cấp tư vấn tài chính Cácchương trình khác, như IBM Watson, đã được áp dụng cho quá trình mua nhà.
2.2.3.5.Ứng dụng của trí tuệ nhân tạo trong pháp luật
Tự động hóa quá trình này là sử dụng thời gian hiệu quả hơn Các công ty khởinghiệp cũng đang xây dựng các trợ lý máy tính hỏi và trả lời có thể sàng lọc các câuhỏi được lập trình để trả lời bằng cách kiểm tra phân loại và bản thể học liên quanđến cơ sở dữ liệu.
2.2.3.6 Ứng dụng của trí tuệ nhân tạo trong sản xuất
Đây là một lĩnh vực đã đi đầu trong việc kết hợp robot vào quy trình làm việc.Robot công nghiệp được sử dụng để thực hiện các nhiệm vụ đơn lẻ và được tách rakhỏi công nhân của con người, nhưng như công nghệ nâng cao mà thay đổi.
2.2.3.7 Ứng dụng của trí tuệ nhân tạo trong dịch vụ khách hàng
Cuối cùng nhưng không kém phần quan trọng, Google đang làm việc với một trợ
lý AI có thể thực hiện các cuộc gọi giống như con người để thực hiện các cuộc hẹntại, giả sử, tiệm tóc của khu phố Ngoài các từ, hệ thống hiểu ngữ cảnh và sắc thái.
2.3 Machine learning
Trang 32Hình 2.3 Machine Learning Workflow
2.3.1 Khái niệm Machine Learning Machine Learning (ML) hay máy học là một nhánh của trí tuệ nhân tạo (AI), nó
là một lĩnh vực nghiên cứu cho phép máy tính có khả năng cải thiện chính bản thânchúng dựa trên dữ liệu mẫu (training data) hoặc dựa vào kinh nghiệm (những gì đãđược học) Machine learning có thể tự dự đoán hoặc đưa ra quyết định mà không cầnđược lập trình cụ thể.
Bài toán machine learning thường được chia làm hai loại là dự đoán (prediction)
và phân loại (classification) Các bài toán dự đoán như dự đoán giá nhà, giá xe… Các bài toán phân loại như nhận diện chữ viết tay, nhận diện đồ vật…
2.3.2 Machine learning Workflow
MLW sẽ cho thấy quy trình để làm việc với machine learning như thế nào Cụ thểtừng bước trong machine learning workflow như sau như sau:
- Data collection -thu thập dữ liệu: để máy tính có thể học được bạn cần có một
bộ dữ liệu (dataset), bạn có thể tự thu thập chúng hoặc lấy các bộ dữ liệu đã đượccông bố trước đó Lưu ý là bạn phải thu thập từ nguồn chính thống, có như vậy dữliệu mới chính xác và máy có thể học một cách đúng đắng và đạt hiệu quả cao hơn.
- Preprocessing - tiền xử lý: bước này dùng để chuẩn hóa dữ liệu, loại bỏ cácthuộc tính không cần thiết, gán nhãn dữ liệu, mã hóa một số đặc trưng, trích xuất đặctrưng, rút gọn dữ liệu nhưng vẫn đảm bảo kết qủa các kỹ thuật tiền xử lý dữ liệu phổ biến hiện nay bao gồm: xử lý dữ liệu bị khuyết (missing data), mã hóa các biến nhóm(encoding categorical variables), chuẩn hóa dữ liệu (standardizing data), co giãn dữliệu (scaling data),… Bước này tốn thời gian nhất tỉ lệ thuận với số lượng dữ liệu bạn
có Bước 1 và 2 thường chiếm hơn 70% tổng thời gian thực hiện.
Trang 3322
- Training model -huấn luyện mô hình: bước này là bước bạn huấn luyện cho
mô hình hay chính là cho nó học trên dữ liệu bạn đã thu thập và xử lý ở hai bước đầu.
- Evaluating model -đánh giá mô hình: sau khi đã huấn luyện mô hình xong,chúng ta cần dùng các độ đo để đánh giá mô hình, tùy vào từng độ đo khác nhau mà
mô hình cũng được đánh giá tốt hay không khác nhau Độ chính xác của mô hình đạttrên 80% được cho là tốt.
- Improve -cải thiện: sau khi đã đánh giá mô hình, các mô hình đạt độ chính xác
không tốt thì cần được train lại, chúng ta sẽ lặp lại từ bước 3, cho đến khi đạt độ chínhxác như kỳ vọng Tổng thời gian của 3 bước cuối rơi vào khoảng 30% tổng thời gianthực hiện.
2.3.3 Phân loại Machine learning
Có rất nhiều cách phân loại machine learning, thông thường thì Machine Learning
sẽ được phân làm hai loại chính sau:
-Supervised learning: học có giám sát.
-Unsupervised learning: học không giám sát.
Ngoài ra, machine learning còn có thể phân làm các loại sau:
- Semi-supervised learning: học bán giám sát.
-Deep learning: học sâu (về một vấn đề nào đó).
-Reinforce learning: học củng cố/tăng cường.
Trang 34Unsupervised learning là cho máy tính học trên dữ liệu mà không được gán nhãn,các thuật toán machine learning sẽ tìm ra sự tương quan dữ liệu, mô hình hóa dữ liệu
hay chính là làm cho máy tính có kiến thức, hiểu về dữ liệu, từ đó chúng có thể phânloại các dữ liệu về sau thành các nhóm, lớp (clustering) giống nhau mà chúng đã đượchọc hoặc giảm số chiều dữ liệu (dimension reduction).
2.3.4 Một số khái niệm cơ bản Dataset (còn gọi là data corpus hay data stock): là tập dữ liệu ở dạng nguyên thủychưa qua xử lý mà bạn đã thu thập được ở bước data collection Một dataset sẽ baogồm nhiều data point.
Data point: là điểm dữ liệu, mỗi điểm dữ liệu biểu diễn cho một quan sát Mỗi
data pointsẽ có nhiều đặc trưng hay thuộc tính khác nhau,chúngđược chia làm hailoại: loại dữ liệu số (numerical) và loại dữ liệu không phải số (ví dụ như chuỗi) (non-
numerical/categorical) Data point được biểu diễn thành dòng tương ứng, mỗi dòng
có thể có 1 hoặc nhiều dữ liệu (chính là các đặc trưng).
Training data và test data: dataset thường sẽ được chia làm 2 tập này, training datadùng để huấn luyện cho mô hình, test data dùng để dự đoán kết quả và đánh giá mô
hình Có bài toán người ta sẽ cho sẵn hai tập này thì bạn không cần phải chia nữa, đốivới bài toán chỉ cho mỗi dataset thôi thì phải chia ra Thường tỷ lệ giữa tập train vàtest sẽ là 8/2.
Features vector: là vector đặc trưng, mỗi vector này sẽ biểu diễn cho một điểm dữliệu trong dataset Mỗi vector có n chiều biểu diễn các đặc trưng của điểm dữ liệu,mỗi đặc trưng là một chiều và phải là dữ liệu số Các mô hình chỉ có thể huấn luyện
Hình 2.5. Minh họa vể Unsupervised learning
Trang 3524
được từ các vector đặc trưng này, do đó dataset cần phải chuyển về dạng một tập các
vector đặc trưng (features vectors).
Model: là các mô hình được dùng để training trên một training data theo thuậttoán của mô hình đó Sau đó mô hình có thể dự đoán hoặc đưa ra các quyết định dựatrên những gì chúng đã được học.
2.3.5 Ứng dụng của Machine learningMachine learning được ứng dụng cực kỳ nhiều trong đời sống hiện nay trong mọilĩnh vực:
Khi này, việc áp dụng machine learning vào để cho máy tính học các quan sátđược ghi nhận trong quá khứ, chúng có thể dự đoán được thời tiết trong tương lai với
độ chính xác cao hơn rất nhiều so với con người dự đoán.