ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRỊNH QUỐC VIỆT ỨNG DỤNG LÝ THUYẾT BAYES TRONG PHÂN LỚP ĐỂ XÂY DỰNG HỆ THỐNG HỖ TRỢ CHẨN ĐOÁN BỆNH VIÊM PHẾ QUẢN Chuyên ngành: Khoa học máy tín
Trang 1ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRỊNH QUỐC VIỆT
ỨNG DỤNG LÝ THUYẾT BAYES TRONG PHÂN LỚP ĐỂ XÂY DỰNG HỆ THỐNG HỖ TRỢ CHẨN ĐOÁN BỆNH VIÊM PHẾ QUẢN
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2017
Trang 2Công trình được hoàn thành tại TRƯỜNG ĐẠI HỌC BÁCH KHOA
Người hướng dẫn khoa học: PGS.TS VÕ TRUNG HÙNG
Phản biện 1: TS NINH KHÁNH DUY
Phản biện 2: PGS.TS HOÀNG XUÂN HIỆP
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật ngành Khoa học máy tính họp tại Trường
Đại học Bách khoa Đà Nẵng vào ngày 16 tháng 9 năm 2016
Có thể tìm hiểu luận văn tại:
- Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại học Bách khoa
- Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa -
Đại học Đà Nẵng
Trang 3MỞ ĐẦU
1 Lí do chọn đề tài
Hàng năm trên thế giới có hơn 4 triệu người tử vong do các bệnh liên quan đến đường hô hấp, trong đó phổ biến nhất là viêm phế quản (Bronchitis) Viêm phế quản là bệnh thường gặp ở trẻ em, bất kể lứa tuổi nào và thời tiết nào, đặc biệt là trẻ ở thành thị cũng như ở các nơi tập trung dân cư đông đúc thì tỉ lệ bệnh còn cao hơn Thế giới hiện có khoảng 300 triệu người mắc viêm phế quản và khoảng 250.000 trường hợp tử vong vì viêm phế quản mỗi năm Tỷ lệ mắc viêm phế quản ước tính khoảng 6-8% ở người lớn và khoảng 10-12% ở trẻ em dưới 15 tuổi
Ở Việt Nam, các nghiên cứu cho thấy, tỷ lệ mắc viêm phế quản dao động từ 1,1% ở Đà Lạt cho tới cao nhất là 5,5% ở cư dân một số khu vực Hà Nội Theo bảng thống kê năm 2013 của bộ y tế ta có số liệu sau:
Bảng thống kê các bệnh mắc cao nhất toàn quốc
(đơn vị tính: trên 10000 dân)
Chính vì vậy, hiểu biết một số nguyên nhân và cách đề phòng của căn bệnh này sẽ làm giảm thiểu số ca bệnh, đề phòng được các biến chứng và nâng cao chất lượng cuộc sống Đồng thời cũng làm giảm nguy cơ dẫn đến các biến chứng do bệnh này gây ra như hen phế quản, ung thư phế quản, viêm phổi, áp xe phổi, suy hô hấp cấp…
Trang 42 Mục tiêu đối tượng của đề tài
Từ nhu cầu thực tiễn trong cuộc sống về khám chữa bệnh cộng với những động lực đã nêu trên, đề tài mong muốn ứng dụng công nghệ thông tin vào lĩnh vực y khoa và đặc biệt là chuyên khoa hô hấp để chẩn đoán bệnh viêm phế quản Đề tài cũng sẽ tìm hiểu và nghiên cứu
về các mô hình biểu diễn tri thức và những phương pháp, kĩ thuật xây dựng hệ chuyên gia để vận dụng vào việc xây dựng hệ hỗ trợ chẩn đoán bệnh một cách tự động Như vậy, đề tài hướng tới việc xây dựng một hệ
hỗ trợ chẩn đoán bệnh viêm phế quản có cơ sở tri thức từ các bác sĩ chuyên khoa Nội - Hô hấp để hỗ trợ cho các bác sĩ chưa có nhiều kinh nghiệm hoặc các bác sĩ không chuyên về Nội - Hô hấp có thể tham khảo kinh nghiệm chẩn đoán và điều trị của các bác sĩ chuyên khoa nhằm đưa ra những quyết định chính xác trong trường hợp chưa có bác
sĩ chuyên khoa kịp thời
Chương trình hỗ trợ cho các bác sĩ không thuộc chuyên khoa Nội – Hô hấp, các bác sĩ đa khoa tuyến huyện chưa có kiến thức chuyên sâu về bệnh viêm phế quản Chương trình hỗ trợ bác sĩ trong việc kết luận bệnh
3 Ý nghĩa khoa học và thực tiễn
Trang 5mơ hình biểu diễn tri thức để ứng dụng nĩ trong tin học thì chưa được tiến hành, vì vậy việc ứng dụng cơng nghệ tri thức để biểu diễn và ứng dụng vào lĩnh vực y khoa để xây dựng một hệ thống chẩn đốn tự động
cĩ ý nghĩa thực tiễn rất lớn
4 Nội dung, phương pháp nghiên cứu
4.1 Các nội dung nghiên cứu
Nội dung nghiên cứu của đề tài được chia ra làm 5 chương như sau:
Chương 1: Cơ sở lý thuyết để thực hiện đề tài
Chương 2: Thiết kế cơ sở tri thức và bộ suy diễn
Chương 3: Cài đặt và kiểm thử
Kết luận và hướng phát triển
4.2 Các phương pháp nghiên cứu
Đề tài này sẽ kết hợp hai phương pháp nghiên cứu:
Phương pháp phân tích, tổng hợp: thu thập tri thức từ các hồ sơ bệnh án về bệnh viêm phế quản tại phịng khám đa khoa trường ĐH Trà Vinh, đồng thời cũng thu thập tri thức từ các bác sĩ chuyên khoa Nội - Hơ hấp của bệnh viện để phân tích và xử lý dữ liệu Ngồi việc đọc các tài liệu chuyên ngành cơng nghệ thơng tin để tìm hiểu cách biểu diễn tri thức và các phương pháp suy diễn cịn đọc thêm các tài liệu chuyên ngành y để cĩ kiến thức về bệnh viêm phế quản
Nghiên cứu thuật tốn Bayes trong phân lớp: nghiên cứu cách biểu diễn tri thức để xây dựng kho tri thức cho phù hợp với thuật tốn
Bayes trong phân lớp (Nạve Bayes classifiers)
Trang 6Chương 1 CƠ SỞ LÝ THUYẾT 1.1 Cơ sở tri thức
Tri thức là những gì mà một người có thể biết và hiểu được Tri thức có thể được phân loại thành tri thức có cấu trúc hoặc không có cấu trúc, tri thức rõ ràng hay tri thức ngụ ý, không rõ ràng Những gì mà chúng ta biết được thường là các tri thức rõ ràng Tri thức không có cấu trúc mà vẫn hiểu được, nhưng không được phát biểu rõ ràng là các tri thức ngầm ý, tri thức không rõ Khi tri thức được tổ chức để có thể chia
sẻ thì lúc đó tri thức được gọi là tri thức có cấu trúc Để có thể chuyển đổi từ tri thức không rõ ràng sang tri thức rõ ràng thì tri thức đó cần phải được cấu trúc hóa và định dạng lại Tri thức có thể được phân loại thành các loại như sau: Tri thức thủ tục, Tri thức mô tả, Tri thức Meta, Tri thức may rủi, Tri thức cấu trúc
1.2 Các phương pháp biểu diễn tri thức
1.2.1 Biểu diễn tri thức bằng logic
1.2.2 Biểu diễn tri thức bằng hệ luật dẫn
1.2.3 Biểu diễn tri thức bằng Frame
1.2.4 Biểu diễn tri thức bằng mạng ngữ nghĩa
1.2.5 Biểu diễn tri thức bằng mạng các đối tượng tính toán
1.3 Hệ chuyên gia
1.3.1 Định nghĩa
Hệ chuyên gia là một hệ thống tin học có thể mô phỏng (emulates) năng lực quyết đoán (decision) và hành động (making ability) của một chuyên gia (con người) Hệ chuyên gia là một trong những lĩnh vực ứng dụng của trí tuệ nhân tạo (Artificial Intelligence)
Hệ chuyên gia sử dụng tri thức của chuyên gia để giải quyết các vấn đề (bài toán) khác nhau thuộc mọi lĩnh vực
Trang 7Hoạt động của một hệ chuyên gia dựa trên cơ sở tri thức được minh họa như sau:
Hình 1.1 Cơ chế hoạt động của hệ chuyên gia
1.3.2 Cơ sở tri thức của hệ chuyên gia
Cơ sở tri thức của hệ chuyên gia bao gồm cả tri thức thực tế và tri thức Heuristic Tri thức thực tế là tri thức chuyên ngành mà được phổ biến và chia sẻ trong phạm vi rộng, có thể tìm thấy dễ dàng trong sách giáo khoa hoặc trong các sách báo và nhìn chung là được chấp nhận dựa trên các kiến thức đúng đắn trong từng lĩnh vực cụ thể Còn tri thức Heuristic mang ít tính nghiêm ngặt hơn, dựa nhiều vào kinh nghiệm và sự phán đoán hơn Trái với tri thức thực tế, tri thức Heuristic
ít khi được thảo luận, và mang đậm tính cá nhân Nó là kiến thức rút ra
từ việc thực hành và phán đoán tốt và sự lập luận chặt chẽ trong từng lĩnh vực
1.3.3 Cấu trúc một hệ chuyên gia
Mỗi hệ chuyên gia đều bao gồm 2 thành phần cơ bản là: hệ cơ
sở tri thức và bộ máy suy diễn Tùy theo cách biểu diễn tri thức mà ta
có thể xây dựng mô tơ suy diễn theo thuật giải suy diễn nào Ngoài ra còn có thể kết hợp phương pháp biểu diễn thừa số chắc chắn để hệ
Trang 8chuyên gia hoạt động một cách tự nhiên Cấu trúc của một hệ chuyên gia thường được phân ra thành các thành phần nhỏ như sau:
Hình 1.2 Cấu trúc của hệ chuyên gia
1.3.4 Quy trình xây dựng hệ chuyên gia
Quy trình được chia làm 7 giai đoạn như sau:
- Giai đoạn 1: Xác định miền tri thức, xác định phạm vi vấn
đề và thu thập tri thức
- Giai đoạn 2: Thiết kế cơ sở tri thức
- Giai đoạn 3: Thiết kế bộ suy diễn
- Giai đoạn 4: Thiết kế giao diện người dùng
- Giai đoạn 5: Cài đặt
- Giai đoạn 6: Xây dựng bảng mẫu để kiểm tra
- Giai đoạn 7: Hiệu chỉnh
1.3.5 Những thuận lợi và khó khăn của hệ chuyên gia
Thuận lợi:
Tính lâu dài của hệ chuyên gia: các chuyên gia là con người vẫn có thể quên những lập luận hay khái niệm nào đó, nhưng hệ chuyên
Trang 9gia thì khơng Ngồi ra hệ chuyên gia cịn cĩ khả năng tái sử dụng cho các mục đích khác nhau, với các lĩnh vực khác nhau, một cách nhanh chĩng và dễ dàng Trong khi đĩ, quá trình tạo ra một chuyên gia là con người phải mất một khoảng thời gian và cơng sức khơng nhỏ
Khĩ khăn:
Một điều dễ nhận ra là các hệ chuyên gia khơng cĩ khả năng học như các hệ thống thơng minh khác như Suy luận dựa tình huống (Case-based reasoning) hay Mạng nơron (Neural Networks) Vì vậy nếu cĩ những thay đổi từ phía các chuyên gia là con người thì hệ chuyên gia cần được cập nhật lập tức Hệ chuyên gia khơng cĩ khả năng sáng tạo và khơng cĩ được các giác quan thơng thường như con người, trong những tình huống bất thường, hệ chuyên gia khơng cĩ khả năng giải quyết
1.4 Phương Pháp Phân Loại Nạve Bayes
1.4.1 Khái niệm về phân lớp:
* Các bước chính để giải quyết bài tốn phân lớp:
Bước 1: Học (Training) Xây dựng mơ hình phân lớp
Bước 2: Phân lớp (classification) Bước này sử dụng mơ hình phân lớp đã được xây dựng ở bước 1 để kiểm tra, đánh giá và thực hiện phân lớp
* Các kỹ thuật phân lớp:
- Phương pháp dựa trên cây quyết định
- Phương pháp dựa trên luật
- Phương pháp Nạve Bayes
1.4.2 Phương pháp phân lớp Nạve Bayes
* Định lý Bayes
Trang 10Tính xác suất xảy ra của một sự kiện ngẫu nhiên A khi biết sự kiện liên quan B đã xảy ra
- Xác suất này được kí hiệu là P(A\B)
- Đọc là “xác suất của A nếu cĩ B”
1.4.3 Thuật tốn Nạve Bayes
* Mơ hình phân lớp Nạve Bayes
* Thuật tốn Nạve Bayes
* Các bước thực hiện thuật tốn phân lớp Nạve Bayes
- Bước 1: Huấn luyện Nạve Bayes (dựa vào tập dữ liệu), tính P(Ci) và P(Xk|Ci)
- Bước 2: Phân lớp Xnew= (x1, x2, …, xn) Xnew ta cần tính xác suất thuộc từng phân lớp khi đã biết trước Xnew Xnew được gán vào lớp
cĩ xác suất lớn nhất theo cơng thức: 𝑚𝑎𝑥𝐶𝑖∈𝐶(𝑃(𝐶𝑖) ∐𝑛𝑘=1𝑃(𝑥𝑘|𝐶𝑖))
Trang 11Chương 2 THIẾT KẾ CƠ SỞ TRI THỨC VÀ BỘ SUY DIỄN 2.1 Giới thiệu hệ thống
2.1.1 Mục đích, đối tượng sử dụng
- Ứng dụng những thành quả của công nghệ thông tin vào lĩnh vực y tế, góp phần phục vụ tốt việc tìm hiểu nghiên cứu đánh giá chất lượng y tế tại các phòng khám bệnh của tỉnh Trà Vinh
- Hỗ trợ công tác khám và chữa bệnh của bệnh nhân và bác sĩ hoàn toàn chính xác, đáng tin cậy
- Triển khai ứng dụng thực tiễn tại các phòng khám bệnh, trạm y tế…
Dữ liệu vào ra của hệ chẩn đoán như sau:
- Dữ liệu đầu vào:
Một số triệu chứng lâm sàng và cận lâm sàng
- Output:
Đưa ra cho người dùng kết luận bệnh hoặc là đợi xác nhận của chuyên gia và có thể xem chi tiết tỷ lệ xác suất bệnh mắc phải từ những triệu chứng đầu vào dựa trên thuật toán Bayes
2.1.2 Chức năng của hệ thống
2.1.2.1.Yêu cầu chức năng
Gồm các chức năng: chẩn đoán bệnh, đăng nhập, cập nhật thông tin các luật, cập nhật tên bệnh, cập nhật triệu chứng, lưu trữ luật, lưu trữ triệu chứng bệnh, lưu trữ tên các bệnh, lưu trữ thông tin người
sử dụng
2.1.2.2 Yêu cầu phi chức năng
- Tính tiện dụng: Giao diện thân thiện dễ sử dụng
Trang 12- Tính hiệu quả: Đảm bảo khả năng truy xuất nhanh đến các màn hình và khả năng kiểm soát lỗi tốt
- Tính tương thích: Hỗ trợ các hệ điều hành Window
- Hỗ trợ nhiều người dùng truy cập cùng lúc
- Mã hóa các thông tin cần được bảo mật
- Thiết kế ứng dụng theo mô hình 3 lớp
2.2 Tri thức về viêm phế quản
2.2.1 Định nghĩa về viêm phế quản
Viêm phế quản mạn (Chronic Bronchitis) còn gọi là bệnh phổi tắc nghẽn mạn tính và được định nghĩa cụ thể như sau: "Viêm phế quản mạn là tình trạng tăng tiết dịch nhầy của niêm mạc phế quản gây ho và khạc đờm liên tục hoặc tái phát từng đợt (khoảng 3 tuần lễ) ít nhất là ba tháng trong 1 năm và ít nhất là 2 năm liền" Viêm phế quản mạn là bệnh thường gặp, chiếm 5% dân số (Pháp), khoảng 47% người ở độ tuổi 55 (Anh)
2.2.2 Nguyên nhân của viêm phế quản
2.2.2.1 Viêm phế quản cấp
- Nhiễm khuẩn đường hô hấp trên do vi khuẩn và virus: viêm mũi, viêm xoang, viêm amydal Thường do Staphylococus, hoặc do Streptococus pneumonia (68,5%) Adenovirus, Hemophylus
- Do bệnh truyền nhiễm: cúm, sởi, ho gà
- Hít phải hơi độc: Chlore, amoniac, khói thuốc lá, dung môi công nghiệp
- Yếu tố dị ứng: cơ địa dị ứng
- Yếu tố thuận lợi: cơ thể suy yếu, suy tim, ẩm, lạnh, khói bụi…
Trang 13- Viêm phế quản cũng có thể xảy ra khi axit từ dạ dày luôn trào ngược vào ống thực quản và một vài giọt đi vào đường hô hấp trên, một vấn đề được gọi là bệnh trào ngược dạ dày (GERD)
2.2.2.2 Viêm phế quản mạn
- Thuốc lá, thuốc lào: 90% bệnh nhân viêm phế quản mạn có hút thuốc lá, bệnh thường xảy ra sau 50 tuổi do sự tích tụ của thuốc lá, nếu hút thuốc nhiều từ khi còn trẻ thì tỉ lệ viêm phế quản mạn tăng lên gấp đôi so với nhóm không hút thuốc
- Bụi trong không khí, khí hậu ẩm ướt
- Nghề nghiệp: công nhân mỏ than, luyện kim, dệt, nhựa: Những chất độc hại có thể gây ra và làm nặng hơn viêm phế quản mạn: khí chlor, phosgen, nitơ, isocyanate có thể gây tổn thương đường hô hấp trung tâm nhưng nếu tiếp xúc kéo dài, đặc biệt có các yếu tố nguy cơ khác như hút thuốc lá hay nhiễm trùng kéo dài dễ gây viêm phế quản mạn
- Nhiễm khuẩn, dị ứng: Nhiễm trùng là yếu tố khởi phát trong 1/3 trường hợp, nhiễm trùng tái đi tái lại sẽ làm giảm chức năng hô hấp
Vi khuẩn thường gặp là H influenzae, Streptococcus pneumoniae
- Tuổi: thường trên 40 tuổi Tuổi cao là một yếu tố nguy cơ thật
sự, có liên quan đến sự tích tụ độc tính của thuốc lá làm tổn thương đường hô hấp
- Giới tính: Viêm phế quản mạn có ưu thế ở nam so với nữ do có liên quan đến thuốc lá
- Yếu tố xã hội: Ở nước công nghiệp, tỉ lệ viêm phế quản mạn cao ở người có thu nhập thấp, nhóm này tăng rõ rệt khi hút thuốc lúc làm việc, cư trú ở vùng ô nhiễm nặng, điều kiện sống thấp và ít được chủng ngừa
Trang 142.2.3 Triệu chứng của viêm phế quản
Triệu chứng cận lâm sàng
- X- Quang phổi: rốn phổi đậm
- Xét nghiệm máu: số lượng bạch cầu tăng, tốc độ máu lắng tăng
Suy hô hấp Giai đoạn cuối Từng đợt cấp
X- Quang Giãn phổi, tăng sáng Hình ảnh "Phổi bẩn" Sức cản đường thở
(Raw)
Trang 15 Triệu chứng cận lâm sàng
Bảng 2.2 Phân biệt viêm phế quản mạn và giãn phế nang
Viêm phế quản mạn Giãn phế nang Lâm sàng
thở
Xuất hiện sau khó thở
Đờm, các chất tiết xuất phế
quản
Biểu hiện suy hô hấp Từng đợt Có tính liên tục
X- Quang phổi Hình ảnh phổi mờ Nhu mô phổi tăng
sáng
2.3 Mô hình biểu diễn tri thức viêm phế quản
Sau khi thu thập tri thức từ Thạc sĩ Bác sĩ khoa Nội – Hô hấp chúng tôi nhận thấy rằng những tri thức chẩn đoán triệu chứng của căn bệnh viêm phế quản là rất phức tạp Do đó một mô hình biểu diễn tri thức phức tạp này cần phải được mô tả được các tri thức thật đầy đủ và chi tiết Trên thực tế lâm sàng quy trình chẩn đoán của bác sĩ cho thấy phần lớn bác sĩ dựa vào các triệu chứng cơ năng là triệu chứng bệnh nhân nhận thấy, triệu chứng thực thể là triệu chứng do bác sĩ phát hiện trong quá trình khám và các kết luận lâm sàng để chẩn đoán Đồng thời bác sĩ cũng dùng những triệu chứng đặc hiệu để chẩn đoán phân biệt với các bệnh lý khác Ngoài những kiến thức kinh điển trong y học, các