Useoase: Dữ liệu nghiên cứu của bệnh nhân đại thao duéme tại trưng tâm Nội tiét — Đi thảo đường, bệnh viện Bạch Mai Hà Nội 5.2... ¬-- Bang 20: Kết quả thực nghiệm của mô hình với bộ đữ l
Trang 1
BỘ GIÁO DỤC VẢ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
NGUYEN DUC TIO
XAY DUNG HE THONG HO TRG CHAN BOAN
BENT SU DUNG NEURAL NETWORKS
LUAN VAN THAC SI KI THUAT
CONG NGHE THONG TIN
THả Nội - 2019
Trang 2
BỘ GIÁO DỤC VẢ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
NGUYÊN ĐỨC THỌ
XAY DUNG ILE TIIONG LI6 TRO CIIAN DOAN
BENH SU’ DUNG NEURAL NETWORKS
LUẬN VĂN THẠC Sĩ KĨ THUẬT CONG NGHE THONG TLN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS TS PIẠM VĂN HÁT
TIà Nội - 2019
Trang 3
LỜI CAM DOAN
Em xin cam đoan dẻ tài: “Xây đựng hệ thống hỗ trợ chân doán bệnh sử đụng,
Neural Networks” 14 mét céng trink nghién ctru độc lập không có sự sao chép của
xrgười khác Để lài là mội sẵn phẩm mà cm đã nỗ lực nghiên cửu trong quá trình học
tập tại Hệ Đảo
Sau Đại Học, Trường Đại Học Bách Khoa Hà Nội Trong qua
trình viết bài có sự tham khảo một số tài liệu có nguồn gốc rõ ràng, đưới sự hướng dan của thảy giáo, Phó Giáo Sư - Tiến Sĩ Phạm Văn Hải, giảng viên Viện Công
Nghệ Thông Tin va ‘Truyén Thông trưởng Đại Học Bách Khoa Hà Nội Hm xin cam
đoan riêu có vân dé gi em xin chịu hoàn toàn trách nhiệm
Hà Nội, ngày 02 tháng 09 nấm 2019
Trang 43.5 Mô hình mang nơ-rơn kết hợp cơ sở trị thức
Cơ sở trị thức Thun hư
Trựa chọn thuộc tính đầu vào sử dụng CSDIL.TT
Lựa chon số lượng lớp và số lượng node sử dụng CSDLTT
Mô hình mạng nơ-rơn
Tối trụ hiệu nẵng mồ hình mạng nơ-rơn
4.1 Thông số máy chủ
4.2 Kết quả thực nghiệm
4,3 Danh gia
4.4 Useoase: Dữ liệu nghiên cứu của bệnh nhân đại thao duéme tại trưng tâm Nội tiét —
Đi thảo đường, bệnh viện Bạch Mai Hà Nội
5.2 Hướng phát triển - nhà 11 errree
TÀI T.IEU THAM KHẢO
Trang 5
Hình 1: Mô bình ửng dụng hệ cơ sở trị thức .- e cv TÌ
linh 2: Đề thị Fact Precedence Graph (I'PG) +
linh 5: Mạng nơ-ron hồi quy co 6c cctccttrcrrrrrrrercee se, TÔ
Hinh 7: M6 hinh mang với uuật toán lan truyền ngược sai số 22 Hình 8: Quả trình lan truyền tiễn esssesssssssessseeeseeeeessanssssssssssessseeensee 23
Hinh 9: Céng thite link outpul cho 1 node trong mang no-ror, 33
Hình 10: Kiến trúc hệ thông mô hình để xuất
1Iỉnh 11: Sơ đồ hoạt động quá trình học của mạng nơ-rơn kết hợp CSDLLVT,
Hinh 12: Biéu dé histogram các thuộc tính của dữ liệu - - 30
linh 14: Diển đồ hảm mất mát lintropy của các mô hình rạng no-ron nhiều lớp
với số lượng nede thay đối từ 1 — 7 trong bài toán phân lớp 41 Hình 15: Biểu đỗ ham mat mat Entropy cửa các mô hình mạng nơ-ron nhiều lớp với số lượng lớp thay đổi từ 1 — 5 trong bài toán phân lớp - 43
Hình 16: Xây dựng cây liên kết từ CSDILLTT - - 44
Hình 17: Xây dựng mạng các node bằng cách ảnh xạ câu trúc phân cắp 44
Tĩinh 18: Xây dựng mạng no-ron - - - - 45
Tình 19: Một mô Tỉnh mạng nơ-ren với số lượng lớp ân và số lượng node trơng
Hình 20: Biểu đồ độ chính xáo và giá trị hàm mắt mát trong quá trình training 17
Trang 6DANH MỤC CÁC BẰNG
Bang 1: Vi du biểu diễn sự kiện trong hè cơ sở trí thức + 13
Bang 7: Một số bàm kích hoạt thông dựng ooo 5 3¬
Bing 3: Mé tả thuộc tính trong lap diz - 29
Bang 4: Số lượng ban ghi sai vé mat ngit nghia theo timg thuộc tính 31
Bang 5: Thude tinh va gia ti bién 49.0000 oceeee —
đảng 7: Mẫu dữ liệu đâu vào đã chuẩn hóa 233
Tăng 8: Một số yếu tổ nguy cơ sử đựng trong các cuộc khảo sát chân đoán bệnh
đảng 9: Một số mô hình chân đoán bệnh đái thảo đường 235
Bang 11: MOL 34 surkign co trong co sé in thie - - 36
Bảng 12: Một số luật co trong CSDLIT
Bảng 13: Một số giá trị khoảng cách giữa các sự kiện trong cơ số trí thúc 40 Bảng 14: Sự tương ứng giữa
cơ sổ trì thức va mang noston 42
Bang 15: Độ chính xác với bộ dữ liệu test khi áp dựng, các phương pháp hạn chế
overfitling sau củng 4000 chủ kì epoch co ¬— SL Bang 16: Hé số sử dụng cho mỏ hình học 53 láng 17: Lhệu nẵng của mồ hình mạng nơ-ron với bộ dữ liệu UCI 154
Bảng 18: Độ chính xác của một số mô hình mạng nơ-ron trên cùng bộ đữ liệu 55 Bang 19: hông tin dử liệu nghiên cứu của bệnh nhân tại trung tâm Nội tiết Dai tháo đường, bệnh viện Bạch Mai Hà Nội ¬ Bang 20: Kết quả thực nghiệm của mô hình với bộ đữ liệu nghiên cứu bệnh nhân đói tháo đường của bệnh viện Bạch Mai Hà Nội ecoceoooeoeoe 58
Trang 7
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 8MUC LU
LOI CAM DOAN
TỎI CẮM ƠN
DANH MỤC CÁC KÍ H1ỆU, CHỮ VHEF TẤT -
DANH MUC CAC BANG
2.2.2 Các thành phản cơ bản trong hệ cơ sở trì thức,
2.2.3 Biểu diễn sự kiện — luật trong hệ cơ sở trị thức
2.2.4 Khoảng cách giữa cáo sự kiện co eocooneeoe
2.3 Mane no-ron nhan tao
2.3.4 Thuật toàn lan truyền ngược i
Định hướng gid quyét DAI 08M ee ccccccceesseeessseessssnnneesseee
Nội dung của luận văn —
3.1 Mé hinh ứng dụng hỗ Ire chẵn đoán bệnh đái tháo đường
3.2 Đầu vào và đầu ra
3.3 Mô tả đử liệu học
3.4 Xử lý đữ liệu HH HH HH HH ng 0d tr
3.41 Xứ
lữ liệu ngoại lai
3.4.2 Quy chuấn đữ liệu
25
Trang 9LỜI CẢM ƠN
Dau tién, cm xin dược gửi lời cảm ơn sâu sắc nhất tới Thấy giáo - PGS.TS
Phạm Văn lái, Viện Công nghệ thông tim vả Truyền thông, Trường Dại học Bach Khoa Hà Nội đã hướng dẫn và cho em những lời khuyên rong quả trình thực biện luận văn này
“Tiếp theo, em xin chân thành cảm ơn các thầy cô trong Viện Công nghệ thông tỉa và truyền thông, Viên đào tạo sau đại học, Trường Đại học Bách Khoa
Hà Nội đã tạo điều kiện cho em trong suốt quá trình học tập vả nghiên cứu tại
trường Căm cm thạc sĩ bác sĩ Phạm Thị IIông Nhung đã hỗ trợ em trong việc xây
dựng cơ sở trí thức và số liệu nghiên cứu cho luận văn
Cudi cing, em xin bay tổ lòng cảm ơn tới những người thân trong gia đỉnh, bạn bè đã động viên và giúp đỡ để em hoàn thành bản luận văn nay
Ha Noi, ngay 02 thang 09 nam 2019
HỌC VIÊN
Nguyễn Đức Thọ
tà
Trang 10DANH MỤC CÁC BẰNG
Bang 1: Vi du biểu diễn sự kiện trong hè cơ sở trí thức + 13
Bang 7: Một số bàm kích hoạt thông dựng ooo 5 3¬
Bing 3: Mé tả thuộc tính trong lap diz - 29
Bang 4: Số lượng ban ghi sai vé mat ngit nghia theo timg thuộc tính 31
Bang 5: Thude tinh va gia ti bién 49.0000 oceeee —
đảng 7: Mẫu dữ liệu đâu vào đã chuẩn hóa 233
Tăng 8: Một số yếu tổ nguy cơ sử đựng trong các cuộc khảo sát chân đoán bệnh
đảng 9: Một số mô hình chân đoán bệnh đái thảo đường 235
Bang 11: MOL 34 surkign co trong co sé in thie - - 36
Bảng 12: Một số luật co trong CSDLIT
Bảng 13: Một số giá trị khoảng cách giữa các sự kiện trong cơ số trí thúc 40 Bảng 14: Sự tương ứng giữa
cơ sổ trì thức va mang noston 42
Bang 15: Độ chính xác với bộ dữ liệu test khi áp dựng, các phương pháp hạn chế
overfitling sau củng 4000 chủ kì epoch co ¬— SL Bang 16: Hé số sử dụng cho mỏ hình học 53 láng 17: Lhệu nẵng của mồ hình mạng nơ-ron với bộ dữ liệu UCI 154
Bảng 18: Độ chính xác của một số mô hình mạng nơ-ron trên cùng bộ đữ liệu 55 Bang 19: hông tin dử liệu nghiên cứu của bệnh nhân tại trung tâm Nội tiết Dai tháo đường, bệnh viện Bạch Mai Hà Nội ¬ Bang 20: Kết quả thực nghiệm của mô hình với bộ đữ liệu nghiên cứu bệnh nhân đói tháo đường của bệnh viện Bạch Mai Hà Nội ecoceoooeoeoe 58
Trang 11
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 12LỜI CẢM ƠN
Dau tién, cm xin dược gửi lời cảm ơn sâu sắc nhất tới Thấy giáo - PGS.TS
Phạm Văn lái, Viện Công nghệ thông tim vả Truyền thông, Trường Dại học Bach Khoa Hà Nội đã hướng dẫn và cho em những lời khuyên rong quả trình thực biện luận văn này
“Tiếp theo, em xin chân thành cảm ơn các thầy cô trong Viện Công nghệ thông tỉa và truyền thông, Viên đào tạo sau đại học, Trường Đại học Bách Khoa
Hà Nội đã tạo điều kiện cho em trong suốt quá trình học tập vả nghiên cứu tại
trường Căm cm thạc sĩ bác sĩ Phạm Thị IIông Nhung đã hỗ trợ em trong việc xây
dựng cơ sở trí thức và số liệu nghiên cứu cho luận văn
Cudi cing, em xin bay tổ lòng cảm ơn tới những người thân trong gia đỉnh, bạn bè đã động viên và giúp đỡ để em hoàn thành bản luận văn nay
Ha Noi, ngay 02 thang 09 nam 2019
HỌC VIÊN
Nguyễn Đức Thọ
tà
Trang 13
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 14DANH MỤC CÁC BẰNG
Bang 1: Vi du biểu diễn sự kiện trong hè cơ sở trí thức + 13
Bang 7: Một số bàm kích hoạt thông dựng ooo 5 3¬
Bing 3: Mé tả thuộc tính trong lap diz - 29
Bang 4: Số lượng ban ghi sai vé mat ngit nghia theo timg thuộc tính 31
Bang 5: Thude tinh va gia ti bién 49.0000 oceeee —
đảng 7: Mẫu dữ liệu đâu vào đã chuẩn hóa 233
Tăng 8: Một số yếu tổ nguy cơ sử đựng trong các cuộc khảo sát chân đoán bệnh
đảng 9: Một số mô hình chân đoán bệnh đái thảo đường 235
Bang 11: MOL 34 surkign co trong co sé in thie - - 36
Bảng 12: Một số luật co trong CSDLIT
Bảng 13: Một số giá trị khoảng cách giữa các sự kiện trong cơ số trí thúc 40 Bảng 14: Sự tương ứng giữa
cơ sổ trì thức va mang noston 42
Bang 15: Độ chính xác với bộ dữ liệu test khi áp dựng, các phương pháp hạn chế
overfitling sau củng 4000 chủ kì epoch co ¬— SL Bang 16: Hé số sử dụng cho mỏ hình học 53 láng 17: Lhệu nẵng của mồ hình mạng nơ-ron với bộ dữ liệu UCI 154
Bảng 18: Độ chính xác của một số mô hình mạng nơ-ron trên cùng bộ đữ liệu 55 Bang 19: hông tin dử liệu nghiên cứu của bệnh nhân tại trung tâm Nội tiết Dai tháo đường, bệnh viện Bạch Mai Hà Nội ¬ Bang 20: Kết quả thực nghiệm của mô hình với bộ đữ liệu nghiên cứu bệnh nhân đói tháo đường của bệnh viện Bạch Mai Hà Nội ecoceoooeoeoe 58
Trang 15MUC LU
LOI CAM DOAN
TỎI CẮM ƠN
DANH MỤC CÁC KÍ H1ỆU, CHỮ VHEF TẤT -
DANH MUC CAC BANG
2.2.2 Các thành phản cơ bản trong hệ cơ sở trì thức,
2.2.3 Biểu diễn sự kiện — luật trong hệ cơ sở trị thức
2.2.4 Khoảng cách giữa cáo sự kiện co eocooneeoe
2.3 Mane no-ron nhan tao
2.3.4 Thuật toàn lan truyền ngược i
Định hướng gid quyét DAI 08M ee ccccccceesseeessseessssnnneesseee
Nội dung của luận văn —
3.1 Mé hinh ứng dụng hỗ Ire chẵn đoán bệnh đái tháo đường
3.2 Đầu vào và đầu ra
3.3 Mô tả đử liệu học
3.4 Xử lý đữ liệu HH HH HH HH ng 0d tr
3.41 Xứ
lữ liệu ngoại lai
3.4.2 Quy chuấn đữ liệu
25
Trang 16MUC LU
LOI CAM DOAN
TỎI CẮM ƠN
DANH MỤC CÁC KÍ H1ỆU, CHỮ VHEF TẤT -
DANH MUC CAC BANG
2.2.2 Các thành phản cơ bản trong hệ cơ sở trì thức,
2.2.3 Biểu diễn sự kiện — luật trong hệ cơ sở trị thức
2.2.4 Khoảng cách giữa cáo sự kiện co eocooneeoe
2.3 Mane no-ron nhan tao
2.3.4 Thuật toàn lan truyền ngược i
Định hướng gid quyét DAI 08M ee ccccccceesseeessseessssnnneesseee
Nội dung của luận văn —
3.1 Mé hinh ứng dụng hỗ Ire chẵn đoán bệnh đái tháo đường
3.2 Đầu vào và đầu ra
3.3 Mô tả đử liệu học
3.4 Xử lý đữ liệu HH HH HH HH ng 0d tr
3.41 Xứ
lữ liệu ngoại lai
3.4.2 Quy chuấn đữ liệu
25
Trang 17
Hình 1: Mô bình ửng dụng hệ cơ sở trị thức .- e cv TÌ
linh 2: Đề thị Fact Precedence Graph (I'PG) +
linh 5: Mạng nơ-ron hồi quy co 6c cctccttrcrrrrrrrercee se, TÔ
Hinh 7: M6 hinh mang với uuật toán lan truyền ngược sai số 22 Hình 8: Quả trình lan truyền tiễn esssesssssssessseeeseeeeessanssssssssssessseeensee 23
Hinh 9: Céng thite link outpul cho 1 node trong mang no-ror, 33
Hình 10: Kiến trúc hệ thông mô hình để xuất
1Iỉnh 11: Sơ đồ hoạt động quá trình học của mạng nơ-rơn kết hợp CSDLLVT,
Hinh 12: Biéu dé histogram các thuộc tính của dữ liệu - - 30
linh 14: Diển đồ hảm mất mát lintropy của các mô hình rạng no-ron nhiều lớp
với số lượng nede thay đối từ 1 — 7 trong bài toán phân lớp 41 Hình 15: Biểu đỗ ham mat mat Entropy cửa các mô hình mạng nơ-ron nhiều lớp với số lượng lớp thay đổi từ 1 — 5 trong bài toán phân lớp - 43
Hình 16: Xây dựng cây liên kết từ CSDILLTT - - 44
Hình 17: Xây dựng mạng các node bằng cách ảnh xạ câu trúc phân cắp 44
Tĩinh 18: Xây dựng mạng no-ron - - - - 45
Tình 19: Một mô Tỉnh mạng nơ-ren với số lượng lớp ân và số lượng node trơng
Hình 20: Biểu đồ độ chính xáo và giá trị hàm mắt mát trong quá trình training 17
Trang 18
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 19
Hình 1: Mô bình ửng dụng hệ cơ sở trị thức .- e cv TÌ
linh 2: Đề thị Fact Precedence Graph (I'PG) +
linh 5: Mạng nơ-ron hồi quy co 6c cctccttrcrrrrrrrercee se, TÔ
Hinh 7: M6 hinh mang với uuật toán lan truyền ngược sai số 22 Hình 8: Quả trình lan truyền tiễn esssesssssssessseeeseeeeessanssssssssssessseeensee 23
Hinh 9: Céng thite link outpul cho 1 node trong mang no-ror, 33
Hình 10: Kiến trúc hệ thông mô hình để xuất
1Iỉnh 11: Sơ đồ hoạt động quá trình học của mạng nơ-rơn kết hợp CSDLLVT,
Hinh 12: Biéu dé histogram các thuộc tính của dữ liệu - - 30
linh 14: Diển đồ hảm mất mát lintropy của các mô hình rạng no-ron nhiều lớp
với số lượng nede thay đối từ 1 — 7 trong bài toán phân lớp 41 Hình 15: Biểu đỗ ham mat mat Entropy cửa các mô hình mạng nơ-ron nhiều lớp với số lượng lớp thay đổi từ 1 — 5 trong bài toán phân lớp - 43
Hình 16: Xây dựng cây liên kết từ CSDILLTT - - 44
Hình 17: Xây dựng mạng các node bằng cách ảnh xạ câu trúc phân cắp 44
Tĩinh 18: Xây dựng mạng no-ron - - - - 45
Tình 19: Một mô Tỉnh mạng nơ-ren với số lượng lớp ân và số lượng node trơng
Hình 20: Biểu đồ độ chính xáo và giá trị hàm mắt mát trong quá trình training 17
Trang 20MUC LU
LOI CAM DOAN
TỎI CẮM ƠN
DANH MỤC CÁC KÍ H1ỆU, CHỮ VHEF TẤT -
DANH MUC CAC BANG
2.2.2 Các thành phản cơ bản trong hệ cơ sở trì thức,
2.2.3 Biểu diễn sự kiện — luật trong hệ cơ sở trị thức
2.2.4 Khoảng cách giữa cáo sự kiện co eocooneeoe
2.3 Mane no-ron nhan tao
2.3.4 Thuật toàn lan truyền ngược i
Định hướng gid quyét DAI 08M ee ccccccceesseeessseessssnnneesseee
Nội dung của luận văn —
3.1 Mé hinh ứng dụng hỗ Ire chẵn đoán bệnh đái tháo đường
3.2 Đầu vào và đầu ra
3.3 Mô tả đử liệu học
3.4 Xử lý đữ liệu HH HH HH HH ng 0d tr
3.41 Xứ
lữ liệu ngoại lai
3.4.2 Quy chuấn đữ liệu
25
Trang 21
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 22DANH MỤC CÁC KÍ HIỆU, CHỮ VIỆT TAT
AI Artificial Intelligence Trí tuệ nhân tạo
ANN Actificial Neural Network Mạng nơ-rơn nhân lạo
DID ái tháo đường Dai tháo đường
FENN Feed forward neural network © Mang no-ron truyén thing,
RNN Recurrent neural network Mạng nơ-ron hồi quy
MLP Multi Layer Perceptron Mạng truyền thắng nhiều lớp
KBANN Knowledge Based Artificial Mạng nơ-ron nhân tạo dựa
Neural Network trên cơ sở trị thức
FPG Fact Precedence Graph Dé thi liên kết sự kiện
UCI Center for Machine Leaming Trung tám học máy và các hệ
and Intelligent Systems at the thông thông minh của trường nvorsity of California, Irvine dai hoc California, Irvine
HbAle Glycaled hemoglobin Hemoglobin dic bigt két hop
giữa hemoglobin và đường
glucose CSDL Cơ sở dữ liệu Cơ sở đữ liệu
CSDLTT Cơ sở dữ liệu trị thức Cơ sở đữ liệu trí thức bao
gồm các sự kiện và luật
ReLU Rectified Linear Unit Hàm truyền ReLU
Trang 23
DANH MỤC CÁC BẰNG
Bang 1: Vi du biểu diễn sự kiện trong hè cơ sở trí thức + 13
Bang 7: Một số bàm kích hoạt thông dựng ooo 5 3¬
Bing 3: Mé tả thuộc tính trong lap diz - 29
Bang 4: Số lượng ban ghi sai vé mat ngit nghia theo timg thuộc tính 31
Bang 5: Thude tinh va gia ti bién 49.0000 oceeee —
đảng 7: Mẫu dữ liệu đâu vào đã chuẩn hóa 233
Tăng 8: Một số yếu tổ nguy cơ sử đựng trong các cuộc khảo sát chân đoán bệnh
đảng 9: Một số mô hình chân đoán bệnh đái thảo đường 235
Bang 11: MOL 34 surkign co trong co sé in thie - - 36
Bảng 12: Một số luật co trong CSDLIT
Bảng 13: Một số giá trị khoảng cách giữa các sự kiện trong cơ số trí thúc 40 Bảng 14: Sự tương ứng giữa
cơ sổ trì thức va mang noston 42
Bang 15: Độ chính xác với bộ dữ liệu test khi áp dựng, các phương pháp hạn chế
overfitling sau củng 4000 chủ kì epoch co ¬— SL Bang 16: Hé số sử dụng cho mỏ hình học 53 láng 17: Lhệu nẵng của mồ hình mạng nơ-ron với bộ dữ liệu UCI 154
Bảng 18: Độ chính xác của một số mô hình mạng nơ-ron trên cùng bộ đữ liệu 55 Bang 19: hông tin dử liệu nghiên cứu của bệnh nhân tại trung tâm Nội tiết Dai tháo đường, bệnh viện Bạch Mai Hà Nội ¬ Bang 20: Kết quả thực nghiệm của mô hình với bộ đữ liệu nghiên cứu bệnh nhân đói tháo đường của bệnh viện Bạch Mai Hà Nội ecoceoooeoeoe 58
Trang 24DANH MỤC CÁC BẰNG
Bang 1: Vi du biểu diễn sự kiện trong hè cơ sở trí thức + 13
Bang 7: Một số bàm kích hoạt thông dựng ooo 5 3¬
Bing 3: Mé tả thuộc tính trong lap diz - 29
Bang 4: Số lượng ban ghi sai vé mat ngit nghia theo timg thuộc tính 31
Bang 5: Thude tinh va gia ti bién 49.0000 oceeee —
đảng 7: Mẫu dữ liệu đâu vào đã chuẩn hóa 233
Tăng 8: Một số yếu tổ nguy cơ sử đựng trong các cuộc khảo sát chân đoán bệnh
đảng 9: Một số mô hình chân đoán bệnh đái thảo đường 235
Bang 11: MOL 34 surkign co trong co sé in thie - - 36
Bảng 12: Một số luật co trong CSDLIT
Bảng 13: Một số giá trị khoảng cách giữa các sự kiện trong cơ số trí thúc 40 Bảng 14: Sự tương ứng giữa
cơ sổ trì thức va mang noston 42
Bang 15: Độ chính xác với bộ dữ liệu test khi áp dựng, các phương pháp hạn chế
overfitling sau củng 4000 chủ kì epoch co ¬— SL Bang 16: Hé số sử dụng cho mỏ hình học 53 láng 17: Lhệu nẵng của mồ hình mạng nơ-ron với bộ dữ liệu UCI 154
Bảng 18: Độ chính xác của một số mô hình mạng nơ-ron trên cùng bộ đữ liệu 55 Bang 19: hông tin dử liệu nghiên cứu của bệnh nhân tại trung tâm Nội tiết Dai tháo đường, bệnh viện Bạch Mai Hà Nội ¬ Bang 20: Kết quả thực nghiệm của mô hình với bộ đữ liệu nghiên cứu bệnh nhân đói tháo đường của bệnh viện Bạch Mai Hà Nội ecoceoooeoeoe 58
Trang 25LỜI CẢM ƠN
Dau tién, cm xin dược gửi lời cảm ơn sâu sắc nhất tới Thấy giáo - PGS.TS
Phạm Văn lái, Viện Công nghệ thông tim vả Truyền thông, Trường Dại học Bach Khoa Hà Nội đã hướng dẫn và cho em những lời khuyên rong quả trình thực biện luận văn này
“Tiếp theo, em xin chân thành cảm ơn các thầy cô trong Viện Công nghệ thông tỉa và truyền thông, Viên đào tạo sau đại học, Trường Đại học Bách Khoa
Hà Nội đã tạo điều kiện cho em trong suốt quá trình học tập vả nghiên cứu tại
trường Căm cm thạc sĩ bác sĩ Phạm Thị IIông Nhung đã hỗ trợ em trong việc xây
dựng cơ sở trí thức và số liệu nghiên cứu cho luận văn
Cudi cing, em xin bay tổ lòng cảm ơn tới những người thân trong gia đỉnh, bạn bè đã động viên và giúp đỡ để em hoàn thành bản luận văn nay
Ha Noi, ngay 02 thang 09 nam 2019
HỌC VIÊN
Nguyễn Đức Thọ
tà
Trang 26MUC LU
LOI CAM DOAN
TỎI CẮM ƠN
DANH MỤC CÁC KÍ H1ỆU, CHỮ VHEF TẤT -
DANH MUC CAC BANG
2.2.2 Các thành phản cơ bản trong hệ cơ sở trì thức,
2.2.3 Biểu diễn sự kiện — luật trong hệ cơ sở trị thức
2.2.4 Khoảng cách giữa cáo sự kiện co eocooneeoe
2.3 Mane no-ron nhan tao
2.3.4 Thuật toàn lan truyền ngược i
Định hướng gid quyét DAI 08M ee ccccccceesseeessseessssnnneesseee
Nội dung của luận văn —
3.1 Mé hinh ứng dụng hỗ Ire chẵn đoán bệnh đái tháo đường
3.2 Đầu vào và đầu ra
3.3 Mô tả đử liệu học
3.4 Xử lý đữ liệu HH HH HH HH ng 0d tr
3.41 Xứ
lữ liệu ngoại lai
3.4.2 Quy chuấn đữ liệu
25
Trang 27MUC LU
LOI CAM DOAN
TỎI CẮM ƠN
DANH MỤC CÁC KÍ H1ỆU, CHỮ VHEF TẤT -
DANH MUC CAC BANG
2.2.2 Các thành phản cơ bản trong hệ cơ sở trì thức,
2.2.3 Biểu diễn sự kiện — luật trong hệ cơ sở trị thức
2.2.4 Khoảng cách giữa cáo sự kiện co eocooneeoe
2.3 Mane no-ron nhan tao
2.3.4 Thuật toàn lan truyền ngược i
Định hướng gid quyét DAI 08M ee ccccccceesseeessseessssnnneesseee
Nội dung của luận văn —
3.1 Mé hinh ứng dụng hỗ Ire chẵn đoán bệnh đái tháo đường
3.2 Đầu vào và đầu ra
3.3 Mô tả đử liệu học
3.4 Xử lý đữ liệu HH HH HH HH ng 0d tr
3.41 Xứ
lữ liệu ngoại lai
3.4.2 Quy chuấn đữ liệu
25
Trang 28
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 293.5 Mô hình mang nơ-rơn kết hợp cơ sở trị thức
Cơ sở trị thức Thun hư
Trựa chọn thuộc tính đầu vào sử dụng CSDIL.TT
Lựa chon số lượng lớp và số lượng node sử dụng CSDLTT
Mô hình mạng nơ-rơn
Tối trụ hiệu nẵng mồ hình mạng nơ-rơn
4.1 Thông số máy chủ
4.2 Kết quả thực nghiệm
4,3 Danh gia
4.4 Useoase: Dữ liệu nghiên cứu của bệnh nhân đại thao duéme tại trưng tâm Nội tiét —
Đi thảo đường, bệnh viện Bạch Mai Hà Nội
5.2 Hướng phát triển - nhà 11 errree
TÀI T.IEU THAM KHẢO
Trang 30DANH MỤC CÁC KÍ HIỆU, CHỮ VIỆT TAT
AI Artificial Intelligence Trí tuệ nhân tạo
ANN Actificial Neural Network Mạng nơ-rơn nhân lạo
DID ái tháo đường Dai tháo đường
FENN Feed forward neural network © Mang no-ron truyén thing,
RNN Recurrent neural network Mạng nơ-ron hồi quy
MLP Multi Layer Perceptron Mạng truyền thắng nhiều lớp
KBANN Knowledge Based Artificial Mạng nơ-ron nhân tạo dựa
Neural Network trên cơ sở trị thức
FPG Fact Precedence Graph Dé thi liên kết sự kiện
UCI Center for Machine Leaming Trung tám học máy và các hệ
and Intelligent Systems at the thông thông minh của trường nvorsity of California, Irvine dai hoc California, Irvine
HbAle Glycaled hemoglobin Hemoglobin dic bigt két hop
giữa hemoglobin và đường
glucose CSDL Cơ sở dữ liệu Cơ sở đữ liệu
CSDLTT Cơ sở dữ liệu trị thức Cơ sở đữ liệu trí thức bao
gồm các sự kiện và luật
ReLU Rectified Linear Unit Hàm truyền ReLU
Trang 31
Hình 1: Mô bình ửng dụng hệ cơ sở trị thức .- e cv TÌ
linh 2: Đề thị Fact Precedence Graph (I'PG) +
linh 5: Mạng nơ-ron hồi quy co 6c cctccttrcrrrrrrrercee se, TÔ
Hinh 7: M6 hinh mang với uuật toán lan truyền ngược sai số 22 Hình 8: Quả trình lan truyền tiễn esssesssssssessseeeseeeeessanssssssssssessseeensee 23
Hinh 9: Céng thite link outpul cho 1 node trong mang no-ror, 33
Hình 10: Kiến trúc hệ thông mô hình để xuất
1Iỉnh 11: Sơ đồ hoạt động quá trình học của mạng nơ-rơn kết hợp CSDLLVT,
Hinh 12: Biéu dé histogram các thuộc tính của dữ liệu - - 30
linh 14: Diển đồ hảm mất mát lintropy của các mô hình rạng no-ron nhiều lớp
với số lượng nede thay đối từ 1 — 7 trong bài toán phân lớp 41 Hình 15: Biểu đỗ ham mat mat Entropy cửa các mô hình mạng nơ-ron nhiều lớp với số lượng lớp thay đổi từ 1 — 5 trong bài toán phân lớp - 43
Hình 16: Xây dựng cây liên kết từ CSDILLTT - - 44
Hình 17: Xây dựng mạng các node bằng cách ảnh xạ câu trúc phân cắp 44
Tĩinh 18: Xây dựng mạng no-ron - - - - 45
Tình 19: Một mô Tỉnh mạng nơ-ren với số lượng lớp ân và số lượng node trơng
Hình 20: Biểu đồ độ chính xáo và giá trị hàm mắt mát trong quá trình training 17
Trang 323.5 Mô hình mang nơ-rơn kết hợp cơ sở trị thức
Cơ sở trị thức Thun hư
Trựa chọn thuộc tính đầu vào sử dụng CSDIL.TT
Lựa chon số lượng lớp và số lượng node sử dụng CSDLTT
Mô hình mạng nơ-rơn
Tối trụ hiệu nẵng mồ hình mạng nơ-rơn
4.1 Thông số máy chủ
4.2 Kết quả thực nghiệm
4,3 Danh gia
4.4 Useoase: Dữ liệu nghiên cứu của bệnh nhân đại thao duéme tại trưng tâm Nội tiét —
Đi thảo đường, bệnh viện Bạch Mai Hà Nội
5.2 Hướng phát triển - nhà 11 errree
TÀI T.IEU THAM KHẢO
Trang 33
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 34LỜI CẢM ƠN
Dau tién, cm xin dược gửi lời cảm ơn sâu sắc nhất tới Thấy giáo - PGS.TS
Phạm Văn lái, Viện Công nghệ thông tim vả Truyền thông, Trường Dại học Bach Khoa Hà Nội đã hướng dẫn và cho em những lời khuyên rong quả trình thực biện luận văn này
“Tiếp theo, em xin chân thành cảm ơn các thầy cô trong Viện Công nghệ thông tỉa và truyền thông, Viên đào tạo sau đại học, Trường Đại học Bách Khoa
Hà Nội đã tạo điều kiện cho em trong suốt quá trình học tập vả nghiên cứu tại
trường Căm cm thạc sĩ bác sĩ Phạm Thị IIông Nhung đã hỗ trợ em trong việc xây
dựng cơ sở trí thức và số liệu nghiên cứu cho luận văn
Cudi cing, em xin bay tổ lòng cảm ơn tới những người thân trong gia đỉnh, bạn bè đã động viên và giúp đỡ để em hoàn thành bản luận văn nay
Ha Noi, ngay 02 thang 09 nam 2019
HỌC VIÊN
Nguyễn Đức Thọ
tà
Trang 35
linh 25: Mê hình mạng nơ-ron thử nghiệm biểu diễn bởi thư viện Keras
Hinh 26: Biéu dé giá trị hàm mắt mát và độ chỉnh xác với bộ đữ liệu training và
lest trong 4000 chu ki epoch, - - - 53
bộ đữ
Tĩnh 27: Kết quả quá trình traiming mô hình mạng sau khi loại bd 2 thuộc tinh
Blood Pressure va Skin Thickness - - 37 THình 28: Màn hình tình răng chẩn doán bệnh DTP - 59 Hình 29: Mán hình tỉnh năng quản lý sự kiện Xeneesseueeoo.ÔU Tình 30: Màn hình tính năng quân lý luật 60
Trang 36MUC LU
LOI CAM DOAN
TỎI CẮM ƠN
DANH MỤC CÁC KÍ H1ỆU, CHỮ VHEF TẤT -
DANH MUC CAC BANG
2.2.2 Các thành phản cơ bản trong hệ cơ sở trì thức,
2.2.3 Biểu diễn sự kiện — luật trong hệ cơ sở trị thức
2.2.4 Khoảng cách giữa cáo sự kiện co eocooneeoe
2.3 Mane no-ron nhan tao
2.3.4 Thuật toàn lan truyền ngược i
Định hướng gid quyét DAI 08M ee ccccccceesseeessseessssnnneesseee
Nội dung của luận văn —
3.1 Mé hinh ứng dụng hỗ Ire chẵn đoán bệnh đái tháo đường
3.2 Đầu vào và đầu ra
3.3 Mô tả đử liệu học
3.4 Xử lý đữ liệu HH HH HH HH ng 0d tr
3.41 Xứ
lữ liệu ngoại lai
3.4.2 Quy chuấn đữ liệu
25
Trang 37DANH MỤC CÁC BẰNG
Bang 1: Vi du biểu diễn sự kiện trong hè cơ sở trí thức + 13
Bang 7: Một số bàm kích hoạt thông dựng ooo 5 3¬
Bing 3: Mé tả thuộc tính trong lap diz - 29
Bang 4: Số lượng ban ghi sai vé mat ngit nghia theo timg thuộc tính 31
Bang 5: Thude tinh va gia ti bién 49.0000 oceeee —
đảng 7: Mẫu dữ liệu đâu vào đã chuẩn hóa 233
Tăng 8: Một số yếu tổ nguy cơ sử đựng trong các cuộc khảo sát chân đoán bệnh
đảng 9: Một số mô hình chân đoán bệnh đái thảo đường 235
Bang 11: MOL 34 surkign co trong co sé in thie - - 36
Bảng 12: Một số luật co trong CSDLIT
Bảng 13: Một số giá trị khoảng cách giữa các sự kiện trong cơ số trí thúc 40 Bảng 14: Sự tương ứng giữa
cơ sổ trì thức va mang noston 42
Bang 15: Độ chính xác với bộ dữ liệu test khi áp dựng, các phương pháp hạn chế
overfitling sau củng 4000 chủ kì epoch co ¬— SL Bang 16: Hé số sử dụng cho mỏ hình học 53 láng 17: Lhệu nẵng của mồ hình mạng nơ-ron với bộ dữ liệu UCI 154
Bảng 18: Độ chính xác của một số mô hình mạng nơ-ron trên cùng bộ đữ liệu 55 Bang 19: hông tin dử liệu nghiên cứu của bệnh nhân tại trung tâm Nội tiết Dai tháo đường, bệnh viện Bạch Mai Hà Nội ¬ Bang 20: Kết quả thực nghiệm của mô hình với bộ đữ liệu nghiên cứu bệnh nhân đói tháo đường của bệnh viện Bạch Mai Hà Nội ecoceoooeoeoe 58