N云K"ECO"AQCP V»k"zkp"eco"8qcp"u嘘 li羽w"8逢嬰c s穎 d映ng trong nghiên c泳u này là s嘘 li羽u s嘘 li羽u th詠c, do tôi nh壱p li羽u t瑛 các b羽nh án xét nghi羽m m瓜t cách trung th詠c và khách quan.. Vt逢噂c m逸v.
Trang 1A萎I H窺C QU渦C GIA TP HCM
Trang 2EðPI"VTîPJ"A姶営E"JQÉP"VJÉPJ"V萎K VT姶云PI"A萎K"J窺E"DèEJ"MJQC"ÎAJSI"-HCM
E p"d瓜"j逢噂pi"f磯p"mjqc"j丑e: TS Lê Thanh Vân
E p"d瓜"ej医o"pj壱p"zfiv"3:VU"Piw{宇p"A泳e"Vj k
E p"d瓜"ej医o"pj壱p"zfiv"4:VU"Piw{宇n Thanh Hiên
Nw壱p"x<p"vj衣e"u "8逢嬰e"d違q"x羽"v衣k"Vt逢運pi"A衣k"j丑e"D ej"Mjqc."AHQG Tp
HCM ngày 27 tháng 12 p<o 2013
Vj pj"rj亥p"J瓜k"8欝pi"8 pj"ik "nw壱p"x<p"vj衣e"u "i欝o<
(Ghi t "j丑."v‒p."j丑e"j o."j丑e"x鵜"e栄c"J瓜k"8欝pi"ej医o"d違q"x羽"nw壱p"x<p"vj衣e"u +
Trang 3A萎I H窺C QU渦C GIA TP.HCM
NHI 烏M V影 LU一P"X;P"VJ萎E"U
H丑 tên h丑c viên: NGUY右N TH卯 VJKçP"J姶愛PI""""""""""""" MSHV:11320964
Pi {."vj pi."p<o"uinh: 16/12/1984 P挨k"ukpj<"Qu違ng Ngãi
Chuyên ngành: H羽 th嘘ng thông tin qu違n lý Mã s嘘: 603448
永ng d映ng khai phá d英 li羽u và h羽 h厩 tr嬰 ra quy院v"8鵜nh trong qu違p"n#"x "8k隠u
tr 鵜 b羽nh 8 k"vj q"8逢運ng típ 2
1 Thu nh壱p và ti隠n x穎 lý d英 li羽w"vt逢噂c khi s穎 d映ng thu壱t toán khai phá d英
li羽w"8吋 tìm ra tri th泳c
2 Xây d詠ng mô hình phân l噂p b羽nh nhân
3 Tìm ra các lu壱t gi英a các thu瓜c tính c栄a b羽nh nhân
4 Xây d詠pi"ej逢挨pi"vt·pj"rj¤p"nq衣i b羽nh nhân trên mô hình phân l噂p xây
d詠pi"8逢嬰c
5 Xây d詠pi"ej逢挨pi"vt·pj"sw違n lý vi羽e"8k隠u tr鵜 c栄a b羽nh nhân
Tp HCM, ngày 22 t j pi"33"p<o"4235
CÁN Bし J⇒すNG DcN CHづ NHIぅM Bし OðP"AÉQ"VSO
VT⇒そNG KHOA
Trang 4N云K"EèO"愛P
L運i c違o"挨p"8亥w"vk‒p"v»k"zkp"8逢嬰c g穎k"8院n TS LÊ THANH VÂN Î gi違ng viên vt逢運pi"8衣i h丑c bách khoa tp H欝 Chí Minh, c違o"挨p"e»"8«"vtw{隠p"8衣t ki院n th泳c, kinh
nghi羽m và nh英ng g嬰i ý giúp tôi hoàn thành lu壱p"x<p"p {0
Ti院p theo tôi mu嘘n g荏i l運i c違o"挨p"8院p"d e"u "PIW[右N TH卯 VJ姶"J姶愛PI"Î
n瓜i trú n瓜i ti院v"p<o"5"vt逢運pi"8衣i h丑e"{"f逢嬰c tp H欝 Chí Minh, c違o"挨p"d e"u "8«"ewpi"
c医p s嘘 li羽u và ch雨 d磯n cho tôi nh英ng ki院n th泳e"u挨"n逢嬰c v隠 b羽pj"8 k"vj q"8逢運ng e pi"pj逢"8逢c"tc"pj英ng nh壱n xét y khoa cho k院t qu違 nghiên c泳u
Tôi xin chân thành c違o" 挨p" e e" vj亥y cô Khoa Khoa H丑c & K悦 Thu壱t Máy
Tính, Khoa Qu違n Lý Công Nghi羽r"x "Rj pi"Ucw"A衣k"Vt逢運pi"A衣i h丑c Bách Khoa- A衣i H丑c Qu嘘e"Ikc"VR0JEO"8«"vjco"iia gi違ng d衣y, qu違n lý l噂p h丑c và truy隠p"8衣t
ki院n th泳c cho tôi trong su嘘t khóa h丑c v瑛a qua
L運i c違o"挨p"ucw"épi"v»k"zkp"8逢嬰c g穎k"8院p"ikc"8·pj"x "d衣n bè, l運k"8瓜ng viên
c栄a m丑k"pi逢運k"8«"ik¿r"v»k"e„"vj‒o"pk隠m tin trong công vi羽c
Trang 5VïO"V溢V"P浦K"FWPI"NW一P"X;P
A隠 tài 8逢嬰c th詠c hi羽n nh茨m nghiên c泳u các y院u t嘘 違pj"j逢荏pi"8院n vi羽e"8k隠u tr鵜
b羽pj" 8 k" vj q" 8逢運ng típ 2 t衣i Vi羽t Nam hi羽n nay Z e" 8鵜nh m泳e" 8瓜 quan tr丑ng v逢挨pi"8嘘i c栄a các y院u t嘘 này nh茨m m映e"8 ej"rj¤p"nq衣i b羽nh nhân, giúp cho các bác
u "e„"e ej"8k隠u tr鵜 b羽nh t嘘v"j挨p"uq"x噂i hi羽n t衣i A隠 v k"e pi"pijk‒p"e泳u m嘘i quan h羽
trong các thu瓜c tính c栄a b羽nh nhân, t瑛 8„"8逢c"tc"e e"mjw{院p"e q."ik¿r"d e"u "e„"vj吋
xem xét các xét nghi羽m nào c亥n thi院v"8逢嬰c ti院p"j pj"8吋 giúp cho quá trình ch育n 8oán b羽nh c栄a b羽nh nhân hi羽u qu違 j挨p0"
Nghiên c泳w"8逢嬰c ti院p"j pj"vjgq"5"d逢噂c chính: (1) thu th壱p d英 li羽u; (2) x穎 lý
d英 li羽u; *5+"#"pij c"vj詠c ti宇n y h丑e"t¿v"tc"8逢嬰c t瑛 d英 li羽w"8«"8逢嬰c x穎 lý
Thu th壱p d英 li羽u 8逢嬰c ti院n hành b茨ng cách l医y d英 li羽u nghiên c泳w" ÐA鵜nh n逢嬰ng HbC3e"8吋 theo dõi ki吋o"uq v"8逢運ng huy院t b羽pj"8 k"vj q"8逢運ng típ 4Ñ"fq"j瓜i
N瓜i Ti院v"x "A k"Vj q"A逢運ng Tp H欝 Chí Minh t鰻 ch泳c
X穎 lý d英 li羽u: g欝o"4"d逢噂c chính là ti隠n x穎 lý d英 li羽u và s穎 d映ng ph亥n m隠m Ygmc"8吋 x穎 lý d英 li羽u
""pij c"vj詠c ti宇p"8„"là tham kh違o ý ki院p"d e"u "ejw{‒p"mjqc"8吋 t¿v"tc"#"pij c"
th詠c ti宇n t瑛 các lu壱v"8逢嬰c trích ra
Ngoài ra 8隠 tài e pi"8隠 xu医v"#"v逢荏pi"ej<o"u„e"d羽nh nhân b茨ng cách xây d詠ng
ch泳e"p<pi"sw違n lý Ch泳e"p<pi"p {"e„"pjk羽m v映 nh逸c nh荏 b羽nh nhân ngày tái khám 8鵜nh k , gi違k"8 r"vj逸c m逸c c栄a b羽nh nhân và có th吋 c壱p nh壱t các bài báo v隠 s泳c
kh臼e cho b羽nh nhân m瓜t cách hi羽u qu違 nh医t
Trang 6ABSTRACT
The purpose of this study is to investigate the factors that affect the treatment
of type 2 diabetes in Vietnam, determine the relative weight of these factors to classify patient, help the doctor do the treatment in a more efficient way
This study also investigates the relationship among the properties of type 2 diabetes to give recommendation to doctors, help them determine the necessary medical test to increase performance of diagnostic process
The study is carried out through three steps: (1) data collecting; (2) data processing; (3) medical data meaning
Vjg" fcvc" eqnngevkpi" rtqeguu" ku" dcugf" qp" fcvc" qh" vjg" tgugctej" ÐSwcpvkh{" qh"
HbC3e"kp"oqpkvqt"cpf"eqpvtqn"dnqqf"uwict"qh"v{rg"4"fkcdgvgu"rcvkgpvÑ"eqpfwevgf"d{"
Association of Endocrine and Diabetes Ho Chi Minh City
The data processing includes two steps: the data are firstly pre-processed then processed using WEKA software
Medical data meaning: the mining rules generated from WEKA software are passed to specialist doctors to deduct medical meaning
Moreover, the study also proposes the idea of doing patient care through patient management module This module will have some function like prepare schedule and remind patient to go to the doctor, manage patient questions and send
qwv"vjg"tgncvgf"ogfkecn"pgyu."tgugctejÓu"vq"rcvkgpv"kp"c"oqtg"eqpxgpkgpv"yc{0"
Trang 7N云K"ECO"AQCP
V»k"zkp"eco"8qcp"u嘘 li羽w"8逢嬰c s穎 d映ng trong nghiên c泳u này là s嘘 li羽u s嘘 li羽u
th詠c, do tôi nh壱p li羽u t瑛 các b羽nh án xét nghi羽m m瓜t cách trung th詠c và khách
quan Vi羽c kh違o sát, nghiên c泳u và th詠c hi羽n do tôi t詠 làm
Trang 8O影E N影E
L云K"EèO"愛P i
TÓM T溢T N浦I DUNG LU一P"X;P ii
ABSTRACT iii
L云K"ECO"AQCP iv
M影C L影C v
DANH M影C CH頴 VI蔭T T溢T x
DANH M影C B謂NG xi
DANH M影C HÌNH xii
EJ姶愛PI"3<IK閏K"VJK烏W 1
303"Ik噂k"vjk羽w"8隠"v k 1
1.1.1 永ng d映ng h羽 h厩 tr嬰 ra quy院v"8鵜pj"vtqpi"n pj"x詠c y t院 1
1.1.2 Hi羽u qu違 c栄a h羽 h厩 tr嬰 ra quy院v"8鵜nh trong y t院 2
1.1.3 M瓜t s嘘 k院t qu違 nghiên c泳u, 泳ng d映pi"vtqpi"x "piq k"p逢噂c 2
304"E挨"u荏 j·pj"vj pj"8隠 tài 4
1.2.1 Th詠c tr衣ng b羽pj"8 k"vj q"8逢運ng 荏 p逢噂c ta 4
1.2.2 M瓜t s嘘 v医p"8隠 8cpi"v欝n t衣k"vtqpi"e e"e挨"u荏 y t院 荏 p逢噂c ta 4
1.2.3 Tình hình 泳ng d映ng CNTT vào y t院 5
305"O映e"vk‒w"x "p瓜k"fwpi"8隠"v k 5
306"""pij c"8隠 tài 6
307"Rj衣o"xk"x "ik噂k"j衣p"8隠"v k 7
308"D嘘"e映e"nw壱p"x<p 7
1.7 T鰻ng k院t 8
EJ姶愛PI"4<""MK蔭N TH永E"E愛"D謂N V陰 B烏PJ"AèK"VJèQ"A姶云NG TÍP 2 9
403"A k"vj q"8逢運ng típ 2 9
40303"A鵜pj"pij c 9
2.1.2 Các y院u t嘘 piw{"e挨"ejq"u詠 phát tri吋n b羽pj"AVA 9
Trang 92.2 Bi院n ch泳ng b羽pj"8 k"vj q"8逢運ng 10
2.3 Các y院u t嘘 nk‒p"swcp"8院n b羽pj"8 k"vj q"8逢運ng 11
2.3.1 Thu嘘e"n "x "dkc"t逢嬰u 11
2.3.2 Béo phì 11
40505"A鵜c"f逢 12
2.3.4 Gi噂i tính 12
2.4 HbA1c 12
40603"A鵜pj"pij c 12
40604"""pij c"JdC3e"vtqpi"ej育p"8q p"d羽pj"AVA"v r"4 12
2.5 Khái ni羽o"8逢運ng huy院v"8„k 12
408"Rj e"8欝 8k隠u tr鵜 b羽pj"8 k"vj q"8逢運ng IDF 13
EJ姶愛PI"5<"E愛"U愛"N""VJW[蔭T 15
3.1 T鰻ng quan v隠 h羽 h厩 tr嬰 quy院v"8鵜nh (DSS-Decision Support System) 15
3.1.1 Khái ni羽m h羽 h厩 tr嬰 quy院v"8鵜nh-DSS 15
50304"E e"d逢噂c c栄a h羽 h厩 tr嬰 ra quy院v"8鵜nh: 15
3.1.3 H羽 h厩 tr嬰 quy院v"8鵜nh trong y t院 (CDSS) 15
3.1.4 Mô hình h羽 h厩 tr嬰 quy院v"8鵜nh s穎 d映pi"vtqpi"d k"vq p"x "#"pij c 17
3.2 Bài toán phân l噂p b羽nh nhân d詠a trên lu壱t sinh ra t瑛 t壱p d英 li羽u 17
3.2.1 Phát bi吋u bài toán phân l噂p b羽nh nhân d詠a tr羽n lu壱t sinh ra t瑛 t壱p d英 li羽u 17 50404"E挨"u荏 lý thuy院t 18
3.2.2.1 Khai phá d英 li羽u (data mining) là gì 18
3.2.2.2 Bài toán phân l噂p 20
3.2.2.3 Trình bày cây quy院v"8鵜nh 23
3.2.3 M瓜t s嘘 v医p"8隠 v噂i bài toán phân lo衣i 25
50406"Rj逢挨pi"rj r"m院t h嬰p các b瓜 phân lo衣i 26
3.2.4.1 Khái ni羽m k院t h嬰p các b瓜 phân lo衣i 26
Trang 103.2.4.2 Các cách ti院p c壱p"rj逢挨pi"rj r"m院t h嬰p các b瓜 phân lo衣i 27
3.2.4.3 Mô hình ho衣v"8瓜ng c栄a Bagging (Boostrap Aggregation) 27
3.3 Khai phá s詠 k院t h嬰p c栄a các thu瓜c tính 28
3.3.1 Phát bi吋u bài toán 28
50504"E挨"u荏 lý thuy院t 28
3.3 T鰻ng k院t 31
EJ姶愛PI"6<""VK陰N X盈 LÝ D頴 LI烏U & PHÂN TÍCH S衛 PHÂN B渦 CÁC THU浦C TÍNH C曳A B烏NH NHÂN 32
4.1 Ngu欝n d英 li羽u 32
604"E e"d逢噂c x穎 lý d英 li羽u 32
4.2.1 Lo衣i b臼 và hi羽u ch雨nh l衣i d英 li羽u 33
4.2.2 Chuy吋p"8鰻i d英 li羽u 34
4.2.3 Chuy吋p"8鰻i các thu瓜c tính có d衣ng s嘘 thành d衣ng Nominal 35
4.2.3.1 Phân lo衣i BMI theo tiêu chu育n 35
4.2.3.2 Phân lo衣i vòng eo 35
4.2.3.3 Phân lo衣k"8逢運ng huy院v"8„k 35
4.2.3.4 Phân lo衣k"8瓜 tu鰻i 36
4.3 Th嘘ng kê các thu瓜c tính c栄a b羽nh nhân 36
4.3.1 Th嘘ng kê s嘘 b羽nh nhân theo tu鰻i 36
4.3.2 Th嘘ng kê s嘘 b羽nh nhân theo ch雨 s嘘 BMI 37
4.3.3 Th嘘ng kê s嘘 b羽nh nhân theo th運i gian m逸c b羽nh 38
4.3.4 Th嘘ng k院 s嘘 b羽nh nhân theo ch雨 s嘘 8逢運ng huy院v"8„k 39
4.3.5 Th嘘ng k院 s嘘 b羽nh nhân theo ch雨 s嘘 HbA1c 40
4.3.6 Th嘘ng k院 s嘘 b羽nh nhân theo vòng eo 41
4.3.6 Th嘘ng kê t雨 l羽 ph亥p"vt<o"e e"{院u t嘘 c栄c"pi逢運i b羽nh 42
4.3.7 Th嘘ng kê t雨 l羽 ph亥p"vt<o"u穎 d映ng các lo衣i thu嘘c c栄c"pi逢運i b羽nh 43
Trang 114.4 T鰻ng k院t 44
EJ姶愛PI"7<"Zå["F衛NG MÔ HÌNH 45
5.1 Xây d詠ng mô hình phân l噂p b羽nh nhân 45
5.1.1 Ph亥n m隠m Weka 45
70304"A鵜nh d衣ng d英 li羽u hu医n luy羽n, d英 li羽u ki吋m th穎 45
5.1.3 Xây d詠ng mô hình s穎 d映ng ph亥n m隠m Weka 47
5.1.3.1 Nh壱p d英 li羽w"8亥u vào 47
5.1.3.2 Xây d詠ng mô hình phân l噂p 48
5.1.3.3 Ki吋o"vtc."8 pj"ik "o»"j·pj 49
5.1.4 Các lu壱v"t¿v"tc"8逢嬰c t瑛 mô hình cây quy院v"8鵜pj"x "#"pij c"{"j丑c 51
5.1.5 Ki吋m ch泳pi."8隠 xu医t v噂k"rj e"8欝 8k隠u tr鵜 b羽pj"8 k"vj q"8逢運ng c栄a t鰻 ch泳c KFH"8隠 xu医t 52
5.2 Xây d詠ng lu壱t k院t h嬰p các thu瓜c tính c栄a b羽pj"pj¤p"8 k"vj q 8逢運ng típ 2 54
5.2.1 Các lu壱t k院t h嬰r"t¿v"tc"8逢挨e"v瑛 x穎 lý WEKA 54
70404"""pij "{"mjqc"e栄a các lu壱t k院t h嬰p 55
5.2.2.1 Lu壱t ch雨 ra s詠 v逢挨pi"swcp"ik英a béo b映ng và béo phì 56
5.2.2.2 Các lu壱t 違pj"j逢荏pi"8院p"v<pi"jw{院t áp 56
5.2.2.3 Lu壱t 違pj"j逢荏pi"8院n RLLP 58
5.3 T鰻ng k院t 58
EJ姶愛PI"8<""Zå["F衛PI"EJ姶愛PI"VTîPJ"RJåP"NQ萎I VÀ QU謂N LÝ B烏NH NHÂN 59
6.1 Gi噂i thi羽u 59
804"V pj"p<pi"ej逢挨pi"vt·pj 59
6.2.1 Nh壱p thông tin b羽nh nhân 59
6.2.2 Nh壱p thông s嘘 ch育p"8q p 59
6.2.3 Ti院n hành ch育p"8q p 59
6.2.4 Qu違n lý b羽nh nhân 60
Trang 126.2.5 C壱p nh壱t mô hình 60
6.3 Thi院t k院 ej逢挨pi"vt·pj 60
80503"U挨"8欝 ho衣v"8瓜ng 60
6.3.2 Ngôn ng英 l壱r"vt·pj"x "vj逢"xk羽n ph亥n m隠m 61
6.3.2 Thi院t k院 giao di羽n 63
6.3.2.1 Giao di羽n nh壱p d英 li羽u 63
8050404"E e"p¿v"8k隠u khi吋n 63
6.4 M瓜t s嘘 k院t qu違 ch衣y th穎 ej逢挨pi"vt·pj 64
6.4.1 Xây d詠ng mô hình d詠a vào t壱p d英 li羽u training 64
6.4.2 Ch育p"8q p"d羽nh nhân 65
6.4.3 Ki吋m tra d英 li羽u b羽nh nhân 66
6.5 T鰻ng k院t 67
EJ姶愛PI9<"AèPJ"IKè"M蔭V"SW謂"PIJKçP"E永W"XÉ"MK蔭P"PIJ卯 68
7.1 K院t qu違 nghiên c泳u 68
7.1.1 Tóm t逸t n瓜i dung nghiên c泳u 68
90304"A„pi"i„r"e栄c"8隠 tài 68
7.2 H衣n ch院 x "j逢噂ng nghiên c泳u ti院p theo 69
7.2.1 H衣n ch院 c栄c"8隠 tài 69
90404"J逢噂ng nghiên c泳u ti院p theo 69
TÀI LI烏U THAM KH謂O 71
LÝ L卯CH TRÍCH NGANG 74
PH影 L影C 745
Trang 13FCPJ"O影E"EJ頴"XK蔭V"V溢V"
AVA<"A k"vj q"8逢運ng
DSS: Decision Support System - H羽 h厩 tr嬰 ra quy院v"8鵜nh
CDSS: Clinical Decision Support System - H羽 h厩 tr嬰 ra quy院v"8鵜nh trong y t院
Data Mining : Khai phá d英 li羽u
CNTT : Công Ngh羽 Thông Tin
VJC<"V<pi"Jw{院t áp
RLLP: R嘘i lo衣n lipid
IDF : International Diabetes Federation - Hi羽p h瓜k"8 k"vj q"8逢運ng th院 gi噂i
CDA: Ch院 8瓜 <p
YTNG: Y院u t嘘 piw{"e挨"
BMI: Body Mass Index - Ch雨 s嘘 kh嘘i c栄c"e挨"vj吋
WHO: World Health Organization ÎT鰻 ch泳c y t院 th院 gi噂i
Trang 14FCPJ"O影E"D謂PI
B違ng 4.1: B違ng phân lo衣i th吋 tr衣pi"e挨"vj吋 theo ch雨 s嘘 BMI 35
B違ng 4.2: Phân lo衣i tình tr衣pi"e挨"vj吋 theo ch雨 s嘘 8逢運ng huy院v"8„k" 35
B違ng 4.3: B違ng th嘘ng kê t雨 l羽 % các y院u t嘘 c栄c"pi逢運i b羽pj"AVA"v r"4 42
B違ng 4.4: B違ng th嘘ng kê t雨 l羽 % các thu嘘e"8cpi"f́pi 43
B違ng 4.5: T雨 l羽 s穎 d映ng thu嘘c trong các b羽pj"pj¤p"e„"8逢運ng huy院v"8逢嬰c ki吋m soát t嘘t 44
B違ng 4.6: T雨 l羽 s穎 d映ng thu嘘c trong các b羽pj"pj¤p"e„"8逢運ng huy院t ej逢c"8逢嬰c ki吋m soát t嘘t 44
Trang 15FCPJ"O影E"JîPJ
J·pj"403<"Rj e"8欝 8k隠u tr鵜 m噂i c栄c"KFH"ejq"e e"p逢噂e"ej¤w"è"p<o"4235" 13
Hình 3.1: Mô hình h羽 h厩 tr嬰 ra quy院v"8鵜nh áp d映ng trong bài toán 17
Hình 3.2: Quá trình khai phá d英 li羽u 19
Hình 3.3: Xây d詠ng mô hình phân lo衣i b羽nh nhân n英 AVA 21
J·pj"506<"O»"j·pj"8 pj"ik "d瓜 phân l噂p và dùng b瓜 phân l噂r"8吋 d詠 8q p"d羽nh nhân m噂i 22
Hình 3.5: Mô hình cây quy院v"8鵜nh 24
Hình 3.6: Mô hình bagging s穎 d映ng 3 b瓜 phân lo衣k"e挨"d違n 28
Hình 4.1: Th嘘ng kê s嘘 b羽nh nhân theo tu鰻i 36
Hình 4.2: Th嘘ng kê s嘘 b羽nh nhân theo ch雨 s嘘 BMI 37
Hình 4.3: Th嘘ng kê s嘘 b羽nh nhân theo th運i gian m逸c b羽nh 38
Hình 4.4: Th嘘ng k院 s嘘 b羽nh nhân theo ch雨 s嘘 8逢運ng huy院v"8„k 39
Hình 4.5: Th嘘ng k院 s嘘 b羽nh nhân theo ch雨 s嘘 HbA1c 40
Hình 4.6: Th嘘ng k院 s嘘 b羽nh nhân n英 theo vòng eo 41
Hình 4.7: Th嘘ng k院 s嘘 b羽nh nhân nam theo vòng eo 41
Hình 5.1: Nh壱p d英 li羽u vào ph亥n m隠m Weka 47
Hình 5.2: Xây d詠ng mô hình phân l噂p b茨ng ph亥n m隠m Weka 48
Hình 5.3: Các thông s嘘 c栄a thu壱t toán bagging 49
Hình 5.4: Ki吋o"vtc"8 pj"ik "8瓜 chính xác mô hình 50
Hình 507<"Rj e"8欝 8k隠u tr鵜 AVA"v r"2 theo IDF dùng Metformin 52
J·pj"708<"Rj e"8欝 8k隠u tr鵜 AVA típ 2 theo IDF thêm insulin 53
Hình 5.7: Các thông s嘘 thu壱t toán Apriori trong Weka 55
J·pj"803"U挨"8欝 kh嘘i ch泳e"p<pi."jq衣v"8瓜ng c栄c"ej逢挨pi"vt·pj 61
J·pj"804<"O»k"vt逢運ng phát tri吋n Eclipse v噂k"e e"vj逢"xk羽n liên quan 62
Hình 6.3: Thi院t k院 giao di羽n ph亥n m隠m 64
Hình 6.4: K院t qu違 xây d詠ng ki吋m tra b瓜 phân l噂p 65
Hình 6.5: Ch衣{"ej逢挨pi"vt·pj"ej育p"8q p"d羽nh nhân 66
Hình 6.6: Ki吋m tra d英 li羽u b羽nh nhân 67
Trang 16EJ姶愛PI 1:IK閏K"VJK烏W
Ej逢挨pi 1 gi噂i thi羽u t鰻ng quan v隠 8隠 tài Ej逢挨pi này trình bày các ph亥n chính
sau (1) gi噂i thi羽u v隠 nh英ng v医p"8隠p"nk‒p"swcp"8院n h羽 h厩 tr嬰 quy院v"8鵜nh trong y t院;
(2) n#"fq"j·pj"vj pj"8隠 tài; (3) m映c tiêu và n瓜i dung nghiên c泳u c栄c"8隠 tài; (4) gi噂i
h衣n và ph衣m vi nghiên c泳u; (5) #"pij c"vj詠c ti宇n c栄c"8隠 tài vào tình hình y t院 p逢噂c
ta hi羽n nay; (6) cu嘘i cùng là trình bày b嘘 c映c c栄a lu壱p"x<p
1.1 Ik噂k"vjk羽w"8隠"v k
H羽 h厩 tr嬰 ra quy院v"8鵜nh y t院 (CDSS) là ph亥n m隠o"v逢挨pi"v c h厩 tr嬰 ra quy院t 8鵜pj."8逢嬰c thi院t k院 nh茨o"ik¿r"d e"u "x "e e"ejw{‒p"ikc"{"v院 trong vi羽c quy院v"8鵜nh
th詠c hi羽n các tác v映 {"mjqc"pj逢"8逢c"tc"e e"ej育p"8q p"f詠a trên d英 li羽u b羽nh nhân[1]
Ho衣v"8瓜ng c栄a h羽 h厩 tr嬰 ra quy院v"8鵜nh y t院 *EFUU+"8逢嬰c mô t違 pj逢"ucw< ÐN "
vi羽c k院t n嘘i nh英ng quan sát y t院 và ki院n th泳c y t院 nh茨o"v e"8瓜pi"8院n nh英ng l詠a
ch丑p" 8k隠u tr鵜 c栄c" d e" u " pj茨m nâng cao hi羽u qu違 ej<o" u„e" {" v院Ñ (theo Robert
Hayward - Centre for Health Evidence) [1]
Fq"8„"j羽 h厩 tr嬰 ra quy院v"8鵜nh y t院 (CDSS) là m瓜t ch栄 8隠 chính c栄a ngành trí
tu羽 nhân t衣q"vtqpi"n pj"x詠c y khoa
1.1. 3"でpi"fつpi"jう"jざ"vtぢ"tc"sw{xv"8おpj"vtqpi"n pj"xばe"{"vx
Vtqpi" n pj" x詠c y t院, h羽 h厩 tr嬰 ra quy院v" 8鵜pj" 8«" d逢噂e" 8亥w" 8逢嬰c quan tâm,
nghiên c泳u, 泳ng d映pi"x "vjw"8逢嬰c nh英ng k院t qu違 nh医v"8鵜nh
H羽 h厩 tr嬰 ra quy院v"8鵜pj"8逢嬰e"f́pi"pj逢"o瓜t công c映 v逢"x医p"ejq"d e"u "vtqpi"
Trang 171.1.2 Jkうw"swV"eてc"jう"jざ"vtぢ"tc"sw{xv"8おpj"vtqpi"{"vx
Th嘘pi"m‒"p<o"4227"e栄a nhóm Garg d詠a trên k院t qu違 c栄a 100 nghiên c泳u 泳ng
d映ng h羽 h厩 tr嬰 ra quy院v"8鵜nh cho bi院t có 64 nghiên c泳u cho k院t qu違 e„" ej="8欝ng
th運i ch雨 ra r茨pi"n逢嬰ng d英 li羽w"x "rj逢挨pi"rj r."vjw壱t toán s穎 d映ng trong các 泳ng
d映ng trên có nhi隠u ti院n tri吋n trong su嘘v"ikck"8q衣n 1973-2004 [1]
E pi"vtqpi"p<o"4227."vj嘘pi"m‒"8鵜pj"n逢嬰ng c栄a nhóm Kawamoto cho th医y h羽
h厩 tr嬰 ra quy院v"8鵜nh có hi羽u qu違 8 pi"m吋 trong kho違pi"8:'"e e"ec"8k隠u tr鵜 [1]
T瑛 các th嘘ng kê trên ta rút ra nh壱n xét là vi羽c áp d映ng h羽 h厩 tr嬰 ra quy院v"8鵜nh
trong y t院 8cpi"rj v"vtk吋p"x "e„"8瓜 tin c壱y ngày càng cao
1.1. 5"Oじv"uぐ"mxv"swV"pijk‒p"eとw."とpi"fつpi"vtqpi"x "piq k"p⇔ずe
Kxt quV nghiên cとu trên thx giずi
Vi羽c áp d映ng h羽 h厩 tr嬰 ra quy院v"8鵜nh vào trong y t院 8«"8逢嬰c nhi隠u t鰻 ch泳e"e挨"
s荏 trên th院 gi噂i áp d映ng, có nhi隠u 泳ng d映pi"tc"8運i v噂i m映c tiêu h厩 tr嬰 vi羽e"8k隠u tr鵜
và ch育p"8q p"d羽nh hi羽u qu違 j挨p Qua tìm hi吋u ta th医y có m瓜t s嘘 t鰻 ch泳c n鰻i tr瓜i
sau:
CADUCEUS là h羽 th嘘ng ch育p"8q p"{"v院 xây d詠ng b荏i Harry Pope t瑛 nh英ng p<o"3;92"8院n kho違ng 1985 m噂i hoàn thành, là m瓜t h羽 e挨"u荏 tri th泳c y t院 8欝 s瓜, có
th吋 ch育p"8q p"vt‒p"3222"d羽nh khác nhau [1]
DiagnosisPro là m瓜t h羽 ch育p" 8q p" vt詠c tuy院n v噂k" e挨" u荏 d英 li羽u trên 11000
b羽nh và 15000 tài li羽u mô t違 tri羽u ch泳ng b羽nh, trang web ho衣v"8瓜ng tr詠c tuy院n có
kho違ng 60000 truy c壱p/tháng (s嘘 li羽w"p<o"422:-2009) [1]
Canada Health Infoway là m瓜t t鰻 ch泳c phi l嬰i nhu壱n h厩 tr嬰 chính ph栄, t鰻 ch泳c
p {"8«"8隠 xu医t nh英ng tiêu chu育p"ej<o"u„e"u泳c kh臼e nh医t quán trên kh逸p Canada E挨" u荏 h衣 t亥ng c栄c" Kphqyc{" 8逢嬰c d詠a trên công ngh羽 SOA (Service Oriented
Architecture) và m映c tiêu c栄c"p„"n "8吋 k院t n嘘i m衣pi"n逢噂i h羽 th嘘ng y t院 c医p t雨pj"8吋
t衣o thành m瓜t m衣ng toàn qu嘘e."p挨k"e e"j欝 u挨"{"v院 8k羽n t穎 có th吋 truy c壱p t瑛 e e"8鵜a 8k吋m khác nhau [2]
EGADSS (Evidence-based Guidelines And Decision Support System) là m瓜t 泳ng d映pi"8瓜c l壱p h厩 tr嬰 h丑c viên t衣k"8k吋o"ej<o"u„e"d茨ng cách t詠 8瓜ng t衣o ra c違nh
Trang 18báo và nh逸c nh荏 EGADSS thông qua m瓜t ngôn ng英 mã hóa ki院n th泳c y t院 8吋 xác 8鵜nh logic ra quy院v"8鵜nh [2]
COMPETE (Computerization Of Medical Practices for the Enhancement of Therapeutic Effectiveness) là m瓜t d詠 án d詠 8鵜nh cung c医p vi羽c ra quy院v"8鵜nh d詠a
trên máy tính h厩 tr嬰 e e" e挨" u荏 qu違n lý b羽pj" pj¤p" v<pi" jw{院t áp, ti吋w" 8逢運ng,
cholesterol, ti隠n s穎 b羽nh tim và/ho員e"8瓜t qu液 và b羽nh mãn tính [2]
Malysia: nghiên c泳u vi羽c áp d映ng OLAP và khai phá tri th泳c trong h羽 h厩 tr嬰
ra quy院v"8鵜nh H羽 h厩 tr嬰 quy院v"8鵜pj"tc"8運i v噂i m映e"8 ej"ik違m giá c違 v隠 y t院 và nâng
cao ch医v"n逢嬰ng d鵜ch v映 [2]
Xkうv"Pco
Tình hình s穎 d映ng CNTT vào trong y h丑c 荏 Vi羽v"Pco"e p"v逢挨pi"8嘘i ít, qua
quá trình tìm ki院m ta th医y có nh英ng gi違i pháp ucw"8¤{<"
Gi違i pháp b羽nh vi羽n thông minh: Gi違i pháp g欝m 8 nhóm s違n ph育m: (1) ph亥n
m隠m qu違n lý b羽nh vi羽n HIS, LIS, PACS (2) Th飲 b羽nh nhân thông minh (3) Màn
hình LCD (4) H瓜i ch育n t瑛 zc"*7+"Vcdngv"ejq"d e"u "*8+"Vcdngv"ik逢運ng b羽nh (7) H羽
th嘘ng g丑i y tá (8) Bãi gi英 xe thông minh [3] Gi違i pháp b羽nh vi羽n thông minh này 8«"8逢嬰c tri宇n khai t衣i m瓜t s嘘 b羽nh vi羽n 荏 p逢噂c ta: b羽nh vi羽p"8c"mjqc"v雨nh Qu違ng Pkpj."8c"mjqc"v雨nh Phú Th丑, 8c"mjqc"VY"Vj k"Piw{‒pÈ0Tuy nhiên mô hình b羽nh
vi羽p"p {"ej逢c" r"f映ng h羽 h厩 tr嬰 ra quy院v"8鵜nh vào vi羽c h厩 tr嬰 d e"u "vtqpi"sw "vt·pj"
ch育p"8q p"x "8k隠u tr鵜 b羽nh
Nghiên c泳u khác là xây d詠ng h羽 h厩 tr嬰 ra quy院v"8鵜nh v隠 quá trình ch育p"8q p"
b羽nh qua s嘘 li羽u siêu âm tim m衣ch ÐQuá trình xây d詠ng h羽 h厩 tr嬰 ra quy院v"8鵜nh này 8逢嬰c th詠c hi羽n d詠a trên s詠 k院t h嬰p gi英c"e挨"u荏 lý thuy院t t壱p m運, 8衣i s嘘 gia t穎 và rj逢挨pi"rj r"uw{"fk宇n m運 8吋 ti院n hành Vi羽c xây d詠ng 泳ng d映pi"8逢嬰c th詠c nghi羽m
trên d英 li羽u m磯u t衣i Vi羽n Tim m衣ch Tp HCM, k院t qu違 d逢噂e"8亥w"8«"vj穎 nghi羽m trên
3000 m磯u d英 li羽u v隠 tri羽u ch泳ng suy tim c栄a b羽pj"pj¤p"x "ej逢挨pi"vt·pj"8逢c"tc"m院t
qu違 ch育p"8q p"x噂k"8瓜 chính xác trên 80% so v噂i k院t qu違 ch育p"8q p"vj詠c t院Ñ [4]
Nghiên c泳w"vt‒p"8«"泳ng d映ng h羽 h厩 tr嬰 ra quy院v"8鵜nh vào trong ch育p"8q p"d羽nh suy
tim
Trang 191.2 E挨"u荏"j·pj"vj pj"8隠"v k
1.2. 3"Vjばe"vtTpi"dうpj"8 k"vj q"8⇔ぜpi"ぞ"p⇔ずc ta
雲 Vi羽t Nam hi羽n nay, b羽pj"8 k"vj q"8逢運pi"8cpi"e„"ejk隠w"j逢噂pi"ikc"v<pi T益
l羽 pi逢運i b鵜 m逸c b羽pj"8 k"vj q"8逢運ng trên toàn qu嘘c là 2,7%, 荏 khu v詠c thành ph嘘
là 4,4%, 荏 mi隠n núi và trung du là 2,1% và 荏 8欝ng b茨ng là 2,7% Các con s嘘 này 8逢嬰c 8逢c"tc"v衣i H瓜i ngh鵜 vj逢嬰pi"8雨nh Qu悦 8 k"vj q"8逢運ng th院 gi噂i khai m衣c ngày
(21/2/2012) t衣i Hà N瓜i
Hi羽n Vi羽t Nam n茨m trong nhóm 10 qu嘘c gia có t益 l羽 m逸c b羽nh này cao nh医t
th院 gi噂k<"ikc"v<pi"433'"vtqpi"x pi"32"p<o"(2002-2012) T衣i Tp JEO."vjgq"8k隠w"vtc"f鵜ej"v宇"j丑e"fq"Vtwpi"v¤o"Fkpj"f逢叡ng Tp JEO"vk院p"j pj"p<o"4234"vt‒p"pj英ng pi逢運k"vt逢荏pi"vj pj"v瑛"52-8;"vw鰻k"vj·"v雨 l羽 8 k"vj q"8逢運pi"n "33.6'."v<pi"522'"uq"
v噂k"p<o"4224"n "3.8%
Nguyên nhân chính khi院n b羽pj"8 k"vj q"8逢運pi"ikc"v<pi"n "fq"pj壱n th泳c c瓜ng 8欝ng v隠 phòng b羽nh th医p, t益 l羽 b羽pj"mj»pi"8逢嬰c phát hi羽n cao, cán b瓜 x "e挨"u荏 v壱t
ch医v"8吋 theo dõi và 8k隠u tr鵜 còn r医t h衣n ch院
Ngoài ra sw "vt·pj"8»"vj鵜 hóa và s詠 phát tri吋n kinh t院 n o"vjc{"8鰻i l嘘i s嘘ng
theo chi隠w"j逢噂ng không có l嬰i cho s泳c kh臼e: s嘘pi"v pj"v衣i, ít v壱p"8瓜pi."<p"pjk隠u
th泳e"<p"pjcpj."ej<o"u„e"vt飲 em và ph映 n英 e„"vjck"vj k"sw È"n "pj英ng nguyên nhân
d磯p"8院p"8 k"vj q"8逢運pi"ikc"v<pi"pjcpj"荏 Vi羽t Nam
Theo T鰻 ch泳c Y t院 th院 gi噂k."8 k"vj q"8逢運ng là m瓜v"vtqpi"5"e<p"d羽nh có t嘘e"8瓜
phát tri吋n nhanh nh医v"x "8cpi"n "o瓜t trong nh英ng nguyên nhân gây t穎 vong hàng 8亥u 荏 e e"p逢噂c phát tri吋n [5]
Chính vì vfy, viうe"rj pi"x "8kzu trお bうpj"8 k"vj q"8⇔ぜpi"8cpi"n "oじt mぐi
quan tâm cてa rXt nhizw"ikc"8·pj"x "vq p"z«"jじi
1.2.2 Oじv"uぐ"xXp"8z"8cpi"vげp"vTk"vtqpi"e e"e¬"uぞ"{"vx"ぞ"p⇔ずe"vc
Th詠c tr衣ng 荏 p逢噂c ta hi羽n nay là các b羽nh vi羽n l噂n quá t違i b羽nh nhân trong khi
các b羽nh vi羽n 荏 tuy院n t雨nh thì ít b羽nh nhân Nguyên nhân chính c栄a tình tr衣ng này
là b羽nh vi羽n l噂n có nhi隠w"d e"u "ik臼i và nhi隠u kinh nghi羽o"j挨p
J挨p" vj院 n英a, m»k" vt逢運ng xã h瓜k" nw»p" vjc{" 8鰻k" 8 k" j臼i ki院n th泳c y h丑c ph違i 8逢嬰c c壱p nh壱t d詠a trên th詠c nghi羽m Th院 pj逢pi"e e"e挨"u荏 y t院 8員c bi羽c là 荏 c医p
Trang 20rj逢運ng xã, tình hình c壱p nh壱t ki院n th泳e"{"mjqc"ej逢c"8逢嬰c chú tr丑ng."8„"ej pj"n "
m瓜t trong nh英pi"piw{‒p"pj¤p"e挨"d違n d磯p"8院n vi羽c phân b嘘 b羽pj"pj¤p"mj»pi"8欝ng 8k隠u t衣k"e e"e挨"u荏 y t院
1.2. 5"V·pj"j·pj"とpi"fつpi"EPVV"x q"{"vx"
Vi羽c 泳ng d映ng CNTT vào ho衣v"8瓜ng c栄a ngành y t院 là m瓜t trong nh英ng yêu c亥u
c医p thi院t hi羽n nay Vt逢噂c m逸v."8„"n "pjw"e亥u r医t l噂n trong vi羽c xây d詠ng h羽 th嘘ng d英
li羽u qu嘘c gia v隠 y t院 b荏i hi羽n nay VN m噂i ch雨 có các s嘘 li羽u th嘘pi"m‒"vtqpi"e e"n ph
v詠c riêng l飲 pj逢"{"v院 d詠 rj pi."JKX1CKFUÈ"o "ej逢c"e„"o瓜v"e挨"u荏 d英 li羽u mang
tính h羽 th嘘ng, t鰻ng th吋 c栄a ngành y t院 V噂i hàng tri羽w"n逢嬰t khám ch英a b羽nh và ch育n 8q p"j·pj 違nh m厩k"p<o."pi pj"{"v院 8cpi"t医t c亥n xây d詠ng m瓜t h羽 th嘘pi"n逢w"vt英 d英
li羽u b羽nh án, tài chính, thu嘘c, xét nghi羽oÈ"]6]
Pj逢"x壱y vi羽c 泳ng d映ng CNNT vào trong y t院 荏 p逢噂e"vc"8«"8cpi"8逢嬰c quan tâm
và t瑛pi"d逢噂c ti院n tri吋n
Ngành y t院 8cpi"8亥w"v逢"rj v"vtk吋n kho d英 li羽u theo chu育n chung cho các t鰻 ch泳c e挨"u荏 khám b羽nh ch泳a thông tin v隠 h欝 u挨"e栄a b羽nh nhân [6] Tuy nhiên vi羽c 泳ng
d映ng DSS vào trong công tác qu違n lý, khám và ch英a b羽nh v磯p"ej逢c"8逢嬰c quan tâm pj逢"pjk隠u t鰻 ch泳c y t院 khác trên th院 gi噂i V噂i mong mu嘘n nâng cao ch医v"n逢嬰ng d鵜ch
v映 y t院, nâng cao công tác qu違n lý b羽nh nhân và s穎 d映ng kho d英 li羽w"8«"x "8cpi"8逢嬰c thi院t l壱p, lu壱p"x<p"oqpi"ow嘘n áp d映ng CNTT 荏 8¤{"n "mjck"rj "vtk"vj泳c và h羽
h厩 tr嬰 ra quy院v"8鵜nh vào trong n隠n y t院 荏 p逢噂c ta
V噂i nh英ng nguyên nhân trên lu壱p"x<p< Ð永ng d映ng khai phá d英 li羽u và h羽 h厩 tr嬰
ra quy院v"8鵜nh trong qu違n lý x "8k隠u tr鵜 b羽pj"8 k"vj q"8逢運ng típ 2Ñ"tc"8運i
1.3 O映e"vk‒w"x "p瓜k"fwpi"8隠"v k
M映c tiêu và n瓜i dung c栄c"8隠 tài g欝m 4 ph亥p"ej pj"ucw"8¤{<
1/ Thu nh壱p d英 li羽u y t院 8«"e„."f英 li羽w"p {"8逢嬰c thu nh壱r"ejq"8隠 v k"ÐKh違o sát 8鵜pj"n逢嬰pi"JdC3e"8吋 theo dõi ki吋m uq v"8逢運ng huy院t b羽pj"8 k"vj q"8逢運ng típ 2Ñ"
do hi羽p h瓜k"8 k"vj q"8逢運ng tp H欝 Chí Minh tri吋n khai và nghiên c泳u Ucw"8„"vc"vk院n
hành ti隠n x穎 lý d英 li羽u vt逢噂c khi s穎 d映ng thu壱t toán data mining 8吋 xây d詠ng mô
hình phân l噂p
Trang 212/ Ti院p theo 8隠 tài s穎 d映ng thu壱t toán data okpkpi"8吋 phân l噂p b羽nh nhân AVA"
thành 2 l噂p: l噂p b羽nh nhân có 8逢運ng huy院v"8逢嬰c ki吋m soát t嘘t, l噂p b羽nh nhân có 8逢運ng huy院t ej逢c"8逢嬰c ki吋m soát t嘘t v噂k"e挨"ej院 8k隠u tr鵜 hi羽n t衣i A„"ej pj"n thành
ph亥n chính c栄a h羽 h厩 tr嬰 ra quy院v"8鵜nh giúp cho d e"u có th吋 8k隠u ch雨nh cách th泳c
ch英a b羽nh phù h嬰p v噂i t瑛ng lo衣i b羽pj"pj¤p"j挨p
3/ Ngoài ra, 8隠 tài còn tìm ra m嘘i liên h羽 gi英a các thu瓜c tính trong d英 li羽u c栄a
b羽pj"pj¤p"8 k"vj q"8逢運ng, giúp d e"u "ej育p"8q p"d羽nh t嘘v"j挨p
4/ Cu嘘k" épi"8隠 v k"8隠 xu医t và xây d詠ng ch泳e"p<pi"sw違n lý b茨ng cách xây
d詠ng h羽 th嘘ng c違nh báo/nh逸c nh荏 cho b羽nh nhân và th亥y thu嘘e"pj逢"ucw<
+ A嘘i v噂i b羽nh nhân: h羽 th嘘ng nh逸c nh荏 ch雨 áp d映pi"8嘘i v噂k"8嘘k"v逢嬰ng b羽nh
nhân ch丑p"8<pi"m#"x q"j羽 th嘘ng, vi羽c tri吋n khai th詠c t院 thì có các l詠a ch丑n cho
phép b羽nh nhân l詠a ch丑n ch泳e"p<pi"p {"x "e„"vjw"rj "pj医t 8鵜nh
+ A嘘i v噂i th亥y thu嘘c: theo dõi quá trình b羽nh c栄a b羽nh nhân và có trách nhi羽m
nh逸c nh荏 b羽nh nhân ngày gi運 khám b羽pj"8鵜nh k , n院u tình tr衣ng c栄a b羽nh nhân 荏
m泳e"d q"8瓜ng thì ph違k"8k隠u ch雨nh ngày tái khám h嬰p lý
1.4 ""pij c"8隠"v k
A隠 tài phân lo衣i b羽nh nhân thành 2 l噂p: l噂p b羽pj"pj¤p"e„"8逢運ng huy院v"8逢嬰c
ki吋m soát t嘘t, l噂p b羽nh nhân e„"8逢運ng huy院t ej逢c"8逢嬰c ki吋m soát t嘘t v噂k"e挨"ej院 8k隠u tr鵜 hi羽n t衣i C挨"u荏 8„"ik¿r"e e"d e"u "8k隠u ch雨nh e ej"8k隠u tr鵜 cho h嬰r"n#"j挨p Piq k"tc."8隠 tài e pi"ej雨 tc"8逢嬰c m嘘i liên h羽 gi英a các thu瓜e"v pj<"8瓜 tu鰻i, BMI,
vòng eo, gi噂i tính, ch院 8瓜 <p."v壱p th吋 d映e."È c栄a b羽nh nhân AVA"típ 2.T瑛 8„"e„"
nh英ng ch育p"8q p"v嘘v"j挨p"ejq"d羽nh nhân: ví d映 b羽nh nhân AVA típ 2 b鵜 béo b映ng
thì s胤 b鵜 r嘘i lo衣n lipid t瑛 8„"mjw{院p"e q"d e"u "p‒p"n o"pj英ng xét nghi羽m liên quan 8院n RLLP
J挨p"vj院 n英c."8隠 v k"e pi"oqpi"ow嘘n xây d詠ng h羽 h厩 tr嬰 v噂i m映e"8 ej"giúp
d e"u "vw{院p"f逢噂i tham kh違q"e ej"8k隠u tr鵜 b羽nh 荏 các b羽nh vi羽n l噂p"8吋 c壱p nh壱t tình
hình ch英a tr鵜, tình hình thu嘘c men và nh英ng l運i khuyên h嬰p lý cho b羽nh nhân
Trang 22Cu嘘k"épi."8隠 tài góp ph亥n trong vi羽c 泳ng d映ng CNTT mà 荏 8¤{"n "mjck"rj "
d英 li羽u, h羽 h厩 tr嬰 quy院v"8鵜nh vào trong y t院, nh茨m nâng cao ch医v"n逢嬰ng và d鵜ch v映 y
t院 荏 p逢噂c ta
1.5 Rj衣o"xk x "ik噂k"j衣p"8隠"v k
A嘘k"v逢嬰ng nghiên c泳u là b羽pj"pj¤p"8 k"vj q"8逢運ng típ 4"8cpi"mj o"x "8k隠u tr鵜
b羽nh t衣i m瓜t s嘘 e挨"u荏 y t院: b羽nh vi羽p"Ac"mjqc"A欝ng Nai, b羽nh vi羽n Nguy宇n Tri Rj逢挨pi."d羽nh vi羽n C亥p"Vj挨"x "d羽nh vi羽n Ch嬰 R磯yÈ
Quá trình l医y m磯u b羽pj"pj¤p"8逢嬰c th詠c hi羽n b荏i hi羽p h瓜k"8 k"vj q"8逢運ng Tp
H欝 Chí v噂k"8隠 tài ÐMj違q"u v"8鵜pj"n逢嬰ng HbC3e"8吋 theo dõi ki吋o"uq v"8逢運ng huy院t
b羽pj"8 k"vj q"8逢運ng tír"4Ñ Sau khi kh違o sát các y院u t嘘 l鵜ch s穎, l医y máu, m磯u máu 8逢嬰e"8逢c"swc"vtwpi"v¤o"{"mjqc"ogfkc Hòa H違q"8吋 xét nghi羽m
A隠 tài ch雨 kh違o sát các thu瓜e"v pj"8«"8逢嬰c l医y trong m磯w<"p<o"ukpj, gi噂i tính,
BMI, vòng eo, ch雨 s嘘 HbA1c, ch雨 s嘘 8逢運ng huy院v"8„k, các lo衣i thu嘘e"8cpi"f́pi."
ch院 8瓜 <p."ej院 8瓜 t壱p luy羽n, u嘘pi"t逢嬰u, hút thu嘘c lá, THA, RLLP
1.6 D嘘"e映e"nw壱p"x<p
Lu壱p"x<p"8逢嬰c th詠c hi羽n g欝m các 7 ej逢挨pi"ucw
Ej逢挨pi"3: Gi噂i thi羽u t鰻ng quan - Gi噂i thi羽u v隠 nh英ng v医p"8隠p"nk‒p"swcp"8院n
h羽 h厩 tr嬰 quy院v"8鵜nh trong y t院."e挨"u荏 j·pj"vj pj"8隠 tài, m映c tiêu nghiên c泳u c栄c"8隠
tài, ph衣m vi và gi噂i h衣n nghiên c泳w."#"pij c"vj詠c ti宇n và b嘘 c映c c栄a lu壱p"x<p
Ej逢挨pi"4: Ki院n th泳e"e挨"d違n v隠 b羽pj"8 k"vj q"8逢運ng típ 2 - Gi噂i thi羽u t鰻ng
quan v隠 8 k"vj q"8逢運ng típ 2 x "#"pij c"e栄a các thu瓜c tính liên quan
Ej逢挨pi" 5< E挨" u荏 lý thuy院t - Tt·pj" d {" e挨" u荏 toán h丑c và vi羽c áp d映ng lý
thuy院t này vào bài toán
Ej逢挨pi"6< Quá trình thu nh壱p và ti隠n x穎 lý d英 li羽u - Trình bày cách thu nh壱p
d英 li羽u, e e"d逢噂c ti院n hành x穎 lý d英 li羽u, phân tích th嘘ng kê các thu瓜c tính c栄a
b羽nh nhân
Ej逢挨pi"7< Xây d詠ng mô hình - Trình bày cách áp d映ng Weka vào vi羽c xây
d詠pi"o»"j·pj."#"pij c"vj詠c ti宇n t瑛 mô hình xây d詠pi"8逢嬰c
Trang 23Ej逢挨pi"8< Xây d詠pi"ej逢挨pi"vt·pj"rj¤p"nq衣i và qu違n lý b羽nh nhân Î Ej逢挨pi"
trình th詠c hi羽n vi羽c nh壱p thông tin b羽nh nhân và xu医t ra k院t qu違 ch育p"8q p"f詠a trên
mô hình DSS xây d詠ng 荏 ej逢挨pi"6."ej逢挨pi"5.K院t qu違 ch育p"8q p và d英 li羽u b羽nh pj¤p"8逢嬰e"n逢w"vt英 nh茨m th詠c hi羽n ch泳e"p<pi"sw違n lý (lên l鵜ch tái khám, ki吋m tra
l鵜ch s穎 8k隠u tr鵜) Ngoài ra, nh英ng k院t qu違 ch医p"8q p"v嘘t có th吋 8逢嬰c s穎 d映pi"8吋 c壱p
nh壱t l衣i mô hình DSS
C j逢挨pi"9< A pj"ik "m院v"sw違"pijk‒p"e泳w: nh壱p"8鵜nh k院t qu違 nghiên c泳u, nêu
nh英ng h衣n ch院 x "8隠 xu医v"j逢噂ng nghiên c泳u ti院p theo
309"V鰻pi"m院v
Tóm l衣i, ej逢挨pi"3"8«"ik噂i thi羽u t欝ng quan v吋 8隠 tài, gi噂i thi羽u v隠 tình hình s穎
d映ng h羽 h厩 tr嬰 ra quy院v"8鵜nh trong y t院 (CDSS), n瓜i dung m映e"vk‒w"x "#"pij c"e栄a 8隠 tài A欝ng th運i ej逢挨pi"p { e pi"8逢c"tc"e挨"u荏 áp d映ng h羽 h厩 tr嬰 (DSS) vào trong
b羽pj"AVA"v r"2 Ti院r"vjgq"ej逢挨pi"4"u胤 trình bày t欝ng quan v隠 b羽pj"AVA"v r"2
Trang 24EJ姶愛PI"4<"
MK蔭P"VJ永E"E愛"D謂P"X陰"D烏PJ"AèK"VJèQ"A姶云PI"VëR"4
Ej逢挨pi"4"vt·pj"d {"v鰻ng quan ki院n th泳c b羽pj"8 k"vj q"8逢運ng típ 2.N瓜i dung
c栄c"ej逢挨pi"pc{"i欝m 6 ph亥n sau: *3+"8鵜pj"pij c"d羽pj"AVA"v r 2; (2) bi院n ch泳ng
b羽nh AVA";(3) các y院u t嘘 nk‒p"swcp"8院n b羽pj"AVA; (4) gi噂i thi羽u v隠 HbA1c; (5)
gi噂i thi羽u v隠 8逢運ng huy院v"8„k; *8+"rj e"8欝 8k隠u tr鵜 b羽pj"AVA"ejq"d羽nh nhân châu Á
(2013) theo tiêu chu育n IDF
2 3"A k"vj q"8逢運pi"típ 2
2.1.1 Aおpj"pij c
B羽pj"AVA"v r"4"z違y ra do tình tr衣ng r嘘i lo衣n chuy吋n hóa cacbonhidrat ch栄 y院u
do s詠 thi院u insulin ho員c tình tr衣pi"8隠 kháng insulin Tình tr衣pi"8隠 kháng insulin gia v<pi"荏 pi逢運k"dfiq"rj·."v<pi"jw{院t áp, r嘘i lo衣p"nkrkf"o wÈ
2.1.2 E e"{xw"vぐ"piw{"e¬"ejq"uば"rj v"vtkあp"dうpj"AVA
Sau khi t鰻ng h嬰p các bài báo v隠 b羽pj"AVA"vc"e„"e e"piw{"e挨"ucw [7], [27]:
+ Có ti隠p"e<p"vt詠c h羽 g亥n trong ikc"8·pj"e„" pi逢運i m逸c b羽pj"AVA"*ejc"o姻
+ A«"8逢嬰c ch育p"8q p"t嘘i lo衣p"AJ"8„k"jq員c r嘘i lo衣n dung n衣p glucose
+ A«"8逢嬰c ch育p"8q p"AVA"vjck"m ho員c sinh con > 4kg
+ HbA1c > 5,7 %
+ N英 có h瓜i ch泳ng bu欝ng tr泳pi"8c"pcpi
Trang 25+ Tu鰻i: theo khuy院n cáo c栄c"YJQ"e e"8嘘k"v逢嬰ng trên 45 tu鰻i nên t亥m soát AVA."d荏i vì b羽pj"AVA"ikc"v<pi"vjgq"vw鰻i, tuy nhiên c亥n nh噂 b羽nh có th吋 x違y
ra 荏 b医t c泳 8瓜 tu鰻i nào, n院u càng có nhi隠u y院u t嘘 piw{"e挨"vj·"p‒p"v亥m soát s噂m j挨p"8吋 tránh b臼 sót b羽nh
2 4"Dk院p"ej泳pi"d羽pj"8 k"vj q"8逢運pi
A k"vj q"8逢運ng n院w"mj»pi"8逢嬰c phát hi羽n s噂o"x "8k隠u tr鵜 k鵜p th運i b羽nh s胤 ti院n
tri吋n nhanh chóng và xu医t hi羽n các bi院n ch泳ng c医p và m衣n tính B羽nh nhân có th吋 t穎
vong do các bi院n ch泳ng này
Bi院n ch泳ng c医r"v pj"vj逢運ng là h壱u qu違 c栄a ch育p"8q p"ow瓜n, nhi宇m khu育n c医p
tính ho員e"8k隠u tr鵜 không thích h嬰p Ngay c違 mjk"8k隠u tr鵜 8¿pi."j»p"o‒"pjk宇m toan egvqp"x "j»p"o‒"v<pi" r"n詠c th育m th医u v磯n có th吋 là hai bi院n ch泳ng nguy hi吋m [7],
[27]
Bixn chとng tim - mTch
B羽nh lý tim m衣ch 荏 b羽pj"pj¤p"8 k" vj q"8逢運ng là bi院n ch泳pi" vj逢運ng g員p và
nguy hi吋m M員c dù có nhi隠u y院u t嘘 tham gia gây b羽nh m衣ej" x pj." pj逢pi" e e
nghiên c泳u cho th医y n欝ng 8瓜 glucose máu cao làm v<pi nguy e挨 m逸c b羽nh m衣ch
vành và các bi院n ch泳ng tim m衣ch khác Pi逢運k"8 k"vj q"8逢運ng có b羽nh tim m衣ch là 67'."piw{"e挨"o逸c b羽nh tim m衣ch g医p 2 - 4 l亥n so v噂k"pi逢運k"d·pj"vj逢運ng Nguyên
nhân t穎 vong do b羽nh tim m衣ch chung chi院m kho違ng 75% t穎 vong 荏 pi逢運i b羽pj"8 k"
tj q"8逢運pi."vtqpi"8„"vjk院w"o w"e挨"vko"x "pj欝k"o w"e挨"vko"n "piw{‒p"pj¤p"i¤{"v穎
vong l噂n nh医t [7], [27]
V<pi"jw{院v" r"vj逢運ng g員p 荏 b羽pj"pj¤p"8 k"vj q"8逢運ng, t益 l羽 m逸c b羽nh chung
c栄c"v<pi"jw{院t áp 荏 b羽pj"pj¤p"8 k"vj q"8逢運ng g医r"8»k"uq"x噂k"pi逢運k"d·pj"vj逢運ng Vtqpi"8 k"vj q"8逢運pi"v r"4."72'"8 k"vj q"8逢運ng m噂k"8逢嬰c ch育p"8q p"e„"v<pi"jw{院t
áp V<pi" jw{院t áp 荏 pi逢運k" 8 k" vj q" 8逢運ng tír" 4" vj逢運ng kèm theo các r嘘i lo衣n
chuy吋p"jq "x "v<pi"nkrkf"o w"[7], [27]
Trang 26Ngoài ra, t益 l羽 bi院n ch泳ng m衣ch máu não 荏 b羽pj"pj¤p"8 k"vj q"8逢運ng g医p 1,5 -
2 l亥n."xk‒o"8瓜ng m衣ej"ejk"f逢噂i g医p 5 - 10 l亥n so v噂k"pi逢運k"d·pj"vj逢運ng [7]
雲 Vi羽t Nam, theo nghiên c泳u c栄a T衣 X<p"D·pj."mjq違ng 80% b羽nh nhân
8 k"vj q"8逢運ng m逸c thêm các b羽pj"nk‒p"swcp"8院n tim m衣ch [27]
Bixn chとng thfn
Bi院n ch泳ng th壱p"fq"8 k"vj q"8逢運ng là m瓜t trong nh英ng bi院n ch泳pi"vj逢運ng g員p,
t益 l羽 bi院n ch泳pi"v<pi"vjgq"vj運i gian B羽nh th壱p"fq"8 k"vj q"8逢運ng kh荏i phát b茨ng
protein ni羽w="ucw"8„"mjk"ej泳e"p<pi"vj壱n gi違m xu嘘ng, ure và creatinin s胤 tích t映 trong
Thu嘘e"n "x "dkc"t逢嬰u là nh英ng ch医t gây h衣k"ejq"e挨"vj吋, làm n員ng thêm các r嘘i
lo衣n chuy吋n hoá M瓜t s嘘 nghiên c泳u 荏 châu Âu cho th医y t益 l羽 hút thu嘘c lá 荏 b羽nh pj¤p" 8 k" vj q" 8逢運ng khá cao, có nhi隠u vùng trên 50% [8] Vt逢運ng 8衣i h丑c Ncwucppg"*Cpj+"8«"vk院n hành 25 cu瓜c nghiên c泳u trên 1,2 tri羽u b羽nh nhân và nh壱n
th医y nh英pi"pi逢運i hút thu嘘e"e„"66'"piw{"e挨"o逸c b羽pj"8 k"vj q"8逢運ng típ 2 Nh英ng pi逢運i hút thu嘘e"e„"zw"j逢噂ng hình thành nh英ng thói quen không có l嬰i khác, ch鰯ng
h衣p"pj逢"mj»pi"v壱p th吋 d映c th吋 thao ho員e"<p"pj英ng th詠c ph育m không có l嬰i cho s泳c
kh臼e
2.3.2 Béo phì
ÐDfiq"rj·"n "vt衣ng thái th瑛a m叡 c栄c"e挨"vj吋Ñ"]9] Theo các chuyên gia c栄a WHO,
béo phì là y院u t嘘 piw{"e挨"o衣nh m胤 nh医v"v e"8瓜ng lên kh違 p<pi"o逸e"8 k"vj q"8逢運ng
típ 2
Trang 272.3. 5"Aおc"f⇔
Các nghiên c泳u t益 l羽 m逸e"8 k"vj q 8逢運pi"8隠u cho th医y l嘘i s嘘ng công nghi羽p
hi羽p"8衣i 違pj"j逢荏ng r医t l噂p"8院n kh違 p<pi"o逸c b羽pj"8 k"vj q"8逢運ng
T益 l羽 m逸c 8 k"vj q"8逢運pi"v<pi"g医p 2 - 3 l亥n 荏 nh英ng pi逢運i n瓜i thành so v噂i
nh英ng pi逢運i s嘘ng 荏 ngo衣i thành theo các công b嘘 nghiên c泳u d鵜ch t宇 荏 Tunisia,
Úc
M瓜t s嘘 nghiên c泳u c栄a Vi羽v"Pco"e pi"ejq"m院t qu違 v逢挨pi"v詠 Nghiên c泳u c栄a
Nguy宇n Jw{"E逢運ng t衣i Hà N瓜i cho th医y t益 l羽 m逸c 8 k vj q"8逢運ng 荏 n瓜i thành là
1,4%, ngo衣i thành là 0,6%
2.3. 6"Ikずk"v nh
Nghiên c泳u v隠 tình hình 8 k tháo 8逢運ng và y院u t嘘 nguy e挨 8逢嬰c ti院n hành trên
c違 p逢噂c p<o"4224"- 2003 cho th医y không có s詠 khác bi羽t v隠 t益 l羽 m逸c b羽nh theo
gi噂i
2.4 HbA1c
2.4.1 Aおpj"pij c
Hemoglobin (Hb) là m瓜t trong nh英ng thành ph亥n c医u t衣o nên t院 bào h欝ng c亥u
c栄a máu, có vai trò v壱n chuy吋n oxy trong máu D·pj"vj逢運ng luôn luôn có s詠 g逸n
k院t c栄c"8逢運ng trong máu v噂i Hb c栄a h欝ng c亥u HbA1c chi院m ph亥n l噂n 荏 pi逢運i
l噂p."p„"8衣i di羽n cho tình tr衣ng g逸n k院t c栄c"8逢運ng trên Hb h欝ng c亥u
S詠 hình thành HbA1c x違y ra ch壱m 0 05% trong ngày, và t欝n t衣i su嘘v"vtqpi"8運i
s嘘ng h欝ng c亥w"342"pi {"*5"vj pi+."vjc{"8鰻i s噂m nh医t trong vòng 4 tu亥n l宇
2.4.2 ""pij c"JdC3e"vtqpi"ejbp"8q p"dうpj"AVA"v r"4
Xét nghi羽m HbA1c cho bi院t m泳e" 8逢運ng huy院t trung bình c栄a b衣n trong 2-3
tháng v瑛a qua A¤{"n "zfiv"pijk羽m t嘘t nh医v"8吋 theo dõi s詠 ki吋o"uq v"8逢運ng huy院t,
giúp b衣p"x "d e"u "8k隠u tr鵜 8 pj"ik "8逢嬰e"8逢運ng huy院t có ki吋m soát t嘘t hay không
trong th運i gian v瑛a qua [7], [27]
2.5 Mj k"pk羽o"8逢運pi"jw{院v"8„k
N "8逢運ng huy院v"8q"8逢嬰c khi b羽nh nhân nh鵜p"<p"swc"8‒o"*@?":"vk院ng)
Trang 28Ch院 8瓜 t壱p luy羽p"x "<p"w嘘ng v隠 e挨"d違n là gi嘘ng nhau cho m丑i b羽nh nhân, tuy nhiên
e pi"rj違i tùy thu瓜e"x q"vj„k"swgp"<p"w嘘ng, l嘘i s嘘pi"e pi"pj逢"d羽pj"n#"8k"mflo"o "pi逢運k"d e"u "u胤 có nh英pi"8k隠u ch雨nh c映 th吋 8吋 phù h嬰p v噂i b羽nh nhân c栄a mình
V噂i b羽nh nhân m噂k"8逢嬰c ch育p"8q p"AVA, m泳e"8逢運ng huy院t không quá cao
HbA1c < 8% thì có th吋 xem xét 8挨p"vt鵜 li羽u N院u quy院v"8鵜nh ch雨 s穎 d映ng m瓜t lo衣i
thu嘘c thì có th吋 xem metformin là l詠a ch丑p"8逢嬰e"逢w"vk‒p"j pi 8亥u hi羽n nay Khi
Trang 29b羽nh nhân có ch嘘ng ch雨 8鵜nh ho員c b鵜 tác d映ng ph映 c栄a metformin thì có nh英ng l詠a
ch丑n thích h嬰r"8吋 thay th院 là sulfonylurea ho員c 泳c ch院 glucosidase
Sau th運i gian theo dõi kho違ng 3-8"vj pi"8逢運ng huy院t v磯p"mj»pi"e„"8衣t m映c vk‒w"f́"8«"e„"ej院 8瓜 <p"w嘘ng và t壱p luy羽p"8¿pi"8逸n thì lúc này xem xét vi羽c k院t h嬰p
thu嘘c Vtqpi"vt逢運ng h嬰p này thì sulfonylurea là l詠a ch丑p"j pi"8亥w"8吋 k院t h嬰p cùng
v噂i metformin 荏 hàng th泳 hai, ngoài còn có th吋 k院t h嬰p thiazodione ho員c DPPIV
hay 泳c ch院 glucosidase v噂k"ogvhqtokp."8k隠u này là tùy thu瓜e"x q"e挨"ej院 tác d映ng,
các tác d映ng ph映."8瓜 m衣nh y院u v隠 m泳c gi違o"8逢運ng huy院t và tùy b羽nh nhân c映 th吋
o "d e"u "u胤 có nh英ng quy院v"8鵜nh c映 th吋
Khi metformin không ph違i là thu嘘e"8逢嬰c l詠a ch丑n 荏 hàng th泳 nh医t thì có th吋
xem xét vi羽c k院t h嬰p thêm metformin 荏 hàng th泳 hai này Khi 8«"rj嘘i h嬰p hai lo衣i
thu嘘c mà v磯p"mj»pi"8衣v"8逢嬰c m映e"vk‒w"8逢運ng huy院v"8隠 ra thì s胤 ph違i qua hàng th泳
ba Vtqpi"vt逢運ng h嬰p này thì ph違i s穎 d映pi"8欝ng th運i ba lo衣i thu嘘c ho員c k院t h嬰p v噂i
Và cu嘘i cùng v磯n không ki吋o"uq v"8逢嬰e"8逢運ng huy院v"pj逢"oqpi"ow嘘n thì ph違i
s穎 d映ng insulin v噂k"rj e"8欝 basal bolus ho員c insulin tr瓜n s印n 2 ho員e"dc"o k"o瓜t
ngày Mjk"8«"u穎 d映ng 荏 rj e"8欝 p {"vj·"vj逢運ng ph違k"pi逢pi"e e"thu嘘e"e„"e挨"ej院 kích
thích ti院t insulin pj逢"sulfonuylurea vì v<pi"piw{"e挨"j衣 8逢運ng huy院t cho b羽nh nhân
Trang 30EJ姶愛PI"5<"E愛"U愛"N""VJW[蔭V"
Ej逢挨pi 3 trình bày c挨"u荏 toán h丑c và vi羽c áp d映ng lý thuy院t này vào bài toán Ej逢挨pi"p {"i欝m 3 ph亥n chính sau (1) Gi噂i thi羽u v隠 h羽 h厩 tr嬰 ra quy院v"8鵜nh và mô
hình áp d映ng h羽 h厩 tr嬰 x q"8隠 tài; (2) Vt·pj"d {"e e"d逢噂e"e挨"d違n c栄a khai phá d英
li羽u, bài toán phân l噂p b羽nh nhân d詠a trên cây quy院v"8鵜nh và thu壱t toán h丑c máy
bagging; (3) ph亥n này trình bày bài toán khai phá lu壱t k院t h嬰r."#"pij c"e栄a nó trong
th詠c t院
3 3"V鰻pi"swcp"x隠"j羽"j厩"vt嬰"sw{院v"8鵜pj"*FUU-Decision Support
System)
3.1. 3"Mj k"pkうo"jう"jざ"vtぢ"sw{xv"8おpj-DSS
H羽 h厩 tr嬰 ra quy院v"8鵜nh m瓜t h羽 th嘘pi"vj»pi"vkp"v逢挨pi"v e"f詠a trên máy tính
nh茨o"ik¿r"pi逢運k"f́pi"8逢c"ta quy院v"8鵜nh h嬰r"n#"x q"8¿pi"n¿e"x "e„"o泳c phí h嬰p lý A„"n "u詠 k院t h嬰p gi英a tri th泳c và vi羽c t衣o l壱p quy院v"8鵜nh H羽 h厩 tr嬰 ra quy院v"8鵜nh có
th吋 dùng cho cá nhân ho員c t鰻 ch泳c Vi羽c h厩 tr嬰 có th吋 là gián ti院p ho員c tr詠c ti院p
[12]
3.1.2 E e"d⇔ずe"eてc"jう"jざ"vtぢ"tc"sw{xv"8おpj<"
Vi羽c ra quy院v"8鵜nh bao g欝o"5"d逢噂e"e挨"d違n sau:
+ Thu th壱p thông tin, tri th泳c (thu th壱p, ch丑n l丑c, chu育p"j„c."È+
+ Thi院t k院: Xây d詠pi"e e"rj逢挨pi" p"vjc{"vj院 Rj¤p"v ej"e e"rj逢挨pi" p"t瑛 8„
có tri th泳c m噂i
+ L詠a ch丑n: s穎 d映ng các tri th泳e"vjw"8逢嬰e"8吋 l詠a ch丑p"e e"rj逢挨pi" p"rj́"j嬰p
Phù h嬰p có th吋 là chi phí th医p và hi羽u qu違, có th吋 là phù h嬰p v噂i m映e"vk‒w"8員t tc.È
3.1. 5"Jう"jざ"vtぢ"sw{xv"8おpj"vtqpi"{"vx"*EFUU+
Mô t 違
Vtqpi"n pj"x詠c y t院, h羽 h厩 tr嬰 ra quy院v"8鵜nh cung c医p thông tin tri th泳c và thông
tin c栄a t瑛ng b羽pj"pj¤p"ejq"8瓜k"pi "d e"u "pj¤p"xk‒p."pi逢運i b羽nh ho員c các cá nhân
Trang 31liên quan khác, nh英pi" vj»pi" vkp" p {" 8逢嬰c ch逸t l丑c và cung c医p m瓜t cách thông okpj."8¿pi"n¿e"n o"ejq"sw "vt·pj"ej<o"u„e"u泳c kh臼e t嘘v"j挨p
H羽 h厩 tr嬰 ra quy院v"8鵜nh y t院 bao g欝m nhi隠u công c映 ik¿r" ej."v<pi"e逢運ng hi羽u
qu違 c栄a quá trình ho衣v"8瓜ng y t院 H羽 th嘘ng công c映 này có nh英pi"v pj"p<pi"chính
sau [1]:
+ Cung c医p c違nh báo nh逸c nh荏 b茨pi"o {"v pj"8院n b羽nh nhân và nhà cung c医p
d鵜ch v映 y t院
+ A隠 ra, chu育n hóa các quy trình y t院, các y l羽nh vtqpi"e e"8k隠u ki羽p"z e"8鵜nh
các bi吋u m磯u tài li羽w."vj»pi"vkp"pi逢運i b羽nh
+ T壱p h嬰p và cung c医p các thông tin quan tr丑ng c栄c"pi逢運i b羽nh
+ H厩 tr嬰 vi羽c ch育p" 8q p" x " ewpi" e医p các thông tin liên quan 泳ng v噂i
t瑛ng ca b羽nh c映 th吋
Lぢi ích hう hざ trぢ quyxv"8おnh y tx [1]
+ V<pi"e逢運ng ch医v"n逢嬰ng c栄c"e»pi"v e"ej<o"u„e"{"v院."8go"n衣i cho b羽nh nhân
s泳c kh臼e t嘘v"j挨p
+ Vt pj"8逢嬰c các sai sót và các tình hu嘘ng nguy hi吋m
+ V<pi"e逢運ng hi羽u qu違, gi違m chi phí cho nhà cung c医p d鵜ch v映 y t院 8欝ng th運i
+ v<pi"o泳e"8瓜 hài lòng c栄c"pi逢運i b羽nh
Các loTi hう hざ trぢ ra quyxv"8おnh trong y khoa
Trong y t院 có 2 lo衣i h厩 tr嬰 ra quy院v"8鵜nh chính: (1) H羽 th嘘ng d詠a trên n隠n t違ng
ki院n th泳c (knowledge base): (2) H羽 th嘘ng không s穎 d映ng n隠n t違ng ki院n th泳c (non-
knowdelge base)
CDSS d 詠a trên knowledge-based
H亥u h院t CDSS bao g欝m 3 ph亥n chính là knowledge base, e挨"ej院 suy lu壱n, và rj逢挨pi"vj泳e"8吋 truy xu医t Thành ph亥n knowkedge base bao g欝m các lu壱t và m嘘i
liên quan c栄a d英 li羽w."vj»pi"vj逢運ng là các lu壱t IF-THEN N院u h羽 th嘘pi"z e"8鵜nh s詠 v逢挨pi"v e"e栄a thu嘘c thì lu壱t có th吋 là n院u s穎 d映ng thu嘘c X và s穎 d映ng thu嘘c Y thì
c違pj" d q" pi逢運i dùng Ngoài ra, h羽 th嘘ng còn cho phép c壱p nh壱t ki院n th泳c
*mpqyngfig"dcug+"8吋 c壱p nh壱t tình hình m噂i nh医t [1]
Trang 32CDSS không d 詠a trên knowledge base
EFUU"nq衣k"p {"u穎"f映pi"o瓜v"j·pj"vj泳e"e栄c"vt "vw羽"pj¤p"v衣q"8逢嬰e"i丑k"n "j丑e"o {"ejq"rjfir"ej逢挨pi"vt·pj"e„"vj吋"j丑e"v瑛"pj英pi"mkpj"pijk羽o."v瑛"pj英pi"f英"nk羽w"e "vtqpi"j羽"vj嘘pi"f英"nk羽w"{"v院
3.1. 6"O»"j·pj"jう"jざ"vtぢ"sw{xv"8おpj"uぬ"fつpi"vtqpi"d k"vq p"x "#"pij c
Mô hình
Hình 3.1<"O»"j·pj"jう"jざ"vtぢ"tc"sw{xv"8おpj" r"fつpi"vtqpi"d k"vq p
Mô hình này g欝m 3 ph亥n chính:
e„"8逢運ng huy院v"ej逢c"8逢嬰c ki吋m soát t嘘t
""pij c cてa mô hình
Vi羽c phân lo衣i b羽nh nhân thành thành l噂p ki吋o"uq v"8逢運ng huy院t t嘘t hay ki吋m
uq v"8逢運ng huy院v"ej逢c"v嘘t n "e挨"u荏 giúp cho vi羽e"8k隠u tr鵜 b羽pj"8逢嬰c t嘘v"j挨p
3 4"D k"vq p"rj¤p"n噂r"d羽pj"pj¤p"f詠c"vt‒p"nw壱v"ukpj"tc"v瑛"v壱r"f英" nk羽w
3.2. 3"Rj v"dkあw"d k"vq p"rj¤p"nずr"dうpj"pj¤p"fばc"vt‒p nwfv"ukpj"tc"vな"vfr"fの" nkうw
D詠a trên d英 li羽u thu th壱r"8逢嬰c t瑛 các h欝 u挨"d羽nh nhân, s穎 d映ng khai phá tri
th泳e"8吋 xây d詠ng các t壱p lu壱t là m瓜v"e挨"u荏 quan tr丑ng trong h羽 h厩 tr嬰 quy院v"8鵜nh
Trang 333.2. 4"E¬"uぞ"n#"vjw{xv"
3.2.2 3"Mjck"rj "f英"nk羽w"*fcvc"okpkpi+"n "i·
ÐKhai phá d英 li羽u (Data Mining) là m瓜t khái ni羽o"tc"8運i vào nh英pi"p<o"ew嘘i
c栄a th壱p niên 1980 Nó là quá trình trích xu医t các thông tin có giá tr鵜 ti隠m 育n bên vtqpi" n逢嬰ng l噂n d英 li羽w" 8逢嬰e" n逢w" vt英 trong các CSDL, kho d英 li羽u Hi羽n nay,
ngoài thu壱t ng英 khai phá d英 li羽w."pi逢運i ta còn dùng m瓜t s嘘 thu壱t ng英 khác có ý pij c" v逢挨pi" v詠 pj逢<" mjck" rj " vtk" vj泳c t瑛 CSDL, trích l丑c d英 li羽u, phân tích d英
li羽u/m磯u, kh違o c鰻 d英 li羽u, n衣o vét d英 li羽u Nhi隠w"pi逢運i coi khai phá d英 li羽u và m瓜t
thu壱t ng英 thông d映ng khác và phát hi羽n tri th泳c trong CSDL (Knowlegde
Discovery in Databases - MFF+"n "pj逢"pjcw Tuy nhiên trên th詠c t院, khai phá d英
li羽u ch雨 là m瓜v"d逢噂c thi院t y院u trong quá trình phát hi羽n tri th泳c trong CSDL Có th吋
nói khai phá d英 li羽u n "ikck"8q衣n quan tr丑ng nh医t trong ti院n trình phát hi羽n tri th泳c
t瑛 e挨"u荏 d英 li羽u, các tri th泳c này h厩 tr嬰 trong vi羽c ra quy院v"8鵜nh trong khoa h丑c và
kinh doanh.Ñ
B逸v"8亥u c栄a quá trình là kho d英 li羽u thô và k院t thúc là tri th泳e"8逢嬰c chi院t xu医t
ra V隠 lý thuy院t thì có v飲 r医v"8挨p"ik違p"pj逢pi"vj詠c s詠 8¤{"n "o瓜t quá trình r医t khó mj<p"i員p ph違i r医t nhi隠w"x逢噂ng m逸e"pj逢<"sw違n lý các t壱p d英 li羽u, ph違i l員r"8k"n員p l衣i
toàn b瓜 quá trình,
Trang 34E e"ikck"8q衣n c栄a quá trình khai phá d英 li羽w"8逢嬰c mô t違 vjgq"j·pj"f逢噂k"8¤{
Hình 3.2<"Sw "vt·pj"mjck"rj "fの"nkうw [28]
(1) Gom dの liうu (Gathering): T壱p h嬰p d英 li羽w"n "d逢噂e"8亥u tiên trong quá trình
khai phá d英 li羽u A¤{"n "d逢噂e"8逢嬰c khai thác trong m瓜v"e挨"u荏 d英 li羽u, m瓜t kho d英
li羽u và th壱m chí các d英 li羽u t瑛 các ngu欝n 泳ng d映ng Web
(2) Trích lがc dの liうu (Selection): 雲 ikck"8q衣n này d英 li羽w"8逢嬰c l詠a ch丑n ho員c
phân chia theo m瓜t s嘘 tiêu chu育p"p q"8„"rj映c v映 m映e"8 ej"mjck"vj e."x "f映 ch丑n t医t
c違 nh英pi"pi逢運i có tu鰻k"8運i t瑛 25 - 57"x "e„"vt·pj"8瓜 8衣i h丑c
(3) Làm sTch, tizn xぬ lý và chubn bお vt⇔ずc dの liうu (Cleansing,
Pre-processing and Preparation)<"Ikck"8q衣n th泳 dc"p {"n "ikck"8q衣n hay b鵜 xao lãng, pj逢pi"vj詠c t院 nó là m瓜v"d逢噂c r医t quan tr丑ng trong quá trình khai phá d英 li羽u M瓜t
s嘘 l厩k"vj逢運ng m逸c ph違i trong khi gom d英 li羽w"n "v pj"mj»pi"8栄 ch員t ch胤, logíc Vì
v壱y, d英 li羽w"vj逢運ng ch泳a các giá tr鵜 x»"pij c"x "mhông có kh違 p<pi"m院t n嘘i d英 li羽u,
ví d映 pj逢"vw鰻i = 673 Ikck"8q衣n này s胤 ti院n hành x穎 lý nh英ng d衣ng d英 li羽u không
ch員t ch胤 nói trên Nh英ng d英 li羽u d衣pi"p {"8逢嬰e"zgo"pj逢"vj»pi"vkp"f逢"vj瑛a, không
có giá tr鵜 B荏i v壱{."8¤{"n "o瓜t quá trình r医t quan tr丑ng vì d英 li羽u này n院u không
Trang 358逢嬰e"Ðn o"u衣ch - ti隠n x穎 lý - chu育n b鵜 vt逢噂eÑ"vj·"u胤 gây nên nh英ng k院t qu違 sai l羽ch
nghiêm tr丑ng
(4) Chuyあp"8ごi dの liうu (Transformation): Ti院r"vjgq"n "ikck"8q衣n chuy吋p"8鰻i
d英 li羽u, d英 li羽w"8逢c"tc"e„"vj吋 s穎 d映pi"x "8k隠u khi吋p"8逢嬰c b荏i vi羽c t鰻 ch泳c l衣i nó,
t泳c là d英 li羽u s胤 8逢嬰c chuy吋p"8鰻i v隠 d衣ng phù h嬰p cho vi羽c khai phá b茨ng cách
th詠c hi羽n các thao tác nhóm ho員c t壱p h嬰p
(5) Khai phá dの liうu (Data mining): A¤{"n "d逢噂e"ocpi"v pj"v逢"fw{"vtqpi"mjck"
phá d英 li羽u 雲 ikck"8q衣n này nhi隠u thu壱v"vq p"mj e"pjcw"8«"8逢嬰c s穎 d映pi"8吋 trích ra
các m磯u t瑛 d英 li羽u Thu壱v"vq p"vj逢運ng dùng là nguyên t逸c phân lo衣i, nguyên t逸c k院t
h嬰p lu壱v."È
(6) A pj"ik "e e"nwft và biあu diいn tri thとc (Evaluation of Result): 雲 giai
8q衣n này, các m磯u d英 li羽w" 8逢嬰c chi院t xu医t ra b荏i ph亥n m隠m khai phá d英 li羽u
Không ph違i b医t c泳 m磯u d英 li羽w"p q"e pi"8隠u h英w" ej."8»k"mjk"p„"e p"d鵜 sai l羽ch Vì
v壱y, c亥n ph違k" 逢w" vk‒p" pj英ng tiêu chu育p" 8 pj" ik " 8吋 chi院t xu医t ra các tri th泳c
(Knowlege) c亥n chi院t xu医t ra A pj"ik "u詠 h英u ích c栄a các m磯u bi吋u di宇n tri th泳c
d詠a trên m瓜t s嘘 rjfir"8q Ucw"8„"u穎 d映ng các k悦 thu壱t trình di宇n và tr詠c quan hoá
d英 li羽w"8吋 bi吋u di宇n tri th泳e"mjck"rj "8逢嬰e"ejq"pi逢運i s穎 d映ng
Vt‒p"8¤{"n "8"ikck"8q衣n c栄a quá trình phát hi羽n tri th泳e."vtqpi"8„"ikck"8q衣n 5 -
khai phá d英 li羽u (hay còn g丑k"8„"n "Fcvc"Okpkpi+"n "ikck"8q衣p"8逢嬰c quan tâm nhi隠u
nh医t
3.2.2.2 D k"vq p"rj¤p"n噂r
A鵜pj"pij c
Bài toán phân l噂p là phân tích d英 li羽u nh茨m rút trích các mô hình mô t違 các
l噂p d英 li羽u ho員c d詠 8q p"zw"j逢噂ng d英 li羽u
Quá trình xây d 詠ng mô hình g欝o"jck"d逢噂c chính
Xây d 詠ng mô hình
+ Xây d詠ng mô hình: xây d詠ng b瓜 phân lo衣i (classifier) b茨ng vi羽c s穎 d映ng các
gi違i thu壱t phân lo衣i (classification Algorithms) t瑛 d英 li羽u hu医n luy羽n (training
data) T壱p hu医n luy羽n là m瓜t t壱p d英 li羽u có c医u vt¿e" 8逢嬰c mô t違 b茨ng các
thu瓜e"v pj"x "8逢嬰c t衣o ra t瑛 t壱p các b瓜 giá tr鵜 c栄a các thu瓜c tính
Trang 36+ Mô hình phân lo衣k"*Encuukhkgt"oqfgn+"8逢嬰c xây d詠ng có th吋 là các lu壱t, cây
quy院v"8鵜nh ho員c công th泳c toán h丑c
S 穎 d映ng mô hình: g欝o"4"d逢噂e"*3+"8 pj"ik "o»"j·ph và (2) s穎 d映ng mô hình
+ (1) A pj"ik "o»"j·pj"i欝o"5"d逢噂c sau: nhãn c栄a m磯w"8逢嬰c bi院v"vt逢噂c (test
set) 8逢嬰c s穎 d映pi"8吋 so sánh v噂i k院t qu違 8亥u ra c穎a b瓜 phân lo衣i; tính t雨 l羽 % 8瓜 chính xác c栄a m磯w"8go"mk吋m th穎 Vtqpi"8„"f英 li羽u ki吋m th穎 (test set) ph違i 8瓜c l壱p v噂i d英 li羽u hu医n luy羽n (training set)
+ (2) S穎 d映pi"o»"j·pj"8吋 phân lo衣k"8嘘k"v逢嬰ng m噂i (Unseen data) n院w"8瓜 chính
xác c栄a b瓜 phân lo衣i là ch医p nh壱p"8逢嬰c (acceptable)
Mつe"8 ej: Phân lo衣i b羽nh nhân n英 vào 2 l噂p: l噂p có k院t qu違 AVA"f逢挨pi"v pj"
và l噂p có k院t qu違 AVA"¤o"v pj M厩i b羽nh nhân có các thu瓜e"v pj"ucw"f́pi"8吋 phân
lo衣k<"AVA"vjck"u違n, BMI, tu鰻i
D逢噂e"3<"Z¤{"f逢pi"o»"j·pj
Hình 3.3: Z¤{"fばpi"o»"j·pj"rj¤p"nqTk"dうpj"pj¤p"pの"AVA
åSau khi hu医n luy羽p"vc"8逢嬰c mô hình phân lo衣i
Trang 37D逢噂c 2: S穎 d映ng mô hình 8逢嬰c xây d詠ng 荏 d逢噂c 1: g欝o"4"d逢噂c sau
Hình 3.4<"O»"j·pj"8 pj"ik "dじ"rj¤p"nずr"xà f́pi"dじ"rj¤p"nずr"8あ"fば"8q p"dうpj"
pj¤p"oずk
S穎 d映ng d英 li羽u ki吋o"vtc"*vguv"ugv+"8吋 8 pj"ik "m院t qu違 c栄a b瓜 phân lo衣i
S穎 d映ng b瓜 phân lo衣k"8吋 phân l噂r"8嘘k"v逢嬰ng m噂i: ví d映 b羽pj"pj¤p"Pj逢"e„"e e"
thông s嘘 sau: AVA"vjck"u違n: có; BMI 30; tu鰻i 49 åMô hình phân b羽pj"pj¤p"Pj逢"
vào l噂p k院t qu違 AVA"f逢挨pi"v pj T泳c là b羽pj"pj¤p"pj逢"d鵜 b羽pj"AVA
Trong mô hình phân lずp, thuft toán phân lずp giの vai trò trung tâm, quyxv"8おnh
tずi sば thành công cてa mô hình phân lずp Do vfy chìa khóa cてa vXp"8z phân lずp dの
liうw"n "v·o"tc"8⇔ぢc mじt thuft toán phân lずp nhanh, hiうu quV."e„"8じ chính xác cao và
có khV p<pi"oぞ rじpi"8⇔ぢc
A pj"ik "o»"j·pj"rj¤p"nq衣i d詠a vào các thu瓜c tính sau [13]
+ A瓜 ej pj" z e" *rtgfkevkxg" ceewtce{+<" A瓜 chính xác c栄a b瓜 phân lo衣i M kí
hi羽w"n "cee*O+"8逢嬰e"8鵜pj"pij c"n "rj亥n t雨 l羽 % d詠 8q p"8¿pi"e栄a t壱p ki吋m th穎
( test set) Ph亥p"vt<o"uck"u嘘: 1-acc(M)
+ T嘘e" 8瓜 (time): Th運i gian xây d詠ng mô hình (training time), th運i gian s穎
d映ng mô hình cho vi羽c phân lo衣i và d詠 8q p" *encuukhkecvkqp" cpf" rtgfkevkqp"
time)
Trang 38+ Nkpj"8瓜ng (robustness): kh違 p<pi"v衣o ra mô hình d詠 8q p"v瑛 d英 li羽u nhi宇u
hay b鵜 thi院u
+ Kh違 p<pi"o荏 r瓜ng (scalability): Kh違 p<pi"o荏 r瓜ng là kh違 p<pi"vj詠c thi hi羽u
qu違 n逢嬰ng l噂n d英 li羽u c栄c"o»"j·pj"8«"j丑c
+ Tính hi吋w"8逢嬰c (interpretability): Tính hi吋w"8逢嬰c là m泳e"8瓜 hi吋w"x "#"pij c"
c栄a nh英ng k院t qu違 sinh ra b荏i mô hình
+ V pj"8挨p"ik違p"*ukornkekv{+<"V pj"8挨p"ik違p"nk‒p"swcp"8院p"m ej"vj逢噂c c栄a cây
quy院v"8鵜pj"jc{"8瓜 e»"8丑ng c栄a các lu壱t
Các k 悦 thu壱t phân l噂p [13]
+ Phân l噂p cây quy院v"8鵜nh (Decision tree classification)
+ Phân lo衣i d英 li羽u v噂i m衣ng Bayesian (Bayesian classifier)
+ Phân lo衣i d英 li羽u v噂i m衣ng Neural
+ Mô hình phân l噂p K-hàng xóm g亥n nh医t (K-nearest neighbor classifier)
+ Phân tích th嘘ng kê
+ Các thu壱t toán di truy隠n
-"Rj逢挨pi pháp t壱p thô (Rough set Approach)
Chi ti院t v隠 các thu壱t toán phân l噂p có th吋 xem thêm 荏 ]35_."ej逢挨pi"8
3.2.2 5"Vt·pj"d {"e¤{"sw{院v"8鵜pj
A鵜pj"pij c"e¤{"sw{院v"8鵜nh
Cây quy院v"8鵜nh v噂i nh英pi"逢w"8k吋m c栄c" o·pj"8逢嬰e"8 pj"ik "n " o瓜t công c映
m衣nh, ph鰻 bi院p"x "8員c bi羽t thích h嬰p cho khai phá d英 li羽u (data mining) nói chung
và phân l噂p d英 li羽u nói riêng [15] Có th吋 k吋 ra nh英pi"逢w"8k吋m c栄a cây quy院v"8鵜nh pj逢<"z¤{"f詠pi"v逢挨pi"8嘘k"pjcpj."8挨p"ik違n, d宇 hi吋u Cu嘘i cùng, vi羽c phân l噂p d詠a
trên cây quy院v"8鵜pj"8衣v"8逢嬰c s詠 v逢挨pi"v詠 x "8»k"mjk"n "ej pj"z e"j挨p"uq"x噂i các rj逢挨pi"rj r"rj¤p"n噂p khác [15]
Trang 39Cây quy院v"8鵜nh là bi吋w"8欝 phát tri吋n có c医u trúc d衣ng cây, có d衣pi"pj逢"o»"v違
trong hình v胤 sau:
Hình 3.5<"O»"j·pj"e¤{"sw{xv"8おpj"]15]
Trong cây quy院v"8鵜nh:
̋"I嘘c: là node trên cùng c栄a cây
̋"Pqfg trong: bi吋u di宇n m瓜t ki吋m tra trên m瓜t thu瓜e"v pj"8挨p"*j·pj"ej英 nh壱t)
̋"Pj pj: bi吋u di宇n các k院t qu違 c栄a ki吋m tra trên node trong *o k"v‒p+
̋"Pqfg lá: bi吋u di宇n l噂p hay s詠 phân ph嘘i l噂p (hình tròn)
Quá trình xây d 詠ng cây quy院v"8鵜nh g欝o"jck"ikck"8q衣n [13][15][14]
+ Ikck"8qTn thと nhXt phát triあn cây quyxv"8おnh
Ikck"8q衣n này phát tri吋n b逸v"8亥u t瑛 g嘘e."8院n t瑛ng nhánh và phát tri吋n quy n衣p
theo cách th泳e"ejkc"8吋 tr鵜 cho t噂k"mjk"8衣v"8逢嬰c cây quy院v"8鵜nh v噂i t医t c違 e e"n "8逢嬰c
gán nhãn l噂p
+ Ikck"8qTn thと hai cht, tえa bずt các cành nhánh trên cây quyxv"8おnh
Ikck"8q衣n này nh茨m m映e"8 ej"8挨p"ik違n hóa và khái quát hóa t瑛 8„"n o"v<pi"8瓜
chính xác c栄a cây quy院v"8鵜nh b茨ng cách lo衣i b臼 s詠 ph映 thu瓜c vào m泳e"8瓜 l厩i (noise)
c栄a d英 li羽w"8 q"v衣o mang tính ch医t th嘘ng kê, hay nh英ng s詠 bi院p"8鰻i mà có th吋 n "8員c
tính riêng bi羽t c栄a d英 li羽w"8 q"v衣o Ikck"8q衣n này ch雨 truy c壱p d英 li羽u trên cây quy院t 8鵜pj"8«"8逢嬰c phát tri吋p"vtqpi"ikck"8q衣p"vt逢噂c và quá trình th詠c nghi羽m cho th医y giai
Trang 408q衣n này không t嘘n nhi隠w"v k"piw{‒p"v pj"vq p."pj逢"x噂i ph亥n l噂n các thu壱t toán, giai 8q衣n này chi院m kho違pi"f逢噂i 1% t鰻ng th運i gian xây d詠ng mô hình phân l噂p
Ikck"8q衣n phát tri吋n cây quy院v"8鵜nh g欝o"6"d逢噂c sau
Pi逢嬰c l衣i: l員p l衣k"d逢噂c 1 t噂k"d逢噂c 4 cho t瑛ng node con Các thu壱t toán khác
nhau có các cách gi違i quy院t v医p"8隠 khác nhau cho hai ikck"8q衣n trên trên
Có 3 lo 衣i tiêu chu育n hay ch雨 s嘘 8吋 z e"8鵜nh thu瓜c tính t嘘t nh医t phát tri吋n t衣i
+ Gini-kpfgz"*Dtgkocp"x "e e"8げng sば, 1984 [14], [13])
Lo衣i tiêu chu育n này l詠a ch丑n thu瓜c tính mà làm c詠c ti吋w"j„c"8瓜 không tinh
khi院t c栄a m厩i phân chia Các thu壱t toán s穎 d映ng này là CART, SLIQ,
SPRINT
+ InformationÎgain hopc Information gain ratio (Quinlan, 1993 [14][13])
Khác v噂i Gini-index, ti吋u chu育n l詠a ch丑n thu瓜c tính theo m泳c c詠e"8衣i hóa ch雨
s嘘 entropy Các thu壱t toán s穎 d映ng tiêu chu育n này là ID3, C4.5
+ 4"-bVng thぐng kê các sば kiうn xVy ra ngdu nhiên [14], [13]
4"8q"8瓜 v逢挨pi"swcp"ik英a t瑛ng thu瓜c tính nhãn l噂p Ucw"8„"n詠a ch丑n thu瓜c
v pj"e„"8瓜 v逢挨pi"swcp"n噂n nh医t, CHAID là thu壱t toán s穎 d映ng tiêu chu育n này
ÐGi違 s穎 r茨ng chúng ta có các t壱p d英 li羽u hu医n luy羽n khác nhau, và t嘘v"pj逢"
nhau, m瓜t thu壱v"vq p"8逢嬰c coi là d詠 8q p"n羽ch (bias) v噂i m瓜t d英 li羽w"8亥u vào x n院u