sự phát triển nhanh chóng của các ứng dụng công nghệ thông tin và internet vào nhiều lĩnh vực đời sống xã hội, quản lý kinh tế, khoa học lỹ thuật... đã tạo ra nhiều cơ sở dữ liệu khổng lồ
Trang 1dQ phuc t~p va s6lcln troy c~p ilia nhflm khai thac tri thuc ti~m §:ntrang kh6i dft lic$uIOn va tri~n khai cac ung dv.ng d1,tatren cac mo hlnh, thu~t giai da pMt tri€n trang lu~n an
Lu~n an da sit dv.ng cac cong cv.loan hQCnhu': mo hlnh vector nh! philo bi€u di6n t~p m~t hang, ke"tn6i Galois, bao dong, daD khai nic$m,19thuye"t t~p tho, t~p mo, cac lien d~ ciia ham metric va cac cong Cl,ltin hQc nhu' m~ng Kohonen, 19thuye"td6 thL 19thuye"tv~ thu~t giai va dQphuc t~p
Lu~n an da nghien CUllva khao sat cac khai nic$mnht(: t~p ph6 bie'n, mo hlnh vector bi~u di6n, do~n l~p ph6 bie"nva t6 h<;5pco thu tl,1'hay khong co thli'tl,1'
cac do~n l~p ph6 bie'n, hc$s6 phv thuQcthuQctlnh ma rQng trang 19 thuye't t~p
tho, hc$s6 phan anh muc dQ tu'Jng t1!gifta cac d6i tu'<;5ngrhea khmlng cach va
mli'c dQ tu'ong t1,tv~ nghla ciia cac tit trong van ban qua Wordnet va d6 th! d6ng
hic$n.
MQt s6 phu'ong phap da d;tgc nghien CIDId~ xua"ttrong lu~n an nhu':
. Bi~u di6n CSDL biing cac bit trong bQnho may tlnh va tlnh loan t~p h<;5p biing rich ciia vector bi€u di6n
. Dung t~p cac ye"ut6 ph6 bie"nd€ d~c tru'ng cho ~p dft lic$unhu' ~p ph6 bie'n trong CSDL, do,!-nl~p ph6 bie"ntrong trlnh t1!sinh hQc, day tU'ph6 bie"ntrong kh6i ngft lic$u
. Dung lu~t ke"th<;5pd€ xem xet tinh d6ng hic$nciia cae d~c tru'ng ciia d6i
trang 19 thuye't t~p tho.
Trang 2. DUng nguyen 1)1Apriori d€ xay dl!ng thu~t giai tlm t~p ph6 bien, do~n I~p
ph6 bie'n, day tit pho bie'n va baa d6ng, daD khai ni~m, cay h?u to' de xay
d1fI1gthu~t giai tang eu'ong
. Dung cae thu~t giai gem e1;lmd€ khao sat sl! tu'ong tl! giii'acae d6i tu"(1ng
Lu~n an dii tho du'qccae kef qua san:
. Phat tri€n cae thu~t giai khong tang eu'ongva thu?t giai tang cu'ongnhim Dang cae hi~u sufft tlm kiem t~p pho bien va lu~t kef h(1p trong CSt>L b~ng each giam dQ phuc t~p tlnh lOan va sO'l~n troy c~p CSDL Trong tie'p e~n thu~t giai khong tang cu'ong, mo hlnh vector bi€u dieD t~p m~t hang va baa dong da: du'(1cphat tri~n Trong tiep c~n thu?t giai tang
ctiC1ng,thu~t giai tren daD khai ni~m hlnh thUG03: Ou'9Cciii bien d€ co th€
dim khai ni~m Ngoai ra, lu~n an d3:d~ xuat cac m6 hlnh ma rQng bai roan lu~t kef hqp sang cae d~ng lu~t kef h<;fpad~ng phil dinh va cae lu~t
ke't h<;fpmo. ~ ~
tang etidng d1!atren cay h~u t6 d€ tlm cac oo~n l~p pho bien trang t~p cae
trlnh t1!sinh hQc.Thu~t giai tren cay h~u to'con du'<;feling d1;lngd~ t1mcae
day tit pho bie'n trong kh6i figii'li~u nhi~u van ban d~ tlm d~c tntng cua
kh6i ngii' li~u van ban va t~o vector d~e tru'ng cha van ban ph1,1cV1.llie'n tnnh gem c1,1mvan ban bing m~ng Kohonen.
tho d1!a tren dQ tin c~y va dQ pho bien cua iu~t kef h9P nh~m Dang caa
khii Dang phan Idp, tlm to h<;fpkhong e6 th6' tl! cae do~n l~p ph6 bien tir ngit canh khai iliac dii'li~u trlnh tl! sinh h9C,rim to h9P co thll' tl! cac do~n
Trang 3l?p ph6 bie'n tll' d6 th! d6ng hi~n cac dm.lnl?p ph6 bien dti phan lOp hQ cac mnh t1!sinh hQc
. OU tie'n thu~t giai hua-nluyc$nm':tng Kohanen d1!a tren vung Ian c~n va d?c nnh cua vector nh! phan van ban nh~m Dang caD hic$usua't cua thu~t
giai hua'n luyc$n m~ng Kohonen nit d?c tfling c1,1m,gall nhan rho c\,lm troy va'n tu'ong t1! qua lop ra Kahanen, nghien CUllung dl:lTIgWordNet va
xac dinh lop dti khao sat muc d(>g~n nghiClcua tll' va di~u chlnh dc thanh
ph~n cua vector d?c tntng van ban
Sa d1,1ngcay M-Tree dti t':toIde'n tnic phan ca'p c1,1mdli lic$utdnh t1,1'sinh hQc nhAm nghien cUn tie'n tdnh tie'n boa cua sinh v~t Cac thaa tae tlm
lu~t d?c tntng c1,1mtit kie'n truc phan ca'p, troy va-ntu'(jngt1! trlnh t1,1'sinh hQc tu'ongd6ng, tlm \rung baa t6n gen qua cae the' hc$tieD boa
lu~t pMn lOp trang CSDL Nhan kh~u Tp H6 Chi Minh nhiim kham pM
nganh daD (':to; khaa sat cac d~c trUng va qua tdnh tieD boa cua sinh v~( dt1a tren dii'li~u trlnh tt1sinh hQcnhtttim cac do~n l~p ph6 bie'n va t6 h<;1p cac do':tnl~p ph6 bien t':toIden tnic phan ca'p dii'li~u khu§n Onchocerca troy v{n trlnh tt1 tu'ongddng, phat hi~n vung baa tdn gen qua cac the h~ tie'n boa; gom c1,1mcae tom t~t baa cao khoa hQc baa g6m thao lac t':to
vector d~c tntng van ban dlfa tren cac day titph6 bien, gam Cl,lffivan ban
va troy van thong tin van ban at kIp ra cua mC;1ngKohonen, sU-d1,1ngcay h~\l to' tlm da:y tu 'Qh6bien va lu~t ket h,)~ d~ tl\\\.c':\\:\&h~\'I116wg,h\~\\
cac day titph6 bie'n trang m(>t s6bai tho, truy~n ng~n.
Trang 4Huang phat tri@ncua lu~n an:
m~m da du'<Jcphat tri€n trong khuon kh6 lu~n an
. Tie'pl\!Cphat triED cac ling dl;lng khai thac diI' li~u vao Huh vt,fe sinh bQc,
di,lebi~t Hi giai thicb cae ke't qua pban rich diI'li~u theo hu'dng sinh hQc: ngbien cti'u cac Calltruc b~c ba, cac ne'p gap cua cae Protein lam cd sa phat hi~n m6i lien b~ giiI'a gen va tlnb tr<.lngcua protein, ngbien cuu bai
toaD nh~n di~n gen tU bai lOan phat hi~n cae lu~t phan lOp gen.
. Nghien cti'u ling dl;lngkhai thac diI'li~u vao van ban nh~m Dang cao khii
nang rim kiem thong tin, gom Cl;lffivan ban dt,I'atren nOi dung, di~n u!cb
nOi dung van ban, h6 tr<JdQc nhanh van ban tie'ng Anh va van ban tieng
Vi~t Nghien cuu truy van thong tin co xem xet ngii' nghla tmng tieng
'i
Vi~t Phat triED eae ling dl;lng khai thac dii' li~u vao Hnh vt,fc ngon ngu tt!
nhien, van chuang, tho ea di,lcbi~t la nghien cu'u d~c thiI va van phong cua tae giii