1. Trang chủ
  2. » Luận Văn - Báo Cáo

dịch tự động Anh-Việt dựa trên việc học luật chuyển đổi từ ngữ liệu song ngữ 8

5 334 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Dịch Tự Động Anh-Việt Dựa Trên Việc Học Luật Chuyển Đổi Từ Ngữ Liệu Song Ngữ 8
Trường học Trường Đại Học Khoa Học Tự Nhiên
Chuyên ngành Công Nghệ Thông Tin
Thể loại Luận án
Năm xuất bản 2023
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 5
Dung lượng 1,66 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

việc dịch thủ công bằng người đòi hỏi thời gian và công sức lớn, đặc biệt là những tri thức chuyên ngành đòi hỏi người dịch phải có chuyên môn trong lĩnh vực mà mình đang dịch. Chính vì vậy như cầu tự động hóa công tác dịch thuật Anh-Việt ngày càng trở nên thiết thực

Trang 1

CHUaNG 7: KET LU~N

7.1 TOM TAT

D!ch may la bai lOan da duQCd?t ra tu bon 50 Dam nay va cling la bai lOan qtc leYkh6 do tinh nh~p nh~ng v6n c6 cua ngon ngli tl1Dillen Tu d6 de'n nay, da c6 nhi~u mo hlnh d€ gi,H quye't nhung chua th€ tn;m Vyn duQc.Nhung do 9 nghla thl1c ti~n cua n6 qua lOn, Den can nguoi v~n khong ngung tlm cach di tieD d€ Dang cao chat luQng d!ch cua n6 Luan an nay cling khong n~m ngoai m1,1clieu d6

Trang chuang 2, sau khi xem xet, danh gia cac chien luQc cling nhu cac cach tie'p c?n va gidi hC;lnIC;liphC;lmvi d!ch cua h~ th6ng, chung toi da quyet dinh ch9n chien luQc chuy€n d5i cu phap (syntax transfer) + phan giai ngu nghla Dong (Shallow semantic analysis) vdi tie'p c~n dl1a tIeD ngu li~u (corpus-based) Thea giai phap nay va dl1a tIeD co so 19 thuye't cua ngon ngu h9C so sanh (comparative linguistics) va co so thl1c nghi~m cua may h9C TBL(Transformation-Based Learning), Trang chuang 3, chung tai da xay dl1ng mQt ma hlnh dich mdi c6 ten la BTL(Bitext-Transfer-Learning) Thea ma hinh nay, thay VI can nguoi phai xay dl1ng cac lu?t chuy€n ngil' mQt cach thu cang (vua t6n kern, ch?m, khong baa quat, kh6 phat tri~n), h~ th6ng se tl1 dQng rlit cae lu?t chuy~n ngil' tu kho ngil' li~u song ngil' EVC (English-Vietnamese Corpus) b~ng giai thu?t h9C KFfBL (K-best FTBL)- mQt giai thu? t duQc chung toi di tie'n tu FTBL (Fast-TBL).-D€ giai quye't cac bai tOaDga n nhan ngon ngil' (hlnh thai, ngil' phap, ngfi'nghla, chuy~n d6i) cho EVC, trong chuang 4, chung toi

da dung giai thu~t KFTBL vdi cae khung lu?t c6 kern thong tin tie'ng Vi~t Luong ling trong EVC dti sua loi cac nhan co so va danh gia ket qua sua loi tIeD ngfi'

Trang 2

li~u ehu§'n SUSANNE Tu cae lu~t ehuy€n ngu duQe rut ra tITEVC cung vdi cae ngu6n thong t~n khac, chuang trlnh diet EVT (English- Vietnamese- Transla tor)

se phan rich cali tieng Anh v~ hint thai, ngu phap, ngu nghIa va chuy€n d6i sang Calltieng Vi~t Wong ling Vi~e eai d~t cae khO'ixU'ly n6i tren cling nhu vi~c t6 chileco sd du li~u cua tITdi€n va cac ngu6n tri thlic khac can thief cho mo hlnh BTL duQc trinh bay trong chuang 5

Chung toi chI t~p trung giai quyet nhung bai roan co lien quail den tieng Vi~t, nhu: lien kef tITtrong song ngu Anh-Vi~t, gall TItan ngon ngu eho tieng Vi~t, chuy€n d6i cay cll phap Anh-Vi~t, danh gia kef qua dich tieng Vi~t Con dO'ivdi cac bai roan lien quail thu~n tuy Wi tieng Anh (nhu' gall TItan tu'lo<;ii,cu phap, quail h~ van ph<;imtieng Anh), chung tai da sli' d1:lDgkef qua mdi nha't eua bQgall TItan ngu phap tieng Anh EOT (My, phien b?m 2001) d€ gall TItan co s6, sail d6 dung KFTBL d€ sli'a sai tIeD do.

Du den nay di'iva dang phat tri€n nhi~u ma hint vdi cae caeh tier e~n tIT

don gian tdi va eung phlie t<;ip,nhu'ng nhin chung (theo [86]) thl "Djch may dI1r;Jc

bitt din 12hdu v~ thelt b9i cua n6 110'11 fa tha12hGong cua n6 va y tua12g phot

triin mf)t Mtho'ng djch moy da nong l1Oanroan tf:Cdf)ng do hi fir bo fir fau".Th~t

v~y, ngay d h~ thO'ngdiet t1,I'dQng SYSTRAN n6i tieng va m<;inhnha't hi~n nay, thl dQ ehinh xae duQe eang bO'ehinh thlic [86] cling chI d<;itkhoang 67% (cho e~p Anh-Phap, day La hai ngan ngu cling Lo<;ii hInh) sail khi qua nhi~u phep thli' ehinh xac, khoa hQe va khaeh quail.

Th~t v~y, do diet may g6m ra't nhi€u cang do~m, ma ngay d eang do<;tn tu'dng chung don gian nha't Latach van ban ra tung cali d€ diet thl den nay tIeD the gidi da e6 nhi~u eong trlnh chI t?P trung giai quyet va'n d€ nay, nhung ehua

co eang trlnh naG giai quyet duQe 100% d [120] Ket qua dieh cuO'icung eua M l?i ph~ thuQe vao dQ ehinh xac cua ta't d cae eong do~mthanhph~n

Trang 3

7.2 CAC DONG GOP

7.2.1 VE MAT KHOA HQC

Lu~n an cia ciua ra mo hlnh mai cho vi~c dich may noi chung va dich Anh-Vi~t noi rieng Mo hlnh nay cia w ciQngboa qua trlnh xay dlfng Iu?t chuyEn ngu trong dich may va no cling cho phep h~ tlf sii'a sai qua qua trlnh dich Theo mo hlnh nay, khi dn thay ci6i 1mh vlfc dich, ta chi dn cho may hQc l<;litren ngu 1i~u huan 1uy~n mai (thay VI phai nha chuyen gia xay dlfng l<;libe>1u~t tu ci~u nhu trong cach tiep c~n truac ciay) Ngoai ra, trong 1u?n an, chung t6i co di lien giai thu?t hQc FTBL va ciua ra ciinh 1y 3.1 chung minh v~ khong gian tlm kiem cua giai thu?t FTBL

Mo hlnh BTL trong 1u?n an cia ke thua nhung ket qua mai nhat (tu 2000 trd I<;ii)trong vi~c phan rich ngon ngu tieng Anh cua the giai cung vai nhung cong ngh~ xli'ly ngon ngu lien tieD (trong thai gian 2001-2002) Theo mo hlnh BTL, chung toi sii' d\lng cac ph~n m~m phan rich tieng Anh m<;inhhi~n nay (EGT) dE gall nhan co sa, sail do dung them thong tin tieng Vi~t trong EVe ciEdi thi~n

D~ tai nay coynghIa thlfCti~n rat IOn: no tlf ciQngboa ph~n naG cong tac dich thu~t cac tai li~u KHKT, gap ph~n tiep thu, ph6 bien cac thong tin, tri thuc KHKT cua the giai me>tcach nhanh chong Kho ngu li~u song ngu EVe se 1a

"mo vang" cho cac nha ngon ngu hQc so sanh nghien cu~~~!1 no ciErut ra cac qui Iu?t Wong d6ng, di bi~t giua 2 ngon ngu, gap ph~n dinh huang cho vi~c dich may duQc ngay cang t6t bon EVe cling con ung d\lng cho vi~c giang d<;lytieng Anh, tieng Vi~t [1]

Trang 4

7.3 RAN CRE VA mJ<JNG PHAT TRIEN

BTL co h(;lnche'l3 khi ta c~p nh~t ngu li~u hua'n luy~n, ta phai cho may hyc l(;litren toEmbQ ngu li~u do Trong tl1'anglai, chung toi t1m each di tie'n vi~c hye cua mo hinh BTL sao cho h~ chi hyc tren nhung ngu li~u mdi, ngu li~u co thay d6i, con ngu li~u cli th1h~ se khong phai hyc l(;li

Hi~n nay, con mQt so khoi (module), chung toi chua sa d1,mgde'n giai thu~t hyc TBL, nhu: tach cali, phan rich h1nh thai hyco Trang tuang lai, ehung toi se chuy€n sang sa dvng giai thu~t hyc TBL nh~m khai thae du<;Jcnhung doC;lnma trong BTL, hay nhung thong tin co san trong EVe Trang h~ EVT, v~n eon mQt

so va'n d~ ma chung toi chua kip giai quye't, nhu: the' dC;litu (anaphora), hi~n tu<;JngtInh lu<;Jc(ellipsis) Trang tU'anglai, chung toi se sa dvng giai thu~t hyc TBL d€ giai quye't cae va'n d~ do

Ngu li~u hua'n luy~n la di~u then chat nhung lC;lilau dai, v1 v~y, ehung toi phai khong ngung toaD thi~n v~ m~t cha't luQng va gia tang v~ m~t so 1U'<;Jngcho kho ngu li~u yang do

Cuoi cling, mo hinh BTL hoC;ltdQng chu ye'u d1,1'atren nhung nguyen 1y rut

ra tlr'cae ke't qua nghien CUlleua nganh ngon ngG'hyc so sanh Anh-Vi~t B€ gall TItan ngon ngu cho EVC, BTL d1,1'atren ti~n d~ 1a eo s1,1'doi ung giua cac ca'p dQ

d cac b1nh di~n giua c~p ngon ngu Anh- Vi~t Nhung th1,1'cte'th1 s1,1'doi ung nay khong don gian 1-1, ma la ill-noVi v~y, chung ta phai xay d1,1'ngduQc cac bang doi chie'u m-n do va cac Gong vi~e nay thuQc nganh ngon ngu hye so santo Chung toi budc d~u da: giai quye't so bQ cae va'n d~ do trong mQt Gongtrlnh hen ngon ngu hye so sanh va hi~n nay dang tie'p tvc giai quye't d~y du han1rang mQt Gong trlnh khac cao hail, cling thuQc nganh ngon ngu hyc so santo Ben ci;lnhdo, chung toi se luon khai thae cac ke't qua so sanh Anh-Vi~t tu cae Gongtrlnh khac

Trang 5

7.4 LOIKET

Dich may la bai roan lau dai duQc d~t ra tu d~u th~p DieD 1950 va Iii bai roan qI'c ky kh6 do ban cha't nh~p nh~ng cila ngon ngu ti{ nhien Han 50 Dam qua, cac nha tin hQc, ngon ngu hQc, ngon ngu hQc - may tinh, khong ngung tlm toi dua ra nhi€u ma hint d~ di lien no, nhu'ng den nay v~n chua th~ giai quyet

, duQc bon 70% cac va'n d€ cila n6 Tuy vo cling kh6 khan nhu v~y, nhu'ng cac nha khoa hQc v~n khong llii budc VIhQ nghI tdi lQi ich vo cling to IOn cila dich may mang ll,licho TItan 16-l,li.Bai loan nay doi hai c6 s\!'ket hQpcila nhi€u nganh: tin hQc, ngon ngu hQc, roan hQc, Day cling 13.bai roan mang net d~c thli cila m6i ngon ngu Chung ta c6 th~ ke thua cac ket qua nghien cuu cila tieng Anh, tIm' hi~u cach giai quyet cae va'n d~ cila tieng Hoa (mQt ngon ngu cling lol,li hint tieng Vi~t) nhung chung ta khong th~ ng6i cha cae nude khac lam thay eho chung ta trong vi~c xU'15'cac va'n d~ co lien quail den tieng Vi~t.

VI v~y, trude si{ philt tri~n nhuvli bao cila cac nganh xU' 15' ngon ngu cho cac ngon ngu IOn tren the gidi, nhu: tieng Anh, Phap, Nga, Nh~t, (va g~n day la tieng Hoa, Han, Thai), chung toi mong muon qua d€ tai nay, g6p ph~n nha be vao nganh xU'15'ngon ngu tieng Vi~t can non t[(~cila chung ta

D~ ket thuG roan bQ lu~n van nay, chung toi xin muQn Gong thuG nISitieng cila Niklaus Wirth - khi d?t ti{a d~ cho mQt euon sach l~p trlnh nISitieng eila ong

ta la: "Ca'u true du li~u + Giai thu?t =Chuang trlnh" Cong thUGnay xin duQc

thay the b~ng: "Ngu li~u song ngu Anh-Vi~t EVC + Giai thu~t hQc KFTBL =

Chuang trlnh dich EVT" Vdi Gong thUGco dQng nay, chung toi hy vQng no s.e noi leu toaD bQ tam tu va nguy~n vQng cila nh6m nghien cUu chung toi trong bon muai Dam qua va mai maio

Ngày đăng: 09/04/2013, 22:12

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm