Chính vi vậy đề tài “Tìm hiểu : t công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng” Ì f được đưa ra nhằm giúp cho các doanh nghiệp hay các tổ chức nhà nước i * hỗ trợ khá
Trang 1
TRUONG DAI HOC KHOA HOC TU NHIEN
KHOA CONG NGHE THONG TIN
BO MON HE THONG THONG TIN
oO „ NGUYEN THI KIM PHUQNG - TRUONG KIEU GIANG
TÌM HIỂU CÔNG NGHỆ XML Và
X€Y DUNG HE THONG QUAN LY
DICH VG KHACH HANG (ESUPPORT)
KHÓA LUẬN CỬ NHÂN TIN HỌC
TP.HCM, 2005
Trang 2TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN HỆ THỐNG THÔNG TIN
oo OF
NGUYEN THI KIM PHƯỢNG 0112237
TÌM HIỂU CÔNG NGHỆ XML Và
XâY DựNG HỆ THỐNG QuảN LÝ
DICH VU KHACH HANG (ESUPPORT)
GIAO VIEN HUGNG DAN THẠC SĨ: NGUYEN TRAN MINH THU’
NIEN KHOA 2001-2005
Trang 3Øp.Z60ô lu Miu, đặc biệt tà
Gây Óô trong khoa Céng Wghé hông in đã tận tình giảng
Øp.Z6ô @lư /Mink,
em ahitnag kiếm tÍuức
cam
£ ) ⁄ e
2 cam
cùng,
Ching toi xin chan thanh cam
tướng thận xét, đóng góp biếu
Ching em xin chin thanh
Ching em xin chain thanh
Cubi
trường Dai hoe Khoa Foe Fu
cede
nam hoe tap tai trường
thie hién lugn van dé chiing em céAhé hoan
dinh dé tao moi diéu kiện
Trang 4“J
, LO! NOI DAU i
[ Thế kỷ 21 - thế kỷ của sự bùng nỗổ công nghệ thông tin, các công nghệ Ì
* tiên tiến phát triển như vũ bão, mang một luồng gió mới thổi vào nhận thức : [ của mỗi người Song song đó, thế giới đang trong xu thế toàn cầu hóa, tat ‘
t cả đều mang ý nghĩa hội nhập Lúc này, các doanh nghiệp va chính phủ i
| khéng chi canh tranh véi cdc doanh nghiép trong mét quéc gia ma con canh 1
* tranh với các doanh nghiệp, chính phủ ở khắp thế giới.:Vì thế, để tồn tại và : phát triển, mục tiêu mà các doanh nghiệp hướng đến đầu tiên là nâng cao :
- chất lượng phục vụ khách hàng Khách hàng là:yêu tố sống còn của bắt kỳ = + doanh nghiệp nào trong thế kỷ 21 Một chính phủ muốn quốc gia mình phát †
t trién phai xem nhan dan va doanh nghiép la*khach, hang Dé cé khach hang j
t đã khó, để giữ khách hàng càng khớ hơn nhiều Doanh nghiệp nào làm cho i + khách hàng thỏa mãn, doanh nghiệp đó sẽ phát triển tốt, chính phủ nào làm *
[ nhân dân hài lòng chính phủ đó.sẽ vững mạnh j
L Trong bối cảnh phát triển mạnh mẽ của Internet nói chung, thương mại j
† điện tử và chính phủ điện tử nói riêng, việc ứng dụng công nghệ thông tin j vào lĩnh vực dịch vự khách hàng không là mới trên thế giới nhưng là mới ở :
[ Việt Nam Nhiều vấn đề đặt ra là làm thế nào đem đến cho khách hàng sự Ì
‹ phục vụ tốt.nhất, tiện lợi và hiệu quả nhất Chính vi vậy đề tài “Tìm hiểu :
t công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng” Ì
f được đưa ra nhằm giúp cho các doanh nghiệp hay các tổ chức nhà nước i
* hỗ trợ khách hàng hiệu quả hơn Với luận văn này, nhóm chúng em mong :
[ muốn sẽ xây dựng được một hệ thống hỗ trợ khách hàng giảm chỉ phí về ]
* nhân sự và viễn thông, thời gian hỗ trợ ngắn hơn, thông tin hỗ trợ chính xác i
| theo yêu cầu và không bỏ sót yêu cầu của khách hàng i
Trang 5| hang như mục tiêu, phạm vi, đôi tượng mà hệ thông hướng tới Song song |
i đó là các cách tiếp cận bài toán và đưa ra hướng giải quyết bài toán j
† các công nghệ đang được hỗ trợ trên XML j
| Chuong 3: M6 ta hé thong quan ly dich vu khach hang =M6 ta chi tiét hé /
i thống hỗ trợ dịch vụ khách hàng và đưa ra ác yêu cầu mà hệ thống sé j
i Chương 4: Phân tích ứng dụng - Phân tích chỉ tiết các yêu câu theo mô ï
„ hình UML (Unified Model Language) *
* Phân cuôi cùng là Tài liệu tham khảo và phụ lục :
I, Do thời gian có hạn, kinh nghiệm phân tích, thiệt kê, cài đặt còn hạn chế;
i nên chắc chắn không tránh khỏi một số sai sót nhất định Rất mong nhận :
ị được sự đóng góp ý kiến của quý Thầy Cô và bạn bè để chúng em hoàn :
? thiện đề tài này i
Trang 6Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
1.3 Mục tiêu cần đạt được và các cách tiếp cận bài tøán - 11 1.3.1 Mục tiêu cần đạt được ẤẾ -.-lằ ll
1.3.2 Các cách tiép cAn bai 0am .cesccseeplteecsssessssseeteesseesesseessssseeees 11
1.3.3 Vấn đề đặt ra cho hệ thống hỗ trợ địch vu khach hang 16
1.4 Hướng giải quyết bài toán <2 TÑghỀ ào ccveeeerrkeirrrkrrrrrrreerrree 18 1.4.1 Về tốc độ thực hiện câu tfuy vấn ì -¿-ccc+ccvecrcrx 18 1.4.2 Vấn đề tìm kiếm thông tỉn -2¿+ze+cvxzrrrrerrrrrx 21
Chương 2: NGHIÊN CỨU CÔNG:'NGHỆ XML 5 25
2.1 Tổng quan về XML ) -22-©222¿+2EE22EEEEEeEEEEEECEEEEErrrrkerrrrkee 25 bên cố nh ›<‹.1 ÔÒỎ 25
2.1.2 Mục tiêu ra đời và lợi ích khi sử dụng XML 25
2.1.3 Một tài liệu XML trông như thế nào) 2-cs++‡ 27
2.1.4 Tạo lập một tài liệu XML 27
2.1.5 Những thành phần của một tài liệu XML 28 2.1.6 Một tài liệu XML hợp lệ 2¿-©2z++22+zevccvxerrrrrecree 29 ba 33 2.1.8 Nhận xét về XMIL .2-22¿+2CE+EetEEEEeCEEEEErrrrkrrrrrkrcree 34
2.2 Cách sử dụng một tài liệu XML - - 5s +s£+cse+xzxzeees+ 2.2.1 Doc va phan tich tai ligu XML
2.2.2 Định hướng qua tài liệu XML để rút trích dữ liệu: 37
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 9
Trang 72.2.3 Truy vấn dữ liệu XML sử dụng XPathDocument và
LU? 0-00 90
4.2.2 Đặc tả Use-Case Đăng ký tài khoản 5s s<ssx+xsxe 67 4.2.3 Đặc tả Use-Case Tạo yêu cầu -: ccccccccrreerrrreccee 69
4.2.4 Đặc tả Use-Case Xem và hiệu chỉnh yêu cầu cccccccces 70
4.2.5 Đặc tả Use-Case Giải đáp yêu cầu -ccccccccrreccee 72 4.2.6 Đặc tả Use-Case Tìm kiếm yêu cau 7B
4.2.7 Dac ta Use-Case Quan ly yéu Sa 74
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 10
Trang 8Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
5.1 Hiện thực hóa se-Case - ¿52252322322 *21E£E£EceEesereereererre 79
5.1.1 Use-Case Tìm kiếm FAQ, -22¿-©2czccrkecrrkerrrkerrrkcee 79 5.1.2 Use-Case Đăng ký tài khoản - - s+sskseeerrrsre 81 5.1.3 Use-Case Tao y6u CaU M6 .secscsssessssssesssssseesssseesesssesesssesessseess 83 5.1.4 Use-Case Giải quy6t y6U CaU eecccccssssssessssssessssseesesssesssssessesseess 85 5.1.5 Use-Case Xem và hiệu chinh y6u Cau .cscsssssssesssssesssssseseessees 87 5.1.6 Use-Case Tìm kiếm yêu cầu
5.1.7 Use-Case Quản lý yêu cẦu ếẾ( - TY ccccccccvecrrrreccee 5.1.8 Use-Case Quản lý FAQ e slỀ các ccvecccrrkerrrrkrrrrrrree 93 5.2 Thiết kế cơ sở dữ liệu €sse kcccc222vvvrrrrccvvvrrrrrrrrrrrrree 96 5.2.1 SO 7a 7© 96
5.2.3 Mô tả chỉ tiết các lớp đối tượng -c¿-©ccxze+ccrsccee 98
5.2.4 Mô tả các ràng buộc toằn:vẹn - - - + cssxseerersrsee 102
5.3 Thiết kế cài đặf và triển khai c2cccccccvverrrrrrrrrrcree 105 5.3.1 Mô hình cài đặt . -2¿-©22+eee2EEEecEEEkerrrrkkrrrrrkrrrrrrree 105 5.3.2 Mô hìnHi triển khai hệ thống 2 22 ©2z2+2+ze+czvzee 106 5.4 Thiết kế gïao diện 2 2++222+ESEEEEE 2212.2211211 107 5.4.1: Sơ đồ Tiên kết các màn hình -2 2¿©zz+cv+ze+rzrsee 108 5.4.2 Thiết kế chỉ tiết một số màn hình -2- ¿+ 109
Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 121
6.1 Kết luận -22¿-©2+z+2EEEESEE111127111122711127111.22111 211122 6.2 Hướng phát triỂn 2 2+©++£©++++E++etExxttrxeerrxerrrreerrk
TÀI LIỆU THAM KHẢO
3:0009/e227.5 125
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 11
Trang 9Hình 1-8: Mô hình truy vấn đữ liệu Ểt- -1Ă%-cc5ccccccccccvecrrres 17 Hình 1-9: Mô hình truy vấn đữ liệu có hỗ trợ KML `› . - 20 Hình 1-10: Mô hình xử lý tìm kiếm `Ề, -22222se+ccvxererrveerrrrrerrrres 21
Hình 1-11: Mô hình mô tả vai trò của XML¡, -2 -522255scccce2 24 Hình 2-1: Mô hình DOM
18580 07.8
Hình 5-2: Mô hình quan hệ cơ sở dữ liệu . 5+ 555 ++s>+£+ez*++> 97
Hình 5-3: Mô hình cài Ga % 0.0.0 ccccccccssssssseesssecsssssssneeesssesesssssseteeseecessssees 105
Hình 5-4: Mô hình triển khai hệ thống . 2- + sz++ze+ee 107 Hình 5-5: Sơ đồ liên kết cáế màn hình -£©sc+e+tcvvvccee 108
Danh mục các bảng:
Bảng 2-1: Danh sách các kiểu dữ liệu của lược đồ XML -.- 33 Bảng 4-1: Danh sách các ALCfOT xxx ngư 65 Bảng 4-2: Danh sách các se-(Cas§e . -¿- + + +5 St #vEsEsEeeeeevrereree 66 Bảng 5-1: Danh sách các đối tượng lưu trữ đữ liệu - + 98
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 12
Trang 10Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
Chương 1: MỞ ĐÀU
1.1 Giới thiệu ứng dụng
Hệ thống quản lý dịch vụ khách hàng được xây dựng với mục tiêu chủ yếu
là hỗ trợ cho khách hàng khi có nhu cầu tìm hiểu thông tin về sản phẩm và dịch vụ của doanh nghiệp Hệ thống hoạt động như sau:
Khi khách hàng có nhu cầu tìm kiếm các thông.fin liên quan đến sản phẩm
va dịch vụ của công ty hay doanh nghiệp, khách hằng vào khu vực dịch vụ khách hàng (gọi là helpdesk) để tìm kiếm:thông tin trong các câu hỏi và câu
trả lời có sẵn (còn gọi là hé thong FAQ)
Trường hợp không tìm thấy thông tin cần thiết trong FAQ, khách hàng có thể gửi yêu cầu và yêu cầu(được giải đáp từ phía doanh nghiệp, công ty Khách hàng có thê gửi trực tiếp qua hệ thống website hỗ trợ khách hàng hoặc gửi email trực tiếp về địa chỉ email hỗ trợ của doanh nghiệp, khách hàng sẽ được giải đáp trong thời gïãñ nhanh nhất có thể
Nhân viêú phụ trách giải đáp yêu cầu của khách hàng sẽ xem xét yêu cầu
và giải đáp chö khách hàng, nếu yêu cầu gửi không đúng phòng ban sẽ được nhân viên chuyên qua phòng ban phù hợp
Nội dung câu hỏi và trả lời của mỗi yêu cầu được nhân viên tuyên chọn, sang lọc dé cập nhật vào FAQ Như thế khi khách hàng cần thông tin tương tự thì có thể tìm kiếm ngay trong hệ thống FAQ một cách nhanh chóng và tiện lợi
Quản trị hệ thống theo dõi quá trình giải quyết yêu cầu của các nhân viên, đảm bảo cho các yêu cầu của khách hàng được hỗ trợ kịp thời
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 9
Trang 111.2 Đối tượng và phạm vi của ứng dụng
1.2.1 Đối tượng
Hệ thống quản lý địch vụ khách hàng (eSupport) được xây đựng hướng đến các đối tượng là các doanh nghiệp, công ty vừa và lớn trong cả nước song song đó là các khách hàng giao dịch với doanh nghiệp Do nhu cầu cạnh tranh các đoanh nghiệp cần phải phục vụ tốt khách hàng về các mặt hỗ trợ thông
tin, giai dap, vi thế các doanh nghiệp này cần có hệ thống hỗ trợ dịch vụ
khách hàng để kịp thời đáp ứng yêu cầu của khách hăng trong quá trình giao dịch với doanh nghiệp
Đầu vào: Phân hệ hỗ trợ khách hàng ' Baur yêu
êu cầu, cầu được
download, we ' Phân hệ hỗ trợ hệ thống | /| van de tim ' kiêm được,
Hình 1-1: Pham vi hệ thống
Hệ thống được xây dựng để hỗ trợ, phục vụ khách hàng trong phạm vi
giữa doanh nghiệp và khách hàng xoay quanh các vấn đề về thông tin các sản
phẩm và dịch vụ của doanh nghiệp
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 10
Trang 12Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
1.3 Mục tiêu cần đạt được và các cách tiếp cận bài
toán
1.3.1 Mục tiêu cần đạt được
1.3.1.1 Yêu cầu chức năng
"Yêu cầu chức năng nghiệp vụ
Thực hiện đầy đủ các chức năng nghiệp vụ như tìm Kiếm yêu cầu, tạo yêu
cầu, giải quyết yêu cầu, tải tài liệu, tìm kiếm thông tin, v.va
"Yêu cầu chức năng hệ thống:
Thực hiện các chức năng tự động như: gởi câu trả lời cho khách hàng qua email, gởi thông báo qua email, thống kê, nhận yêu cầu của khách hàng qua
email, v.v Việc lưu trữ dữ liệu phải đạtchi phí tối thiểu và có sự ồn định
cao
1.3.1.2 Yêu cầu phi chức năng
Hệ thống hỗ trợ.địch vụ khách hàng làm việc hiệu quả, có thể giúp doanh
nghiệp giảm chỉ phí về thời gian và nhân lực, giúp doanh nghiệp giải đáp nhanh và chính xác khi khách hàng có yêu cầu, có thể hỗ trợ trực tuyến
(online), v.v
4.3.2 Các cách tiếp cận bài toán
Hệ thống hỗ trợ dịch vụ khách hàng không còn xa lạ với các doanh nghiệp trong cả nước vì tầm quan trọng và ích lợi của nó trong vấn dé giao dịch với
khách hàng Vì thế nhu cầu xây dựng một hệ thống phục vụ khách hàng cho
doanh nghiệp là cần thiết và tất yếu Nhưng khi bắt đầu xây dựng hệ thống,
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 11
Trang 13điều quan tâm đầu tiên của chúng ta là gì? Bất cứ hệ thống nào vấn đề quan
trọng đầu tiên cần được quan tâm là tổ chức tốt việc lưu trữ dữ liệu Nếu dữ liệu được tổ chức tốt thì hệ thống của chúng ta sẽ cải thiện về mọi mặt như tốc
độ truy xuất, chỉ phí lưu trữ, thời gian cập nhật, v.v Như vậy, làm cách nào
tổ chức tốt việc lưu trữ đữ liệu, nhất là ứng dụng của hệ thống dịch vụ khách
hàng chạy trong môi trường Internet, môi trường đa người dùng Ví dụ như khách hàng cần tìm kiếm những vấn đề về sản phẩm mà doanh nghiệp nào đó cung cấp, chúng ta lưu trữ dữ liệu như thế nào để cho việc tìm kiếm của khách hàng đạt hiệu quả là nhanh nhất Để giải quyết vấn đề này, một số giải pháp
cho vấn đề lưu trữ đữ liệu của hệ thống được đề nghị như sau:
Hinh 1-2: Giai phap 1
Ký hiệu: A_ Table hay A_ Database chỉ một đối tượng trong ngôn ngữ lập trình có thể giao tiếp với CSDL) quan hệ
1 Cơ sở đữ liệu
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 12
Trang 14Tim hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
Ưu điểm: Đây là mô hình đang được sử đụng rất phổ biến vì tận dụng được
những ưu điểm của hệ quản trị cơ sở dữ liệu
Khuyết điểm: Không linh động trong vấn đề trao đổi đữ liệu giữa các hệ
thống khác nhau đặc biệt là khi ứng dụng chạy trên web
Ưu điểm: Không phụ thuộc vào bất cứ hệ quản trị nào, dễ thực hiện
Khuyết điểm: Việc thao tác truy vấn trên tập tin XML? con nhiéu hạn chế
và vấn đề bảo mật không bằng hệ quản trị
1.3.2.3 Giải pháp 3
Theo giải pháp này, việc lưu trữ dữ liệu được tổ chức theo mô hình sau:
? Extensible Markup Language
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 13
Trang 15SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 14
Trang 16Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
Ưu điểm: Mô hình này nghiên về việc lưu trữ trên tập tin XML Và việc trao đổi giữa một đối tượng XMLDom và cơ sở đữ liệu quan hệ cũng dé dang
vì từ SQL Server 2000 trở lên đã hỗ trợ truy xuất trên tập tin XML
Khuyết điểm: Mặc dù từ SQL 2000 trở lên có hỗ trợ XML nhưng việc tao
ra tập tin XML vẫn còn bị lỗi do không thể tạo ra đúng cấu trúc mà người dùng mong đợi nếu như cấu trúc XML đó phức tạp
Ưu điển: Việc đọc/ghi trên từng đối tượng đã được tách riêng biệt ra dé
mỗi đối tượng chỉ làm đúng nhiệm vụ của đối tượng đó nên thuận tiện trong
vấn đề xử lý
Khuyết điểm: Vẫn đề là làm cách nào đề thực hiện việc chuyên đổi từ đối tượng XMLDom thành đối tượng Datatable và ngược lại
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 15
Trang 17Ưu điển: Việc trao đổi thông tin giữa các đốifượng rất linh động, vì một
đối tượng XMLDom có thể đọc/ghi trực tiếp đến CSDL quan hệ hoặc có thể
thông qua một Datatable
Khuyết điểm: Do có nhiều cách đọc/ghi nên phức tạp, khó quản lý
> Kết luận: Mỗi giải pháp có ưu điểm và khuyết điểm khác nhau Việc chọn lựa mô hình nào sẽ-tùy thứộc vào nhu cầu của ứng đụng của chúng ta Nghĩa là ứng dụng của chúng ta sẽ quan tam van dé nao? Van dé nao là vấn
đề được quan tam hang daw thi lúc đó chúng ta sẽ lựa chọn giải pháp lưu trữ
dữ liệu cho phù hợp
1.3.3 Vấn đề đặt ra cho hệ thống hỗ trợ dịch vụ khách
hàng
Vấn đề quan tâm hàng đầu của hệ thống là làm sao tăng tốc độ thực hiện
các thao tác truy vấn trên cơ sở dữ liệu quan hệ Ví dụ như khách hàng cần
tìm kiếm thông tin trong hệ thống FAQ, khách hàng sẽ nhập vào câu hỏi cần
tìm kiếm, sau đó chương trình sẽ thực hiện kết nối với SQL đề thực hiện câu
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 16
Trang 18Tim hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
truy vấn trả về thông tin tìm kiếm được cho khách hàng Mô hình thực hiện
được mô tả như sau:
câu hỏi tìm kiếm
Kết quả thực
hiện truy vấn Câu truy vấn Kết nối
với SQL
Hình 1-§: Mô hình truy vấn đữ liệu
Như vậy, nếu có nhiều Khách hàng có nhu cầu tìm kiếm thì mỗi khách
hàng đều phải kết hối đến SQL Server để lấy dữ liệu Và sẽ có trường hợp nhiều khách hăng đều cùng truy vấn đến cùng một đữ liệu, khi đó thời gian
thực hiện.câu truy vấn đề trả về kết quả sẽ rất chậm do phải thực hiện việc
điều khiển đồng thoi, phan bé tai nguyên để thực hiện câu truy van tai CSDL Một vấn đề khác đặt ra cho hệ thống là không chỉ tìm kiếm được vấn đề dựa trên câu hỏi mà phải tìm kiếm được tất cả những vấn đề có liên quan đến nội dung câu hỏi Nghĩa là nếu khách hàng nhập vào câu hỏi: “các vấn đề liên quan đến mạng và email” thì hệ thống sẽ phải trả về tất cả những vấn đề có liên quan đến từ khóa “mạng” và “email” Như vậy nếu chỉ đơn thuần tổ chức trên CSDL quan hệ thì không thể giải quyết được vấn đề này vì với cách thực
hiện trên CSDL quan hệ, mà cụ thể là SQL Server 2000, nó sẽ tìm đúng cụm
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 17
Trang 19từ “các vấn đề liên quan đến mạng và email” và nếu trong CSDL không có đúng cụm từ này thì kết quả trả về là không có, trong khi mong đợi của người dùng là trả ra những vấn đề có liên quan đến “mạng” và “email”
Tóm lại: Chúng ta có hai vấn đề cần giải quyết khi lưu trữ đữ liệu trên
SQL Server
— Tốc độ thực hiện câu truy van
—_ Việc tìm kiếm thông tin hiệu quả
Làm sao giải quyết được bài toán đặt ra cho hệ thống khi chỉ lưu trữ trên
CSDL quan hệ
1.4 Hướng giải quyết bài toán
Chúng ta thấy được việc sử dụng giải pháp 1 để lưu trữ dữ liệu sẽ không giải quyết được những vấn đề đặt ra cho bài toán Và như vậy cần thiết phải
sử dụng mô hình khác để hệ thông thực hiện khả thi hơn
Sau đây, chúng ta sẽ xem qua cách hệ thống thực hiện để giải quyết lần lượt các vấn đề trên, và từ đó chọn ra giải pháp lưu trữ thích hợp nhất
1.4.1 Về tốc độ thực hiện câu truy vấn
Nhu cầu khách hàng tìm kiếm các vấn đề cần giải đáp là thường xuyên xảy
ra và với tần suất rất cao nên việc lưu trữ trong SQL Server sẽ không khả thi
Nên chúng ta sẽ sử dụng thêm một cách lưu trữ nữa đó là trên tập tin mà cụ
thể là trên tập tin XML Giải pháp thực hiện cụ thể như sau:
Giả sử trong SQL Server ta lưu trữ dữ liệu của bảng Câu hỏi-Trả Lời
(FAQ) như sau:
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 18
Trang 20Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
FAQ ID FAQ QUESTION FAQ ANSWER FAQ TOP ID
Cách nhận biết người nhận Ban làm theo các FAQ00001 ' thư đã đọc thư của mình bước sau su TOP001
Bằng việc sử dụng các công cụ hỗ trợ trong.môi trường lập trinh Visual
Studio.NET, ta sẽ tạo được tập tin FAQ.xmI từ đữ liệu được lưu trữ trong
bảng FAQ có nội dung và cấu trúc như sau:
</FAO Cau Tra Loi>
<FAQ_Ngay_Cap_Nhat> 10-7-2005 </FAO Ngay_Cap_Nhat>
<FAO Ma Chu De> TOP001 </FAO Ma Chu De>
<FAO So Tan Xem> 10 </FAO So Lan Xem>
<FAO Ma Tai Lieu Tai Ve> DOC001 </EAO Ma Tai Lieu Tai Ve>
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 19
Trang 21
<FAO Cau Tra Loi> </FAO Cau Tra Loi>
<FAO Ngay Cap Nhat> </FAO Ngay Cap_Nhat>
</FAQ>
</Danh_sach_FAQ>
Như vậy, mỗi khi khách hàng có nhu cầu tìm kiếm trong hệ thống FAQ,
thì không cần phải thực hiện kết nối đến SQL Server, mà chỉ cần mở tập tin
FAQ.xml và thực hiện việc truy vấn trên tập tin XML,`cuối cùng trả về kết
quả cho khách hàng Như vậy, việc thực hiện trên tập tin sẽ nhanh hơn rat nhiều so với cơ sở đữ liệu (mở kết nối, tìm kiếm dữ liệu và thực hiện truy vấn
trên dữ liệu tìm được để cuối cùng cho ra kết quả như mong muốn =>truy vấn
câu hỏi tìm kiếm
Câu hỏi
Câu truy vấn
Kết quả thực hiện truy vấn
Chuyển đổi dữ liệu
Hình 1-9: Mô hình truy vấn đữ liệu có hỗ trợ XML
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 20
Trang 22Tìm hiểu công nghệ XML và xây dựng hệ thống quản lý dịch vụ khách hàng
1.4.2 Vấn đề tìm kiếm thông tin
Muốn kết quả tìm kiếm đúng như mong muốn người dùng thì phải dựa vào ngữ nghĩa của nội dung câu hỏi mà người dùng nhập vào Để làm được điều này thì phải dựa vào từ điển mới biết được chính xác ngữ nghĩa của câu
Theo đó, dựa trên tập tín FAQ.xml ở trên, chương trình sẽ trích từ dựa trên
từ điển bằng phương pháp LRMM (Left Right Maximum Matching)[4]
Sau đây là mô hình minh họa cho quá trình xử lý
Yêu cầu tim kiếm loại bỏ từ thừa Tríchtừvà —=— =| XML Ì
Theo phương pháp LRMM, để phân đoạn từ tiếng Việt trong một ngữ/câu,
ta đi từ trái sang phải và chọn từ có nhiều âm tiết nhất mà có mặt trong từ
điển, rồi cứ tiếp tục cho từ kế tiếp cho đến hết câu Với cách này, ta đễ đàng tách được chính xác các ngữ câu như: “hợp tác xã | mua bán”; “thành lập | nước | Việt Nam | dân chủ | cộng hòa” Tuy nhiên, phương pháp này sẽ tách
từ sai trong các trường hợp như: “học sinh | học sinh | học”; “một | ông | quan tài | giỏi” Mặc đù vậy, phương pháp này cũng tách từ chính xác đến 95%
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 21
Trang 23(theo giáo trình Xử lý ngôn ngữ tự nhiên) Vì vậy nhóm chúng em quyết định chọn phương pháp này để sử dụng trong việc trích từ này mặc đù nó chưa phải là phương pháp tối ưu nhất
Trở lại vấn đề trích từ cho tập tin FAQ.xml, bằng phương pháp LRMM, chúng ta sẽ trích được các từ trong tập tin FAQ.xml và lưu thành một tập tin FAQ Word.xml véi cấu trúc như sau:
Chủ thích: Danh sách các thẻ <FAQ> </FAQ> trong mỗi thẻ
<WORD> </WORDS> cho biết ứng với từ này thì có những tài liệu nào liên quan đến nó
Tập tin FAQ_Word.xml này sau đó sẽ qua một khâu nữa đó là loại bỏ những từ thừa gọi là kỹ thuật “stoplist” Chúng ta sẽ duyệt qua các từ trong tập tin FAQ_ Word.xml và so sánh với tập tin Stoplist.xml (đây là tập tin lưu
SVTH: Nguyễn Thị Kim Phượng GVHD: Th.S Nguyễn Trần Minh Thư
Trương Kiều Giang 22