Hơn 20 năm qua, các nhà nghiên cứu đã tốn rất nhiều công sức nhưng bài toán nhận dạng virus máy tính vẫn chưa được giải quyết trọn vẹn
Trang 1Kết luận
5.1 Những đóng góp mới của đề tài
Hơn 20 năm qua, các nhà nghiên cứu đã tốn rất nhiều công sức nhưng bài toán nhận dạng virus máy tính vẫn chưa được giải quyết trọn vẹn Virus máy tính là
sản phẩm trí tuệ phản diện của con người Làm cách nào giúp máy tính học được cách điều trị của các chuyên gia anti-virus để máy tính có thể tự khám và chữa khỏi
bệnh? Để trả lời câu hỏi này, tiếp cận máy học và hệ chuyên gia được chọn nhằm giải quyết bài toán chẩn đoán virus máy tính, vốn phức tạp và vượt khỏi sức tính toán cơ học của con người
Nghiên cứu khoa học trí tuệ nhân tạo theo trình tự logic học từ thấp đến cao,
đề tài xây dựng một phương pháp tiếp nhận và vận dụng tri thức chuyên gia trên cơ
sở kế thừa và kết hợp ưu điểm, khắc phục nhược điểm của các tiếp cận đã có, nhằm giải quyết vấn đề một cách tự nhiên, phù hợp với bản chất của bài toán nhận dạng virus máy tính Phương pháp mới đó là:
Tiếp cận chuỗi mã+Tiếp cận hành vi+Tiếp cận ý định=Tiếp cận máy học và hệ chuyên gia
Virus máy tính vốn phức tạp với nhiều loại hình quấy rối, phát triển qua nhiều thời kỳ với nhiều biến thể, lai tạp, kế thừa đan xen nhau Tiếp cận giải quyết vấn đề bằng cách định nghĩa các lớp virus dựa vào đặc điểm dữ liệu, sau đó áp dụng các bài toán học phù hợp cho từng lớp Trong từng bài toán, các kỹ thuật học được
vận dụng linh hoạt: phân cụm dữ liệu bằng V-Tree, rút luật nhận dạng với R2LTA
và ARCRD; phân lớp và giản lược không gian quan sát với NNSRM; khắc phục
Chương 5
Trang 2nhiễu bằng kỹ thuật hợp nhất dữ liệu DF2RV; vận dụng mô hình AMKBD phối hợp
CSDL và CSTT; học khái niệm hành vi bằng mô hình máy ảo; vận dụng mô hình
không gian vectơ sử dụng nguyên lý TF-IDF để phân loại và nhận dạng mã độc…
Không chỉ thiết kế riêng cho bài toán nhận dạng virus máy tính, các kỹ thuật này còn có thể áp dụng cho nhiều bài toán thuộc nhiều lĩnh vực khác nhau
Là một trong những người đề xướng phương pháp hệ chuyên gia anti-virus,
tác giả luận án đã nghiên cứu xây dựng hệ phần mềm MAV (Machine Learning
Approach to Anti-virus Expert System) trên hệ thống mạng cục bộ mô hình
client-server Là anti-virus hướng tri thức đầu tiên của Việt Nam, MAV còn là một trong bốn hệ chuyên gia anti-virus thực nghiệm công bố thông tin sớm nhất trên Internet
Đề tài mở ra hướng nghiên cứu mới trong lĩnh vực phòng chống virus máy tính nói riêng, góp phần xây dựng cơ sở lý thuyết cho việc phát triển các mô hình bảo vệ an toàn dữ liệu cho các hệ thống CNTT nói chung
5.2 Hạn chế của đề tài, cách khắc phục
Mặc dù “chia để trị” khá hiệu quả khi giải quyết bài toán nhận dạng virus trên tập dữ liệu không đồng nhất, nhưng chiến lược này cũng làm giảm số lượng tập mẫu trên mỗi lớp bài toán, khiến cho việc lựa chọn mô hình học gặp nhiều khó khăn
vì thiếu mẫu thử Đây cũng là hạn chế chung của các AV trong nước hiện nay
Hạn chế này có thể khắc phục bằng cách gia tăng số virus mẫu trong các lớp Việc làm này cần có thời gian (thu thập mẫu virus từ nhiều nguồn), kinh phí (mua tập mẫu) và nhân lực (đào tạo chuyên gia, chuyển giao công nghệ) Virus máy tính
là loại dữ liệu đặc biệt nguy hiểm, không dễ kiếm được số lượng lớn trong một thời gian ngắn (do cạnh tranh thương mại nên các anti-virus thường không chia xẻ tập mẫu virus cho các hãng “đối thủ”)
Để thu thập mẫu virus nhanh trong thời gian ngắn, có thể xây dựng một hệ
sandbox tạo “vùng trũng” thu hút virus trên hệ thống mạng toàn cầu Tuy nhiên,
phương án này cần kinh phí khá lớn để trang bị server, networking, thuê leased line, hosting, chi phí duy trì domain, nhân lực thiết kế và vận hành hệ thống…
Trang 35.3 Hướng phát triển tương lai
Để đáp ứng nhu cầu thực tiễn xã hội, đề tài chỉ tập trung nghiên cứu các loại virus máy tính lây lan trên các HĐH Windows 32 bit Theo xu thế phát triển của Internet, có thể dự báo loại hình quấy nhiễu tương lai vẫn là các loại mã độc lan truyền qua mạng Vì vậy lớp bài toán A-class phối hợp các kỹ thuật phân loại virus
và ước lượng mã độc là bài toán có hướng phát triển tốt nhất
Ngày nay, công nghệ phần cứng cũng phát triển mạnh mẽ Các bộ vi xử lý đa luồng, đa nhân, lõi kép… ngày càng phổ biến Công nghệ lưu trữ (RAM, HDD, CD-ROM, DVD…) cũng đa dạng, khả năng lưu trữ lớn, tốc độ truy xuất nhanh, chi phí thấp Khi rào cản về tốc độ xử lý và không gian lưu trữ của nhóm giải pháp
‘quay về quá khứ’ được giải tỏa, lớp bài toán E-class hướng tiếp cận ý định với cơ chế đa tác tử thông minh đa luồng xử lý sẽ có nhiều triển vọng
Tiếp cận máy học và hệ chuyên gia được vận dụng để xử lý virus máy tính dưới góc độ dữ liệu, do đó phương pháp này có thể áp dụng cho các loại virus lây trên các HĐH khác, chạy trên các kiến trúc máy tính khác, sau khi tái cấu trúc mô hình dữ liệu cho phù hợp Trong tương lai, các virus trên môi trường Windows 32 bit sẽ từng bước nhường chỗ cho virus Windows Vista 64 bit, như chúng đã từng truất phế các virus DOS 16 bit Tuy nhiên do tương thích đi lên, các HĐH mới phải chấp nhận các ứng dụng cũ Vì vậy các AV không thể loại bỏ hoàn toàn tập mẫu virus 16 bit và 32 bit trên môi trường mới Nói cách khác, việc các AV phải ‘gánh’ theo một CSDL mẫu virus khổng lồ qua nhiều thế hệ là điều khó tránh khỏi Vì vậy,
cơ chế phân loại CSDL để nhận dạng nhanh và giảm thiểu chi phí miền nhớ như cách làm của đề tài là lựa chọn tất yếu cho các anti-virus tương lai
Song song với xu hướng phát triển của các kiến trúc máy tính cá nhân, công nghệ liên lạc di động cũng phát triển mạnh với số lượng người dùng ngày càng gia tăng Mặc dù hiện nay các loại virus trên máy di động chưa phổ biến, nhưng tương lai chúng sẽ hình thành lực lượng quấy nhiễu đông đảo, gây tác hại không nhỏ cho người sử dụng Trong bối cảnh đó, các phương án phân hoạch không gian tìm kiếm
sẽ rất hữu dụng cho môi trường tài nguyên hạn chế của các thiết bị cầm tay
Trang 45.4 Đề nghị về các nghiên cứu tiếp theo
Nghiên cứu xây dựng các hệ phòng chống virus máy tính là việc làm cần thiết trong giai đoạn hiện nay Với những kết quả bước đầu, tiếp cận máy học và hệ chuyên gia đã mở ra hướng đi mới trong công nghệ anti-virus Các nghiên cứu tiếp theo cần tập trung cải tiến chất lượng các bài toán bằng cách bổ sung các mô hình học tiên tiến, áp dụng lý thuyết mờ để cải thiện độ dự báo bằng cách học các giá trị tích lũy của hằng số λ, nghiên cứu phương án kế thừa tri thức chuyên gia từ các hệ
AV khác, xây dựng hệ tích hợp tri thức chẩn đoán virus máy tính…
Kết quả nghiên cứu của đề tài giúp có thêm một phương pháp phòng chống virus mạnh mẽ, góp phần làm cho môi trường CNTT trong sạch hơn Tuy nhiên AV không phải là biện pháp bảo vệ duy nhất Khi có dịch, đặc biệt là bệnh lạ, một bác sĩ không thể chữa trị cho tất cả mọi người mà cần huy động cả bệnh viện, thậm chí cả guồng máy y tế Một AV không thể đơn lẻ bảo vệ an ninh dữ liệu cho cộng đồng mà cần sự phối hợp chặt chẽ với các AV khác nói riêng, các hệ thống an toàn dữ liệu nói chung Vì vậy, tiếp cận máy học và hệ chuyên gia trong lĩnh vực anti-virus là một hướng đi đúng đắn, tạo tiền đề nghiên cứu các hệ tích hợp tri thức chuyên gia, tiến tới xây dựng các trung tâm chẩn đoán virus máy tính trên mạng
Cùng với việc nghiên cứu các hình thức tấn công không xác định địa chỉ (virus máy tính, sâu trình, trojan horse…), cần nghiên cứu xây dựng cơ chế bảo vệ
hệ thống CNTT khỏi các cuộc tấn công có địa chỉ xác định (SPAM, DoS/DDoS, phishing, dirty tricks…) trên các website và cổng thông tin công cộng; từng bước
mở rộng nghiên cứu sang các hệ thống liên lạc di động (wireless, điện thoại cầm tay, máy iPod, máy nghe nhạc…) tạo thành một thế trận bảo vệ các hệ thống CNTT chặt chẽ, liên hoàn và vững chắc
YZ
Trang 5CÔNG TRÌNH ĐÃ CÔNG BỐ
1 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Các giải pháp cho phần
mềm chống virus thông minh Tạp chí Tin học và Ðiều khiển, T.13, S.3 (1997),
123-132
2 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Các cơ chế chẩn đoán
virus tin học thông minh dựa trên tri thức Tạp chí Tin học và Ðiều khiển,T.14,
S.2 (1998), 45-52
3 Nguyen Thanh Thuy, Truong Minh Nhat Quang Expert System Approach to
Diagnosing and Destroying Unknown Computer Viruses Proceedings of the
IASTED International Conference Artificial Intelligence and Soft Computing 27-30 May 1998, Cancun – Mexico, 371-374 IASTED/ACTA Press
4 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Cây chỉ thị nhị phân biểu
diễn không gian trạng thái chẩn đoán virus tin học VN, Tạp chí Tin học &
Ðiều khiển, T.15, S.3 (1999), 40-45
5 Nguyen Thanh Thuy, Truong Minh Nhat Quang A Global Solution to
Anti-virus Systems The Proc of the 1st International Conference on Advanced
Communication Technology 10-12 Feb 1999, Muju-Korea, 374-377
6 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Máy ảo, công cụ hỗ trợ
chẩn đoán và diệt virus tin học thông minh Tạp chí Tin học & Ðiều khiển,
T.16, S.2 (2000), 37-40
7 Hoang Kiem, Nguyen Thanh Thuy, Truong Minh Nhat Quang A Machine
Learning Approach to Anti-virus System Joint Workshop of Vietnamese
Society of AI, SIGKBS-JSAI, ICS-IPSJ and IEICE-SIGAI on Active Mining 4-7 Dec 2004, Hanoi-Vietnam, 61-65
8 Hoang Kiem, Nguyen Thanh Thuy, Truong Minh Nhat Quang Machine
Leaning Approach to Anti-virus Expert System with Nearest Neighbor Rule-based Structural RIVF’05, February 2005, Cantho-Vietnam 295-298.
Trang 69 Truong Minh Nhat Quang, Hoang Van Kiem, Nguyen Thanh Thuy Using
Null data Processing to Recognize Variant Computer Virus for Rule-based Anti-virus Systems The Proceedings of the IEEE International Conference on
Granular Computing May 2006, Atlanta-USA, 600-603
10 Truong Minh Nhat Quang, Hoang Van Kiem, Nguyen Thanh Thuy
Association Model of Knowledge Base and Database in Machine Learning Anti-virus System The Proceedings of the WMSCI 2006 Conference July
2006, Florida-USA, 277-282
11 Truong Minh Nhat Quang, Hoang Trong Nghia A Multi-agent Mechanism
in Machine Learning Approach to Anti-virus System In the Proceedings of the
2nd Symposium on Agents and Multi-Agent Systems, KES-AMSTA 2008, Korea Springer Lecture Notes in Artificial Intelligence, Vol 4953, 743-752
12 Trương Minh Nhật Quang, Hoàng Kiếm, Nguyễn Thanh Thủy Ứng dụng
Máy học và Hệ chuyên gia trong phân loại và nhận dạng virus máy tính Tạp
chí Công nghệ Thông tin và Truyền thông (ISSN 0866-7039) Số 19, 2-2008 (93-101), Việt Nam, 2008
13 Hoàng Kiếm, Trương Minh Nhật Quang Cơ chế máy học chẩn đoán virus
máy tính Tạp chí Tin học và Điều khiển học Số 1 (2008), Tập 24 (32- 41), Việt
Nam, 2008