Kết luận

Hơn 20 năm qua, các nhà nghiên cứu đã tốn rất nhiều công sức nhưng bài toán nhận dạng virus máy tính vẫn chưa được giải quyết trọn vẹn

Trang 1

Kết luận

5.1 Những đóng góp mới của đề tài

Hơn 20 năm qua, các nhà nghiên cứu đã tốn rất nhiều công sức nhưng bài toán nhận dạng virus máy tính vẫn chưa được giải quyết trọn vẹn Virus máy tính là

sản phẩm trí tuệ phản diện của con người Làm cách nào giúp máy tính học được cách điều trị của các chuyên gia anti-virus để máy tính có thể tự khám và chữa khỏi

bệnh? Để trả lời câu hỏi này, tiếp cận máy học và hệ chuyên gia được chọn nhằm giải quyết bài toán chẩn đoán virus máy tính, vốn phức tạp và vượt khỏi sức tính toán cơ học của con người

Nghiên cứu khoa học trí tuệ nhân tạo theo trình tự logic học từ thấp đến cao,

đề tài xây dựng một phương pháp tiếp nhận và vận dụng tri thức chuyên gia trên cơ

sở kế thừa và kết hợp ưu điểm, khắc phục nhược điểm của các tiếp cận đã có, nhằm giải quyết vấn đề một cách tự nhiên, phù hợp với bản chất của bài toán nhận dạng virus máy tính Phương pháp mới đó là:

Tiếp cận chuỗi mã+Tiếp cận hành vi+Tiếp cận ý định=Tiếp cận máy học và hệ chuyên gia

Virus máy tính vốn phức tạp với nhiều loại hình quấy rối, phát triển qua nhiều thời kỳ với nhiều biến thể, lai tạp, kế thừa đan xen nhau Tiếp cận giải quyết vấn đề bằng cách định nghĩa các lớp virus dựa vào đặc điểm dữ liệu, sau đó áp dụng các bài toán học phù hợp cho từng lớp Trong từng bài toán, các kỹ thuật học được

vận dụng linh hoạt: phân cụm dữ liệu bằng V-Tree, rút luật nhận dạng với R2LTA

và ARCRD; phân lớp và giản lược không gian quan sát với NNSRM; khắc phục

Chương 5

Trang 2

nhiễu bằng kỹ thuật hợp nhất dữ liệu DF2RV; vận dụng mô hình AMKBD phối hợp

CSDL và CSTT; học khái niệm hành vi bằng mô hình máy ảo; vận dụng mô hình

không gian vectơ sử dụng nguyên lý TF-IDF để phân loại và nhận dạng mã độc…

Không chỉ thiết kế riêng cho bài toán nhận dạng virus máy tính, các kỹ thuật này còn có thể áp dụng cho nhiều bài toán thuộc nhiều lĩnh vực khác nhau

Là một trong những người đề xướng phương pháp hệ chuyên gia anti-virus,

tác giả luận án đã nghiên cứu xây dựng hệ phần mềm MAV (Machine Learning

Approach to Anti-virus Expert System) trên hệ thống mạng cục bộ mô hình

client-server Là anti-virus hướng tri thức đầu tiên của Việt Nam, MAV còn là một trong bốn hệ chuyên gia anti-virus thực nghiệm công bố thông tin sớm nhất trên Internet

Đề tài mở ra hướng nghiên cứu mới trong lĩnh vực phòng chống virus máy tính nói riêng, góp phần xây dựng cơ sở lý thuyết cho việc phát triển các mô hình bảo vệ an toàn dữ liệu cho các hệ thống CNTT nói chung

5.2 Hạn chế của đề tài, cách khắc phục

Mặc dù “chia để trị” khá hiệu quả khi giải quyết bài toán nhận dạng virus trên tập dữ liệu không đồng nhất, nhưng chiến lược này cũng làm giảm số lượng tập mẫu trên mỗi lớp bài toán, khiến cho việc lựa chọn mô hình học gặp nhiều khó khăn

vì thiếu mẫu thử Đây cũng là hạn chế chung của các AV trong nước hiện nay

Hạn chế này có thể khắc phục bằng cách gia tăng số virus mẫu trong các lớp Việc làm này cần có thời gian (thu thập mẫu virus từ nhiều nguồn), kinh phí (mua tập mẫu) và nhân lực (đào tạo chuyên gia, chuyển giao công nghệ) Virus máy tính

là loại dữ liệu đặc biệt nguy hiểm, không dễ kiếm được số lượng lớn trong một thời gian ngắn (do cạnh tranh thương mại nên các anti-virus thường không chia xẻ tập mẫu virus cho các hãng “đối thủ”)

Để thu thập mẫu virus nhanh trong thời gian ngắn, có thể xây dựng một hệ

sandbox tạo “vùng trũng” thu hút virus trên hệ thống mạng toàn cầu Tuy nhiên,

phương án này cần kinh phí khá lớn để trang bị server, networking, thuê leased line, hosting, chi phí duy trì domain, nhân lực thiết kế và vận hành hệ thống…

Trang 3

5.3 Hướng phát triển tương lai

Để đáp ứng nhu cầu thực tiễn xã hội, đề tài chỉ tập trung nghiên cứu các loại virus máy tính lây lan trên các HĐH Windows 32 bit Theo xu thế phát triển của Internet, có thể dự báo loại hình quấy nhiễu tương lai vẫn là các loại mã độc lan truyền qua mạng Vì vậy lớp bài toán A-class phối hợp các kỹ thuật phân loại virus

và ước lượng mã độc là bài toán có hướng phát triển tốt nhất

Ngày nay, công nghệ phần cứng cũng phát triển mạnh mẽ Các bộ vi xử lý đa luồng, đa nhân, lõi kép… ngày càng phổ biến Công nghệ lưu trữ (RAM, HDD, CD-ROM, DVD…) cũng đa dạng, khả năng lưu trữ lớn, tốc độ truy xuất nhanh, chi phí thấp Khi rào cản về tốc độ xử lý và không gian lưu trữ của nhóm giải pháp

‘quay về quá khứ’ được giải tỏa, lớp bài toán E-class hướng tiếp cận ý định với cơ chế đa tác tử thông minh đa luồng xử lý sẽ có nhiều triển vọng

Tiếp cận máy học và hệ chuyên gia được vận dụng để xử lý virus máy tính dưới góc độ dữ liệu, do đó phương pháp này có thể áp dụng cho các loại virus lây trên các HĐH khác, chạy trên các kiến trúc máy tính khác, sau khi tái cấu trúc mô hình dữ liệu cho phù hợp Trong tương lai, các virus trên môi trường Windows 32 bit sẽ từng bước nhường chỗ cho virus Windows Vista 64 bit, như chúng đã từng truất phế các virus DOS 16 bit Tuy nhiên do tương thích đi lên, các HĐH mới phải chấp nhận các ứng dụng cũ Vì vậy các AV không thể loại bỏ hoàn toàn tập mẫu virus 16 bit và 32 bit trên môi trường mới Nói cách khác, việc các AV phải ‘gánh’ theo một CSDL mẫu virus khổng lồ qua nhiều thế hệ là điều khó tránh khỏi Vì vậy,

cơ chế phân loại CSDL để nhận dạng nhanh và giảm thiểu chi phí miền nhớ như cách làm của đề tài là lựa chọn tất yếu cho các anti-virus tương lai

Song song với xu hướng phát triển của các kiến trúc máy tính cá nhân, công nghệ liên lạc di động cũng phát triển mạnh với số lượng người dùng ngày càng gia tăng Mặc dù hiện nay các loại virus trên máy di động chưa phổ biến, nhưng tương lai chúng sẽ hình thành lực lượng quấy nhiễu đông đảo, gây tác hại không nhỏ cho người sử dụng Trong bối cảnh đó, các phương án phân hoạch không gian tìm kiếm

sẽ rất hữu dụng cho môi trường tài nguyên hạn chế của các thiết bị cầm tay

Trang 4

5.4 Đề nghị về các nghiên cứu tiếp theo

Nghiên cứu xây dựng các hệ phòng chống virus máy tính là việc làm cần thiết trong giai đoạn hiện nay Với những kết quả bước đầu, tiếp cận máy học và hệ chuyên gia đã mở ra hướng đi mới trong công nghệ anti-virus Các nghiên cứu tiếp theo cần tập trung cải tiến chất lượng các bài toán bằng cách bổ sung các mô hình học tiên tiến, áp dụng lý thuyết mờ để cải thiện độ dự báo bằng cách học các giá trị tích lũy của hằng số λ, nghiên cứu phương án kế thừa tri thức chuyên gia từ các hệ

AV khác, xây dựng hệ tích hợp tri thức chẩn đoán virus máy tính…

Kết quả nghiên cứu của đề tài giúp có thêm một phương pháp phòng chống virus mạnh mẽ, góp phần làm cho môi trường CNTT trong sạch hơn Tuy nhiên AV không phải là biện pháp bảo vệ duy nhất Khi có dịch, đặc biệt là bệnh lạ, một bác sĩ không thể chữa trị cho tất cả mọi người mà cần huy động cả bệnh viện, thậm chí cả guồng máy y tế Một AV không thể đơn lẻ bảo vệ an ninh dữ liệu cho cộng đồng mà cần sự phối hợp chặt chẽ với các AV khác nói riêng, các hệ thống an toàn dữ liệu nói chung Vì vậy, tiếp cận máy học và hệ chuyên gia trong lĩnh vực anti-virus là một hướng đi đúng đắn, tạo tiền đề nghiên cứu các hệ tích hợp tri thức chuyên gia, tiến tới xây dựng các trung tâm chẩn đoán virus máy tính trên mạng

Cùng với việc nghiên cứu các hình thức tấn công không xác định địa chỉ (virus máy tính, sâu trình, trojan horse…), cần nghiên cứu xây dựng cơ chế bảo vệ

hệ thống CNTT khỏi các cuộc tấn công có địa chỉ xác định (SPAM, DoS/DDoS, phishing, dirty tricks…) trên các website và cổng thông tin công cộng; từng bước

mở rộng nghiên cứu sang các hệ thống liên lạc di động (wireless, điện thoại cầm tay, máy iPod, máy nghe nhạc…) tạo thành một thế trận bảo vệ các hệ thống CNTT chặt chẽ, liên hoàn và vững chắc

YZ

Trang 5

CÔNG TRÌNH ĐÃ CÔNG BỐ

1 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Các giải pháp cho phần

mềm chống virus thông minh Tạp chí Tin học và Ðiều khiển, T.13, S.3 (1997),

123-132

2 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Các cơ chế chẩn đoán

virus tin học thông minh dựa trên tri thức Tạp chí Tin học và Ðiều khiển,T.14,

S.2 (1998), 45-52

3 Nguyen Thanh Thuy, Truong Minh Nhat Quang Expert System Approach to

Diagnosing and Destroying Unknown Computer Viruses Proceedings of the

IASTED International Conference Artificial Intelligence and Soft Computing 27-30 May 1998, Cancun – Mexico, 371-374 IASTED/ACTA Press

4 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Cây chỉ thị nhị phân biểu

diễn không gian trạng thái chẩn đoán virus tin học VN, Tạp chí Tin học &

Ðiều khiển, T.15, S.3 (1999), 40-45

5 Nguyen Thanh Thuy, Truong Minh Nhat Quang A Global Solution to

Anti-virus Systems The Proc of the 1st International Conference on Advanced

Communication Technology 10-12 Feb 1999, Muju-Korea, 374-377

6 Nguyễn Thanh Thủy, Trương Minh Nhật Quang Máy ảo, công cụ hỗ trợ

chẩn đoán và diệt virus tin học thông minh Tạp chí Tin học & Ðiều khiển,

T.16, S.2 (2000), 37-40

7 Hoang Kiem, Nguyen Thanh Thuy, Truong Minh Nhat Quang A Machine

Learning Approach to Anti-virus System Joint Workshop of Vietnamese

Society of AI, SIGKBS-JSAI, ICS-IPSJ and IEICE-SIGAI on Active Mining 4-7 Dec 2004, Hanoi-Vietnam, 61-65

8 Hoang Kiem, Nguyen Thanh Thuy, Truong Minh Nhat Quang Machine

Leaning Approach to Anti-virus Expert System with Nearest Neighbor Rule-based Structural RIVF’05, February 2005, Cantho-Vietnam 295-298.

Trang 6

9 Truong Minh Nhat Quang, Hoang Van Kiem, Nguyen Thanh Thuy Using

Null data Processing to Recognize Variant Computer Virus for Rule-based Anti-virus Systems The Proceedings of the IEEE International Conference on

Granular Computing May 2006, Atlanta-USA, 600-603

10 Truong Minh Nhat Quang, Hoang Van Kiem, Nguyen Thanh Thuy

Association Model of Knowledge Base and Database in Machine Learning Anti-virus System The Proceedings of the WMSCI 2006 Conference July

2006, Florida-USA, 277-282

11 Truong Minh Nhat Quang, Hoang Trong Nghia A Multi-agent Mechanism

in Machine Learning Approach to Anti-virus System In the Proceedings of the

2nd Symposium on Agents and Multi-Agent Systems, KES-AMSTA 2008, Korea Springer Lecture Notes in Artificial Intelligence, Vol 4953, 743-752

12 Trương Minh Nhật Quang, Hoàng Kiếm, Nguyễn Thanh Thủy Ứng dụng

Máy học và Hệ chuyên gia trong phân loại và nhận dạng virus máy tính Tạp

chí Công nghệ Thông tin và Truyền thông (ISSN 0866-7039) Số 19, 2-2008 (93-101), Việt Nam, 2008

13 Hoàng Kiếm, Trương Minh Nhật Quang Cơ chế máy học chẩn đoán virus

máy tính Tạp chí Tin học và Điều khiển học Số 1 (2008), Tập 24 (32- 41), Việt

Nam, 2008

Tiêu đề	Kết luận
Trường học	Trường Đại Học Công Nghệ Thông Tin
Chuyên ngành	Công Nghệ Thông Tin
Thể loại	Luận án
Thành phố	Thành phố Hồ Chí Minh

Định dạng
Số trang	6
Dung lượng	3,48 MB