ỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA CÔNG NGHỆ THÔNG TIN 1 Đ ÁN TỐT NGHIỆP ĐẠI HỌC ĐỀ TÀI: PHÁT HIỆN ĐỘT NHẬP DỰA TRÊN KHAI PHÁ CÁC LUẬT KẾT HỢP MỜ VÀ LẬP TRÌNH TIẾN HÓA Giảng viên hướng dẫn : TS. H N U N ẬU Sinh viên thực hiện : N U ỄN V N N Lớp : D07CNPM2 Khóa : 10 (2007 – 2012) Hệ : Chính quy Hà Nội, tháng 12 năm 2011 i LỜI CẢ ƠN Trước tiên, em xin gửi lời biết ơn sâu sắc nhất tới Thầy giáo TS. H ng n , người đã tận tình chỉ bảo, đ n ướng em trong suốt quá trình học tập và t i n đồ n n đồng t ời gi tiế ận ới ương tư u ng i n u ọ ới Em xin gửi lời cả ơn ân t n tới tất cả t ầ gi gi tr ng khoa Công ngh thông tin cùng c thầy, cô gi trong ơ ản - Học vi n Công ngh Bưu hính Viễn t ng đã tận tình đ ng i n giúp đ em tr ng suốt u tr n ọ tậ ng i n u in gửi ời ả ơn ân t n n ất tới gi đ n n đã ết ng tin tư ng đ ng i n đ ng g n ng iến u u tr ng suốt u tr n t i n đ t i n Xin chân thành cả ơn! Hà N i t ng 12 nă 2011 Sinh viên th c hi n Ng n Văn N m
Trang 1KHOA CÔNG NGHỆ THÔNG TIN 1
Đ ÁN TỐT NGHIỆP ĐẠI HỌC
ĐỀ TÀI:
PHÁT HIỆN ĐỘT NHẬP DỰA TRÊN KHAI PHÁ CÁC LUẬT KẾT HỢP MỜ
Trang 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA CÔNG NGHỆ THÔNG TIN 1
Đ ÁN TỐT NGHIỆP ĐẠI HỌC
ĐỀ TÀI:
PHÁT HIỆN ĐỘT NHẬP DỰA TRÊN KHAI PHÁ CÁC LUẬT KẾT HỢP MỜ
Trang 3LỜI CẢ ƠN
Trước tiên, em xin gửi lời biết ơn sâu sắc nhất tới Thầy giáo TS H ng n ,
người đã tận tình chỉ bảo, đ n ướng em trong suốt quá trình học tập và t i n đồ
n n đồng t ời gi tiế ận ới ương tư u ng i n u ọ ới
Em xin gửi lời cả ơn ân t n tới tất cả t ầ gi gi tr ng khoa Công ngh thông tin cùng c thầy, cô gi trong ơ ản - Học vi n Công ngh Bưu hính Viễn t ng đã tận tình đ ng i n giúp đ em tr ng suốt u tr n ọ tậ
ng i n u
in gửi ời ả ơn ân t n n ất tới gi đ n n đã ết ng tin tư ng đ ng
i n đ ng g n ng iến u u tr ng suốt u tr n t i n đ t i n Xin chân thành cả ơn!
Hà N i t ng 12 nă 2011
Sinh viên th c hi n
Ng n Văn N m
Trang 4C C
LỜI CẢ ƠN i
C C ii
NHẬN ÉT, ĐÁNH IÁ, CH ĐIỂM iv
NHẬN ÉT, ĐÁNH IÁ, CH ĐIỂM v
NH C CÁC T VIẾT T T vi
NH C CÁC H NH V vii
DANH M C CÁC BẢNG viii
Đ U 1
CHƯƠN 1: TỔNG QUAN VỀ PHÁT HIỆN ĐỘT NHẬP 3
1.1 Các vấn đ an toàn m ng ương đảm bảo an toàn 3
1.1.1 u ầu đả ả t n n t n t ng tin t ống 4
1.1.2 ng tấn ng đ t n ậ ng t ường g 5
1.1.3 i n ống tấn ng đ t n ậ ng 10
1.2 ương t i n đ t nhập 13
1.2.1 ân i tr n t uật ân t i u 14
1.2.2 ân i tr n nguồn i u 14
1.3 Các k thuật xử i u t ường ng trong phát hi n đ t nhập 16
1.3.1 t uật ân t t ống 16
1.3.2 t uật ọ 16
1.3.3 t uật ng nơ-ron 17
1.3.4 ương ết 17
1.4 Mô tả i t n đ xuất tr ng đồ án 18
1.5 ết ương 18
CHƯƠN 2 : CƠ THU ẾT 19
2.1 i i u sử ng uật ết 19
2.1.1 iới t i u t ống i i u 20
2.1.2 i i u ng uật ết 23
2.2 Giới thi u v lý thuyết tập mờ 25
Trang 52.2.2 ương pháp tính hàm thành viên 29
2.3 K thuật lập trình tiến hóa GNP 30
2.3.1 Cấu tr ơ ản của GNP 31
2.3.2 ơ ế làm vi c của GNP 33
2.3.3 Các toán tử di truy n 34
2.4 ết ương 37
CHƯƠN : ỰN H NH PHÁT HIỆN ĐỘT NHẬP Ự T N H I PHÁ UẬT ẾT HỢP Ờ V ẬP T NH TIẾN H NP 38
3.1 â ng n t i n đ t n ậ tr n i uật ết ờ ậ tr n tiến 38
3.1.1 Ti n ử i u 38
3.1.2 i uật ết ờ 41
3.1.3 â ng ân ớ n t i n đ t n ậ 48
3.2 i đ t t ử ng i 49
3.3 ết uả – đ n gi 51
3.3.1 ết uả t ử ng i 51
3.3.2 n gi ết uả gi ris t ining n u t ining 53
3.4 ết ương 55
CHƯƠN 4 : ẾT UẬN 56
4.1 ết uả đ t đư 56
4.2 ướng ng i n u tương i 56
T I IỆU TH HẢ 57
Trang 6NHẬN ÉT, ĐÁNH IÁ, CH ĐIỂ
(Của người hướng dẫn)
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
Điểm: ……… ………( ằng ch : … ……… … )
Đồng ý/ hông đồng ý cho sinh viên bảo v trước h i đồng chấ đồ án tốt nghi p?
Hà nội, ngày tháng 12 năm 2011
Trang 7NHẬN ÉT, ĐÁNH IÁ, CH ĐIỂM
(Của người phản biện)
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
Điểm: ……… ………( ằng ch : … ……… … )
Đồng ý/ hông đồng ý cho sinh viên bảo v trước h i đồng chấ đồ án tốt nghi p?
Hà nội, ngày tháng 12 năm 2011
Trang 8NH C CÁC T VIẾT T T
IDS Intrusion Detection System
HIDS Host-based instrusion detection systems
SVM Support Vector Machines (SVM)
Trang 9NH C CÁC H NH V
n 1 1 ương tr n i 6
n 1 2 Tấn ng gi n đ n 7
n 1 Tấn ng ng tr 8
n 1 Tấn ng giả 9
Hình 1.5 Tấn ng t đổi gói tin 9
n 1 ngăn n đ t n ậ 10
Hình 1.7 Mô tả NIDS 15
Hình 1.8 Mô tả HIDS 15
Hình 2.1 Kiến tr điển hình của h thống khai phá d li u 20
Hình 2.2 Quá trình khai phá d li u 21
n 2 ồ t gi tr ủ t iến tr ng gi n ân 27
n 2 ồ t gi tr ủ t iến tr ng gi ờ 27
n 2 iểu iễn i u ằng tậ ờ 27
Hình 2.6 Minh họa mi n tin cậy và mi n đ nh của tập mờ 29
Hình 2.7 Cấu tr ơ ản của cá thể GNP 32
Hình 2.8 Biểu đồ luồng th c thi GNP 34
Hình 2.9 Ví d v phép lai ghép 35
Hình 2.10 Ví d v é đ t biến 36
n 1 t uật ân i t u t n 39
n 2 t n i n ờ t u t n i n t 40
n ng t n i n ờ t u t n i n t 41
n ấu tr đơn giản i i uật ết 42
n suất u ển t t u g nt n s ng t n 43
n s r n n t tiế ận tất đ n 44
n ân ớ tr ng t i n đ t n ậ ng isus 48
n ố uật i đư u t ế 51
Trang 10NH C CÁC BẢN
Bảng 1 t u t n ngu n t ủ ủ u 50
Bảng 2 t số i đ t n đ uất 51
Bảng ết uả iể t ử t i n đ t n ậ ng isus 52
Bảng ết uả t ủ t uật ọ tr n u 53
Bảng ết uả t ử ng i ủ ương ris t ining 54
Trang 11Đ U
S phát triển m nh m của máy vi tính và ng nt rn t đã ng i n người rất nhi u l i ích trong mọi ĩn c của cu c sống: học tập, nghiên c u tr đổi thông tin, kinh doanh, quản … Internet đã ần tr thành m t thành phần cốt yếu của xã h i thông tin hi n đ i Tu n i n đ c tính m của Internet, s an toàn của h thống máy tính và
d li u n ân u n ngu ơ xâm nhập trái phép S phát triển r ng khắp của Internet đã iến vấn đ ng ống phát hi n ngăn n đ t nhập m ng tr thành
m t thành phần c c kỳ quan trọng trong vi c bảo v ơ s h tầng m ng máy tính
i n n đã n i u giải t i n đ t n ậ ng đư ng i n u t triển B n n n ng t n n ế t giải n ng đã n ng t n
ng n ất đ n ới t t i n đ t n ậ ồ n n tr n t ương tiế ận ới i â ng t n t i n đ t n ậ ng tr n i uật ết ờ ậ tr n tiến , ới ng uốn ắ đư t số
n ư điể ủ ương i n nâng ả năng t i n n ng đ t n ậ
Chư ng ựng mô h nh hát hiện đột nh ự t ên h i há á t
t h mờ v t nh ti n h NP: ương n tậ trung ương ết
c ơ s t u ết đã đư ng i n u tr n trướ đ u tr n â ng
n t i n đ t n ậ ới Tiến n i đ t t ử ng i n đ uất tr n
n ng ết uả đ t đư ủ i đ t t ử ng i đư r n ng s s n đ n gi
n đ uất ới t số n i n
Chư ng 4: t n: Tổng ết i t n n ng ng i đã t i n đư tr ng
đồ n n tr n n ng ết uả đ t đư n u r n ng ướng ng i n u t triển
tr ng tương i t ướng tiế ận đ uất
Trang 12n ế t iến t t ời gi n đồ n ng tr n i t iếu s t
ậ rất ng n ận đư n ng iến đ ng g ủ t ầ gi n để
t ể n t i n ơn iến t ủ n n ng ng i n u s u n
Trang 13CHƯƠN 1: TỔN QU N VỀ PHÁT HIỆN ĐỘT NHẬP
Tr ng ương n trước hết ng t s ét t tổng u n ấn đ n
t n t ống t ng tin T ng u i ân t ng tấn ng đ t n ậ t ống
ng t s đư r i n ung n ằ đả ả n t n ng ần tiế t s
tr n t ể ơn ương t i n đ t n ậ ng n ư t uật ử
i u tr ng t i n đ t n ậ uối ng s tả ung i t n đư đ uất
tr ng đồ n n
1.1 Cá vấn đ n t n mạng v á hư ng há đảm bả n t n
t triển n ủ ọ t n đ i t Internet đã ng i n người rất n i u i tr ng ọi ĩn ủ u sống T i ọ tậ ng i n u
tr đổi t ng tin đến in n uản giải tr … Internet đã t tr ng gần n ư ầu
ết ĩn tr ng u sống đã ần tr t n t t n ần ốt ếu ủ ã i
t ng tin i n đ i t tr ng n ng ưu điể ớn ủ Internet s ới ương ti n tr đổi t ng tin đ s đ ng iểu i u: i u ăn ản i u đ ương
ti n n ư n ản â t n i ng ng ần ả t iết
ần ng i n t đư t triển ải tiến n ằ tr gi n người tr ng i i
t tr đổi t ng tin u ng Internet t i u uả Tu n i n n ng ưu điể ư t tr i ủ n Internet ng t tr ng n ng ương ti n n ng
đ ấu
nt n t đư sử ng ương ti n để t i n đ tấn ng â
n ậ t i ngu n ng tr i é Tr n đường tru n g i tin tr đổi t ể â i
n ư ng tr i u giả g i tin… ối ới t ống ấu t ể â n ậ
t ống tr i é i t tr i é t i ngu n i ần gi n đi ng i trọng ơn t ể iế u n đi u iển t i t t ống ng n i n
t ể gâ r n ng tổn t ất n ng n n ất ới t ống ớn n ư ng uân s ngân ng… đ i ả t ống t ng tin ủ tổ n ân sử ng ng Internet ết s u n trọng
Trang 141.1.1 Cá ê đảm bả t nh n t n h thông tin v hệ th ng
An oàn n đả ả t ống đư sẵn s ng sử ng i n ng t
nhân đư ân u n t ể t ống ần đả ả u ầu s u:
n A n on : t t u tr n đả ả t ng tin tr đổi
gi n gửi n n ận đ ng tin ậ g ĩ đả ả g i tin n n ận n ận
đư đ ng ủ n gửi n n ận uốn tr đổi t ng tin ới t
t t ường t ấ n ất trường người ng đăng n ậ t t ống t ng tin t ống n s u ầu người ng n ậ t số t ng tin ần t iết : T n người ng (us rn ) ật ẩu ( ss r ) để u ết đ n ả năng tru ậ
t ống ủ người ng
n n A o on : ân u n t ương ả t i ngu n
t ống t ng tin ằng giới n u n tru ậ t i ngu n t ống đối ới
t ng người ng t số iểu ân u n n ư: u n đọ i u u n ỉn sử
m o n A on o : L ả năng iể s t n ế tru ậ tới
ủ ương tr n ng ng đối ới t ng người ng i iể s t n
t ể t i n tậ trung t n t ống ri ng đối ới t ng t t ể iể
s t tru ậ t ể đư ng uản t i ngu n ật n ư t iết ần
ng t i ngu n gi n ư t i ản ngân ng t i ngu n số n ư: u n
đọ t đổi đối ới t t ăn ản
T ng tin đư c coi là tài sản của m t h thống t ng tin đ đ u ầu v an toàn
thông tin là m t yêu cầu tối quan trọng An oàn n n i n n ằ đả ả
t n ất s u ủ thông tin:
n m on n : ả ả ỉ n ưng người ng u n ới đư
é tru uất t ng tin i u i n u n i u ri ng tư n ân n ư: i
t t n ng… t ng tin ỉ n ri ng n ân s u n i u ủ t
tổ n ng i n ư: u tr n sản uất ương t c kinh doanh… t ỉ t
số n ân n ất đ n i n u n ng i ới u n tru ậ
Trang 15 n oàn n n : T n t n ẹn i u đả ả i u đư ưu tr
ngu n ẹn t ống n ất tr ng đi u i n ưu tr t i n tru n t ng
tr ng t ương i đi n tử i u số ư ng gi ả … ủ ng ải t ống
n ất ỉ n ng người t ẩ u n ới t ể tru ậ t đổi i u
i u ng t đổi tr ng u tr n tru n t ng gi tr tr ng t ống
n n on-repudiation): ả ả nếu t n gửi n ận t
g i tin t n đ ng t ể ủ n ận đư đi u n đ i n n ận n ận đư
t g i tin t n n ận t ể đ n đư g i tin n đư gửi t n gửi Tương t n gửi ng t ể ẳng đ n đư g i tin đã đư n ận i n
1.1.2.1 Tấn ông b ng á h n m m há h ại
ần i n gọi là các phần m t n ( r ) n ng ần
đư t iết ế â ng n ằ đ tấn ng gâ tổn t ất iế ng ất
t i ngu n ủ t n ng ần n t ường đư ấu ng
tr ng n ư ần ng i t â n ậ t ật t n
ti u Có 2 lo i phần m m phá ho i: Phần m m phá ho i ph thu ương tr n ủ
và phần m m phá ho i đ c lậ ương tr n ủ n ư in ọa trên Hình 1.1 T s
ét ơ ế i ủ t ng i ần n
Trap-Door: n gọi B r điể ương tr n ật é
người tru ậ u t ủ t iể tr n nin t ng t ường Tr - r t ường
ậ tr n i n t r tr ng u tr n t triển ần Tu n i n nếu n ư
để tr ng ương tr n sản ẩ Tr - r t ể i t i n ng tấn ng
tr t n ối đ ọ ớn t ống
Logic Bomb: L t đ n ã n ng tr ng ương tr n L gi B
ương t t đ ng giống n ư t uả B n t ể t t i t ãn
t số đi u i n đ n L gi B i đư t s i t ống n ư
Trang 16iến đổi fi t ống ng ng t đ ng …
n 1 1 ương tr n i
Trojan Horse: L t đ n ã đư ấu tr ng t ương tr n t ường rất ấ
ẫn n ư: ần nâng ấ … i ương tr n đư người ng
t t i đ n ã ấu s t đ ng é tấn ng t i n đ ủ mình
Viruses: L t đ n ã ương tr n n t i n t đ i n đ
ả năng t n ân ản s é n n đối tư ng â n iễ n ư:
fi ổ đĩ irus n iễ ương tr n ằng sử ương tr n n
i i ương tr n đã n iễ irut đư t irus s tiế t â n iễ s ng ương tr n t số i irus n ả năng “ iến n ” ng ĩ t t đổi đ n ã ủ n để tr n s t i n ủ ần i t irus
Worm: L t ương tr n đ ậ ả năng t n ân ản giống n ư irus
Trojan Horse
Viruses
Worms Zombie
ần ả năng t n ân ản
Trang 17r tr n t n n iễ
Zombie: L t ương tr n đ ậ ả năng ật ống ế t t n ết
nối Internet Z i s sử ng t n ống ế n để ắt đầu n ng
u tấn ng rất để ần r ấu ết ủ người đã t r n
1.1.2.2 Tấn ông v t i ng ên mạng
ng ấu tấn ng t i ngu n ng n ư đường tru n g i tin tr n đường tru n t i ngu n t ng tin ủ t ống n ằ i t tr i é t i ngu n t ống t t i t t ống ng tấn ng n gồ :
n n : ng u tấn ng tr tiế t ng t ường đư sử ng tr ng
gi i đ n đầu để iế u n tru n ậ n tr ng t ương tấn ng ổ điển
là dò tìm tên người sử ng ật ẩu â ương đơn giản ễ t i n
ng đ i i t đi u i n đ i t n để ắt đầu tấn ng t ể sử ng
n ng t ng tin n ư t n người ng ng sin đ ỉ số n để đ n ật ẩu
Tr ng trường đư n s người sử ng n ng t ng tin i trường
i t ương tr n t đ ng i t ật ẩu n ả năng
t n ng ủ ương n t ể n tới 0 t t ng ản tấn ng
tr ng t i t ống ương sử ng i ủ ương tr n ng ng ản
t ân đi u n đã đư sử ng t n ng tấn ng đầu ti n ẫn đư tiế t
để iế u n tru n ậ Tr ng t số trường ương n é tấn
c ng đư u n ủ người uản tr t ống (r t inistr t r)
n n n o n n on : ắ tấn ng n t n ả ng ủ t ống
n 1 2 Tấn ng gi n đ n
â n t tấn ng ễ t i n n ất ngắt ết nối gi 2 tr tr n ng
n ư tr n n 1 2 t số ương tấn ng ng n n ư: Ping of Death - Các
Information source Information destination
Trang 18tr gửi n i u g i tin ớn t ng u n ping đến đ iến t ống
đ tr Tear Drop - ửi g i tin ới gi tr offset (số t t g i tin) ồng
tré n u ng t t t iến ủ u tải ẫn đến ng ng t đ ng
ải sắ ế i g i tin SYN Attack - ửi tới đ t t g i tin SYN
ới đ ỉ nguồn ng t iến t ống đ ải ưu i g i tin
SYN n ớ ải ờ đ i ản ồi t ời n t đ ỉ ng t
t số ương tấn ng ng n n ư: Packet Sniffers - t i n ắt gi tất ả
g i tin đư gửi tr ng t ng L Port Scans và ping sweeps - ửi g i
tin ết nối tới s r r n ằ đ n t số t ng tin n ư: rt n đ ng t đ ng
Trang 19n 1 Tấn ng giả
t số ương tấn ng giả : Tấn ng giả đ ỉ tấn ng
tr n ss r …
n n ào on n : tấn ng t ể i n ới người uản tr
t ống giả t người sử ng để t đổi ật ẩu t đổi u n tru ậ ủ
n đối ới t ống t ậ t đổi t số ấu n ủ t ống để t
i n ương tấn ng ới iểu tấn ng n ng t t iết n
Information destinationInformation source Information destination
Trang 20điển n ng tấn ng t đổi g i tin ĩ t uật người đ ng gi Middle Attack)
Các bi n ngăn n đ t nhậ đư c coi là lớp bảo v đầu tiên trong an toàn
m ng Có nhi u bi n ngăn n đ t nhập, m i bi n pháp bảo v h thống theo các
Trang 21cách khác nhau Trong th c tế, các h thống t ường đư c áp d ng kết h đồng thời nhi u kiểu ương ngăn n đ t nhập Có thể chia các bi n ngăn n đ t nhập theo m đ bảo v n ư in ọa trên n 1
C ng ứng dụng (Application gateways): Làm vi c m T / đ ng i tr trung
gian trong mọi kết nối t máy khách tới máy chủ Khi máy khách có nhu cầu truy n thông tới máy chủ, gói tin gửi t máy khách tới máy chủ s đư c nhận b i cổng ng
d ng Cổng ng d ng xem xét tính h p l của gói tin yêu cầu d a theo tập luật đã đ nh sẵn
n mứ m -level gateways): L i ớn n ất ủ ổng giấu
n t n t ết nối ới tới đ
Tu n i n tường ử ng t số điể ếu:
ng ống đư tấn ng t n tr ng ng Tường ử u n giả t iết rằng
ấu ỉ n ng i ng n ọi tr n tr ng ng đ n tin ậ
Trang 22 ng ống đư s â n iễ i ủ ương tr n irus ã đ
ng ống đư tấn ng iểu u ( ss- ) Tường ử rằng ọi ết nối gi n tr ng ng i ng đ u ần đi u tường ử n ưng t tế ẫn t
số ết nối ng u tường ử đư t i ản t ân tổ
1.1.3.1.2 Bả vệ v t ý Ph i
L ngăn ản truy cập h thống bằng ương ật n ư: găn ấm người sử d ng không có thẩm quy n sử d ng ng để t n …
1.1.3.1.3 h iệ t n ti n
Mã hóa d li u ương ảo v thông tin d li u bằng cách chuyển d li u t
d ng t ng t ường sang d ng b mã hóa không thể đọ đư n ưng t ể biến đổi v
d ng n đầu đư c nhờ m t hình th c giải ã tương ng Có hai kiểu mã hóa chính là:
ã đối x ng và mã hóa bất đối x ng
ã ó ứn ã ó ó m Hai bên gi sử ng ã gồm
hai t ể giống t n u ỉ n u t i iến đổi đơn giản để ã
giải ã t số t uật t n ổ iến: AES, Blowfish, DES, IDEA… ương
ã n ưu điể đơn giản ễ đư ới i u i n
tu n i n i t ống n ất ung gi 2 n gi ng ần u ầu ả ật
ã ó ứn ã ó ó n i n gi sử ng ã
giải ã n u ng để ã ng i ất ể n gửi g i tin n ng t ể sử ng n ng để giải ã ật ỉ
n n ận g i tin iết ng t ể t n r đư ật i iết ng i
t số ĩ t uật ã ất đối ng: RSA, DSS (Digital Signature Standard).
1.1.3.1.4 á thự th nti ti n
t u tr n đ n người ng đ ng tru n ập vào h thông có phải người người dùng h p l hay không Các yếu tố - t ng tin ng để xác th người dùng bao gồm:
n n n ùn ữ : ng in n ân ân iếu số đi n t i i
đ ng…
n n n ùn : ật ẩu ã (personal identification
number)…
n n ộ ặ m n ùn : ân t giọng n i …
Trang 231.1.3.1.5 Ph n n t P mi i ns)
Quy n truy cập là m c bảo v trong cùng Sau khi xác th t n ng người dùng
có thể truy cập vào h thống Tùy vào t ng người dùng c thể đư c phân quy n truy cập, sử d ng h thống khách nhau Ví d trong m t phân quy n sử d ng tài nguyên h
thống, tùy tài khoản mà có thể đọ g i t đổi, hay xóa d li u
1.1.3.2 Cá giải há hát hiện đột nh
H thống phát hi n đ t n ập (Intrusion Detection System – IDS) là h thống phần
c ng ho c phần m m có ch năng t đ ng theo dõi các s ki n xảy ra trên h thống máy tính và m ng ân t để phát hi n ra các vấn đ i n u n đến an ninh, bảo mật Khi số
v tấn ng đ t nhập vào các h thống máy tính, m ng ng ng tăng thống phát
hi n xâm nhậ ng ng ĩ u n trọng và cần thiết ơn tr ng n n tảng bảo mật của các tổ ch c
M t IDS t ường gồm có 3 b phận ch năng ơ ản: Nguồn d li u, phân tích các
s ki n đư r ết quả trả Nguồn d li u cung cấ t ng tin đư c lấy t nhi u
m c của h thống cần phát hi n đ t nhập M t số nguồn d li u thông d ng n ư: Internet, host và các thông tin t các ng d ng Thành phần phân tích s n i ân t các
s ki n, d li u d a vào nguồn d li u huấn luy n mô hình hóa và phân tích các s ki n thu thậ đư t đ đ n trường h p có dấu hi u của s tấn công Kết quả trả
là m t tậ n đ ng xử lý các s ki n đư đ n trường h p tấn công Hành
đ ng xử lý có thể là th đ ng n ư ỉ cảnh báo tới người quản tr , ho c có thể là chủ đ ng
n ư ập t ngăn n n i đ t nhập bằng cách hủy gói tin gửi tới đ
1.2 Cá hư ng há hát hiện đột nh
Tiến tr n t i n đ t n ậ t i s ki n xảy ra trên m t h thống máy tính hay h thống m ng ân t ng để tìm ra các dấu hi u xâm nhập bất h p pháp Xâm nhập bất h đư đ n ng ĩ s cố gắng tìm mọi để xâm h i đến các thu c tính an toàn của thông tin và h thống n ư: tính bí mật, tính toàn vẹn, tính ng t ể ối … hay cố gắng ư t u ơ ế bảo mật của h thống Vi c xâm nhập có thể là xuất phát t m t k tấn ng n đ tr n Internet nhằm giành quy n truy cập h thống,
ng t ể là m t người ng đư c phép trong h thống đ uốn chiế đ t các quy n khác mà họ ng đư c cấp phát
i ân i ương t i n đ t n ậ : Phân lo i d a trên k thuật phân tích d li u và phân lo i d a trên nguồn d li u
Trang 241.2.1 Ph n ại ự t ên th t h n t h iệ
T ân i tr n t uật ân t i u i n t i n đ t
n ậ t ể i 2 ĩ t uật n :
P n ộ n ên ữ ý Signature Based): L ương â ng
ủ tất ả đ t n ậ đã iết s u đ sử ng n để ét trường
ới đ n trường ải đ t n ậ ng i n tương t n ư
ầu ết ần ống irus ới ĩ t uật n t ống t ể t i n rất
n n trường đ t n ậ đã iết n ưng i ng t ể t i n đư n ng đ t
n ậ ới ể ả n ng t đổi tr ng n ng tấn ng
Ph n ộ n ên n L ương â ng ồ sơ n i ủ
người ng t ống ng t i ế đ i n t ường u đ s s n
n i sử ng đ ng iễn r ới ồ sơ n i đư i n t ường đư r
ản nếu n ư ng tr ng ng ĩ n i đ ng iễn r ất t ường
đ ĩ t uật n t ể t i n đư ả n ng đ t n ậ ới n ưng i ăn
tr ng i â ng ồ sơ n i n t ường ễ đư r ản n ầ
1.2.2 Ph n ại ự t ên ng ồn iệ
Theo phân lo i d a trên nguồn d i u 2 i IDS chính:
H th ng phát hi n ột nh p m ng (Network-based Instrusion Detection Systems - NIDS): Nguồn d li u s ki n thu thậ đư c đâ t ng tin ưu ư ng m ng
đư c lấy t u s it đã đư c cấu n để theo dõi cổng ho c các nút m ng (n t r t ) t ống đư đ t t i t điể iến ư tr ng t ống ng để
t i ưu ư ng tru ậ đến đi t tất ả t iết tr n ng n ư tr n Hình 1.7
i ưu ư ng m ng lớn, NIDS g p phải m t số ăn khả năng ưu tr và xử lý
t ng tin đ t ể đư r n ng thông báo sai khi phải xử ư ng rất ớn
d li u Ngoài ra, NIDS không thể ân t đư c các d li u mã hóa
n n ộ n o m o -based instrusion detection systems):
i s t ân t s i n n tr ng t t ống t n ơn ết nối
ới n ng i t u t ậ i u t st ri ng đ n â n ậ ằng
ân t ời gọi t ống n ật ng ng s t đổi fi t ống (fi n ân fi ật ẩu ơ s i u) s i n tr n t ống
Hình 1.8 in ọ t điển n
Trang 25n 1 tả
Hình 1.8 tả
Trang 261.3 Cá th t ý iệ thường ng t ng hát hiện đột nh
i u đầu u tr n ân t t i n đ t n ậ rất đ ng t u
i n ĩn ng i t ng tin t ống uản T i n ĩn đối tư ng i u t ể i t uật ử n u để i u uả t i n
n ất T ét t số t uật ử i u tr ng t i n đ t n ậ t ường đư
u ỳ ân t t ể t đổi t t i t đến t t ng t ống ưu gi tr
ng ĩ i iến đư sử ng để t i n s ư t u ngư ng đư đ n
ng ĩ t trướ đến n ương đơn giản n ng n ới
n n i người ng điển n ương tiế ận tr n i đối s n
r fi ủ người ng ri ng ới iến đã đư n g i ng t i u uả
ậ n t ơn n i người ng đã đư t triển ằng sử
t ể ắt ướ ọ i n ng ả năng t ng tin ủ n người ọ i
tr ng trường n đư iểu n ng su uận r tri t t n ng ẫu i u
tr ng u tr n uấn u n ới ti u t ể đư r đ n âu trả ời trường ới ẫu uấn u n trướ i ng đư u n s t t ấ t r
r ng ư ậ i ọ i đâ ng ỉ i g i n ớ âu i n s tổng
u t ả trường ư iết
ng ấn đ n nin ng t i n đ t n ậ t n tr n giải
t uật ọ s đư ọ để ân ớ ản s i n n nin t ống
tr n i ân t “ ọ ” t t ư ng ớn i u sử t số giải t uật tr ng
Trang 27t uật ọ t ường đư ng n ư: ng B si n n r t uật
gi ờ giải t uật i tru n …
1.3.3 th t mạng n -ron
M ng nơr n tiếp cận tính toán mới i n u n đến vi c phát triển các cấu trúc toán học với khả năng ọ ương n ết quả của vi c nghiên c u mô hình học của h thần in n người M ng có thể đư r ng ĩ t các d li u ph c t p ho c không chính xác và có thể đư c sử d ng để chiết xuất các mẫu và phát hi n ra các xu ướng ph c t n người ng n ư thuật máy tính khác không thể phát hi n
r đư c
t uật ng nơ-r n sử ng giải t uật ân t su iễn ối u
gi ớ đầu đầu r ủ t ống t đ tổng u t ng để r t r tri
t n ng ối u n – r ới ương n t ường sử ng để đ n
ân ớ n i ng tr n nguồn i u đầu ng đầ đủ n ế
Tr ng t uật ng nơ-r n đư sử ng để nghiên c u hành vi củ người
ng t gi ng ết uả ủ t c nghi ân t đ n n i người ng đã đư c tiến hành cho thấy rằng các hành vi củ người ng ới u n uản
tr (si u người dùng) là có thể d đ n ới m t số ít ngo i l , hành vi của hầu hết người
ng ng t ể d đ n
Tuy m ng nơr n t số h n chế gâ ăn tr ng i c áp d ng và triển khai
n ưng n ẫn là m t k thuật tính toán m n n ng ưu điể đ ng ể M t trong số
nh ng ưu điể đ ả năng t o ra các mô hình d đ n đ chính xác cao, có thể áp
d ng đư c cho rất nhi u i t n n u đ ng đư c nhi m v đ t ra của khai phá
d li u n ư ân ớp, phân nhóm, mô hình hóa, d báo các s ki n ph thu c thời gi n …
1.3.4 Phư ng há t h
â ương ết ương t n ung t ng
u i ân t ưu – n ư điể ủ ương i n n nin ng
t ấn đ rất u n trọng tr ng t ời đ i số i n n ậ rất n i u ương â
ng t t i n đ t n ậ đư ng i n u ương đư r t ường
n i u ưu điể tu n i n ẫn n ưng n ế ri ng ủ n ương ết đư
ng i n u n ằ tận ng ưu điể ắ t tối đ ấn đ n tồn
t i n ng ương trướ đ ương ng n i n đ ng rất đư u n tân ng i n u i n ết uả rất ả u n
Trang 28t số ương ng ết đư đ n gi i n n n ư: ết gi ương u rt t r in s ( ) ới giải t uật i tru n ( n ti
g rit s) ới L gi ờ ng nơ-r n ới ( rin i n nts
n sis) …
1.4 ô tả b i t án đ ất t ng đồ án
Tr n ơ s phân tích v ưu t ế củ ương t i n đ t nhập kết h p
và h n chế củ ương t i n đ t nhập riêng l đồ n đư r t ương
t i n đ t n ậ ng tr n i uật ết ờ ậ tr n tiến
n ằ ắ ấn đ ử lý các tập d i u ớn ả n ng t u t n gi tr
i n t rời r ới t u t n gi tr rời r tậ t u t n i n t
i n gi tr ớn ấn đ rất ắ i đư giải t uật tru n thống ễ
ẫn tới i tổn t ất t ng tin i ử i u giảm hi u quả phát hi n
Bằng ết t u ết tậ ờ ới t uật ương đ uất t ể
ồ n đư r t tiế ận ới t ương t i n đ t n ậ ng ằng ết t u ết tậ ờ ậ tr n tiến gi ắ đư t số ấn
đ n tồn t i ủ ương đã đư t triển trướ đ T s t iểu i tiết
ơ s t u ết ủ ương n tr ng ương tiế t
Trang 29CHƯƠN 2 : CƠ THU ẾT
N i dung củ ương n s giới thi u v các ơ s lý thuyết đư c sử d ng cho mô hình phát hi n đ t nhậ đ xuất
n để xuất sử d ng k thuật khai phá các luật kết t ơ s d li u thông tin kết nối m ng nhằm trích rút ra các luật để ân ớ ết nối đến n t n ng
n t n ới h thống T đ t u ết t ống i i u điển n
t uật i i u t ường ng s đư tr n t cách khái quát trong phần đầu
ủ ương Tr ng t uật i i u ổ iến t uật i i u ng uật ết s đư tậ trung tả t i tiết
ần tiế t ủ ương giới t i u sơ ư t u ết tập mờ é t n
gi sử ng tr n tậ ờ L t u ết tậ ờ đư c áp d ng vào quá trình mờ hóa các tham
số trong các kết nối m ng gi giải t uật i uật kết h đư t i n ễ
ng ơn giải u ết đư ấn đ đường i n r ( r B un r ) gi tr n tổn thất
t ng tin i ti n ử i u
Phần cuối ương tr n ơ s lý thuyết của k thuật lập trình tiến hóa GNP
gồ : biểu diễn kiểu hình của các cá thể, biểu diễn kiểu gene của các node, v ơ ế làm vi ng n ư t n tử di truy n đư c áp d ng vào quần thể qua các thế h để t o
đư c quần thể tối ưu thuật GNP giúp vi c mô hình hóa bài toán dễ ng ơn ng
n ư ễ ng t n t n đ đ ủa các luật tr ng u tr n i gi giả đư c thời gian ch y cho h thống
gồ : iến tr ủ t ống i i u ướ tr ng tiến tr n i i u
t số ương i i u ổ iến tr ng đ ương i uật
ết s đư tr n t i tiết để t ể ng giải t uật đ uất
Trang 302.1.1 iới thiệ v hệ th ng h i há iệ
Hình 2.1 iến tr điển n ủ t ống i i u
Tr ng đ :
- ơ s i u i u WWW t ng tin : t t
tậ ơ s i u i u … n ng nguồn i u ần i ung
Trang 31ấ đầu ng đ n ti n ử i u: s i u t
i u ọ i u …
- ơ s i u i u : n ng i u i n u n đư ọ
s t i u tr n ơ s u ầu i i u ủ người ng
- ơ s tri t : ĩn tri t đư ử ng để ướng ẫn i t đ n
gi ẫu ết uả t đư
- t ining ngin : gồ tậ u năng để t i n n i
n ư tả đ điể ết ân ớ ân i u …
- u đ n gi ẫu: T n ần n sử ng đ đ tương t ới
u i i u để tậ trung t ẫu đ ng u n tâ
- i i n người ng: é người ng tương t ới t ống tr n ơ s
n ng tru ấn t ung ấ t ng tin i t iế
Trang 32- T u t ậ ti n ử i u: t u t ậ i u i n u n ử ng đư
ng s giải t uật i i u t ể iểu đư Ở đâ t ể g t
số ấn đ n ư: i u ải đư s ưu r n i u ản (nếu đư iết uất
t ) uản t i u đi i u tr n (nếu n i u t đổi) …
- T ống t tắt i u đồng t ời ết ới i u tr tiế để đầu
ướ t i n giải t uật i i u
Chọn thuật toán khai phá d li u thích h p và th c hi n vi c khai phá d li u để tìm
đư c mẫu ng ĩ ới các nhi m v khác nhau ủ khai phá d li u, d ng của các mẫu chiết xuất đư ng n u ẫu chiết xuất đư c có thể là m t mô tả v xu
ướng, có thể ưới d ng ăn ản, m t đồ th mô tả các mối quan h tr ng n …
2.1.1.3 ột hư ng há h i há iệ
n i u ương i i u đư ng i n u t triển T t ng
ĩn đ trưng ủ i t n t tế sử ng ương tương ng để
đư i u uả ương i i u t ể đư i t n n ng ảng n n ư sau:
ẫu đầu r ủ u tr n i i u sử ng t uật n tậ ẫu
i u ung n ng t n ất n đ đư ân t t ơ s i u i
ẫu đư t iết ậ ng t ể đư sử ng để t i t tậ i u ng ễ iểu ơn đồng t ời ng ung ấ n i u t đ ng ng n ư
ng i ân t ối ới ơ s i u ớn i ấ r n n rất u n trọng
(2) (Association Rule Mining): ương n n ằ t i n r
uật ết gi t n ần i u tr ng ơ s i u ẫu đầu r ủ giải
t uật i i u tậ uật ết t đư T t ể ấ t đơn giản
Trang 33(3) (Sequence Mining): Luật u i i u i t ể i n ư
t tr u tư ng ủ uật ết t i n uật ết tr ng ơ s i u
Luật kết h p là d ng luật đơn giản n ưng ng i khá nhi u ng ĩ T ng tin
mà d ng luật n đ i là rất đ ng ể và h tr không nh trong quá trình ra quyết đ nh Tìm kiế đư c các luật kết h p quý hiếm và mang nhi u thông tin (luật m nh) t ơ s
d li u tác nghi p là m t trong nh ng ướng tiếp cận chính củ ĩn c khai d li u
2.1.2.1 Biể i n t t h
M t ví d th c tế của khai phá luật kết h p là phân tích th trường t các giao d ch trong gi hàng đơn ủa khách hàng (Basket Analysis), với m đ khám phá cách mua hàng của khách hàng trong m t siêu th ho c cửa hàng, t đ gi n nghi t đư c chiến ư c bán hàng cho mình
o ữ m o ị à o ị t t1, , ,2 t n
Trang 341 2{ , , , }n
T t t t
T g i iệ gi ị h T n ti n t b
o ị ti o m n à m
1 2{ , , , }n
I i i i
ộ m m m à -itemset
ụ ủ à m o on n n
o on ữ m ữn nà ó n X Y
Trong bài toán phân tích gi hàng, luật kết h p X Ycó thể hiểu rằng nh ng
người mua các m t hàng trong tập X ng t ường mua các m t hàng trong tập Y (X và Y gọi là itemset) Ví d , nếu X = {Apple, Banana} và Y = {Cherry, Durian} và ta có luật kết
h p X Y thì chúng ta có thể nói rằng nh ng người mua Apple và Banana t ng
t ường mua Cherry và Durian T u n điểm thống kê, X đư c xem là biến đ c
lập (Independent variable) còn Y đư c xem là biến ph thu c (Dependent variable)
on n ủ X Y suất ả r Y i đã iết X đ tin
ậ ủ uật ết { } => {B n n } 80%, ó n ĩ à 80% khách hàng mua
A ũn m B n n