Luận văn
Trang 1Dương Tuấn Anh
XÂY DỰNG HỆ CÁC ĐIỀU KIỆN GIỚI HẠN PHỤC VỤ PHÂN BỐ
Chuyên ngành: Kỹ thuật Viễn thông
Mã số: 62.52.70.05
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Người hướng dẫn khoa học:
1 TS Bùi Thiện Minh
2 PGS.TS Hoàng Minh
HÀ NỘI – 2013
Trang 2Dương Tuấn Anh
XÂY DỰNG HỆ CÁC ĐIỀU KIỆN GIỚI HẠN PHỤC VỤ PHÂN BỔ LƯU LƯỢNG DỊCH VỤ
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu do tôi thực hiện Các số liệu
và kết quả trình bày trong luận án là trung thực, chưa được công bố bởi bất kỳ tác giả nào hay ở bất kỳ công trình nào khác
Tác giả
Dương Tuấn Anh
Trang 4LỜI CẢM ƠN
Luận án Tiến sĩ này được thực hiện tại Học viện Công nghệ Bưu chính Viễn thông dưới sự hướng dẫn khoa học của TS Bùi Thiện Minh và PGS.TS Hoàng Minh Nghiên cứu sinh xin bày tỏ lòng biết ơn sâu sắc tới các Thầy về định hướng khoa học, liên tục quan tâm, tạo điều kiện thuận lợi trong suốt quá trình nghiên cứu hoàn thành cuốn luận án này Nghiên cứu sinh xin được chân thành cảm ơn các nhà khoa học, tác giả các công trình công bố đã trích dẫn trong luận án vì đã cung cấp nguồn tư liệu quý báu, những kiến thức liên quan trong quá trình nghiên cứu hoàn thành luận án
Nghiên cứu sinh xin trân trọng cảm ơn Lãnh đạo Học viện Công nghệ Bưu chính Viễn thông, Hội đồng Khoa học, Hội đồng Tiến sĩ của Học viện vì đã tạo điều kiện để nghiên cứu sinh được thực hiện và hoàn thành chương trình nghiên cứu của mình Nghiên cứu sinh xin được chân thành cảm ơn GS.TSKH Nguyễn Ngọc San, GS.TS Nguyễn Bình vì những chỉ dẫn về học thuật hóa, kết nối giữa lý luận với kết quả thực nghiệm thời gian thực Xin chân thành cám ơn Khoa Quốc tế và Đào tạo sau đại học
và các nhà khoa học thuộc Học viện Công nghệ Bưu chính Viễn thông cũng như các nghiên cứu sinh khác về sự hỗ trợ trên phương diện hành chính, hợp tác có hiệu quả trong suốt quá trình nghiên cứu khoa học của mình
Nghiên cứu sinh xin gửi lời cảm ơn tới VNPT Thừa Thiên Huế và các bạn đồng nghiệp, bạn bè thân hữu, nhất là nhóm cộng tác nghiên cứu vì đã tạo nhiều điều kiện thuận lợi, hỗ trợ thực hiện việc quan trắc thu thập dữ liệu, triển khai các đề tài nghiên cứu tại hiện trường
Cuối cùng là sự biết ơn tới Ba Mẹ, gia đình và những người bạn thân thiết vì đã liên tục động viên để duy trì nghị lực, sự cảm thông, chia sẻ về thời gian, sức khỏe và các khía cạnh của cuộc sống trong cả quá trình để hoàn thành luận án
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii THUẬT NGỮ VIẾT TẮT v
DANH MỤC BẢNG BIỂU viii
DANH MỤC HÌNH VẼ ix
LỜI NÓI ĐẦU xii
Chương 1 TỔNG QUÁT VỀ ĐẶC TÍNH HÓA LƯU LƯỢNG IP 1.1 GIỚI THIỆU CHƯƠNG 1
1.2 LƯU LƯỢNG VÀ CÁC ĐẶC TÍNH PHÂN LOẠI 2 1.3 VỀ CÁC PHẦN MỀM MÃ NGUỒN MỞ SỬ DỤNG 14
1.3.1 Lựa chọn các phần mềm vào đặc tính hóa lưu lượng 14
1.3.2 Phần mềm NTOP 14
1.3.3 Phần mềm mã nguồn mở Observium 18
1.4 KẾT LUẬN CHƯƠNG 24
Chương 2 ĐẶC TÍNH THỐNG KÊ VÀ ĐIỀU KIỆN GIỚI HẠN PHÂN BỐ LƯU LƯỢNG IP INTERNET 2.1 GIỚI THIỆU CHƯƠNG 27
2.2 ĐẶC TÍNH LƯU LƯỢNG CỦA NHỮNG MÔ HÌNH KHÁC NHAU 28
2.2.1 Tương tác đa phương tiện và lưu lượng thời gian thực 28
2.2.2 Đối với lưu lượng Web và Client-Server 34
2.2.3 Đối với di động trong môi trường mạng không dây 38
2.3 ĐIỀU KIỆN GIỚI HẠN SỬ DỤNG MÔ HÌNH, PHƯƠNG PHÁP 41
2.3.1 Những đồ thị biểu đồ thông lượng khác nhau 41
2.3.2 Định hình và phân chia giới hạn tắc nghẽn 42
2.4 KẾT LUẬN CHƯƠNG 44
Chương 3 CÁC ĐIỀU KIỆN GIỚI HẠN VỀ PHÂN BỔ LUỒNG LƯU LƯỢNG IP INTERNET THEO CHẤT LƯỢNG DỊCH VỤ (QoS) TƯƠNG THÍCH 3.1 GIỚI THIỆU CHƯƠNG 45
3.2 VỀ TƯƠNG THÍCH QoS TRONG MÔI TRƯỜNG INTERNET 46
Trang 63.3 ĐIỀU KIỆN ĐỂ TƯƠNG THÍCH QoS ĐỐI VỚI MIDDLEWARE 49
3.3.1 Kiến trúc middleware đảm bảo QoS 49
3.3.2 Các cơ chế điều kiện tương thích trong hệ thống QoS middleware 50
3.3.3 Áp dụng mô hình điều khiển truyền thống 54
3.3.4 Các điều kiện về mô hình điều khiển tác vụ 58
3.3.5 Ứng dụng mô hình điều khiển tác vụ trong kiến trúc middleware 59
3.4 GIỚI HẠN PHÂN BỐ LƯU LƯỢNG ƯU TIÊN TRONG MẠNG HÀNG ĐỢI 62
3.4.1 Mô hình hóa cơ chế ưu tiên lưu lượng trong mạng hàng đợi 62
3.4.2 Giải quyết bài toán ưu tiên lưu lượng trong mạng hàng đợi 66
3.4.3 Bàn luận về những điều kiện giới hạn liên quan đến xử lý mạng hàng đợi 77
3.5 KẾT QUẢ MÔ PHỎNG 78
3.5.1 Thiết lập hệ thống điều khiển 78
3.5.2 Thiết lập tham số cấu hình 80
3.5.3 Phân tích đặc điểm của hệ thống theo mô hình lý thuyết 81
3.5.4 Kết quả mô phỏng tại Viễn thông Thừa Thiên Huế 82
3.6 KẾT LUẬN CHƯƠNG 86
Chương 4 NGHIÊN CỨU VỀ CÁC GIỚI HẠN TRONG CHỐNG TẤN CÔNG TỪ CHỐI DỊCH VỤ (DoS) VÀ SÂU INTERNET 4.1 GIỚI THIỆU CHƯƠNG 88
4.2 MỘT SỐ VẤN ĐỀ LIÊN QUAN ĐÊN TẤN CÔNG MẠNG 89
4.2.1 Giới thiệu về tấn công mạng 89
4.2.2 Cơ sở và các vấn đề liên quan đến DoS 90
4.2.3 Sâu Internet: Cơ sở và các vấn đề liên quan 94
4.3 CHỐNG TẤN CÔNG TỪ CHỐI DỊCH VỤ (DoS) VÀ CÁC GIỚI HẠN 99
4.3.1 Giới thiệu 99
4.3.2 Hệ thống phòng thủ DoS dựa trên mạng Proxy 100
4.3.3 Nhận xét về các điều kiện giới hạn 112
4.4 NGĂN CHẶN SÂU INTERNET VÀ CÁC ĐIỀU KIỆN 113
4.4.1 Mô hình lây truyền và phát hiện tín hiệu virus/sâu 113
4.4.2 Phòng chống, ngăn chặn sâu Internet và các điều kiện 115
4.5 KẾT LUẬN CHƯƠNG 118
KẾT LUẬN VÀ ĐỊNH HƯỚNG NGHIÊN CỨU TIẾP 120
DANH MỤC CÁC CÔNG TRÌNH CỦA NGHIÊN CỨU SINH 122
TÀI LIỆU THAM KHẢO 123
Trang 7THUẬT NGỮ VIẾT TẮT
Line
Đường dây thuê bao số không đối
xứng
mức cao
protocol
Giao thức bản tin điều khiển
Internet
Trang 8ISP Internet Service Provider Nhà cung cấp dịch vụ Internet
ITU-T
International Telecommunication Union
sector T
Hiệp hội tiêu chuẩn viễn thông quốc
tế
Reference Model
Mô hình tham chiếu kết nối hệ
thống mở
Model
Mô hình phân bổ tài nguyên trên
QoS
Protocol
Giao thức truyền tải điều khiển thời
gian thực
Trang 9UDP User datagram protocol Giao thức gói dữ liệu người dùng
Telecommunications System
Hệ thống viễn thông di động toàn
cầu
Trang 10DANH MỤC BẢNG BIỂU
Bảng 2-1 Yêu cầu băng thông điển hình đối với các định dạng Audio khác nhau 29 Bảng 2-2 Yêu cầu về băng thông đối với những định dạng Video khác nhau 29
Bảng 2-3 Bảng so sánh các yêu cầu QoS giữa các loại lưu lượng 34
Bảng 3-1 Các tham số của hệ thống điều khiển tương thích 79
Bảng 3-2 Các tham số cấu hình và của bộ điều khiển tương thích 81
Bảng 3-3 Đánh giá điều kiện ổn định của hệ thống điều khiển 81
Bảng 4-1 Các tham số của mô hình ngẫu nhiên 103
Trang 11DANH MỤC HÌNH VẼ
Hình 1-1 Biễu diễn các phân lớp của môi trường mạng Internet 9 Hình 1-2 Phân tích các luồng lưu lượng ở phía đầu cuối 10 Hình 1-3 Phân tích các luồng lưu lượng của một môi trường mạng 10 Hình 1-4 Mô tả một quá trình điều khiển sự kiện, thời gian truyền đến lẫn nhau
giữa các sự kiện trong khoảng một chu kì thời gian nhất định 12
Hình 1-10 Thống kê sử dụng các loại ứng dụng Internet 18
Hình 1-12 Cấu trúc các khối chức năng của ứng dụng Observium 20
Hình 1-16 Lịch sử lưu lượng qua 1 cổng 10Gbps của thiết bị Router Core tại
Viễn thông Thừa Thiên Huế 24
Hình 2-3 Biểu đồ thông lượng từ các phép đo đối với ứng dụng truyền hình
hội nghị 42
Hình 3-2 Kiến trúc middleware tương thích QoS theo ứng dụng 49 Hình 3-3 Các thành phần mạng tham gia quá trình thiết lập QoS 52
Trang 12Hình 3-7 Mô hình điều khiển tác vụ trong kiến trúc Middleware 60
Hình 3-8 Mô hình điều khiển tương thích QoS trong kiến trúc Middleware 60
Hình 3-9 Mô hình bài toán quản lý lưu lượng hàng đợi 62 Hình 3-10 Mô hình hàng đợi có ưu tiên tuyệt đối 65 Hình 3-11 Mô hình mạng hàng đợi hở không hồi tiếp 68
Hình 3-12 Giản đồ chuyển trạng thái không thuận nghịch theo hình 3-9 69
Hình 3-13 Giản đồ chuyển trạng thái thuận nghịch của mô hình theo hình 3-12 69
Hình 3-14 Mô hình mạng hàng đợi có hồi tiếp 70
Hình 3-15 Giản đồ chuyển trạng thái thuận nghịch của mô hình ở hình 3-14 70 Hình 3-16 Thuật toán chập xác định G(n,k) 71 Hình 3-17 Mô hình M/M/1-PS đối với lưu lượng hai chiều 73
Hình 3-18 Chuyển trạng thái của mô hình M/M/1-PS với lưu lượng hai chiều 74 Hình 3-19 Sơ đồ mô phỏng hệ thống điều khiển tương thích QoS 79 Hình 3-20 Kết quả quan sát trường hợp 1 82 Hình 3-21 Kết quả quan sát trường hợp 2 83 Hình 3-22 Kết quả quan sát trường hợp 3 84 Hình 3-23 Kết quả quan sát trường hợp 4 85 Hình 3-24 Kết quả quan sát trường hợp 5 86 Hình 4-1 Mạng Zombie DDoS điển hình 92
Hình 4-2 Cấu hình thí nghiệm 100
Hình 4-3 Framework chung cho các mạng 101
Hình 4-4 Chuyển tiếp trạng thái máy chủ 104
Hình 4-5 Chuyển tiếp trạng thái Proxy 105
Hình 4-6 Quá trình hoạt động của mạng Proxy 106
Hình 4-7 Ảnh hưởng của các cuộc tấn công DoS lên hiệu suất ứng dụng 108
Hình 4-8 Hiệu suất ứng dụng dưới những cuộc tấn công DoS dàn trải 109
Hình 4.9 Hiệu suất ứng dụng trước các cuộc tấn công tập trung, lựa chọn Proxy biên tĩnh 110
Hình 4-10 Hiệu suất ứng dụng trước các cuộc tấn công tập trung, lựa chọn Proxy biên động 111
Hình 4-11 Phân tích việc lựa chọn Proxy biên động 111
Trang 13Hình 4-12 Tính đàn hồi và kích thước của mạng Proxy 112
Hình 4-13 Quá trình lây nhiễm của sâu 117
Hình 4-14 Hiệu ứng ngưỡng toàn cục 117
Hình 4-15 Lợi ích của việc phòng thủ hợp tác 118
Trang 14LỜI NÓI ĐẦU
A MỤC TIÊU ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Việt Nam bắt đầu triển khai Internet muộn hơn so với nhiều nước trong vùng và thế giới, với vai trò chủ đạo của Tập đoàn Bưu chính Viễn thông Việt Nam (VNPT) Đến nay Việt Nam có thể tự hào về tốc độ phát triển số lượng người sử dụng Internet (thứ 3 ở khu vực Đông Nam Á, thứ 8 trong phạm vi châu Á và thứ 18 trên toàn cầu),
đã kết nối 63 tỉnh thành trong nước và kết nối quốc tế, với tổng lưu lượng băng thông tới 200 GBps và đang được tiếp tục phát triển, mở rộng Tuy nhiên, sự phát triển vượt bậc về “nội dung số” trong “thế giới phẳng” tạo ra nhiều thách thức lớn trên phạm vi toàn cầu, kể cả VNPT, về chất lượng dịch vụ và về “an ninh mạng” trước sự hiện diện của các luồng lưu lượng IP Internet, dẫn đến nhu cầu về các giải pháp thích hợp để xử
lý và phân bổ lưu lượng IP Internet
Phân bổ lưu lượng Internet là vấn đề ngày càng trở nên cấp thiết đối với các nhà cung cấp dịch vụ mạng do sự phát triển không ngừng của các lớp ứng dụng mới hội
tụ trên nền IP dẫn đến lưu lượng của các dịch vụ viễn thông luôn thay đổi, tăng lên có tính đột biến trong khi sự phát triển hạ tầng nhằm mở rộng băng thông bị hạn chế bởi nhiều lý do khác nhau [2], [10], [19] Đó là chưa kể đến các đối tượng với lưu lượng thuộc nhóm “phi truyền thống” xâm nhập trên nền IP vì mục tiêu chuyên dụng hoặc đặc thù về “an ninh mạng”, “an toàn thông tin” hoặc về các hình thái “tấn công” khác nhau Việc giám sát, định danh “tín hiệu” ở dạng toán học cùng các tham số kèm theo
có tính “đặc thù” đối với lưu lượng của các lớp “dịch vụ truyền thống” và phân bố tài nguyên đối với mạng diện rộng có lưu lượng lớn là rất khó vì các phương tiện quản lý không thể đồng bộ theo nghĩa thời gian thực về bổ sung, cập nhật phương tiện đối với
cơ chế quản lý phân tán trong điều kiện tích hợp các phương thức truyền thông và đa tích hợp các loại hình dịch vụ khác nhau, v.v… [1], [36], [81] Liên quan đến nhiệm
vụ giám sát và quản trị luồng lưu lượng đối với mạng đã nêu, nhiều giải pháp khoa
Trang 15học, công nghệ khác nhau phục vụ việc phân tích tín hiệu, phân tích đánh giá cơ chế chuyển đổi, chấp hành và phân bổ tài nguyên mạng diện rộng đã được các nhà khoa học trong và ngoài nước đề xuất [55], [84], [104] Tuy nhiên, giải pháp chung nhất là
sử dụng phương pháp tối ưu (trên cơ sở tiêu chí phù hợp), kết hợp với các điều kiện ràng buộc (thể hiện tính đặc thù khác nhau) để xử lý tối ưu bài toán giải phóng hàng đợi nhằm đảm bảo tính hiệu dụng của nguồn vốn đầu tư, khai thác tối đa tiềm năng hạ tầng cơ sở mạng sẵn có hoặc đảm bảo chất lượng dịch vụ trong điều kiện hạn chế băng thông, v.v… [2], [11], [14]
Nhưng thực tế, đối với nhà cung cấp dịch vụ mạng, vấn đề xử lý tắc nghẽn đôi khi đòi hỏi bài toán định tuyến, phân bố tài nguyên mạng phải loại bỏ ngay cả một số luồng lưu lượng có ít đóng góp vào việc xác lập mối quan hệ giữa đầu vào và đầu ra (về kinh tế hoặc về chất lượng dịch vụ) của hệ thống mạng, dẫn đến nhu cầu xác định mức ưu tiên của các luồng lưu lượng và khả năng cho phép của hệ thống mạng [1], [49], [68] Đã có nhiều công trình nghiên cứu về các điều kiện giới hạn phục vụ việc phân bổ lưu lượng Internet, đề xuất giải pháp hỗ trợ, giải quyết tắc nghẽn đường truyền, đảm bảo chất lượng dịch vụ cho các ứng dụng đa phương tiện phân bố trong môi trường hỗn tạp đối với các nhà khai thác, quản trị mạng [8], [14], [21] và nhiều công trình nghiên cứu về lĩnh vực hỗ trợ chất lượng cho hệ thống đa phương tiện phân bố trong môi trường hỗn hợp [30], [44], [63] Trong đó, phải kể đến phương pháp đặc tính hóa lưu lượng đối với các luồng tín hiệu IP Internet trong quá trình
“trong suốt hóa” tích hợp lớp truyền tải, điều khiển và phân bổ dịch vụ [55], [84],
[104] Đặc tính hóa luồng lưu lượng IP được hiểu theo nghĩa của một quy trình áp
dụng công cụ phân tích các sự kiện ngẫu nhiên để biểu diễn luồng IP theo những không gian thuộc miền (thực hoặc phức) với hệ tọa độ khác nhau nhằm vào khả năng phát hiện ra các lưu lượng thuộc nhóm “phi truyền thống”, đồng thời xác định những tham số đặc trưng cho mỗi loại hình dịch vụ IP thông dụng, truyền thống và quy trình
Trang 16này đã được xây dựng thành các phần mềm khác nhau; cả thương mại lẫn mã nguồn
mở Tuy nhiên, đa số công trình nghiên cứu trước đây liên quan đến áp dụng đặc tính hóa luồng lưu lượng mới chỉ đưa ra những đề xuất cải tiến đối với các lớp kiến trúc riêng rẽ, kèm theo các trang, thiết bị cần thiết theo nhu cầu “thời gian thực” [41], [58], [76] Điều đó đòi hỏi những đề xuất mới đối với nhà quản lý cung cấp dịch vụ chưa
có điều kiện trang bị những thiết bị chuyên dụng trong khi phải đảm bảo sự hoạt động
ổn định về quản trị, cung cấp dịch vụ
Giải pháp dựa trên những đặc tính của luồng lưu lượng IP Internet để định danh lưu lượng “phi truyền thống” phục vụ an ninh mạng và xác định các điều kiện giới hạn phục vụ giải pháp xử lý, phân bổ lưu lượng IP Internet sẽ được minh chứng là có khả năng hỗ trợ chất lượng dịch vụ đối với các ứng dụng thời gian thực trong môi trường hỗn tạp Nhằm giải quyết vấn đề nắm bắt, phân tích dữ liệu theo thời gian thực
để xác định các điều kiện giới hạn phục vụ hỗ trợ việc phân bổ lưu lượng IP Internet theo chất lượng dịch vụ tương thích và các điều kiện phục vụ nhiệm vụ bảo đảm an ninh mạng, chống lại những cuộc “tấn công mạng”, cần khai thác các phần mềm mã nguồn mở và sử dụng thời gian thực hạ tầng cơ sở mạng của một nhà quản lý, cung cấp dịch vụ cụ thể có tính đại diện
B NHIỆM VỤ NGHIÊN CỨU VÀ KẾT QUẢ ĐẠT ĐƯỢC
Như vậy, nhiệm vụ nghiên cứu được nghiên cứu sinh tập trung vào các vấn đề sau đây:
1) Nghiên cứu tổng quát về đặc tính hoá lưu lượng của IP Internet và mã nguồn
mở liên quan, gồm các đặc tính lưu lượng, nhu cầu về dung lượng và các yêu cầu liên quan tới việc đảm bảo QoS Từ đó xác định các tham số đại diện cho mỗi lớp dịch vụ
để xác định thứ tự ưu tiên của các dịch vụ, đồng thời xác định các tham số liên quan đến lưu lượng có khả năng làm ảnh hưởng tới an ninh thông tin và mạng
Trang 172) Nghiên cứu phương pháp điều khiển có các mức ưu tiên tương ứng với chất lượng dịch vụ đòi hỏi bởi các lớp dịch vụ khác nhau trong môi trường truyền thông đa chiều, đa dịch vụ để đề xuất chiến lược định tuyến theo thời gian thực phù hợp Từ đó xác định các giới hạn phục vụ nhiệm vụ chống nghẽn và đảm bảo chất lượng dịch vụ 3) Nghiên cứu các giải pháp chống tấn công áp dụng cho các nhà quản lý, cung cấp dịch vụ mạng nhằm bảo đảm an ninh mạng cũng như duy trì chất lượng dịch vụ 4) Dùng Viễn thông Thừa Thiên Huế, đơn vị thành viên thuộc VNPT, nhà cung cấp dịch vụ mạng viễn thông thời gian thực để tiến hành thu thập dữ liệu, phân tích, thử nghiệm các kết quả nghiên cứu do tính đại diện về môi trường tích hợp các loại hình dịch vụ và “an toàn mạng”, “an ninh thông tin” Sở dĩ như vậy là vì Viễn thông Thừa Thiên Huế có vai trò cung cấp các dịch vụ, đảm bảo an ninh thông tin cho một trung tâm Văn hóa, Giáo dục, Du lịch, khu vực kinh tế trọng điểm của miền Trung có 30% số người dùng Internet, 100% số xã có điểm cung cấp dịch vụ viễn thông công cộng, kết nối Internet băng rộng, 100% số trường học, trạm y tế được kết nối Internet
và là điểm nóng về vấn đề tôn giáo, luôn có các hành vi chống phá Đảng, Nhà nước,
“tình hình diễn biến hòa bình“ phức tạp, quyết liệt Viễn thông Thừa Thiên Huế còn vận hành mạng truyền số liệu chuyên dùng, hệ thống tổng đài đặc biệt phục vụ các cơ quan của Đảng, Chính quyền và Trung tâm điều hành thông tin phòng chống bão, lụt, tìm kiếm cứu nạn, gồm hệ thống vô tuyến điện, điện thoại cố định, Internet, di động
vệ tinh và di động mặt đất
Như vậy, trong bốn nhiệm vụ nghiên cứu đã nêu ở trên, ba nhiệm vụ đầu tiên có tính tổng quan về lý luận được thực hiện thông qua việc tập hợp, nghiên cứu tài liệu, tạp chí, phân tích và tổng hợp làm cơ sở đề xuất ứng dụng (phát triển) Việc điều tra, khảo sát theo thời gian thực về đặc tính lưu lượng IP trên mạng, nghiên cứu giải pháp điều khiển theo mức ưu tiên tương ứng với các lớp dịch vụ và phân tích, tối ưu lưu lượng mạng dịch vụ IP của Viễn thông Thừa Thiên Huế ở nhiệm vụ thứ tư được thực
Trang 18hiện thông qua việc chủ trì, xây dựng và triển khai 03 đề tài nghiên cứu khoa học cấp
cơ sở cùng với việc nghiên cứu, khai thác sử dụng các phần mềm mã nguồn mở Thực hiện các nhiệm vụ nghiên cứu đã nêu ở trên, nghiên cứu sinh có thể liệt kê kinh nghiệm thực tiễn thu được khi thực hiện các đề tài nghiên cứu khoa học tại cơ sở
và những đóng góp mới thể hiện ở các công trình công bố trên các tạp chí như sau: 1) Tổng quát, hệ thống hóa về đặc tính hóa lưu lượng IP và phát triển, phân loại các đặc tính đối với luồng lưu lượng IP Internet trong trường hợp cụ thể của một nhà quản lý, cung cấp dịch vụ viễn thông
2) Đề xuất phương pháp xác định các giới hạn trên cơ sở áp dụng lý thuyết hệ thống vào bài toán xử lý hàng đợi trong trường hợp kết quả ưu tiên được cung cấp bởi đặc trưng hóa luồng lưu lượng IP Internet tại nút mạng của một nhà quản lý, cung cấp dịch vụ viễn thông
3) Hệ thống hóa về giải pháp chống tấn công từ chối dịch vụ (DDoS) và ngăn chặn sâu Internet mạng trên cơ sở đặc trưng hóa luồng lưu lượng IP để đề xuất, xác định các giới hạn nhằm vào mục tiêu bảo đảm an ninh mạng
4) Đề xuất giải pháp sử dụng tài nguyên thời gian thực (nhà quản lý, cung cấp dịch vụ viễn thông và các phần mềm mã nguồn mở) để thực hiện minh chứng lý luận Các kết quả nghiên cứu về lý luận và thực tiễn đã nêu ở trên được chương mục hóa trong cuốn luận án này như sau
C GIỚI THIỆU TỔNG QUÁT VỀ NỘI DUNG LUẬN ÁN
Trong chương 1 có tiêu đề: “Tổng quát về đặc tính hóa lưu lượng IP”, nghiên cứu sinh trình bày một cách tổng quát, hệ thống về đặc tính hóa luồng lưu lượng, các tham số đặc trưng phân loại dịch vụ trên cơ sở phân tích các sự kiện ngẫu nhiên Tiếp đến, nghiên cứu sinh trình bày tóm lược các phần cơ bản trong hai phần mềm mã nguồn mở sử dụng để giám sát mạng, nắm bắt dữ liệu thời gian thực tại Viễn thông
Trang 19Thừa Thiên Huế Trong phần kết luận chương, nghiên cứu sinh tóm tắt ngắn gọn những nội dung chính đã trình bày trong chương và nhấn mạnh những kết quả sẽ được sử dụng trong các chương tiếp theo
Những vấn đề trình bày trong chương này gồm kết quả của 02 đề tài nghiên cứu KHCN cấp cơ sở thực hiện tại Viễn thông Thừa Thiên Huế do nghiên cứu sinh chủ trì
và kết quả công bố cùng giáo viên hướng dẫn khoa học đăng tải trên tạp chí trong danh mục các tạp chí được Hội đồng chức danh giáo sư nhà nước tính điểm công trình:
- “Nghiên cứu về đặc tính lưu lượng trên mạng IP”; Mã số 001-11-CS-R-VT-01, năm 2012; Đơn vị chủ trì: Viễn thông Thừa Thiên Huế, VNPT
- “Phân tích và tối ưu lưu lượng mạng dịch vụ IP của VNPT TT Huế”; Mã số 007-11-CS-RDP-TH-28, năm 2012; Đơn vị chủ trì: Viễn thông Thừa Thiên Huế, VNPT
- “Tổng quan về đặc tính hoá luồng lưu lượng IP”, Tạp chí Khoa học và Công nghệ tập 49, số 3, tháng 12/2011
Trong chương 2 có tiêu đề: “Đặc tính thống kê và điều kiện giới hạn phân bổ lưu lượng IP Internet”, nghiên cứu sinh trình bày hai vấn đề chính liên quan đến kết quả đặc tính hóa luồng lưu lượng thu được tại Viễn thông Thừa Thiên Huế, chưa kể phần giới thiệu và kết luận chương Trong mục 2, trình bày về đặc tính hóa lưu lượng của các mô hình thu được đối với các lớp dịch vụ khác nhau, gồm tương tác đa phương tiện và lưu lượng thời gian thực, lưu lượng Web và Client-Server và di động trong môi trường mạng không dây Trong mục 3, “Điều kiện giới hạn sử dụng mô hình, phương pháp”, nghiên cứu sinh trình bày về những đồ thị biểu đồ thông lượng khác nhau, về định hình và phân chia giới hạn tắc nghẽn những điều kiện giới hạn sử dụng đối với mô hình cấu trúc mạng và phương pháp xử lý cắt lớp Trong phần kết
Trang 20luận, những kết quả thể hiện trong chương này được nghiên cứu sinh nhấn mạnh và gợi ý sử dụng những kết quả đó vào chương 3 tiếp theo
Nội dung trình bày trong chương này gồm các kết quả thu được khi thực hiện 01
đề tài nghiên cứu KHCN cấp cơ sở do nghiên cứu sinh chủ trì và 01 bài báo công bố cùng GS hướng dẫn khoa học đăng tải trên tạp chí Cụ thể:
- “Nghiên cứu về đặc tính lưu lượng trên mạng IP”; Mã số 001-11-CS-R-VT-01, năm 2012; Đơn vị chủ trì: Viễn thông Thừa Thiên Huế, VNPT
- “Tổng quan về đặc tính hoá luồng lưu lượng IP”, Tạp chí Khoa học và Công nghệ tập 49, số 3 tháng 12/2011
Trong chương 3 với tiêu đề: “Các điều kiện giới hạn về phân bố luồng lưu lượng
IP Internet theo chất lượng dịch vụ (QoS) tương thích”, nghiên cứu sinh trình bày một
số khía cạnh về việc áp dụng kết quả đặc tính hóa luồng lưu lượng vào các bài toán điều khiển xây dựng từ phía nhà quản trị, cung cấp dịch vụ để đảm QoS, gồm bốn mục chính, chưa kể phần giới thiệu và kết luận chương Trong mục 2, “Về tương thích QoS trong môi trường Internet”, nghiên cứu sinh trình bày khái quát về nghĩa tương thích QoS trong môi trường Internet làm luận cứ để trình bày các mục tiếp theo Trong mục 3, “Điều kiện để tương thích QoS đối với middleware”, trình bày sự tương quan giữa cấu trúc middleware với các thành phần của bài toán điều khiển QoS tương thích dựa trên phương pháp điều khiển truyền thống, gồm kiến trúc middleware đảm bảo QoS, các cơ chế điều kiện tương thích trong hệ thống QoS middleware, áp dụng
mô hình điều khiển truyền thống, các điều kiện về mô hình điều khiển tác vụ và ứng dụng mô hình điều khiển tác vụ trong kiến trúc middleware Mục 4, ”Giới hạn phân
bổ lưu lượng ưu tiên trong mạng hàng đợi” trình bày việc áp dụng bài toán điều khiển hiện đại để giải quyết theo các mức ưu tiên khác nhau ở hàng đợi của một nút mạng
và bàn luận về những điều kiện giới hạn gồm: “Mô hình hóa cơ chế ưu tiên lưu lượng trong mạng hàng đợi”, “Giải quyết bài toán ưu tiên trong mạng hàng đợi” và “Bàn
Trang 21luận về những điều kiện giới hạn liên quan đến xử lý mạng hàng đợi” nhằm xác định các điều kiện giới hạn cần thiết Trong mục 5, trình bày về việc thiết lập mô hình và các kết quả mô phỏng thu được tại Viễn thông Thừa Thiên Huế Trong mục kết luận chương, nghiên cứu sinh tóm tắt các nội dung chính trình bày trong chương, khẳng định đóng góp mới, sự liên hệ với các chương trước và dẫn dắt đến chương sau
Nội dung của chương này là kết quả của 01 đề tài nghiên cứu KHCN cấp cơ sở
do nghiên cứu sinh chủ trì, 02 bài báo khoa được nghiên cứu công bố đồng tác giả:
- “Nghiên cứu các phương pháp điều khiển ưu tiên khác nhau đối với các lớp dịch vụ trên mạng IP”; Mã số: 005-11-CS-R-VT-01, năm 2012; Đơn vị chủ trì: Viễn thông Thừa Thiên Huế, VNPT
- “Đảm bảo chất lượng dịch vụ cho các ứng dụng bằng phương pháp tương thích động", Tạp chí Công nghệ thông tin & Truyền thông, Vol.9, No.1, 2007
- “Kết quả mô phỏng phương pháp điều khiển tương thích chất lượng dịch vụ cho kiến trúc middleware nhận biết ứng dụng“, Chuyên san “Các công trình nghiên cứu khoa học, nghiên cứu triển khai Công nghệ thông tin“, Tạp chí KH và CN, số 75, 05/2010
Chương 4 có tiêu đề: “Nghiên cứu về các giới hạn trong chống tấn công từ chối dịch vụ (DoS) và sâu Internet” để trình bày kết quả nghiên cứu có tính khởi nguồn về ứng dụng đặc tính hóa luồng lưu lượng IP Internet vào nghiên cứu các giới hạn trong nhiệm vụ chống tấn công và bảo vệ an ninh mạng tại Viễn thông Thừa Thiên Huế; gồm bốn mục, chưa kể phần giới thiệu chương Mục 2 trình bày những điểm chính liên quan đến tấn công mạng, được biết đến như DoS và sâu Internet Mục 3 trình bày giải pháp chống DoS trên cơ sở của hệ thống phòng thủ sử dụng mạng Proxy và điều kiện giới hạn Mục 4 trình bày về các giải pháp ngăn chặn sâu Internet và các giới
Trang 22hạn Trong mục 5, ”Kết luận chương”, nghiên cứu sinh trình bày tóm tắt các nội dung của chương và kết quả đạt được của nghiên cứu sinh
Nội dung chính trình bày trong chương này là kết quả nghiên cứu có tính triển khai ứng dụng, được công bố cùng với GS hướng dẫn trên tạp chí trong danh sách các tạp chí được Hội đồng chức danh giáo sư nhà nước tính điểm công trình Cụ thể:
- “Nghiên cứu về bảo vệ và chống tấn công mạng”, Tạp chí Khoa học và Công nghệ tháng 9/2012
Cuối cùng, phần “Kết luận và định hướng nghiên cứu tiếp” gồm hai mục như tiêu đề, và được trình bày một cách tóm tắt Trong phần “Kết luận” gồm ý tưởng, kết quả nghiên cứu về lý luận, thực tiễn và các đóng góp trong lĩnh vực nghiên cứu đặc tính hóa lưu lượng IP, xác định những giới hạn biên ràng buộc cần thiết đối với các
mô hình điều khiển phân bổ lưu lượng (điều khiển truyền thống và hiện đại) để đảm bảo chất lượng dịch vụ QoS, cũng như trong việc tìm hiểu, xây dựng các giới hạn của
mô hình phục vụ an toàn thông tin và an ninh mạng Internet Liên quan đến các vấn
đề nghiên cứu và các đóng góp mới là những hướng mở có thể triển khai ở các công trình nghiên cứu tiếp theo trong mục “Những vấn đề cần nghiên cứu tiếp”
Nội dung chi tiết về các kết quả nghiên cứu đạt được của nghiên cứu sinh theo khuôn khổ của các chương, mục được trình bày tiếp theo Nghiên cứu sinh nhận thấy nội dung của chương 1 và chương 2 thường được sát nhập và bố trí trong cùng một chương Nhưng sự tách biệt thành hai chương trong cách bố cục ở đây có hàm ý nhấn mạnh các kết quả đặc tính hóa lưu lượng IP thu được do triển khai thực nghiệm thời gian thực tại Viễn thông Thừa Thiên Huế
Trang 23Chương 1
TỔNG QUÁT VỀ ĐẶC TÍNH HÓA LƯU LƯỢNG IP
1.1 GIỚI THIỆU CHƯƠNG
Hiển nhiên, luồng lưu lượng IP đến nút mạng của nhà quản lý, cung cấp dịch
vụ viễn thông tuân thủ theo quy luật của các sự kiện ngẫu nhiên Nhưng do các đặc tính của lớp dịch vụ khác nhau (lớp thoại, lớp luồng lưu lượng, lớp tương tác, lớp nền, …) cùng với sự khác biệt của các phương thức truyền (cách thức điều chế) và môi trường truyền thông (vô tuyến ở các băng tần, cáp đồng trục, cáp quang, khoảng cách, …) giữa điểm đầu (nơi có nhu cầu phục vụ) và điểm cuối (đến nhà cung cấp dịch vụ) làm dáng điệu luồng lưu lượng IP bị biến dạng không giống nhau trong mọi trường hợp Điều đó dẫn đến nhu cầu đặc tính hóa để tìm các tham số đặc trưng cho lớp dịch vụ của luồng lưu lượng thể hiện ở sự biến đổi ngẫu nhiên theo cả tần số và thời gian do tương quan giữa luồng lưu lượng, phương thức truyền với môi trường truyền thông
Đã có nhiều công trình nghiên cứu về đặc tính hóa lưu lượng Internet, cả về khía cạnh phân tích lẫn khía cạnh nắm bắt và đo lường chất lượng [1], [2], [3], [36], [81] Những công trình đó chỉ ra rằng trên phạm vi toàn cầu, công nghệ mạng và dịch vụ Internet phát triển nhanh hơn so với sự phát triển liên quan đến việc phân tích và đến sự hiểu biết lý thuyết về cách ứng xử và xử lý của mạng Điều đó làm hạn chế đối với lĩnh vực đo lường, bắt giữ luồng dữ liệu và phân tích các đặc tính lưu lượng phục vụ việc giám sát, loại bỏ lưu lượng “độc hại” và dự báo các dịch vụ theo thời gian thực, mặc dù đã có một số thành công nhất định trong kĩ thuật sử dụng mô hình vật lý-toán học trong lĩnh vực truyền dẫn truyền thống, nhất là lý
thuyết hàng đợi Thêm vào đó, đối với phạm vi doanh nghiệp, có nhiều lý do khác
nhau khiến việc tập hợp các đặc tính lưu lượng Internet, đặc tính lưu lượng của mạng đường trục đã không nhận được nhiều sự quan tâm đúng mức của các nhà quản lý, cung cấp dịch vụ mạng Trong đó, một trong những nguyên nhân chính là
Trang 24do các nhà quản trị, cung cấp dịch vụ mạng chỉ tập trung nỗ lực vào các hoạt động sản xuất, phục vụ nhiệm vụ kinh doanh, không dành thời gian, nguồn lực cho việc
thu thập, hệ thống hóa dữ liệu Điều này dẫn đến sự tồn tại một khoảng cách giữa
những kết quả thu được bởi các thí nghiệm (trong môi trường cô lập) với những kết quả thể hiện bởi đặc tính của cơ sở hạ tầng Internet rộng lớn phân tán ở mọi nơi, trên phạm vi toàn cầu [8], [72], [75], [76], [78]
Để giảm khoảng cách giữa lý thuyết và thực tế trải nghiệm, nghiên cứu sinh dựa trên cơ sở lý thuyết và sử dụng các mã nguồn mở có uy tín để tiến hành điều tra mạng viễn thông tại đơn vị cung cấp dịch vụ nhằm tổng hợp các số liệu lưu lượng
và đóng góp vào sự hiểu biết về hành vi mạng ở quy mô lớn Từ năng lực lý luận trên cơ sở lý thuyết về hành vi mạng có thể áp dụng và tạo điều kiện cho các nhà cung cấp dịch vụ mạng thực hiện có hiệu quả về quản lý, phát triển cơ sở hạ tầng quy mô lớn Ngược lại, những đòi hỏi thực tế về cung cấp dịch vụ, chất lượng dịch
vụ làm động lực thúc đẩy việc ứng dụng kết quả thuộc lĩnh vực nghiên cứu lý thuyết đến thế giới hoạt động thực của mạng Từ cách nhìn như vậy, những kết quả nghiên cứu tổng quát về đặc tính hóa lưu lượng IP (tham số hóa quá trình ngẫu nhiên của các luồng lưu lượng) sẽ được trình bày theo kiểu một tài liệu hướng dẫn đối với các nhà quản lý mạng, cung cấp dịch vụ mạng trong chương 1
1.2 LƯU LƯỢNG VÀ CÁC ĐẶC TÍNH PHÂN LOẠI
Có nhiều loại lưu lượng khác nhau, tùy theo từng ứng dụng cụ thể, cùng tồn tại trên mạng và có thể phân các ứng dụng thành loại theo thời gian thực và không theo thời gian thực Các loại lưu lượng ứng với ứng dụng khác nhau, ngay cả khi chúng có cùng điểm xuất phát, cùng điểm đến và cùng cách thức truyền thông, thì
đã có các đặc tính ngẫu nhiên và nhu cầu về QoS (các tham số thể hiện băng thông,
tỷ lệ mất gói, v.v…) khác nhau và có thể phân tích các yêu cầu về QoS dựa trên mức thời gian và mức truyền dịch vụ (mức gói, cuộc gọi) khác nhau Thường sử dụng phân tích thống kê để xác định các đặc tính lưu lượng và sử dụng những đặc tính lưu lượng đó với các yêu cầu tương ứng của loại dịch vụ làm các tham số chính
Trang 25để phân loại lưu lượng IP [55], [63], [84], [85], [104] Mô hình lưu lượng đối với các dịch vụ cơ bản dựa trên lý thuyết Erlang, gồm hai tham số chính (tốc độ xuất hiện cuộc gọi và thời gian chiếm giữ trung bình) để xác định lưu lượng ra ứng với thời gian sử dụng tài nguyên
Nếu phân bố Poisson phù hợp với thống kê xuất hiện các cuộc gọi thì đối với
hệ thống có N kênh, tổng lưu lượng A, thời gian giữ cuộc trung bình τ, độ trễ lớn nhất cho phép trước khi cuộc gọi mới bị khóa T Xác suất không có server (hệ thống bận, cuộc gọi mới bị khóa) GOS tuân theo mô hình Erlang B khi không có cơ chế trễ T và xác suất không có server khi có cơ trễ thiết lập lớn hơn T, GOS tuân theo
mô hình Erlang C [84]:
Erlang B:
N
k N
k=0
AN!
GOS
Ak!
τ k N-1 N
- Tốc độ dữ liệu đỉnh (Peak Data Rate) được biết đến là tốc độ dữ liệu lớn nhất
có thể tạo ra bởi một nguồn lưu lượng trong khoảng thời gian điển hình
- Tốc độ dữ liệu trung bình (Average Data Rate) được hiểu là số dữ liệu tạo ra
từ nguồn trong một khoảng thời gian nhất định và đơn vị đo thường là bps (số byte per second) hoặc prs (packet per second) Việc tính toán đối với tốc độ dữ liệu trung bình thường được diễn ra trong khoảng thời gian dài
- Burstiness dùng để mô tả nguồn gửi lưu lượng không thường xuyên qua việc
sử dụng biểu thức đơn giản để tính toán như sau:
Trang 26AverageDataRate
Nếu một nguồn gửi lưu lượng với tốc độ không đổi thì nguồn đó không đột biến và có burstiness bằng 1 Nguồn được coi là biến đổi rất lớn hay burstiness lớn hơn rất nhiều so với 1, nếu nguồn đó cho phép các khoảng thời gian lớn không gửi lưu lượng xen kẽ với những khoảng thời gian gửi với tốc độ gần bằng tốc độ đỉnh Tính đa dạng của dịch vụ băng rộng dẫn tới sự phân tán lớn của burstiness, về thời gian chiếm giữ và tốc độ đỉnh Trong dịch vụ đa phương tiện, các ứng dụng cung cấp có thể nhóm thành bốn loại chính của các lớp dịch vụ như sau:
- Lớp thoại (Conversational Class) bao gồm các dịch vụ thoại, hội nghị Video, Video-game … Yêu cầu quan trọng nhất đối với lớp dịch vụ này liên quan đến thời gian, bao gồm độ trễ thấp, biến đổi trễ thấp và duy trì tốc độ dữ liệu nguồn Tỷ lệ tổn thất không phải là quá quan trọng
- Lớp luồng lưu lượng (Streaming Class) bao gồm các luồng lưu lượng Audio, Video Yêu cầu đối với lớp luông lưu lượng này là duy trì tương quan với thời gian
để biến đổi trễ thấp, nhưng không quan trọng như yêu cầu độ trễ thấp đối với lớp thoại Tỷ lệ tổn thất là không quan trọng
- Lớp tương tác (Interactive Class) bao gồm Web-browser, truy nhập cơ sở dữ liệu, truy nhập LAN từ xa Đối với lớp tương tác, một tham số quan trọng đó là độ trễ toàn trình (round-trip delay) vì tham số này mô tả thời gian yêu cầu và đáp ứng
Tỷ lệ tổn thất là rất quan trọng đối với các loại ứng dụng này
- Lớp nền (Background Class) gồm các ứng dụng phi thời gian thực như email, truyền file … không có hạn chế nào về thời gian hay độ trễ nhưng tỷ lệ tổn thất là rất quan trọng
Hiện nay chưa có định nghĩa thống nhất chuẩn hoá về luồng lưu lượng Internet (tùy mục đích nghiên cứu mà luồng lưu lượng được định nghĩa theo các cách khác nhau) Mục tiêu ở đây là xây dựng mô hình nhận biết lưu lượng trên mạng Internet trên cơ sở các kết quả phân tích đặc tính, biểu hiện hoạt động của luồng lưu lượng
Trang 27Vì vậy, cần sử dụng định nghĩa sao cho có thể cung cấp được nhiều thông số thống
kê luồng lưu lượng và đồng nhất theo thời gian
Ở đây nghiên cứu sinh đã sử dụng phương pháp định nghĩa luồng lưu lượng
gần giống phương pháp của RTFM, trong đó thuật ngữ "khoá" được sử dụng để chỉ
tập các thuộc tính địa chỉ trên các lớp khác nhau của mô hình TCP/IP, gồm các thông số về địa chỉ IP nguồn, địa chỉ IP đích, cổng ứng dụng nguồn, cổng ứng dụng
đích và chỉ số nhận dạng giao thức TCP Cụ thể, Hai gói liên tiếp được xem là thuộc
cùng một luồng nếu chúng không cách nhau quá một khoảng thời gian cho trước (gọi là thời gian time-out), nếu không một luồng mới sẽ được tạo ra
Để mô tả luồng lưu lượng, cần sử dụng các thuộc tính đặc trưng (tập thuộc tính) của luồng và phương pháp đo lường phù hợp Thuộc tính luồng có thể là các trường trong phần tiêu đề của gói (địa chỉ IP nguồn/đích, cổng ứng dụng nguồn/ đích, v.v…) hoặc các bộ đếm số lượng byte, số lượng gói chứa trong luồng hoặc các giá trị thống kê của các tham số trên (trị trung bình, trị trung tâm, hay độ lệch tiêu chuẩn) Để phản ánh đúng bản chất biến thiên và các biểu hiện hoạt động của luồng lưu lượng Internet, ngoài các thuộc tính đã nêu, cần khảo sát, tính toán thêm nhiều thuộc tính quan trọng khác kể cả những thông số của các phân bố rời rạc liên quan
như: phân bố thời điểm đến của các luồng, phân bố kích thước các luồng, phân bố
thời điểm đến của các gói thuộc luồng, phân bố kích thước các gói thuộc luồng, v.v… vào tập các thuộc tính mô tả luồng
Trong quá trình phân tích luồng, ngoài định nghĩa khoá, cần xác định cơ chế bắt đầu, kết thúc của một luồng lưu lượng Có ba phương pháp cơ bản để xác định
sự kết thúc của một luồng Đó là phương pháp dựa trên cơ chế hoạt động của giao
thức; dựa trên thời gian time-out cố định và dựa trên thời gian time-out tương thích
Trên thực tế, số thuộc tính của luồng lưu lượng IP thu được rất lớn, nhưng chỉ có một số đặc tính được sử dụng cho việc nhận biết, phân loại luồng lưu lượng [81] như thể hiện trong bảng 1-1 và bảng 1-2
Trang 28Bảng 1-1 Các thuộc tính chung của các luồng
đầu
Xác định hướng truyền của luồng (10 giá trị): 1: hướng từ nút khởi tạo đến nút đáp ứng -1: theo hướng ngược lại
cửa sổ thời gian cho trước (2 phút) Các thuộc tính thể hiện phiên làm việc kiểu đối thoại
thoại trên tổng số gói đầy đủ của luồng
trung bình trên tổng số gói đầy đủ của luồng
Trang 29αgd
Dấu hiệu cho biết mức độ thường xuyên của các trao đổi gói kiểu ping-pong quan sát được trong luồng lưu lượng
Bảng 1-2 Các thuộc tính trên mỗi hướng của luồng
9 giá trị, liên tục
tin
Phân bố rời rạc: Chiều dài phần tải tin của gói (bin giá trị về chiều dài phần tải tin của mỗi gói, giá trị trong mỗi bin nằm giữa 0 và 1)
23 giá trị, liên tục
Các thuộc tính thể hiện phiên làm việc kiểu tương tác từ bàn phím
7
Trang 30Các thuộc tính thể hiện phiên làm việc kiểu tương tác dòng lệnh
8
Các thuộc tính thể hiện phiên làm việc kiểu truyền file
Liên tục
tâm tải tin
Trung tâm của phân bố chiều dài phần tải tin
Thể hiện mức độ gần với trị trung tâm của độ dài phần tải tin của các gói (tính không đổi độ dài phần tải tin)
Liên tục
Trang 31Để hiểu cơ chế hoạt động phức tạp của mạng, đặc tính hoá lưu lượng được xem như một hàm nhiều tham số Thống kê lưu lượng phục vụ mục đích đặc tính hoá được nghiên cứu sinh sử dụng ở đây là phương pháp gộp chi tiết (Aggregation granularity, AG); phân tích hệ thống trên cơ sở chia hệ thành các phân hệ khác nhau
để hiểu biết chi tiết hơn và tổng hợp đặc tính của các phân hệ để có những đặc tính của toàn bộ hệ đó Hình 1-1 dưới đây biểu diễn cấu trúc điển hình và phân lớp tương ứng của môi trường mạng Internet
Một trong những cách thu thập các số liệu thống kê liên quan đến đặc tính hoá,
mô hình hoá lưu lượng mạng là rời rạc hoá các thành phần theo nghĩa “Rời rạc các thành phần để lấy thông tin từ mỗi thành phần và rời rạc các thành phần để mỗi thành phần biễu diễn được thông tin”
Việc phân tích lưu lượng thường được thực hiện theo hai cách: Phân tích hướng đầu cuối sử dụng (chia tải theo loại đầu cuối - đầu cuối), mô tả trong hình 1-
2 và phân tích từ phía mạng (phân tích, tổng hợp các luồng lưu lượng của môi trường mạng cho trước nào đó) như mô tả trong hình 1-3
Mạng trục quốc gia Nhà cung cấp dịch vụ khu vực
Mạng IP Mạng con IP Host IP hoặc hệ thống đầu cuối Người sử dụng
Nhà cung cấp dịch vụ địa phương
Các ứng dụng
Hình 1-1 Biễu diễn các phân lớp của môi trường mạng Internet
Trang 32Môi trường liên mạng
Mạng nội bộ
Mạng khu vực
Môi trường mạng trục quốc gia
Host lưu lượng truyền qua
Host lưu lượng truyền qua
Hình 1-3 Phân tích các luồng lưu lượng của một môi trường mạng
Host lưu
lượng
truyền qua
Host nguồn
Host đích
Môi trường liên mạng
Host lưu lượng truyền qua
Host lưu
lượng
truyền qua
Host lưu lượng truyền qua
Hình 1-2 Phân tích các luồng lưu lượng ở phía đầu cuối
Trang 33Để đánh giá toàn diện, trước hết cần phân tích khả năng đáp ứng của một điểm đầu cuối của mạng, sau đó phân tích các đặc tính lưu lượng của mạng Việc đánh giá theo hướng đầu cuối này được chia làm nhiều loại tham số khác nhau ví dụ như
độ trễ và trượt thời gian, độ mất mát gói tin và thông lượng
Sau khi thu được những kết quả cần thiết cho việc phân tích lưu lượng như trình bày ở trên, các yếu tố điều kiện cho một phép phân tích lưu lượng mạng gồm:
- Sự sử dụng: Mức độ sử dụng có thể phản ánh trong mỗi phép đo các đặc tính
phân chia của mạng Các số liệu thống kê về việc phân bố dữ liệu (giá trị trung bình, độ sai khác, tỉ lệ thống kê) chỉ khuynh hướng sử dụng trong khoảng thời gian nào đó Liên quan đến khái niệm về sự sử dụng là vấn đề tắc nghẽn mạng, hạn chế
về tài nguyên băng thông và năng lực chuyển mạch
- Khả năng tiếp cận: Phục vụ việc duy trì bảng định tuyến, tìm kiếm trong
bảng định tuyến để chuyển gói tin trong các node chuyển mạch Các số liệu (kích cỡ của các bảng định tuyến, số mạng IP trong mạng Internet có thể định tuyến để chuyển lưu lượng) là các chỉ số phản ánh khả năng tiếp cận mạng
- Tính địa phương: Liên quan đến khả năng tiếp cận của mạng tại một nút
mạng cụ thể chính là lưu lượng tại điểm mạng đó, phản ánh sự không đồng nhất trong việc phân bố lưu lượng về mặt địa lý Các nhà thiết kế mạng đã rất quan tâm đến việc sử dụng bộ nhớ thực qua việc sử dụng bộ nhớ ảo cũng như bộ đệm [90] Ví
dụ, Jain đã nghiên cứu so sánh việc sử dụng bộ nhớ địa chỉ tại điểm đó theo không gian hoặc thời gian [47]; nhóm của Gulati cung cấp bốn đặc trưng của đặc tính địa phương hoá [33]; Estrin và Mitzel đã khám phá tính cục bộ địa phương bằng cách xét mào đầu trong các thiết bị định tuyến [55]
- Tính truyền (Burstiness): Trên quan điểm phân tích mạng, liên quan đến việc
phân bố chung về độ trễ, độ trượt là tính truyền của toàn bộ lưu lượng tải làm việc Tính truyền mô tả như trong hình 1-4, phải biểu diễn được tiến trình dữ liệu giữa các thời điểm đến (thời gian giữa các gói đến), tiến trình dữ liệu các gói đến (số gói
Trang 34đến trong mỗi khoảng thời gian) và những tham số bổ sung về nơi đến (các gói, các byte, các luồng, các phiên lớp giao vận)
- Tải có ích (Payload): Được hiểu là số lượng thông tin chứa trong một gói
Như vậy, tải có ích của một gói IP là nội dung của gói theo sau thông tin mào đầu
IP (tải có ích của một gói telnet lại không tính các mào đầu TCP và IP) Nhưng đôi
khi tải có ích cũng được định nghĩa một cách không rõ ràng, bao gồm toàn bộ các mào đầu gói Dùng khái niệm gói tải có ích để chỉ hiệu quả của giao thức mặc dù phân tích chính xác về tính hiệu quả cũng phản ánh cách xử lý cuối đến cuối, bao gồm cả việc thừa nhận, sự phát lại và các chiến lược cập nhật các giao thức khác
- Vùng giao lưu lượng: Nhiều đặc tính tải khác nhau khi dùng vào các ứng
dụng khác nhau Các ứng dụng và các giao thức vận chuyển tầng dưới khác với
dạng hoạt động của nó (TCP khác với UDP, ftp khác từ telnet) Vì vậy, ngoài toàn
bộ phần mô tả lưu lượng, việc xét theo từng giao thức cũng là phần quan trọng để
mô tả mạng
- Các metric lưu lượng riêng lẻ: Nhiều nghiên cứu chỉ ra số liệu đo ở các
khoảng thời gian, các loại mạng khác nhau ảnh hưởng đến vùng giao của lưu lượng mạng diện rộng [66], [72], [79] Các số liệu đo tham chiếu (metric) đóng vai trò quan trọng không chỉ đối với nhiệm vụ đánh giá về vùng giao mà còn đối với việc đánh giá sự đóng góp của từng thành phần riêng của vùng giao vào lưu lượng tải tổng hợp Khảo sát cách xử lý các ứng dụng cụ thể (chuyển tập tin trao đổi hay đăng nhập màn hình từ xa) và các giao thức truyền sử dụng ở lớp dưới (TCP, UDP, IP)
Sự kiện
Sự kiện đến
Thời gian đến
Khe thời gian
Hình 1-4 Mô tả một quá trình điều khiển sự kiện, thời gian truyền đến lẫn nhau
giữa các sự kiện trong khoảng một chu kì thời gian nhất định
Trang 35cấu thành thành phần vào thực hiện nhiệm vụ thiết lập định hình và dạng (profile) lưu lượng Nhiều nghiên cứu lập profile lưu lượng TCP đã xem xét đến lưu lượng Internet thông qua các điểm chuyển tiếp đến mạng diện rộng như nhóm của Caceres định hình các trao đổi Internet bằng cách đặc tính hoá các trao đổi TCP giữa các điểm đầu cuối với nhau [79]; Danzig và Jamin đã dùng kết quả của nhóm Caceres
để tạo thư viện về đặc tính tải của TCP mang tính thực nghiệm sử dụng vào mô phỏng mạng [43], [102]; Paxson xem xét các kết nối TCP trong mạng diện rộng bắt nguồn từ ba cấp độ của Internet (khuôn viên trường đại học, các tổ chức nghiên cứu, vùng và môi trường cổng quốc tế) [43], [66], [73]; nhóm của Danzig tập trung lập profile của một ứng dụng đơn lẻ để phân tích lưu lượng dữ liệu phân giải tên miền (DNS) trong mạng diện rộng [76]
- Tổng hợp các metric lưu lượng: Vì các mạng tích hợp đòi hỏi những thông
tin về luồng đối với một số luồng được định hướng duy trì kết nối suốt thời gian sống, nên nhiều metric phục vụ việc tổng hợp lưu lượng đóng vai trò quan trọng cho các nhà phát triển thiết bị mạng như số lượng các luồng hoạt động trên giây, số lượng các luồng mới yêu cầu thiết lập trên mỗi giây và số lượng các luồng nhàn rỗi cần xóa
- Các đặc tính phụ thuộc môi trường mạng: Ngoài cấu trúc phân cấp giao thức
còn một thành phần phân cấp nữa của đặc tính lưu lượng là kiến trúc phân cấp kết nối Internet như trong hình 1-1 Ở đó chỉ cần phù hợp với kiến trúc phân cấp, ngay
cả khi profile tải làm việc của mỗi giao thức riêng khác nhau qua các thành phần mạng khác nhau Một số kết quả được tham khảo ở phần này gồm nghiên cứu của nhóm Acharya về đặc tính hoá có phân cấp lưu lượng tại một mạng campus bằng việc phân tích quan sát lưu lượng từ ba vùng campus theo nội mạng LAN, liên mạng LAN và lưu lượng tương ứng từ LAN đến WAN [101]; Wakeman và đồng nghiệp và Asaba với nghiên cứu đặc tính lưu lượng trên cơ sở hạ tầng mạng quốc tế, tương ứng với lưu lượng xuyên Đại Tây Dương và Thái Bình Dương
Trang 361.3 VỀ CÁC PHẦN MỀM MÃ NGUỒN MỞ SỬ DỤNG
1.3.1 Lựa chọn các phần mềm vào đặc tính hóa lưu lượng
Để thu thập thông tin dữ liệu của mạng phục vụ việc giám sát mạng, nghiên cứu sinh đã nghiên cứu một số công cụ đang được nhiều nhà quản trị mạng sử dụng
và phát triển thêm như NTOP (dùng để theo dõi lưu lượng di chuyển trong mạng), Wireshark (công cụ sử dụng để thu thập lấy mẫu các gói tin trong mạng), SPAN (bắt gói thụ động sử dụng để cấu hình hỗ trợ bắt gói tin của các SW Core Cisco cung cấp dịch vụ cho khách hàng), Observium (dùng để theo dõi thông lượng các gói tin đi qua hệ thống)
Tuy nhiên, do mạng dịch vụ của Viễn thông Thừa Thiên Huế đang hoạt động cung cấp dịch vụ cho khách hàng, đòi hỏi phải đảm bảo hoạt động ổn định Việc thay đổi cấu hình hoặc chuyển hướng lưu lượng phục vụ giám sát có thể làm ảnh hưởng, gián đoạn đến hoạt động của toàn mạng Vì vậy, kỹ thuật SPAN và ứng dụng Wireshark chỉ dừng lại ở mức nghiên cứu mà không áp dụng để triển khai trên mạng Triển khai giám sát, phân tích, nhận biết đặc tính lưu lượng tại Viễn thông Thừa Thiên Huế được chọn lọc, sử dụng hai phần mềm mã nguồn mở:
- Ứng dụng phần mềm NTOP để quan sát, giám sát, thống kê một khu vực
(nhóm người dùng) về tỉ lệ sử dụng các loại giao thức mạng (tập trung ở lớp 4) ở mức chi tiết như WWW, FTP, SNMP, NTP, … để đề xuất về việc thiết lập các QoS cho từng loại giao thức để tăng chất lượng phục vụ người dùng
- Ứng dụng phần mềm mã nguồn mở Observium để quan sát, giám sát và
thống kê lưu lượng tổng quát (chủ yếu lưu lượng lớp 3) của mạng cung cấp dịch vụ MAN-E nhằm mục đích phân tích, đưa ra các đề xuất tối ưu về quy hoạch băng thông đường truyền, định tuyến cho mạng MAN-E đối với dịch Internet và IPTV
1.3.2 Phần mềm NTOP
a) Giới thiệu phần mềm NTOP
Phần mềm này là một ứng dụng mã mở dùng để quan sát việc sử dụng mạng một cách chi tiết, dễ sử dụng và phù hợp để quan sát nhiều loại mạng NTOP được
Trang 37Luca Deri phát triển từ năm 1998 do nhu cầu cần một ứng dụng để giám sát thời gian thực các loại lưu lượng mạng Phiên bản mã mở bắt đầu từ 1.3, được biên dịch theo các công cụ biên dịch mã mở và phiên bản hiện tại 5.0.1 có các thay đổi phù hợp với các phiên bản cải tiến của nhân hệ điều hành, sửa lỗi và nâng cấp các tính
Việc tải, sử dụng phần mềm này theo giấy phép phần mềm mã mở GPL với
Các chức năng có thể cung cấp bởi NTOP gồm:
- Sắp xếp lưu lượng sử dụng theo nhiều loại giao thức mạng www, ftp, snmp, ntp, …
- Sắp xếp lưu lượng theo các tiêu chí khác nhau
- Hiển thị các số liệu thống kê lưu lượng
- Xác định được các địa chỉ mạng (nguồn/đích) phát sinh lưu lượng
- Xác định phần cứng đầu cuối
- Hiển thị biểu đồ lưu lượng IP theo các tỉ lệ sử dụng các giao thức
Vì vậy, NTOP rất hiệu quả khi sử dụng để quan sát thống kê về thói quen sử dụng mạng của một tập người dùng cụ thể Bằng cách quan sát chung nhóm người dùng, NTOP có thể cung cấp cho nhà quản trị mạng về tỉ lệ các loại dịch vụ Internet
mà người dùng sử dụng như thế nào Từ đó có thể thiết lập chi tiết hơn các độ ưu tiên QoS, ToS khi triển khai tối ưu sử dụng các dịch vụ mạng của khách hàng Hình 1-5 thể hiện mô hình chung về sử dụng ứng dụng NTOP để thống kê việc sử dụng các giao thức mạng của một nhóm người dùng Internet
b) Triển khai cài đặt
Việc cài đặt NTOP được thực hiện trên một máy chủ Linux Ubuntu Máy chủ này được đặt tại Gateway của mạng Internet phục vụ cho hơn 600 người dùng của Viễn thông Thừa Thiên Huế và Bưu điện Tỉnh Thừa Thiên Huế
Máy chủ sử dụng ba card mạng, một cổng mạng kết nối vào mạng người dùng, hai cổng mạng còn lại kết nối vào mạng Internet và sử dụng chức năng chia tải
Trang 38Dung lượng Internet có thể hoạt động ở tốc độ 100Mbps Hình 1-6 thể hiện mô hình triển khai ứng dụng NTOP tại Viễn thông Thừa Thiên Huế
Hình 1-5 Mô hình sử dụng ứng dụng Ntop
Hình 1-6 Mô hình triển khai ứng dụng Ntop
Việc cài đặt Ntop tương đối đơn giản bao gồm các bước như sau
Bước 1: Cài đặt gói ứng dụng Ntop từ kho phần mềm Cụ thể:
Máy chủ Linux
FTTH (Fiber Internet)
Local Network (Mạng người dùng)
Điều chỉnh các tham số
QoS của thiết bị định tuyến
Trang 39$ sudo apt-get update
$ sudo apt-get install ntop
Bước 2: Cấu hình NTOP bằng cách:
Lập mật khẩu để quản lý ứng dụng NTOP: $sudo /usr/sbin/ntop –A Kích hoạt ứng dụng: $sudo /etc/init.d/ntop restart
Bước 3: Sử dụng
Truy nhập vào máy chủ thông qua giao diện web với cổng 3000, có thể sử
dụng ứng dụng thông qua giao diện web
c) Một số kết quả thu được sau khi triển khai
Sau khi cài đặt và kích hoạt phần mềm NTOP hoạt động tại nhà quản lý, cung
cấp dịch vụ Viễn thông Thừa Thiên Huế, thu được tải lưu lượng của mạng như
trong hình 1-7, lưu lượng tại giao thức HTTP như trong hình 1-8, lưu lượng phân bổ
theo cổng đích dịch vụ như trong hình 1-9 và thống kê sử dụng các ứng dụng
Internet như trong hình 1-10
Hình 1-7 Tải lưu lượng của mạng
Hình 1-8 Lưu lượng giao thức HTTP
Trang 40Hình 1-9 Lưu lượng phân bố theo cổng đích dịch vụ
Hình 1-10 Thống kê sử dụng các loại ứng dụng Internet
1.3.3 Phần mềm mã nguồn mở Observium
a) Giới thiệu phần mềm
Phần mềm Observium phiên bản mã mở số hiệu 0.2.1 được nhóm phát triển do Adam Armstrong chủ trì cho ra đời năm 2007 với tính năng cơ bản Các phiên bản sau được cộng đồng hỗ trợ, phát triển để tương thích với các chuẩn thư viện linux
và mã nguồn PHP phiên bản mới và bổ sung thêm các thuộc tính MIB (trong giao thức SNMP) của các hãng cung cấp thiết bị Phiên bản hiện tại, số hiệu 0.12.4.3049,