Khắc phục sự cố liên kết và các thiết bị lỗi: chẩn đoán và giải quyết sự cố liên quan đến các thành phần mạng, liên kết hay kết nối cung cấp dịch vụ là nhiệm vụ cần thiết trong công việc
Trang 1TRƯỜNG ĐẠI HỌC NHA TRANG
KHOA CÔNG NGHỆ THÔNG TIN
_*** _
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH
CÔNG NGHỆ THÔNG TIN
GVHD: Th.S PHẠM VĂN NAM SVTH: PHAN THÁI VƯƠNG
Trang 2LỜI NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
… ……….………
………
………
Trang 3Ý KIẾN CỦA GIÁO VIÊN PHẢN BIỆN
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
Trang 4LỜI CẢM ƠN
Máy tính và mạng máy tính có vai trò hết sức quan trọng trong cuộc sống ngày nay Ngày nay trong bất kỳ lĩnh vực nào cũng cần đến máy tính, máy tính rất hữu ích với chúng ta Chính nhờ có máy tính và sự phát triển của nó đã làm cho khoa học kỹ thuật phát triển vượt bậc, kinh tế phát triển nhanh chóng và thần kỳ Được sự hướng dẫn nhiệt tình và chu đáo của thầy Phạm Văn Nam em đã tìm hiểu và nghiên cứu đề tài tốt nghiệp “CÁC KỸ THUẬT KHẮC PHỤC SỰ CỐ MẠNG TIÊN TIẾN” Đồ án trình bày những vấn đề Lập kế hoạch bão dưỡng cho mạng phức tạp - Giới thiệu về quá trình khắc phục sự cố - Công cụ bảo trì và khắc phục sự cố - Khắc phục sự cố cơ bản trên Switch - Khắc phục sự cố nâng cao trên Switch - Khắc phục sự cố giữa các giao thức định tuyến - Duy trì và khắc phục sự
cố bảo mật mạng - khắc phục sự cố dịch vụ địa chỉ IP - Khắc phục sự cố hiệu suất mạng
Do nội dung đồ án rộng và bao gồm nhiều kiến thức mới mẻ, thời gian và kiến thức còn hạn chế, việc nghiên cứu chủ yếu dựa trên lý thuyết nên chắc chắn đề tài không tránh khởi những thiếu sót Em rất mong nhận được sự đóng góp ý kiến của thầy cô giáo và bạn bè
Với lòng biết ơn sâu sắc, em xin chân thành cảm ơn thầy Phạm Văn Nam cùng các thầy cô giáo trong khoa Công nghệ thông tin trường Đại Học Nha Trang
đã tận tình dạy dỗ và giúp đỡ em trong 4 năm học vừa qua
Cuối cùng xin cảm ơn bạn bè, người thân đã luôn bên tôi, kịp thời động viên
và giúp đỡ tôi trong thời gian vừa qua
Em xin chân thành cảm ơn !
Nha Trang, tháng 6 năm 2011 Sinh viên thực hiện:
Phan Thái Vương
Trang 5MỤC LỤC
CHƯƠNG 1 LẬP KẾ HOẠCH BẢO DƯỠNG CHO CÁC MẠNG PHỨC TẠP 1
1.1 Mô hình và phương pháp bảo dưỡng 1
1.2 Mô hình bảo dưỡng và tổ chức 1
1.3 Quy trình và phương pháp bảo dưỡng mạng 2
1.4 Công cụ bảo dưỡng hệ thống mạng, ứng dụng và tài nguyên 3
1.5 Công cụ cấu hình và tài liệu mạng 9
1.6 Công cụ khắc phục sự cố 9
1.7 Công cụ giám sát và đo lường 10
CHƯƠNG 2 GIỚI THIỆU VỀ QUÁ TRÌNH KHẮC PHỤC SỰ CỐ 11
2.1 Phương pháp khắc phục sự cố 11
2.2 Phương pháp khắc phục sự cố có cấu trúc 12
2.2.1 Phương pháp trên xuống (Top-down) 12
2.2.2 Phương pháp dưới lên (Bottom-up) 13
2.2.3 Phương pháp chia để trị 13
2.2.4 Chuyển tiếp lưu lượng đường dẫn 14
2.2.5 So sánh cấu hình 14
2.2.6 Hoán đổi các thành phần 15
2.2.7 Ví dụ Lựa chọn phương pháp tiếp cận để khắc phục sự cố 15
2.3 Thực hiện quy trình khắc phục sự cố 17
2.3.1 Xác định sự cố 18
2.3.2 Thu thập và phân tích thông tin 18
2.3.3 Nguyên nhân loại bỏ sự cố 19
Trang 62.3.4 Xây dựng và kiểm tra giả thuyết 19
2.3.5 Giải quyết sự cố 19
2.4 Mối quan hệ giữa nhiệm vụ bảo trì và khắc phục sự cố 20
2.5 Tài liệu duy trì mạng hiện tại 20
2.6 Thiết lập ranh giới 21
2.7 Giao tiếp trong quá trình khắc phục sự cố 22
2.8 Quản lý thay đổi 23
CHƯƠNG 3 CÔNG CỤ BẢO TRÌ VÀ KHẮC PHỤC SỰ CỐ 24
3.1 Công cụ chẩn đoán của Cisco IOS 24
3.1.1 Bộ lọc đầu ra của lệnh show 24
3.1.1.1 Khắc phục sự cố kết nối 27
3.1.1.2 Khắc phục sự cố phần cứng 28
3.1.2 Công cụ chẩn đoán chuyên môn 29
3.1.3 Thực hiện nắm bắt gói tin 30
3.1.4 Tạo đường cơ sở bằng SNMP và NetFlow 31
3.1.4.1 Giao thức quản lý mạng cơ bản (Simple Network Management Protocol =SNMP) 32
3.1.4.2 NetFlow 33
CHƯƠNG 4 KHẮC PHỤC SỰ CỐ CƠ BẢN TRÊN SWITCH 34
4.1 Khắc phục sự cố VLAN 34
4.1.1 Hoạt động VLAN trên Switch .34
4.1.2 Kiểm tra chuyến tiếp ở Lớp 2 37
4.2 Khắc phục sự cố giao thức chống lặp (Spanning Tree Protocol) 37
4.2.1 Hoạt động của giao thức chống lặp 37
Trang 74.2.2 Thu thập thông tin về câu trúc liên kết giao thức chống lặp 39
4.2.3 Khắc phục sự cố giao thức chống lặp 40
4.2.3.1 Hư bảng địa chỉ MAC của switch 40
4.2.3.2 Tấn Công Broadcast 40
4.2.3.3 Khắc phục sự cố EtherChannel 41
CHƯƠNG 5 KHẮC PHỤC SỰ CỐ NÂNG CAO TRÊN SWITCH 42
5.1 Khắc phục sự cố định tuyến giữa các mạng cục bộ ảo (VLAN) 42
5.1.1 Sự khác biệt giữa Router và Switch 42
5.1.2 Khắc phục sự cố Control Plane và Data Plane 42
5.1.3 So sánh cổng giao diện chuyển đổi giữa Router và Switch 44
5.2 Khắc phục sự cố First Hop Redundancy Protocols 45
5.2.1 HSRP 45
5.2.2 Hội tụ sau khi Router bị lỗi 47
CHƯƠNG 6 KHẮC PHỤC SỰ CỐ GIỮA CÁC GIAO THỨC ĐỊNH TUYẾN 48
6.1 Khắc phục sự cố kết nối giữa các lớp mạng 48
6.2 Khắc phục sự cố OSPF 50
6.2.1 Tổng quan 51
6.2.2 Theo dõi OSPF với lệnh show 59
6.2.3 Theo dõi OSPF với lệnh debug 59
6.2.4 Ví dụ khắc phục sự cố OSPF 60
6.3 Khắc phục sự cố phân phối lại đường đi 64
CHƯƠNG 7 DUY TRÌ VÀ KHẮC PHỤC SỰ CỐ BẢO MẬT MẠNG 70
7.1 Khắc phục sự cố bảo mật mạng 70
7.1.1 Tổng quan 70
Trang 87.1.2 Đánh giá tính năng bảo mật 70
7.2 Khắc phục sự cố bảo mật Management Plane 71
7.3 Khắc phục sự cố bảo mật Control Plane 72
7.4 Khắc phục sự cố bảo mật Data Plane 74
7.5 Khắc phục sự cố kết nối Branch Office và Remote Worker 75
7.5.1 Vấn đề kết nối Branch Office và Remote Worker 75
7.5.2 Vấn đề kết nối giữa Branch Office với GRE 76
CHƯƠNG 8 KHẮC PHỤC SỰ CỐ DỊCH VỤ ĐỊA CHỈ 80
8.1 Dịch vụ địa chỉ IPv4 80
8.1.1 Hoạt động của NAT/PAT 80
8.1.2 Khắc phục sự cố NAT/PAT 82
8.2 Khắc phục sự cố DHCP 84
8.3 Dịch vụ địa chỉ IPv6 87
8.3.1 Tổng quan về IPv6 – IPv6 so với IPv4 87
8.3.2 Vấn đề khắc phục sự cố IPv6 89
8.3.3 Lệnh khắc phục sụ cố IPv6 89
8.4 Ví dụ khắc phục sự cố 6to4 Tunnel 90
CHƯƠNG 9 KHẮC PHỤC SỰ CỐ HIỆU SUẤT MẠNG 92
9.1 Khắc phục sụ cố ứng dụng dịch vụ mạng 92
9.1.1 Tổng quan về ứng dụng dịch vụ mạng 92
9.1.2 Tối ưu hóa chu trình ứng dụng các dịch vụ mạng 92
9.1.3 NetFlow 94
9.1.4 IP SLAS 97
9.1.5 QoS 101
Trang 99.2 Vấn đề khắc phục sự cố hiệu suất trên Switches 104
9.2.1 Xác định những vấn đề về hiệu suất trên Switches 104
9.2.2 Sự cố trên port/interface của switch 105
9.2.3 Chuyển tiếp phần cứng trên Switch 108
9.2.4 Vấn đề khắc phục sự cố TCAM 108
9.2.5 Khắc phục sự cố tải trọng CPU cao trên Switch 111
9.2.6 Vấn đề DHCP 113
9.2.7 Vấn đề Spanning-Tree 114
9.2.8 Vấn đề HSRP 115
9.2.9 Ví dụ khắc phục sự cố hiệu suất trên switch 115
9.2.9.1 Thiết lập Speed và Duplex 115
9.2.9.2 Quá nhiều Broadcasts 118
9.3 Vấn đề khắc phục sự cố hiệu suất mạng trên Router 121
9.3.1 Khắc phục sự cố tải trọng CPU cao trên Router 121
9.3.2 Khắc phục sự cố đường đi đến Switch 124
9.3.3 Khắc phục sự cố CEF 126
9.3.4 Công cụ phân tích chuyển tiếp gói tin 129
9.3.5 Vấn đề khắc phục sự cố bộ nhớ trên router 131
CHƯƠNG 10 CÁC KỊCH BẢN MINH HỌA 135
10.1 HSRP with IP SLA 135
10.2 GRE over IPSec 137
10.3 6to4 tunnel, EIGRP IPv4, Static Route IPv6 138
10.4 SDM kết nói router thật của cisco 140
Trang 1010.5 Kịch bản minh họa nhiều giao thức và khắc phục sự cố các giao thức đó .
142
CHƯƠNG 11 KẾT LUẬN 146
11.1 Những vấn đề đã đạt được 146
11.2 Hướng phát triển 147
TÀI LIỆU THAM KHẢO 148
Trang 11
MỞ ĐẦU
I Mục tiêu đề tài
Tìm hiểu các kỹ thuật khắc phục sự cố chuyên nghiệp dựa trên cách tiếp cận
có hệ thống để phục vụ cho việc giám sát và duy trì cho các mạng doanh nghiệp phức tạp
II Đối tượng nguyên cứu
Phần mềm của Cisco như: GNS3, Packet Tracer, SDM
Ngoài ra còn một số phần mềm khác hổ trợ trong việc cấu hình
III Nội dung thực hiện
Tìm hiểu tổng quan về hoạch định duy trì các mạng phức tạp: tiến trình, công
cụ dùng để duy trì khắc phụ sự cố
Xây dựng kịch bản demo các kỹ thuật khắc phục sự cố tiên tiến cho routed network, switched network, addressing services, net performance……
Trong đề tài này được tổ chức thành 11 chương:
Chương 1: Lập kế hoạch bão dưỡng cho mạng phức tạp
Chương 2: Giới thiệu về quá trình khắc phục sự cố
Chương 3: Công cụ bảo trì và khắc phục sự cố
Chương 4: Khắc phục sự cố cơ bản trên Switch
Chương 5: Khắc phục sự cố nâng cao trên Switch
Chương 6: Khắc phục sự cố giữa các giao thức định tuyến
Chương 7: Duy trì và khắc phục sự cố bảo mật mạng
Chương 8: Khắc phục sự cố dịch vụ địa chỉ IP
Chương 9: Khắc phục sự cố hiệu suất mạng
Chương 10: Các kịch bản minh họa
Chương 11: Kết luận
Trang 12CHƯƠNG 1 LẬP KẾ HOẠCH BẢO DƯỠNG CHO CÁC MẠNG PHỨC TẠP
Công việc của một kỹ sư mạng bao gồm việc liên quan đến:
Cài đặt thiết bị và bào trì: bao gồm các công việc như cài đặt thiết bị, phần mềm cũng như tạo và sao lưu cấu hình phần mềm
Lỗi đáp ứng: bao gồm các công việc hỗ trợ người dùng có kinh nghiệm về vấn đề mạng, khắc phục sự cố thiết bị hoặc các liên kết bị lỗi, thay thế thiết
bị và sao lưu phục hồi
Hiệu suất mạng: bao gồm các công việc như lập kế hoạch, điều chỉnh hiệu năng và theo dõi cách sử dụng
Phương pháp hạch toán: bao gồm các nhiệm vụ như tài liệu, kiểm tra thủ tục
và thỏa thuận cấp độ dịch vụ quản lý
Bảo mật: bao gồm các công việc như theo dõi, thực hiện các thủ tục bảo mật
và kiểm tra bảo mật
IT infrastructure Library (ITIL): Đây là một tổ chức thương mại cung cấp
dịch vụ IT chất lượng cao liên kết với các nhu cầu kinh doanh và xử lý Tổ chức này có trụ sở đặt tại Anh quốc
FCAPS [được viết tắc của Fault management (quản lý lỗi), Configuration management (quản lý cấu hình), Accounting management (quản lý kế toán), Performance management (quản lý hiệu suất) và Security management (quản
Trang 13Quản lý cấu hình: Yêu cầu đăng nhập của bất kì thay đổi trên phần cứng mạng hay cấu hình phần mềm Thực hiện thay đổi hệ thống quản lý để cảnh báo những người có liên quan đến kế hoạch thay đổi mạng
Quản lý hạch toán: Hóa đơn cho những người sử dụng cuộc gọi đường dài và quốc tế
Quản lý hiệu suất: giám sát số liệu hiệu suất mạng cho cả 2 liên kết mạng cục bộ (LAN) và mạng diện rộng (WAN) Triển khai phù hợp chất lượng dịch vụ (QoS) để cho việc sử dụng băng thông của mạng diện rộng một cách hiệu quả nhất
Quản lý bảo mật: Triển khai tường lửa (firewall), VPNs và hệ thống phòng chống xâm nhập công nghệ để bảo vệ chống lại luồng lưu lượng nguy hại Tạo ra quy luật bảo mật sử dụng chính sách mạng lưới chấp nhận được Sử dụng ủy quyền, xác thực và kế toán máy chủ để xác nhận thông tin người dùng, phân quyền người dùng thích hợp và hoạt động người dùng
Quản lý mạng viễn thông (ITL-T-Telecommunications Managegent network): Các ITU-T được tích hợp và tinh chế từ mô hình FCAPS để tạo ra cách tiếp cận này, trong đó xác định một khung cho việc quản lý mạng viễn thông
Cisco Lifecycle Services Phases-PPDIO (Prepare, Plan, Design, Implement, Operate và Optimize) Nhiệm vụ bảo trì mạng thường được coi là một phần của giai đoạn kinh doanh và tối ưu hóa của chu kỳ
Kế hoạch bảo dưỡng mạng lưới bao gồm các phương pháp cho các nhiệm vụ sau:
Thêm sức chứa, di chuyển và thay đổi: Ảnh hưởng đến người dùng, máy tính, máy in, máy chủ, điện thoại và những thay đổi tiềm ẩn trong cấu hình
và cáp
Trang 14Cài đặt và cấu hình thiết bị mới: Bao gồm thêm các cổng, khả năng liên kết
và các thiết bị mạng Có thể được xử lý bởi 1 nhóm khác nhau trong tổ chức, bên ngoài hoặc nhân viên trong tổ chức
Thay thế các thiết bị lỗi: Hoàn tất thông qua hợp đồng dịch vụ hoặc sự hổ trợ của các kỹ sư trong công ty
Sao lưu cấu hình thiết bị và phần mềm: Sao lưu tốt cả phần mềm và cấu hình đơn giản và làm giảm thời gian phục hồi các thiết bị lỗi
Khắc phục sự cố liên kết và các thiết bị lỗi: chẩn đoán và giải quyết sự cố liên quan đến các thành phần mạng, liên kết hay kết nối cung cấp dịch vụ là nhiệm vụ cần thiết trong công việc của một kỹ sư mạng
Nâng cấp phần mềm: Nâng cấp phần mềm điều hành hệ thống (như server, client và ngay cả các thiết bị mạng) được thực hiện định kỳ Ngoài ra phải thường xuyên cập nhật sự cố về hiệu suất và lỗ hổng bảo mật
Giám sát hiệu suất mạng: Giám sát hoạt động của các thiết bị và người dùng
có thể thực hiện bằng cách sử dụng các cơ chế đơn giản như thiết bị định tuyến và tường lửa bằng cách sử dụng các bản ghi hay ứng dụng các mạng lưới giám sát thông minh
Hiệu suất đo lường và quy hoạch công suất: Điều này có thể giúp xác định khi nâng cấp liên kết hoặc thiết bị Tạo điều kiện cho việc lập kế hoạch nâng cấp (quy hoạch công suất) để tránh tình trạng tắc nghẽn
Viết và cập nhật tài liệu: Hiện tại tài liệu mạng sử dụng để tham khảo trong quá trình thực hiện, quản lý và xử lý sự cố là công việc bảo dưỡng mạng bắt buộc
CLI Tools: Phần mềm Cisco IOS cung cấp nhiều giao diện dòng lệnh để cấu hình và giám sát router và switch Như show, debug, Embedded Device Manager (EEM), IP SLA (Service Level Agreement: Mức thỏa thuận dịch vụ) Để minh họa, xem xét Ví dụ 1-1, trong đó cho thấy router R2 nhận Open
Trang 15Shortest Path First (OSPF) cập nhật trạng thái liên kết từ những hàng xóm OSPF như những bản cập nhật xảy ra
Ví dụ 1-1 Kết quả khi sử dụng lệnh debug ip ospf event
Graphical user interface Tools: Cisco có hỗ trợ một số GUI tools như CiscoWorks Ngoài ra một số các thiết bị cơ bản có sẵn trong GUI tools:
Cisco Configuration Professional (CCP)
Security Device Manager (SDM)
Cisco Configuration Assistant (CCA)
Cisco Network Assistant (CNA)
Ví dụ cấu hình SDM: Các bước ta cần làm trong bài lab như sau:
Trang 16Hình 1-2 Lệnh cấu hình SDM cho Router
Hình 1-3 Hiển thị màn hình chủ của Cisco SDM
Công cụ sao lưu (Backup Tools): Các server thường được sử dụng để lưu trữ thông tin thiết bị của hệ điều hành Tuy nhiên, nó tùy thuộc vào thiết bị mạng mà
có thể lưu trữ trong các server như: TFTP, FTP, HTTP hay SCP (Security Copy Protocol) để lưu trữ phần mềm và cấu hình của router và switch
Nếu bạn có ý định sao lưu thường xuyên đến 1 server FTP, bạn có thể tránh được quy định cụ thể thông tin đăng nhập mỗi lần (cho mục đích an ninh), bằng cách thêm những thông tin về cấu hình của router
Ví dụ 1-3 Thêm thông tin đăng nhập vào server FTP để cấu hình
Router
Trang 17Ví dụ 1-4 Sao lưu cấu hình khởi động của Router đến server FTP
không có Chỉ định thông tin Đăng nhập
Quá trình sao lưu cấu hình của router có thể tự động sử dụng tính năng lưu trữ, đó là phần thay thế cấu hình Cisco IOS và cấu hình tính năng khôi phục Đặc biệt, bạn có thể cấu hình router Cisco IOS định kỳ (định
kỳ trong vài phút) lại một bản sao của cấu hình khởi động vào một vị trí quy định (ví dụ, flash của router hoặc 1 server FTP) Ngoài ra, tính năng lưu trữ có thể được cấu hình để tạo ra một kho lưu trữ mỗi khi bạn chạy một bản sao cấu hình của router để cấu hình khởi động
Ví dụ 1-5 Cấu hình tự động Archive
Bạn có thể xem các tập tin lưu trữ trong cấu hình archive bằng cách sử
dụng lệnh show archive, như thể hiện trong ví dụ 1-6
Ví dụ 1-6 Xem cấu hình archive
Ví dụ 1-7 Cho thấy việc thực hiện lệnh copy run start, bản sao cấu hình running của router tới cấu hình startup của router Sau đó lệnh show
archive được thực hiện lại, xác nhận đầu ra của quá trình thêm cấu hình
archive (được đặt tên R1-config-3) đã được tạo ra trên máy chủ FTP
Trang 18Ví dụ 1-7 xác nhận tự động sao lưu
Có thể khôi phục lại cấu hình trước đó đã lưu trữ bằng cách sử dụng lệnh cấu hình thay thế Câu lệnh này không hợp nhất cấu hình archive với cấu hình đang chạy, mà là thay thế hoàn toàn cấu hình đang chạy với cấu hình
archive Ví dụ 1-8 cho thấy sự phục hồi của cấu hình archive cho router Chú ý rằng thay đổi hostname của router sau khi khôi phục lại cấu hình
Ví dụ 1-8 Khôi phục lại cấu hình archive
Công cụ đăng nhập máy chủ (Logging Server Tools): Cung cấp thông tin
có giá trị khi xử lý sự cố vấn đề về mạng Ngoài ra nó cũng có thể gửi hoặc chuyển thông điệp vào server syslog Syslog là 1 dịch vụ chuẩn trên hầu hết các hệ điều hành UNIX Một số cũng hổ trợ trên windows syslog
server Để minh họa, xem hình 1-4 cho thấy thông tin đăng nhập được
thu thập bởi Syslog Server Kiwi
Hình 1-4 Syslog Server
Trang 19Giao thức thời gian (Time protocol): Để đồng bộ hóa đồng hồ trên tất cả các thiết bị mạng, nó rất hữu ích để có giao thức đồng bộ thời gian mạng (Network Time Protocol=NTP) máy chủ trên mạng Có rất nhiều time server có trên internet và NTP được hỗ trợ bởi Cisco IOS
Hình 1-5 Mô hình cấu hình NTP
Hình 1-6 Cấu hình NTP master
Hình 1-7 Cấu hình NTP Client
Trang 201.5 Công cụ cấu hình và tài liệu mạng
Công cụ cấu hình động (Dynamic Configuration Tools): Công cụ này hỗ trợ bạn trong việc cấu hình phần cứng Nó xác minh khả năng tương thích của phần cứng và phần mềm được chọn
https://apps.cisco.com/qtc/config/html/configureHomeGuest.html
Tính năng định hướng: Công cụ này cho phép chúng ta nhanh chóng tìm thấy phần mềm bản quyền của Cisco IOS cho các tính năng mà chúng ta muốn chạy trên mạng http://tools.cisco.com/ITDIT/CFN/
Đối tượng định hướng của giao thức quản lý mạng đơn giản [(Simple Network Management Protocol=SNMP) Object Navigator]: Cho phép thiết bị giám sát (như router, switch…) chủ động chạy trong SNMP Công cụ này cũng cho phép chúng ta tải các tập tin SNMP quản lý thông tin cơ bản và xác nhận quản lý thông tin cơ bản được hỗ trợ trong phiên bản phần mềm Cisco IOS cụ thể
Khắc phục thành công phụ thuộc vào sự tồn tại của những điều sau đây:
Sao lưu cấu hình
Sao lưu phần mềm
Kiểm kê phần cứng
Công cụ cấu hình và phần mềm dự phòng
Trang 21Như một phần của bộ công cụ bảo trì hệ thống mạng cơ bản, TFTP, FTP, SCP, HTTP và HTTPS server rất hữu ích cho việc tạo bản sao lưu cấu hình và hệ điều hành của router hay switch
Lý do để giám sát hiệu suất mạng là:
Đảm bảo phù hợp với mức độ thỏa thuận dịch vụ (Service Level Agreement=SLA): Nếu bạn là nhân viên của một nhà cung cấp dịch vụ hoặc là khách hàng của một nhà cung cấp dịch vụ, bạn muốn xác nhận rằng mức độ thực hiện đến và đi từ cloud của nhà cung cấp dịch vụ có đúng với thỏa thuận SLA
Khuynh hướng giám sát: Giám sát nguồn tài nguyên sử dụng trên mạng (như băng thông, CPU router….) có thể giúp chúng ta nhận ra xu hướng
và dự báo khi nâng cấp
Giải đáp thắc mắc các vấn đề hiệu suất: Khó có thể khắc phục sự cố hiệu suất nếu chúng ta không thường xuyên giám sát hiệu suất mạng và đối
chiếu số liệu thu thập được sau khi người dùng thông báo sự cố hiệu suất
Trang 22CHƯƠNG 2 GIỚI THIỆU VỀ QUÁ TRÌNH KHẮC PHỤC SỰ CỐ
Khắc phục sự cố là quá trình đưa ra việc chẩn đoán và nếu có thể, giải quyết
sự cố
Thường kích hoạt khi có người thông báo sự cố
Mạng thường hoạt động tốt cho đến khi bạn bắt đầu kết nối máy tính với nó
Trong số những nguyên tắc này áp dụng cho nhiều lĩnh vực IT, không chỉ kết nối mạng
Hệ thống phân tích
Hỗ trợ máy tính để bàn
Chuẩn đoán
Hình 2.1 Sơ đồ luồng cách tiếp cận khắc phục sự cố có cấu trúc
Bước đầu tiên: Xác định sự cố
Bước thứ hai: Chẩn đoán sự cố
Cuối cùng quá trình này nên dẫn đến giả thuyết cho các nguyên nhân gốc
rễ của sự cố
Xác định sự cố:
Quá trình khắc phục sự cố là quá trình ứng phó với thông báo sự cố
Sau khi nhận được thông báo sự cố, bước đầu tiên để giải quyết sự cố là xác định rõ sự cố
Phân tích thông tin
Loại trừ nguyên nhân Xây dựng
giả thuyết Kiểm tra
giả thuyết
Trang 23Sau khi xác định được nguyên nhân gây ra sự cố, bước tiếp theo xác định cách tiếp cận để giải quyết sự cố và chọn phương pháp tốt nhất
Thu thập thông tin: Phỏng vấn tất cả các bên (người dùng) có liên quan và bất kỳ phương tiện khác để thu thập thông tin có liên quan
Phân tích thông tin: So sánh các triệu chứng đối với kiến thức về hệ thống, quy trình và hành vi của nó
Từ hành vi thông thường từ hành vi bất thường
Loại trừ nguyên nhân có thể: Bằng cách phân tích thông tin gây ra sự cố có thể được loại bỏ
Xây dựng giả thuyết: một hoặc nhiều nguyên nhân vẫn là sự cố tiềm ẩn
Mỗi sự cố tiềm ẩn được đánh giá và nguyên nhân đề xuất rất có thể là nguyên nhân gây ra sự cố
Kiểm tra giả thuyết: Đề xuất một giải pháp dựa trên giả thuyết này, thực hiện các giải pháp đó và xác minh nếu điều này giải quyết được sự cố
Phương pháp khắc phục sự cố trên xuống bắt đầu tại tầng trên cùng của mô hình 7 lớp OSI (Open Systems Interconnection), như trong Hình 2-2 Lớp trên cùng được đánh số là lớp 7, lớp ứng dụng
Hình 2-2 Phương pháp khắc phục sự cố trên xuống
Trang 242.2.2 Phương pháp dưới lên (Bottom-up)
Đối ngược với phương pháp trên xuống là phương pháp dưới lên, như minh họa trong hình 2-3 Phương pháp dưới lên thu hẹp khoảng cách tiềm ẩn bằng cách loại bỏ các lớp OSI bắt đầu từ lớp 1, lớp vật lý
Hình 2-3 Phương pháp khắc phục sự cố dưới lên
Mặc dù đây là một phương pháp có hiệu quả cao, nhưng cách tiếp cận dưới lên có thể không được hiệu quả trong các mạng lớn hơn vì thời gian cần thiết
để kiểm tra đầy đủ các lớp của mô hình OSI thấp hơn Vì vậy, phương pháp dưới lên thường được sử dụng sau khi sử dụng một số phương pháp khác để thu hẹp phạm vi sự cố
2.2.3 Phương pháp chia để trị
Sau khi phân tích các thông tin thu thập cho sự cố, bạn có thể không nhìn thấy những chỉ dẫn rõ ràng cho dù cách tiếp cận trên xuống hay dưới lên Trong tình hình như vậy, bạn có thể chọn phương pháp chia để trị (divide and conquer) bắt đầu vào giữa các OSI stack, như trong Hình 2-4
Hình 2-4 Phương pháp khắc phục sự cố chia để trị
Trang 25Ví dụ trình bày trong hình 2-4, admin đã sử dụng lệnh ping 10.1.2.3 Nếu kết quả thành công, admin có thể kết luận rằng lớp 1-3 đã hoạt động, và cách tiếp cận dưới lên có thể bắt đầu từ vị trí đó Tuy nhiên, nếu ping không thành công, admin có thể bắt đầu cách tiếp cận trên xuống ở lớp 3
Phương pháp khắc phục sự cố hữu ích là chuyển tiếp lưu lượng đường dẫn trải nghiệm qua một số vấn đề Ví dụ, nếu client được mô tả trong hình 2-5 là không thể tiếp cận server, trước tiên kiểm tra sự liên kết giữa client và switch SW1 Nếu tất cả các liên kết không có vấn đề gì, có thể kiểm tra kết nối giữa switch SW1 và router R1 Tiếp theo, sẽ kiểm tra các liên kết giữa các router R1 và switch SW2 và cuối cùng là liên kết giữa switch SW2 và server
Hình 2-5 Chuyển tiếp lưu lượng đường dẫn
2.2.5 So sánh cấu hình
Ví dụ, có nhiều văn phòng đặt ở nhiều vị trí xa nhau, cùng chạy một mô hình của Cisco router Client tại một trong những văn phòng đặt ở xa không thể có được một địa chỉ IP thông qua DHCP Cách tiếp cận khắc phục sự cố là so sánh cấu hình router của trang web đó với cấu hình router của trang web đặt
ở xa Cách tiếp cận phương pháp này đồi hỏi nhân viên khắc phục sự cố phải
có một ít kinh nghiệm về mạng nhưng không cần thành thạo chi tiết cụ thể về mạng Do đó, vấn đề có thể được giải quyết mà không có một sự hiểu biết tường tận về những sự cố gì đã xảy ra Vì vậy, khả năng tái xuất hiện sự cố là rất cao
Trang 262.2.6 Hoán đổi các thành phần
Cách tiếp cận khác để thu hẹp hiệu quả nguyên nhân của sự cố là hoán đổi vị trí vật lý giữa các thành phần Nếu các triệu chứng của sự cố biến mất sau khi hoán đổi một trong các thành phần đặc biệt (ví dụ, dây cáp hay switch)
có thể kết luận rằng các thành phần đã bị lỗi (trong phần cứng hay cấu hình)
Ví dụ, xem xét hình 2-6 Một thông báo cho rằng sự cố kết nối giữa máy tính xách tay A và switch SW1 là 2 liên kết giữa máy tính xách tay hoặc switch không được up
Hình 2-6 Hoán đổi các thành phần
Bước đầu tiên, có thể hoán đổi cáp nối trên 2 thiết bị
Nếu sự cố vẫn còn, nên quay lại hoán đổi cáp nối trên 2 thiết bị như vị trí ban đầu và sau đó di chuyển cáp từ switch port 1 đến switch port 2 Bước tiếp theo, có thể kết nối một máy tính xách tay khác đến switch SW1 Nếu không còn sự cố, có thể kết luận rằng sự cố với máy tính xách tay A Tuy nhiên, nếu sự cố vẫn tiếp tục, có thể hoán đổi switch SW1 bằng một switch khác: trong ví dụ này là SW2 Kiểm tra từng thành phần và tìm thấy nó không có sự cố, quay lại thay đổi
Mặc dù hoán đổi các thành phần theo cách này có thể không cung cấp cái nhìn tổng thể vào các sự cố cụ thể, nhưng nó có thể giúp bạn nỗ lực tập trung khắc phục sự cố
Khi khắc phục sự cố, bạn có thể sử dụng một trong những phương pháp trước đây đã thảo luận để khắc phục sự cố hoặc có thể kết hợp các phương
Trang 27pháp Để minh họa làm thế nào có thể chọn một phương pháp khắc phục sự
cố thích hợp, xem xét các thông báo sự cố sau đây:
Một phòng thí nghiệm máy tính tại một trường đại học chứa 48 máy tính
PC Hiện tại, 24 máy tính không thể truy cập Internet, trong khi 24 máy
PC khác thì có thể Trong 24 máy tính hiện đang không thể truy cập Internet đã có thể truy cập Internet ngày hôm qua Hãy xem xét các mô hình khắc phục sự cố đã thảo luận trước đó để có thể có nhận xét thích hợp cho các sự cố như thông báo Sau khi có kết luận về cách thức hay phương pháp thích hợp nhất, xem xét các lý do sau đây:
Trên xuống: Vì các ứng dụng đang làm việc trên một số máy tính
trong cùng một thời điểm, bắt đầu từ lớp ứng dụng có thể sẽ không có hiệu quả Mặc dù trong 24 máy tính PC có thể có một số thiết lập trong trình duyệt Internet (ví dụ, cấu hình proxy) làm ngăn cản nó truy cập Internet, những máy PC làm việc ngày hôm qua Do đó, khó
có khả năng 24 máy PC đã được cấu hình tất cả lại gần đây với cấu hình ứng dụng không chính xác
Dưới lên: Căn cứ vào các triệu chứng thông báo, để dự đoán rằng có
sự cố với Ethernet switch (24 port ) Vì vậy, phương pháp dưới lên là
cơ hội tốt để cô lập sự cố một cách nhanh chóng
Chia để trị: Sự cố có vẻ liên quan đến một khối máy PC và sự cố có
lẽ không phải liên quan ứng dụng Vì vậy, phương pháp chia để trị có thể có ích Bắt đầu từ lớp 3 (Lớp mạng), bạn có thể sử dụng một loạt các lệnh ping để xác định xem cổng vào next-hop có truy cập không Nếu cổng vào next-hop không thể truy cập, bạn có thể bắt đầu khắc
phục sự cố lớp 2, kiểm tra các switch với 24 máy PC được đính kèm
Chuyển tiếp lưu lượng đường dẫn: Các triệu chứng có thể chỉ ra 24
máy PC sử dụng chung 1 switch Do đó, chuyển tiếp lưu lượng đường dẫn đến đầu kia của cáp (switch) có thể rất hữu ích Có thể switch bị
mất điện dẫn đến sự cố kết nối của 24 máy PC
Trang 28So sánh cấu hình: Nếu phương pháp khắc phục sự cố trước đó (ví dụ,
dưới lên, chia để trị, hay chuyển tiếp lưu lượng đường dẫn) cho thấy rằng 24 máy PC không kết nối với switch, và 24 máy PC đang làm việc được kết nối với switch khác, so sánh cấu hình của hai thiết bị switch có thể là hữu ích
Hoán đổi các thành phần: Bởi vì trong 24 máy PC đang gặp sự cố
tương tự trong một thời gian ngắn (kể từ ngày hôm qua), khó có khả năng hoán đổi các loại cáp Tuy nhiên, nếu 24 máy PC cùng kết nối đến switch, hoán đổi switch có thể giúp cô lập các vấn đề
Quy trình khắc phục sự cố bao gồm các nhiệm vụ sau đây:
Hình 2.7 Phương pháp khắc phục sự cố có cấu trúc
1 Xác định sự cố
2 Thu thập thông tin
3 Phân tích thông tin
4 Loại bỏ sự cố có khả năng xảy ra
5 Xây dựng giả thuyết về khả năng có thể xảy ra của sự cố
6 Kiểm tra giả thuyết
Trang 29Nếu bạn có nhiều kinh nghiệm bạn có thể áp dụng vào để khắc phục sự cố nhiều hơn từ các phương pháp tiếp cận
2.3.1 Xác định sự cố
Người dùng thông báo sự cố
Sự cố không rõ ràng, thậm chí gây hiểu lầm
"Tôi không thể kết nối được với Internet." hoặc "Internet của tôi bị hỏng."
Không thể truy cập email thông qua trình duyệt
Sự cố đầu tiên đã được xác minh và sau đó được xác định bởi bạn (các kỹ
sư hỗ trợ, không phải là người sử dụng)
Mô tả sự cố tốt bao gồm các mô tả chính xác các triệu chứng và không có
giải thích hoặc kết luận
Bạn phải xác định xem sự cố này là trách nhiệm của bạn hay trách nhiệm
của người sử dụng
Vấn đề cơ sở hạ tầng mạng, vấn đề cơ sở dữ liệu , vấn đề máy chủ…
2.3.2 Thu thập và phân tích thông tin
Truy cập vào thiết bị mà bạn cần phải kiểm tra
Thu thập thông tin
Tại một số thời điểm bạn có thể cần phải đi xa hơn sự cố
Trang 302.3.3 Nguyên nhân loại bỏ sự cố
Sử dụng các sự kiện và chứng cứ để dần dần loại bỏ các nguyên nhân có thể xảy ra và cuối cùng xác định được gốc rể của sự cố
Giải thích các thông tin thô từ:
Lệnh show và debug
Nắm bắt gói tin
Bản ghi các thiết bị
Có thể cần phải học:
Lệnh research, giao thức và công nghệ (luôn luôn học hỏi!)
Tài liệu hướng dẫn mạng
Xây dựng và đề xuất một giả thuyết
Đề xuất nguyên nhân
Loại bỏ nguyên nhân
Ví dụ:
Đề xuất Nguyên nhân: Tải trọng CPU rất cao trong thiết bị chuyển mạch
đa lớp, có thể là dấu hiệu của vòng lặp chuyển tiếp
Loại bỏ nguyên nhân: Ping thành công từ Client đến default gateway của
nó trong lớp 2
2.3.5 Giải quyết sự cố
Đề xuất các giả thuyết
Dựa trên kinh nghiệm, có thể đề xuất một biện pháp cụ thể cho phần còn lại của nguyên nhân tiềm ẩn
Có thể cần một giải pháp tạm thời cho người dùng nếu sự cố cần thời gian để khắc phục
Sau giả thuyết được đề xuất bước tiếp theo là tìm ra một giải pháp càng tốt (hoặc cách giải quyết) cho sự cố đó
Bước tiếp theo: Đánh giá tác động sự thay đổi trên mạng
Trang 31Kiểm tra các giả thuyết
Nếu giải pháp không giải quyết được sự cố cần phải có cách để lùi lại thay đổi của bạn và quay trở lại tình trạng ban đầu
Kế hoạch khôi phục
Tạo thời gian để khôi phục này! - “Drop-dead time”
Sự cố được giải quyết sau khi bạn đã xác minh rằng các triệu chứng đã biến mất
Tạo bản sao lưu cho bất kỳ cấu hình thay đổi hoặc nâng cấp phần mềm
Thay đổi tất cả tài liệu
• Tài liệu bình thường
• Cơ sở dữ liệu Trouble-ticket (nhanh chóng giải quyết trong khoảng thời gian điều này xảy ra)
Giao tiếp sự cố đã được giải quyết
• Đầu tiên người sử dụng thông báo sự cố
• Những người khác tham gia vào quá trình xử lý sự cố
• Các nhóm thành viên
Chương 1, "Lập kế hoạch bão dưỡng cho mạng phức tạp," chỉ ra rằng duy trì mạng bao gồm nhiều quy trình và công việc Công việc bảo dưỡng mạng thường bao gồm các nhiệm vụ khắc phục sự cố, và ngược lại Ví dụ, khi cài đặt mới một linh kiện mạng như một phần của mạng bảo dưỡng liên tục, cài đặt thường yêu cầu phải khắc phục cho đến khi các linh liện đó hoạt động tốt Ngoài ra, khi khắc phục sự cố vấn đề mạng, khắc phục sự cố có thể sử dụng tài liệu mạng (ví dụ, tạo ra một sơ đồ cấu trúc liên kết vật lý như là một phần của nhiệm vụ bảo trì mạng) để giúp cô lập sự cố
2.5 Tài liệu duy trì mạng hiện tại
Yêu cầu tài liệu: Tài liệu có được bằng cách tổng hợp các kinh nghiệm trong quá trình khắc phục sự cố
Trang 32Kiểm tra tài liệu theo lịch trình: Kế hoạch bảo dưỡng cấu trúc có thể bao gồm thành phần thường xuyên yêu cầu xác minh tài liệu mạng
Tự động hóa tài liệu: Kiểm tra tài liệu hướng dẫn có thể không được khả thi trong môi trường lớn hơn, quy trình tự động có thể được sử dụng đến,
ví dụ, so sánh bản hiện tại và bản sao lưu của cấu hình thiết bị Bất kỳ sự khác biệt nào trong cấu hình chỉ ra rằng có ai đó đã nâng cấp cấu hình sao lưu bị lỗi sau khi thực hiện thay đổi cấu hình cho thiết bị đó Để hỗ trợ việc
tự động hóa các bản sao lưu, Cisco IOS cung cấp tính năng lưu trữ cấu hình, phục hồi và quản lý sự kiện
2.6 Thiết lập ranh giới
Như đã đề cập từ trước, khắc phục sự cố liên quan đến việc hiểu biết những
gì xảy ra trên mạng, quan sát những gì đang xảy ra trên mạng, và xác định sự khác biệt giữa chúng Để xác định những gì cần được diễn ra trên mạng, một đường ranh giới của hiệu suất mạng nên được đo như là một phần của quy trình bảo dưỡng thường xuyên
Ví dụ, quy trình bảo dưỡng mạng thường xuyên có thể yêu cầu hiển thị bằng
lệnh show processes cpu định kì đã ban hành trên tất cả router trong mạng,
đầu ra đã đăng nhập và lưu trữ Như trong ví dụ 2-1, lệnh show processes
cpu chứng minh việc tận dụng CPU trung bình second, 1-minute, và
5-minute Khi khắc phục sự cố vấn đề hiệu suất trên router, bạn có thể sử dụng lệnh này để xác định xem router đang hoạt động như thế nào Tuy nhiên, không có một cơ sở tài liệu tham khảo trước khi khắc phục sự cố, bạn không
thể rút ra một kết luận có hiệu quả dựa trên lệnh output
Ví dụ 2-1 Giám sát Router tận dụng CPU
Trang 332.7 Giao tiếp trong quá trình khắc phục sự cố
Mỗi giai đoạn khắc phục sự cố được mô tả trong phần trước, "Sử dụng quy trình khắc phục sự cố ," yêu cầu giao tiếp rõ ràng
Bảng 2-1 Tầm quan trọng của truyền thông rõ ràng trong thời gian khắc phục sự cố
Giai đoạn khắc phục sự
cố
Vai trò của giao tiếp
Thông báo sự cố Khi người dùng thông báo sự cố, giao tiếp rõ ràng với
người dùng giúp xác định sự cố
Thu thập thông tin Một số thông tin thu thập được có thể đến từ người khác
(ví dụ, nhà cung cấp dịch vụ) Giao tiếp Rõ ràng với người khác giúp đảm bảo thu thập các dữ liệu thích hợp Kiểm tra thu thập thông
tin
Khắc phục sự cố thường không hiểu tường tận tất cả các khía cạnh của mạng, hợp tác với nhân viên IT thường cần thiết
Đưa ra giả thuyết Tư vấn gỡ rối với 1 nhân viên IT khi loại trừ nguyên
nhân tiềm ẩn cũng có thể giúp gỡ rối chính xác hơn đưa
ra giả thuyết nguyên nhân của vấn đề
Xác minh giả thuyết Mạng bị gián đoạn tạm thời thường xảy ra khi xác minh
một giả thuyết vì vậy, bản chất và lý do gián đoạn sẽ được thông báo tới người dùng bị ảnh hưởng
Giải quyết sự cố Sau khi sự cố được giải quyết, người sử dụng đầu tiên
thông báo các vấn đề cần được thông báo, và người sử dụng nên xác nhận rằng sự cố đã thực sự được giải quyết
Trang 342.8 Quản lý thay đổi
Quản lý thay đổi là một quá trình cơ bản trong bảo dưỡng mạng
Quản lý khi có thay đổi, yêu cầu ủy quyền và những hành động được thực
hiện
Có thể giảm thiếu điện bất ngờ và tăng thời gian hoạt động mạng
Việc quản lý quá trình thay đổi:
Thực hiện thay đổi
Xác minh rằng nó đạt được kết quả mong muốn
Quay trở lại nếu cần thiết
Sao lưu cấu hình thay đổi hoặc phần mềm
Tài liệu/giao tiếp thay đổi của bạn
Trang 35CHƯƠNG 3 CÔNG CỤ BẢO TRÌ VÀ KHẮC PHỤC SỰ CỐ
3.1.1 Bộ lọc đầu ra của lệnh show
Cisco IOS cung cấp nhiều lệnh show có ích cho thu thập thông tin Tuy nhiên, nhiều trong số các lệnh show tạo ra số lượng lớn đầu ra
Xem kết quả hiển thị trong Ví dụ 3-1 Đầu ra của lệnh show processes CPU
sinh ra khoảng 180 dòng đầu ra, làm cho khó khăn để chọn ra một quá trình duy nhất
Ví dụ lệnh show processes CPU
Ví dụ 3-1 Đầu ra của lệnh show processes CPU
Có lẽ chúng ta chỉ tìm kiếm các số liệu thống kê sử dụng CPU trong quá trình kiểm tra Bởi vì muốn biết nội dung của dòng mà chúng ta đang tìm kiếm chứa nội dung văn bản kiểm tra,chúng ta có thể đưa kết quả của lệnh
show processes CPU và pipe (use the | character)) vào câu lệnh để kiểm tra
ví dụ 3-2 Đây là loại bộ lọc có thể giúp khắc phục sự cố nhanh hơn trong
quá trình tìm kiếm dữ liệu
Ví dụ 3-2 Kết quả của lệnh show processes cpu sau khi lọc
Trang 36Ví dụ lệnh show ip interface brief
Tương tự như kết quả cho lựa chọn include, chúng ta có thể lựa chọn
exclude Tùy chọn exclude có thể hiển thị tất cả các dòng kết quả đầu ra,
ngoại trừ dòng chứa chuỗi chúng ta chỉ định Ví dụ, lệnh show ip interface
brief có thể hiển thị địa chỉ IP và thông tin trạng thái cho tất cả các interface
trên router, như trong ví dụ 3-3
Ví dụ 3-3 Kết quả lệnh show ip interface brief
Trong ví dụ 3-3 một số interface không được gán địa chỉ IP Nếu muốn xem
thông tin của những interface được gán địa chỉ IP chúng ta có thể dùng lệnh
show ip interface brief | exclude unassigned như minh họa trong ví dụ 3-4
Ví dụ 3-4 Kết quả của lệnh show ip intarface brief sau khi lọc
Trang 37Ví dụ lệnh show ip route
Một số lệnh thường cho kết quả đầu ra dài dòng, đặc biệt là trong môi trường
lớn hơn, đó là lệnh show ip route Ví dụ, xem lệnh show ip route trong ví
dụ 3-6
Ví dụ 3-6 Kết quả của lệnh show ip route
Kết quả hiển thị trong ví dụ 3-6 tương đối ít, một số bảng định tuyến IP có thể chứa hàng trăm, thậm chí hành ngàn dòng Nếu trong ví dụ chúng ta muốn xác định tuyến đường mạng 172.16.1.0 chỉ có mặt trong bảng định
tuyến, chúng ta có thể dùng lệnh show ip route 172.16.1.0 được thể hiện
trong ví dụ 3-7
Chúng ta muốn tìm kiếm cho tất cả các mạng con của không gian địa chỉ 172.16.0.0/16 Trong trường hợp đó, chúng ta có thể xác định mặt nạ mạng con và các đối số longer-prefixes như là một phần của câu lệnh của chúng ta Như lệnh, thể hiện ở Ví dụ 3-8, cho thấy tất cả các mạng con của mạng 172.16.0.0/16, bao gồm các mạng classful quan trọng của 172.16.0.0/16
Ví dụ 3-7 Chỉ định tuyến đường cụ thể với lệnh show ip route
Trang 38Ví dụ 3-8 Kết quả của lệnh show ip route với lựa chọn longer-prefixes sau
khi lọc
3.1.1.1 Khắc phục sự cố kết nối
Ngoài kết quả của lệnh show, chúng ta có thể sử dụng nhiều lệnh Cisco IOS
để khắc phục điều kiện mạng Lệnh thông thường, có thể được sử dụng để
kiểm tra kết nối mạng, là lệnh ping Lệnh ping cơ bản gửi Internet Control
Message Protocol (ICMP) Echo messages đến địa điểm được chỉ định; cho
tất cả các ICMP Echo Reply từ đó xác định đích đến, dấu chấm than xuất
hiện ở đầu ra, như thể hiện trong ví dụ 3-9
Ví dụ 3-9 Lệnh ping cơ bản
Lệnh ping không có nhiều lựa chọn có thể giúp ích trong quá trình xử lý sự
cố
Ví dụ:
Size: Chỉ định số byte trên mỗi gói dữ liệu
Repeat : Chỉ định số thông điệp ICMP Echo messages (mặc định là 5)
Timeout: Chỉ định số giây chờ một ICMP Echo Reply
Source: Chỉ ra nguồn gốc của gói tin ICMP Echo
df-bit: Không thiết lập phân đoạn bit trong gói tin ICMP Echo
Ngoài việc sử dùng lệnh ping để kiểm tra các kết nối ở lớp 3 (lớp mạng) chúng ta có thể sử dụng lệnh Telnet để khắc phục sự cố ở lớp 4 (vận
Trang 39chuyển) Lệnh Telnet thường được sử dụng TCP port 23, chúng ta có thể chỉ
định chúng chạy trên 1 port khác Để minh họa xem ví dụ 3-10
Ví dụ 3-10 Sử dụng lệnh Telnet để kết nối tới 1 cổng mặt định
Trong ví dụ 3-10 lệnh Telnet trên R1 tìm cách kết nối TCP với 192.168.1.50
thông báo toàn diện về sử dụng bộ nhớ
show interfaces Hiển thị trạng thái interface lớp 1 và lớp 2, thông tin tải trọng,
và sai số liệu thống kê bao gồm:
Đầu vào hàng đợi drop (Input queue drops): Chỉ ra
thông tin bộ định tuyến nhận được nhanh hơn so với thông tin được xử lý bởi các router
Đầu ra hàng đợi drop (Output queue drops): Chỉ ra
thông tin bộ định tuyến nhận được nhanh hơn so với thông tin được gửi đi khỏi interface (có lẽ vì input/output không phù hợp tốc độ)
Lỗi đầu vào (Input errors): Khung đã không nhận
Trang 40được một cách chính xác (Ví dụ, kiểm tra chu kỳ dự phòng lỗi xảy ra), chỉ có thể là sự cố cáp hoặc không phù hợp song công
Lỗi đầu ra (Output errors): khung không được
truyền chính xác, có lẽ do không phù hợp song công Chú ý: Trước khi thu thập số liệu thống kê, giao diện
có thể được thiết lập lại sử dụng lệnh clear counters
show controllers Hiển thị thông tin thống kê cho giao diện (ví dụ, số liệu thống
kê lỗi), thay đổi thông tin khác nhau cho các loại interface khác nhau (ví dụ, các loại cáp kết nối có thể được hiển thị cho giao diện nối tiếp)
chuyển đổi
Sử dụng công cụ chuyên môn trong quá trình khắc phục sự cố
Khó khăn trong thông báo: Chủ động giám sát các thiết bị mạng, chúng
ta có thể cảnh báo các sự cố hiệu suất sắp xảy ra trước khi người dùng bị ảnh hưởng
Thu thập thông tin: Thu thập thông tin khi khắc phục sự cố vấn đề
thường được thực hiện hiệu quả hơn thông qua việc sử dụng các công cụ bảo dưỡng chuyên nghiệp và khắc phục sự cố
Kiểm tra thu thập thông tin: Kiểm tra thông tin khắc phục sự cố đã thu
thập trong quá trình khắc phục sự cố, chúng ta cần phải biết trạng thái mạng bình thường như thế nào Sau đó chúng ta xác định hướng giải quyết dựa trên số liệu thu thập được Công cụ bảo dưỡng chuyên nghiệp
và khắc phục sự cố có thể được sử dụng trong mạng để thu thập số liệu
cơ bản trên nền tảng đang diễn ra