NỘI DUNG CHƯƠNG 13Chương này bao gồm những nội dung sau: Quản lý sự cố mạng Khắc phục sự cố mạng Sự cố hệ thống hay sự cố từ người dùng trong hệ thống Kiểm tra các thông báo vật
Trang 2KHẮC PHỤC SỰ CỐ
MẠNG
Trang 3NỘI DUNG CHƯƠNG 13
Chương này bao gồm những nội dung sau:
Quản lý sự cố mạng
Khắc phục sự cố mạng
Sự cố hệ thống hay sự cố từ người dùng trong hệ thống
Kiểm tra các thông báo vật lý và logic
Các phương pháp khắc phục sự cố mạng
Trang 4QUẢN LÝ SỰ CỐ MẠNG
Việc truyền dữ liệu không phải lúc nào cũng suôn sẻ.
Nhiều sự cố có thể xảy ra khi bạn đang kết nối mạng với nhiều loại máy tính khác nhau: MainFrames, máy in và các thiết bị mạng sử dụng các hệ điều hành, giao thức và
phương thức truyền dữ liệu khác nhau.
Khi xảy ra sự cố, bạn không những phải có vốn hiểu biết về từng thiết bị trong mạng mà còn phải nắm rõ được toàn bộ mạng.
Mỗi thiết bị cùng hoạt động và là một thành phần trong
mạng, cung cấp cho bạn một nền tảng kiến thức vững chắc
về cách thức và nguyên nhân xảy ra các sự cố liên quan đến mạng cũng như biện pháp khắc phục chúng.
Trang 5QUẢN LÝ SỰ CỐ MẠNG
• Trước tiên, cần xác định được phạm vi sự cố.
Sự cố xảy ra với một máy cụ thể?
Sự cố xảy ra trên toàn hệ thống mạng?
• Những biểu hiện giúp xác định nguyên nhân xảy ra sự cố:
Sự cố về định tuyến có thể xảy ra trong quá trình giao tiếp giữa một đoạn mạng này với một đoạn mạng khác.
Mạng bus đồng trục không thể hoạt động mà có thể là sự cố
từ backbone (trục tuyến chính)
Một biểu hiện khác là một phòng ban của công ty trên mạng Ethernet cáp xoắn đôi không thể giao tiếp với các phòng ban còn lại trong hệ thống mạng Nguyên nhân có thể do sự cố với thiết bị trung tâm được sử dụng để kết nối đến các phòng ban này.
Trang 6QUẢN LÝ SỰ CỐ MẠNG
Sự cố với máy trạm, nhóm, LAN hoặc WAN ?
• Các mạng lớn hơn thường có khả năng bị lỗi nhiều hơn Bạn
sẽ không chỉ phải đối mặt với các sự cố trên từng máy tính,
mà bạn còn gặp các vấn đề trong một nhóm làm việc, mạng nội bộ hoặc thậm chí mạng diện rộng
Liệu sự cố xảy ra trong nội bộ và có thể lan rộng ?
• Đôi khi bạn gặp phải những vấn đề lạ, không dễ giải quyết và
đòi hỏi bạn phải thu nhập nhiều thông tin ngoài phạm vi vấn
đề đó Bạn biết bạn đang gặp sự cố mạng LAN hoặc WAN
• Tìm cách thức lan rộng sự cố.
• Chú ý cách nhanh chóng để chúng ta thu hẹp những sự cố đến
một nguồn nhất định Hơn nữa, chú ý cách chúng ta sử dụng logic để xác định nguyên nhân của sự cố
Trang 7QUẢN LÝ SỰ CỐ MẠNG
• Điều quan trọng là ngắt kết nối hệ thống phụ có liên quan đến
quá trình đang gặp sự cố Khi xử lý sự cố nội bộ với một máy tính, bạn phải ngắt kết nối với hệ thống phụ có liên quan
• Bạn cũng phải áp dụng phương pháp này để giải quyết các sự
cố liên quan đến mạng
Trang 8KHẮC PHỤC SỰ CỐ MẠNG
Ba câu hỏi cơ bản khi khắc phục sự cố
• Thiết bị đã từng hoạt động chưa?
• Lần cuối thiết bị hoạt động là khi nào?
• Điều gì đã thay đổi kể từ đó?
Bước đầu tiên để tìm biện pháp khắc phục là thực hiện
chẩn đoán đúng Sử dụng các lý luận và phương pháp
khoa học “sửa chữa một lỗi tại một thời điểm!” Bắt đầu với những thứ đơn giản nhất trước khi kiểm tra các yếu tố phức tạp hơn.
Trang 9KHẮC PHỤC SỰ CỐ MẠNG
Quá trình giúp bạn khắc phục sự cố gồm 8 bước sau đây:
1. Xác định biểu hiện của sự cố
2. Xác định các vùng bị ảnh hưởng bởi sự cố
3. Xác định những yếu tố đã thay đổi
4. Lựa chọn nguyên nhân có thể xảy ra nhất
5. Áp dụng biện pháp khắc phục
6. Kiểm tra kết quả
7. Nhận thấy những hiệu quả của giải pháp khắc phục lỗi
8. Ghi lại biện pháp khắc phục
Trang 10KHẮC PHỤC SỰ CỐ MẠNG
Xác định biểu hiện
• Xác định biểu hiện luôn là bước đầu tiên để giải quyết sự cố Dù
bạn là một quản trị viên hoặc kỹ thuật viên, thì phần này thường
là dễ nhất
• Điều này cho phép chúng ta biết chính xác sự ảnh hưởng mà sự
cố gây ra Sau đó, bạn sẽ sử dụng các thông tin này để xác định
sự cố đã được giải quyết vì các biểu hiện này sẽ biến mất
• Hãy nhớ rằng lỗi từ phía người sử dụng luôn là một nguyên nhân
có thể xảy sự cố
• Làm việc tại máy trợ giúp có thể khó khăn vì hầu hết các tình
huống đều đòi hỏi chúng ta kiểm tra trực tiếp sự cố để có thể xác định phạm vi của sự cố và giải pháp có thể áp dụng Một số thiết
bị trợ giúp được thiết lập để chỉ định sự cố cho kỹ thuật viên nhất định giải quyết
Trang 11KHẮC PHỤC SỰ CỐ MẠNG
• Sau khi đã tìm ra chính xác các vấn đề đang xảy ra do sự cố, bạn
cần xác định được số lượng và danh tính người dùng bị ảnh hưởng
Xác định phạm vi ảnh hưởng từ sự cố
Xác định độ ưu tiên xảy ra vấn đề
Tìm nguồn gốc của sự cố
• Biết được phạm vi sự cố sẽ giúp bạn xác định được độ ưu tiên cũng
như thời gian khắc phục sự cố
Trang 12KHẮC PHỤC SỰ CỐ MẠNG
Xác định vùng bị ảnh hưởng
• Máy tính cùng chung dải mạng , khác máy tính
Một phương pháp để cô lập một vấn đề về mạng là thay thế máy trạm gặp sự cố bằng một máy trạm đang hoạt động tốt
Thậm chí bạn có thể sử dụng một máy tính xách tay ở vị trí của máy trạm để xác nhận các kết nối, vì máy tính xách tay sẽ
dễ dàng mang theo hơn
Nếu máy trạm hoặc máy tính xách tay hoạt động tốt vẫn bị gặp khó khăn trong quá trình làm việc, thì sự cố không thể được cô lập với máy trạm ban đầu
Bạn nên bắt đầu khắc phục sự cố đối với các thành phần mạng như dây cáp, thiết bị, bộ chuyển tiếp, hoặc backbone (trục mạng chính) vì sự cố không phải từ máy tính cụ thể
Trang 13KHẮC PHỤC SỰ CỐ MẠNG
Xác định vùng bị ảnh hưởng
• Cùng máy tính, khác dải mạng
Máy trạm gặp sự cố được chuyển tới một tuyến khác
Nếu các máy trạm có thể hoạt động tốt trong tuyến mới thì vấn đề nằm trên tuyến ban đầu chứ không phải do máy trạm
Phương pháp này cũng có thể được kiểm tra bằng cách sử dụng một dây cáp mạng từ một máy trạm gần đó mà không cần phải di chuyển bất kỳ máy tính cá nhân
Trang 14KHẮC PHỤC SỰ CỐ MẠNG
• Hoán đổi các thành phần
Hoán đổi các thành phần giữa các máy trạm đang gặp sự
cố Các thành phần này bao gồm thiết bị trung tâm, dây cáp, và các thiết bị đầu cuối, bất cứ thành phần nào có thể
bị lỗi
Đây là một cách nhanh chóng để đưa hệ thống mạng trở
về trạng thái hoạt động bình thường
Bằng cách hoán đổi các thành phần, bạn có thể giải quyết
sự cố này một cách nhanh chóng và hiệu quả
Trang 15KHẮC PHỤC SỰ CỐ MẠNG
• Cô lập các đoạn mạng
Bạn sẽ phải kiểm tra lại toàn mạng để tìm ra những vùng
bị ảnh hưởng bởi sự cố này
Với các mạng như hiện nay, khá đơn giản để cô lập mạng chỉ bằng cách thông thường là tháo một dây cáp để ngắt kết nối đoạn mạng
Trang 16Loại bỏ các sự cố đơn giản Lắp đặt lại tất cả thành phần chính bị ảnh hưởng bằng
cách rút các thiết bị và cắm trở lại Tiếp tục xác định máy trạm có biểu
hiện gặp sự cố và máy trạm hoạt
Xử lý các sự cố về dây cáp phức tạp Kiểm tra dây cáp bằng TDR để tìm ra sự cố.
Xin trợ giúp Tham khảo các nguồn như TechNet, bộ công cụ tài
nguyên, hoặc trang web của nhà cung cấp để tìm hiểu thêm thông tin.
Trang 17KHẮC PHỤC SỰ CỐ MẠNG
Thiết lập những yếu tố đã thay đổi
• Xác định bất kỳ khác biệt giữa những vùng bị ảnh hưởng và
vùng không bị ảnh hưởng bằng cách tìm ra những sự thay đổi
kể từ lần cuối các thành phần mạng hoạt động bình thường
• Thiết lập những yếu tố đã thay đổi kể từ lần cuối tất cả thành
phần hoạt động bình thường là một bước quan trọng, tùy thuộc vào loại sự cố
• Bước này sẽ giúp xác định sự cố đã xảy ra khi một thiết bị
mạng đã được cài đặt và thiết lập lại cấu hình không giống như trước
• Bước này cũng có thể chỉ ra các bản nâng cấp máy chủ không
chỉ bộ cài phần cứng mà còn cả phần mềm, các bản vá lỗi phần mềm, và thậm chí cài đặt ứng dụng
• Bước này có thể dễ dàng được xác định từ tài liệu được các
quản trị viên và kỹ thuật viên mạng lưu giữ
Trang 18KHẮC PHỤC SỰ CỐ MẠNG
Lựa chọn nguyên nhân có thể xảy ra nhất
• Sau khi thu hẹp danh sách các tác động do sự cố gây ra, xác định
rõ phạm vi của sự cố và những thành phần đã thay đổi, chúng ta
có thể tìm ra một số điều cần kiểm tra Chúng ta chọn sự cố có thể xảy ra nhất và xác định một giải pháp
• Không có hướng dẫn nhất định cho bất cứ ai trong việc xác định
nguyên nhân của sự cố từ một số vấn đề nhất định mà chủ yếu được đúc rút từ kinh nghiệm Bạn càng giải quyết nhiều sự cố, thì bước này sẽ càng dễ dàng hơn với bạn
• Lựa chọn nguyên nhân có thể xảy ra nhất không chỉ dựa trên kiến
thức của bạn về mạng nói chung, mà nó cũng dựa trên vốn hiểu biết của bạn về loại mạng mà bạn kết nối vào thời điểm đó
Trang 19KHẮC PHỤC SỰ CỐ MẠNG
Áp dụng biện pháp khắc phục
• Sau khi xác định được sự cố cụ thể, chúng ta cần tìm biện
pháp khắc phục sự cố và thực hiện biện pháp đó
• Quản trị viên hoặc kỹ thuật viên sẽ có ý tưởng để xử lý
nguyên nhân gây ra sự cố và cũng có một hay nhiều giải pháp
để xử lý nó Nhiệm vụ này dựa trên kinh nghiệm và kiến thức để:
Xác định nguyên nhân gây ra sự cố
Sử dụng giải pháp đã biết hoặc tìm hiểu những giải pháp chưa biết trước đó
Tham khảo ý kiến của người khác về cách khắc phục sự cố
Gửi bản báo cáo qua internet hoặc gọi điện trực tiếp cho đội
hỗ trợ từ nhà sản xuất
Trang 20KHẮC PHỤC SỰ CỐ MẠNG
Kiểm tra kết quả
• Kiểm tra kết quả của việc áp dụng biện pháp xử lý sự cố là bước
quan trọng hơn những bước trước
• Không có gì nản lòng hơn là việc người dùng trong hệ thống
mạng gặp sự cố và cần đến sự giúp đỡ của đội kỹ thuật, và sau khi đội kỹ thuật đã thông báo là vấn đề đã được giải quyết mà lại không kiểm tra lại kết quả
• Hãy thông báo lại cho người dùng trong hệ thống mạng tình
trạng hệ thống sau khi đã xử lý xong sự cố
Trang 21 Phát hiện những khả năng có thể xảy ra sau khi áp dụng
những biện pháp xử lý sự cố
• Sau khi bạn đã thực hiện và kiểm tra lại việc xử lý sự cố, bạn
phải chắc chắn rằng việc xử lý sự cố đó không ảnh hưởng xấu đến bất cứ thành phần khác trên mạng Trong một số trường hợp, bạn nên cân nhắc bước này trước khi thực hiện việc xử
lý sự cố
• Sau khi xử lý sự cố mạng, bạn phải kiểm tra các vấn đề mạng
khác có thể bị ảnh hưởng do việc xử lý sự cố này
KHẮC PHỤC SỰ CỐ MẠNG
Trang 22 Ghi lại những biện pháp khắc phục sự cố trong hệ thống
• Bước cuối cùng và quan trọng nhất trong quá trình khắc phục
sự cố là ghi lại biện pháp khắc phục
• Bước này giúp bạn tránh lãng phí thời gian về sau khi bạn
hoặc ai đó phải xử lý sự cố tương tự, trải qua tất cả các bước bạn đã thực hiện để đi đến cùng một giải pháp
• Ghi lại thông tin cũng quan trọng cho những người sau này sẽ
hỗ trợ hoặc thay thế bạn
Trang 23SỰ CỐ HỆ THỐNG HAY SỰ CỐ TỪ NGƯỜI DÙNG TRONG HỆ THỐNG
Lỗi hệ thống có thể được phân loại như : lỗi xảy ra trên
một cái máy tính, thiết bị hoặc quá trình xử lý trong hệ thống mạng không do tác động trực tiếp của người dùng.
Sự cố từ người sử dụng hệ thống : xảy ra từ những hành
động của người dùng trong hệ thống , chẳng hạn không đăng nhập chính xác, kết nối không đúng với máy chủ, hoặc in sai máy in.
Trang 24KIỂM TRA CÁC THÔNG BÁO
Trang 25KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Đèn Link
• Đèn link có ý nghĩa quan trọng trong việc xác định có kết nối
mạng hay không
• Đèn link là một điốt phát quang màu xanh lục hoặc LED, sẽ
phát sáng nếu thiết bị mạng được kết nối mạng
• Vì vậy, nhiều thiết bị mạng như bộ routers, bộ switches và
card mạng, được trang bị đèn link báo liên kết
• Hầu hết card mạng có hai đèn: đèn link liên tục phát sáng khi
có kết nối mạng vật lý và một đèn chỉ thị các hoạt động hiện tại của card mạng và xung mạng khi dữ liệu được chuyển đến
và đi từ máy tính hoặc thiết bị
Trang 26 Đèn xung đột
• Đèn xung đột chỉ báo hiệu khi có một kết nối cụ thể có gặp sự
cố do các gói tin xung đột với nhau
• Đèn xung đột đôi khi có thể giống như đèn hoạt động; đèn
hoạt động màu xanh lục khi gửi hoặc nhận dữ liệu và chuyển sang màu vàng hoặc màu da cam khi xảy ra xung đột
• Xung đột gây ra mất gói tin đã nhận và gói tin đã gửi đi.
• Quản trị viên và kỹ thuật viên cần phải kiểm tra các đèn để
xác minh rằng có sự xung đột mạng xả ra hay không
KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Trang 27KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Đèn nguồn
• Đèn nguồn không sáng có nghĩa là thiết bị không được kết nối
với nguồn điện hoặc đèn nguồn đã bị cháy
Nếu đèn nguồn không sáng, hãy kiểm tra xem thiết bị có được kết nối với nguồn điện đúng cách hay chưa
Nếu không, bạn nên kiểm tra nguồn điện, cáp nguồn hoặc
ổ cắm tường
Nếu bạn đã kiểm tra và thấy rằng tất cả chúng đều hoạt động bình thường, thì thiết bị có thể bị hỏng Trong trường hợp này, bạn sẽ phải thay thế nó
Trang 28KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Hiển thị lỗi
• Hiển thị lỗi là một phương tiện để cảnh báo cho bạn về việc
thiết bị gặp sự cố hay bị hỏng
• Hiển thị này có thể là một hộp thoại báo lỗi trực quan trên
máy tính khi xảy ra lỗi hoặc một màn hình báo lỗi bằng LED trên thiết bị mạng
• Hiển thị báo lỗi có thể đưa ra lỗi mà bạn phải tìm để xác định
nguyên nhân của sự cố và cách khắc phục nó
Trang 29KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Nhật ký và hiển thị lỗi
• Tương tự với hiển thị lỗi là nhật ký lỗi, trong đó duy trì một
danh sách các lỗi gặp phải trên thiết bị
• Nhật ký lỗi này chứa các thông tin về thời gian xảy ra sự cố,
bản chất của sự cố, và có thể là quá trình khắc phục sự cố
• Ghi nhật ký sự lỗi rất quan trọng vì nó có thể giúp bạn xác
định
Thời gian xảy ra sự cố
Nguyên nhân gây ra sự cố
Những quá trình khác bị ảnh hưởng bởi sự cố này
Trang 30KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Logs và hiển thị sự cố
• Các hệ điều hành Windows như máy khách Windows và máy
chủ Windows đều có một cơ chế ghi nhật ký lỗi được gọi là Trình xem sự kiện (Event Viewer), đóng vai trò quan trọng trong việc chẩn đoán và khắc phục sự cố trong các hệ điều hành đó
• Trình xem sự kiện (Event Viewer) là một ứng dụng đọc các
tệp ghi nhị phân được lưu trữ trong <windows diectory>\system32\config folder
• Có ba loại logs chính trong các hệ điều hành dựa trên
Windows mà bạn nên theo dõi thường xuyên
Logs hệ thống
Logs bảo mật
Logs ứng dụng
Trang 31KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Các vấn đề về chất lượng và tối ưu hóa
• Có rất nhiều thuật ngữ trong Mạng + mục tiêu mà bạn cần
phải biết liên quan đến chất lượng mạng, băng thông và tính khả dụng
Trang 32KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
• Chất lượng dịch vụ (QoS) được dùng để kiểm soát băng thông
mạng do các ứng dụng hoặc người dùng khác nhau sử dụng
• QoS rất quan trọng đối với các ứng dụng băng thông cao như
Voice over IP hoặc đa phương tiện, mà các kỹ sư mạng cần phải đảm bảo đủ băng thông sẵn có cho những ứng dụng đó hoạt động chính xác
Trang 33KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Quản lý lưu lượng băng thông
• Quản lý lưu lượng băng thông là khi quản trị viên mạng điều
khiển lưu lượng mạng để đạt được một mức độ chất lượng mong muốn trên mạng
• Với việc quản lý lưu lượng băng thông, quản trị viên mạng sẽ
hoãn các gói tin gửi đi theo các tiêu chí nhất định, như các loại lưu lượng truy cập, để băng thông có sẵn cho các ứng dụng có nhiệm vụ quan trọng
Trang 34KIỂM TRA CÁC THÔNG BÁO
VẬT LÝ VÀ LOGIC
Công cụ bộ nhớ đệm
• Công cụ bộ nhớ đệm là một biện pháp khắc để tối ưu hóa lưu
lượng truy cập
• Khi bạn thêm một công cụ bộ nhớ đệm vào mạng, nó sẽ tải về
nội dung từ Internet và lưu trữ trong bộ nhớ của nó và cho các máy khách khác có yêu cầu cùng một nội dung