Configuration management Hiệu chỉnh hoạt động của hệ thống thông qua việc thay đổi các thông số hoạt động, cài đặt phần mềm, thay đổi các module phần cứng, … Cấu hình thiết bị Theo
Trang 1Các chức năng quản
lý mạng
Trang 3Fault management
tình huống bất thường của hệ thống.
Giám sát trạng thái hệ thống.
Xử lý cảnh báo.
Chẩn đoán và khắc phục sự cố
Vận hành hệ thống trouble ticket
Hỗ trợ người dùng (user help desk)
Ngăn chặn lỗi (proactive fault management)
Trang 4Configuration management
Hiệu chỉnh hoạt động của hệ thống thông qua việc thay đổi các thông số hoạt động, cài đặt phần mềm, thay đổi các module
phần cứng, …
Cấu hình thiết bị
Theo dõi cấu hình thiết bị
Đồng bộ thông tin cấu hình giữa hệ thống
quản lý và thiết bị
Sao lưu và phục hồi cấu hình
Quản lý phần mềm (image)
Trang 6Performance management
Quản lý hoạt động của hệ thống qua các thông số: độ tiếp thông, độ trễ, chất lượng dịch vụ…
Giám sát và hiệu chỉnh hệ thống
Thu thập thông tin về hiệu năng hệ thống
Trang 8Performance management
Trang 10Độ sẵn sàng
Availability
MTTR MTBF
MTBF A
+
=
A: Availability (Tính bằng đơn vị %)
MTBF: Mean Time Between Failure
MTTR: Mean Time To Repair
M c s n sàng c a h th ng ph thu c vào ứ ẵ ủ ệ ố ụ ộ
đ tin c y c a các thành ph n m ng và ộ ậ ủ ầ ạ các c ch d phòng ơ ế ự
Trang 13h th ng??? ệ ố
Trang 14Thời gian đáp ứng
Response time: thời gian đáp ứng của hệ thống đối với một tác động của người
dùng
Giá trị tham khảo:
>15s: không dùng cho hệ thống tương tác
>4s: Chấp nhận được đối với các thống xử lý dữ liệu cỡ lớn
2-4s:hệ thống đầu cuối thô (terminal)
<2s:hệ thống đầu cuối với nhiều thông tin
Subsecond: hệ thống giao diện đồ họa
Decisecond: giao diện đồ họa dùng chuột
Trang 15RT: response time CPU: CPU processing delay
TI: Inbound terminal delay SO: outbound service time
WI: inbound queuing time WO: outbound queuing time
SI: inbound service time TO: outbound terminal delay
RT = TI + WI + SI + CPU + WO + SO + TO
Trang 16Độ chính xác
Accuracy: tính chính xác của hệ thống thể hiện ở xác suất các loại lỗi hệ thống, ví dụ lỗi gói, lỗi giao thức, lỗi dịch vụ, …
Trang 17Thông lượng
Throughput: thông lượng (độ tiếp thông)
Số giao tác xử lý được trong 1 đơn vị thời
Số kết nối TCP được trong 1 đơn vị thời gian
Số gói truyền đi trong một đơn vị thời gian…
Trang 18Mức độ chiếm dùng
Utilization: Tỉ lệ tài nguyên hệ thống được chiếm dùng
so với tổng số tài nguyên khả dụng (tỉ lệ 80/20)
Trang 19Câu hỏi
thông số hiệu năng hệ thống.
toán để xác định giá trị của các thông số hiệu năng (độ sẵn sàng, thời gian đáp
ứng, …)
Trang 20Fault management
Trang 21 Giảm thiểu sự cố bằng cách:
Chấp nhận sự thật: sự cố là hiển nhiên.
Triển khai cơ chế dự phòng (redundancy)
Duy trì hệ thống tài liệu (documentation)
Huấn luyện kỹ năng xử lý sự cố cho đội ngũ quản lý mạng
Bắt đầu từ những điều đơn giản trước!
Trang 22Tài liệu (documentation)
Documentation là cần thiết trong tất cả các lĩnh vực quản lý mạng (OAM&P)
Thông tin về cấu hình (configuration)
Thông tin về quy trình (procedure)
Trang 23Quy trình xử lý sự cố
Sart Xác định sự cố Thu thập thông tin Xác định các khả năng
Ra phương án xử lý Thực hiện phương án Kiểm tra kết quả
Hết sự cố
Documentation
Stop
Trang 24 Các thành phần sự cố có liên quan không?
Sự cố được phát hiện khi nào?
Thành phần bị sự cố trước đó có làm việc không?
Những thay đổi của hệ thống kể từ thời điểm hoạt động bình thường gần nhất?
…
Trang 25Thu thập thông tin
Hỏi thêm những người khác (user, admins, managers, …)
Trang 26Xác định khả năng
Liệt kế tất cả những khác năng có thể có
Rút gọn những khả năng khó xảy ra
Trang 27Ra phương án xử lý
Hiểu rõ sự cố trước khi hành động
Chọn khả năng có xác suất cao nhất và cách xử lý đơn giản nhất làm trước
Phương án cần có tính hệ thống
Thực hiện từng thao tác đơn lẻ
Đặt mục tiêu giải quyết sự cố chứ không dừng lại ở mức giảm dấu hiệu
Trang 28Thực hiện phương án, kiểm tra kết quả, ghi tài liệu
Thực hiện phương án
Cẩn thận
Từng bước
Xác định rõ kết quả mong muốn tại từng bước
Kiểm tra kết quả
Dấu hiệu giảm hoặc mất
Kiểm tra lặp lại, kéo dài
Ghi tài liệu là thao tác bắt buộc!
Trang 29Chọn phương án khác
Nếu phương án đã thực hiện không giải
quyết được sự cố thì trả lại trạng thái cũ
cho hệ thống và chọn phương án khác
Nếu tất cả các phương án đưa ra đều
không giải quyết được?
Vendors
Mailing lists and forums
Colleagues
Trang 30Kết thúc
Trang 31Các công cụ kiểm tra cấu hình IP
Trang 33Kiểm tra các thông số IP
Kiểm tra các giá trị động nhận được từ DHCP server
Trang 34Kiểm tra kết nối
Kiểm tra routing table (route)
Kiểm tra DNS resolver (nslookup)
Kiểm tra port đang mở, tiến trình đang chạy (netstat, ps)
Kiểm tra định tuyến bằng (trace)
Kiểm tra kết nối (ping)
Trang 35 Destination host unreachable
Destination network unreachable
Trang 38Xác định thông lượng của kết nối bằng lệnh ping
Phân biệt:
Băng thông (Bandwidth)
Tốc độ (Speed)
Thông lượng (throughput)
Thông tin trả về từ lệnh ping:
Kích thước gói
Thời gian trễ
Trang 39Kết quả lệnh ping
Trang 40Dùng lệnh ping để tính thông lượng
Tính thông lượng
từ máy hiện hành đến máy có địa chỉ 203.162.4.1?
Trang 41Dùng lệnh ping để tính thông lượng
Trang 43Câu hỏi ôn tập
Trình bày các chức năng quản lý mạng