1.2 Tiến trình ngẫu nhiên Tiến trình ngầu nhiên Các tín hiệu ngẫu nhiên trong hệ thống mạng truyền thông tín hiệu thoại, dữ liệu máy tính có các đặc điểm: - Các tín hiệu này đều là nhữn
Trang 1Mô hình phân tích và lượng hóa lưu lượng số liệu ở mức gói, mức phiên và theo ứng dụng
1 Lý thuyết lưu lượng
1.1 Giới thiệu
Lý thuyết lưu lượng và lý thuyết hàng đợi được sử dụng để mô hình hóa hệ thống mạng truyền thông và để đánh giá các tham số hiệu năng của mạng như: Trễ (hành đợi, end-to-end), xác suất từ chối kết nối, xác suất mất gói v.v.
1.2 Tiến trình ngẫu nhiên
Tiến trình ngầu nhiên
Các tín hiệu ngẫu nhiên trong hệ thống mạng truyền thông (tín hiệu thoại, dữ liệu máy tính) có các đặc điểm:
- Các tín hiệu này đều là những hàm biến đổi theo thời gian được xác định trong một số khoảng thời gian quan trắc.
- Các tín hiệu này là ngẫu nhiên và không thể mô tả được chính xác dạng sóng của tín hiệu quan sát được.
Tiến trình ngẫu nhiên được định nghĩa là một tập hợp của các hàm thời gian cùng với một luật xác suất nhất định.
X(t,s), -T≤ t ≤ T
Tiến trình ngẫu nhiên X với giá trị thử s trong khoảng thời gian t
- Phân bố Poisson là một phân bố ngẫu nhiên của một biến rời rác Nó thể hiện xác suất của số sự kiên xảy ra trong một khoảng thời gian xác đinh.
- Hàm mật độ xác suất:
Tiến trình Poisson là một tiến trình ngẫu nhiên gồm một tập hơp {N(t):t≥0} các biến ngẫu nhiên Trong đó N(t) là số sự kiện xảy ra cho tời thời điểm t; N(a)-N(b) là số sự kiện xảy ra giữa 2 thời điểm
a, b và có phân bố Poisson
- Tiến trình Poisson thường được sử dụng để mô hình hóa lưu lượng đến các nút mạng (số cuộc gọi đến tổng đài, gói đến router.v.v.)
Định lý1: nếu tiến trình {N(t): t≥0} là một tiến trình poisson với tham số λ >0 thì số sự kiện k xảy ra
trong một khoảng thời gian [0,t] sẽ tuân theo phân bố Poisson với tham số λt.
Trang 2λ – là số sự kiện trung bình xảy ra trong một đơn vị thời gian
Định lý 2: nếu tiến trình {N(t): t≥0} là một tiển trình Poisson với tham số λ>0 thì khoảng thời gian
xảy ra giữa 2 sự kiện I và i-1 sẽ tuân theo phân bố mũ với tham số λt:
Một số đặc tính của tiến trình Poisson:
- Các sự kiện độc lập với nhau
- Tính chất kết hợp: tổng hợp của nhiều tiến trình Poisson là một tiến trình Poisson
- Tính phân tách
1.3 Hệ thống phục vụ và các khài niệm có liên quan
Khái niệm hệ thống phục vụ
Hệ thống phục vụ (service system):
- Các hệ thống tiếp nhân yêu cầu phục vụ ngẫu nhiên từ bên ngoài vào sau đó xử lý/ phục vụ các yêu cầu đó
- Các yêu cầu sau khi được phục vụ xong sẽ đi ra khỏi hệ thống
Ứng dụng: hệ thống phục vụ được sử dụng mô hình hóa nhiều quá trình xảy ra trên thực tế:
- Hệ thống giao thông
- Hệ thống xếp hàng tại siêu thị, các nơi công cộng
- Mạng viễn thông
Hệ thống phục vụ được mô tả bằng các hàng đợi
Trang 3Ký hiệu Kendall
- Được sử dụng để mô tả hệ thống hàng đợi
- Ký hiệu: A/B/C/S/R/D
A: tiến trình ngẫu nhiên của yêu cầu đến hệ thống (arival proces), đặc trưng bởi phân bố ngẫu nhiên và tốc độ TB λ
M: Markov; D: Deterministic; G: General
C: số sever (c≥0)
S: dung lượng hàng đợi (s≥0)
R: số nguồn phát sự kiện, với tiến trình Poisson, R không quan trọng
D: Cách thức phục vụ của server (FIFO, LIFO, Round Robin, WRR, Prỉoity, v.v.)
Hệ thống đóng (enclosed system) là một hệ thống phục vụ có đặc điểm:
- Các yêu cầu đi vào hệ thống bằng các yêu cầu đã đi ra khỏi hệ thống
- Hệ thống không tự sản sinh ra các yêu cầu mới mà cũng không hủy bỏ các yêu cầu đang tồn tại
Hệ thống đóng là tập hợp của một hay nhiều hàng đợi
Các tham số của hệ thống đóng
- N(t): số yêu cầu nằm trong hệ thống tại t
- : số yêu cầu nằm trong hàng đợi tại thời điểm t
- : số yêu cầu được phục vụ bởi server tại thời điểm t,
- T: thời gian tổng cộng một yêu cầu lưu lại hệ thống
- : thời gian yêu cầu nằm đợi trong hàng đợi
- : thời gian yêu cầu được phục vụ bởi server
- : tốc độ trung bình của yêu cầu đi vào hệ thống (số yêu cầu/đơn vị thời gian)
Trang 4- μ: tốc độ phục vụ trung bình của một server (số yêu cầu/đơn vị thời gian)
- c: số server
- Mật độ lưu lượng (traffic inténity) hoặc tải của hệ thống (traffic load) được tính như sau.
- Điều kiện để hệ thống hoạt động ổn định:
hoặc
- Ngược lại, hệ thống sẽ ở trạng thái quá tải (trang hành đợi)
Định lý Little:
N =
- Định lý Little áp dụng cho tất cả các hệ thống đóng, không phụ thuộc vào tính chất ngẫu nhiên của tiến trình đến (arrival process) và tiến trình phục vụ (server process)
Một số tính chất khác của hệ thống đóng:
1.4 Lý thuyết hành đợi
Một số ký hiệu quy ước
- N: số yêu cầu trung bình nằm trong hệ thống
- : số yêu cầu nằm trong hàng đợi
- : số yêu cầu được phục vụ bởi server
- T: thời gian trung bình một yêu cầu lưu lại trong hệ thống
- : thời gian trung bình một yêu cầu nằm đợi trong hàng đợi
- : thời gian trung bình yêu cầu được phục vụ bởi server
Trang 5- : xác suất để thời gian trong hàng đợi nhỏ hơn một thời gian t cho trước
- : xác suất một yêu cầu bị từ chối
- : tốc độ trung bình của một yêu cầu đi vào hệ thống
- : tốc đọ phục vụ trung bình của một server
Hàng đợi M/M/1/∞
Tiến trình tới và tiến trình phục vụ: Poisson, hàng đợi vô hạn, 1 server
Hàng đợi M/M/1/K
Tiến trình tới và tiến trình phục vụ: Poisson hàng đợi có độ dài k, 1 server
Xác suất từ chối phụ thuộc vào chiều dài hàng đợi và tải :
Trang 6Hàng đợi M/M/c/∞
- Tiến trình tới và tiến trình phục vụ: Poisson
- Hàng ợi có kích thước vô hạn đợi có kích thước vô hạn
- c server với tôc ộ phục vụ trung bình μ như nhau đợi có kích thước vô hạn
- Gọi :
- Công thức Erlang C: cho biết xac suất một yêu cầu phải ợi trong hàng ợi trước khi đợi có kích thước vô hạn đợi có kích thước vô hạn ược phục vụ:
đợi có kích thước vô hạn
Trang 7Hàng ợi M/M/c/0 đợi có kích thước vô hạn
- Trình tới và tiến trình phục vụ: Poisson
- Hệ thống không có hàng ợi đợi có kích thước vô hạn
- C server với tốc ộ phục vụ trung bình μ như nhau đợi có kích thước vô hạn
- Công thức Erlang B: cho biết xác suất một yêu cầu bbị từ chối phục vụ
Khái niêm Erlang
- Erlang là đơn vị được sử dụng để đo lưu lượng hoặc tải trong một hệ thống viễn thông trong một giờ.
Hàng đợi M/D/1/∞
- Tiến trình tới: Poisson
- Thời gian phục vụ là hằng số
- Hàng đợi vô hạn
- 1 server
So sánh M/M/1 và M/D/1
2 Áp dụng nguyên lý lưu lượng trong mạng chuyển mạch gói
2.1 Một số khái niệm cơ bản:
- Độ dài gói L(bit)
- Chiều dài đường truyền vật lý giữa 2 nút mạng (m)
Trang 8- Trễ lan truyền: là thời gian để tín hiệu truyền trên kênh vật lý: ; là vận tốc lan truyền của tín hiệu.
- Dung lượng kênh C(bit/s)
- Thời gian phục vụ gói (transmission time): thời gian gửi hết một gói từ bit đầu tiên đến bit cuối cùng lên kênh truyền ;
- Trễ hàng đợi : là thời gian một gói phải lưu lại trong hành đợi ở nút mạng trung gian.
- Trễ từ đầu cuối đến đầu cuối (end-to-end) : là trễ từ khi gửi một gói tín từ đầu phát cho đến khi nó được nhận ở đầu thu.
2.2 Nguyên tắc chuyển mạch gói
- Lưu giữ tại các nút trung gian và gửi tiếp “store-and-forward”
- Tại sao phải chia nhỏ bản tin thành nhiều gói nhỏ trước khi truyền đi:
+ Để giảm trễ End-to-end
+ tăng độ tin cậy
2.3 Trễ hàng đợi
- Trong điều kiện tải cao, các gói đi vào nút mạng phải đợi trong hàng đợi trước khi gửi ra đầu ra.
- Hệ thống mạng có thể được mô hình hóa thành các hàng đợi được kết nối với nhau
- Đối với một kết nối xác định từ nguồn tới đích, trễ đầu cuối chỉ phụ thộc vào trễ hàng đợi.
- Nếu xác định được trễ hàng đợi thì sẽ đánh giá được hiệu năng hoạt động của mạng
Trang 9- A(t): là tiến trình tới – là số gói đến nút mạng trong một khoảng thời gian [0,t]
- D(t) là tiến trình ra – số gói ra khỏi nút mạng trong khoảng thời gian [0,t]
- Q(t): số gói nằm trong hàng đợi tại t
- Tính chất của A(t) và D(t):
+ A(t) và D(t) là các hàm đơn điệu tăng
+ A(t) ≥ D(t)
- Số gói nằm trong hàng đợi tại t:
Q(t) = A(t) – D(t)
3 Các mô hình lưu lượng và lượng hóa lưu lượng số liệu ở mức gói, mức phiên và ứng dụng 3.1 Giới thiệu
Các nguyên tắc, phương trình lưu lượng cơ bản và tổng quan về đặc điểm của lưu lượng mạng được giới thiệu trong phần trên Trên cơ sở những khái niệm mở đầu đó chúng ta sẽ trình bày các mô hình lưu lượng quan trọng nhất để nắm được các đặc điểm lưu lượng mạng chính Các mô hình được sắp xếp từ đơn giản đến rất phức tạp Trong thực tế, cần có sự cân nhắc để mô hình chúng ta chọn có
độ phức tạp vừa phải để nhận được mô hình có các đặc tính lưu lượng chính xác nhưng vẫn kiểm soát
và tính toán lưu lượng một cách thuận lợi
Tổng quan về các nguyên lý lượng hóa trong cả hệ thống điện thoại và mạng dữ liệu (tập trung vào Internet) cũng sẽ được đê cập đến.
Trang 103.2 Các mô hình lưu lượng
Lưu lượng bao gồm các thực thể rời rạc hoặc liên tiếp (các gói, các cell, v v ) Nó có thể được mô
tả toán học bằng một quá trình điểm “point process” Có hai đặc điểm của quá trình điểm là: các các quá trình đếm “counting processes” hoặc các quá trình thời gian đến “interarrival time processes” Quá trình đếm là một quá trình stochastic giá trị nguyên không âm liên tục theo thời gian, trong
đó là số lượng đến trong khoảng thời gian (0,t] Quá trình thời gian đến là một chuỗi ngẫu nhiên thực , trong đó là khoảng thời gian giữa gói đến thứ n
và gói đến trước đó Lưu lượng được xem là lưu lượng kết hợp trong trường hợp các gói đến theo từng loạt Để mô tả lưu lượng kết hợp, tiến trình đến từng loạt được định nghĩa, ở đây là số lương các đơn vị trong đợt đó Một khái niệm khác là quá trình tải (workload process) Nó được mô tả bằng số lượng các được đưa tới hệ thống bởi gói đến thứ n
Sau đây một số các mô hình lưu lượng được mô tả có thể được dùng để tạo ra lưu lượng mô tả bằng
Trong một quá trình tái tái sinh (renewal process) là độc lập, được phân bố đều với phân bố chung Mô hình này đơn giản nhưng không thực tế trong nhiều trường hợp bởi vì nó không
có tính tương quan tốt trong hầu hết lưu lượng dữ liệu hiện thời.
Tiến trình Poisson là một tiến trình phục hồi mà các thời gian đến của nó được phân bố theo luật hàm mũ với tham số tỷ lệ λ Khái niệm này cũng có thể được đưa ra bởi tiến trình đếm, trong
đó có các lượng tăng độc lập và ổn định với P{N(t)=n}=exp(-λt)(λt) n /n! Tiến trình Poisson rất thường được sử dụng trong lý thuyết lưu lượng bởi vì tính đơn giản và một vài thuộc tính của chúng Lưu lương thoại đến trong hệ thống điện thoại chủ yếu được mô hình hóa bởi các tiến trình Poisson.
Các quá trình Bernoulli là các quá trình giống các quá trình Poisson rời rạc theo thời gian Trong
mô hình này xác suất của một gói đến trong bất kỳ một khe thời gian nào luôn là p Số lượng gói đến trong khe k được phân bố nhị thức, nghĩa là và các thời gian giữa
các gói đến được phân bố hình học, nghĩa là
Quá trình tái sinh kiểu pha (Phase-type renewal processes): gồm có một lớp các quá trình tái
sinh có các thời gian đến phân bố kiểu pha Nó là một lớp quan trọng bởi vì các mô hình này dễ kiểm soát theo phép phân tích và, mặt khác, bất kỳ một phân bố nào cũng có thể xỉ bởi các phân bố kiểu pha.
Các mô hình dưa theo Markov đưa ra sự phụ thuộc vào chuỗi ngẫu nhiên Cấu trúc của mô hình này như sau Xem xét một quá trình Markov với một không gian trạng thái rời rạc M hành xử như sau: nó ở trạng thái i đối với một thời gian giữ phân bố hàm mũ với tham số nó chỉ phụ thuộc vào i Sau đó nó nhẩy sang một trạng thái j với xác suất Mỗi lần nhẩy của quá trình
Trang 11Markov này được hiểu như là việc báo hiệu một gói đến do vậy các thời gian đến theo luật mũ Đây là
mô hình lưu lượng Markov đơn giản nhất.
Các quá trình Markov tái sinh (Markov renewal processes) tổng quát hơn các quá trình Markov
đợn giản nhưng chúng vẫn có thể vận dụng phép phân tích Một quá trình Markov tái sinh
được xác định bởi chuỗi Markov { } và các thời gian nhẩy tương ứng của nó { }, tùy thuộc vào các rằng buộc sau: phân bố của cả ( ), của trạng thái và thời gian nhẩy tiếp theo, chỉ phụ thuộc vào trạng thái hiện tại , mà không phụ thuộc vào cả các trạng thái trước lẫn các thời gian nhẩy trước Trong mô hình này các gói đến cũng có thể được hiểu là khi các bước nhẩy xuất hiện.
Các quá trình đến Markov (MAP) tạo thành một lớp các quá trình Markov tái sinh lớn trong
MAP các thời gian đến có kiểu pha và các gói đến xuất hiện tại ở một số lúc thu hút của quá trình Markov phụ Ngoài ra, quá trình này được khởi động lại cùng với một phân bố phụ thuộc vào trạng thái tức thời từ sự thu hút vừa xuất hiện MAP vẫn có thể vận dụng phép phân tích và nó là một quá trình linh hoạt cho các mục đích mô hình hóa.
Trong một quá trình điều chế Markov (Markov-modulated process) mộ quá trình Markov đang
tiến triển đúng lúc và trạng thái hiện tại kiểm soát quy luật xác suất các gói đến xem xét một quá trình Markov liên tục theo thời gian với không gian trạng thái 1, 2, …, m Khi M ở trạng thái k, thì luât xác suất của lưu lượng đén hoàn toàn xác định bởi k Khi M chuyển sang trạng thái khác, trạng thái j, thì một luật xác suất mới của lưu lượng đến sẽ chọn hiệu quả đối với khoảng thời gian trạng thái j, và tiếp tục như vậy Nói cách khác, luật xác suất lưu lượng đến được điều chỉnh bởi trạng thái của M.Các quá trình Stochastic này đôi khi cũng gọi là các quá trình Stochastic kép (double stochastic process) Quá trình điều chế có thể cũng có thể phức tạp hơn nhiều so với một quá trình Markov nhưng những mô hình như thế này thì kiểm soát theo phép phân tích khó hơn.
Chuỗi Poisson điều chế Markov (MMPP) là mô hình lưu lượng điều chế Markov được sử dụng
thông dụng nhất Ở mô hình này, khi quá trình Markov định điều chế ở trạng thái k của M thì các gói đến xuất hiện tuân theo một quá Markov tốc độ Trường hợp MMPP đơn giản nhất là mô hình MMPP hai trạng thái khi một trạng thái tương ứng với trạng thái “ON” với tốc độ Poisson riêng, và trạng thái còn lại là trạng thái “OFF” với tốc độ tương ứng là 0 Mo hình này còn được gọi là quá trình Poisson ngắt (interrupted Poisson process) Các mô hình như thế được dùng cho việc mô hình hóa các nguồn lưu lượng thoại với trạng thái On tương ứng với khi nói và trạng thái OFF tương ứng với khoảng thời gian yên lặng.
Trong các quá trình điều chế truyền Markov (Markovian transition-modulated processes),
chuyển đổi của quá trình Markov là việc điều chế thích hợp hơn trạng thái của M các chuyển đổi trạng thái có thể được mô tả bởi một cặp trạng thái: một trạng thái trước khi chuyển đổi và một trạng thái sau khi chuyển đổi Số lượng gói đến trong khe n được hoàn toàn xác định bởi
vào bất kỳ thông tin trạng thái trước đó.
Trong quá trình tiền định điều chế chung (GMDP: generally modulated deterministic process ) nguồn có thể là bất kỳ trạng thái nào trong N trạng thái có thể Trong nó ở trạng thái j thì lưu
lượng đã được tạo ra ở tốc độ cố định Thời gian tiêu tốn trong trạng thái j có thể được mô tả bởi một phân bố chung nhưng trong hầu hết các trường hợp nó có thể được coi là phân bố hình học để dễ
Trang 12kiểm soát theo phép phân tích Nếu bạn xem xét một GMDP trạng thái ở đó một trong chúng có tốc độ tạo không mà chúng ta có phiên bản khe thời gian của mô hình ON/OFF.
Trong kỹ thuật mô hình hóa lưu lượng lỏng (fluid traffic modeling technique) lưu lượng được
xem như một chất lỏng thay cho các đơn vị lưu lượng riêng biệt (như các gói) Đây là một mô hình tốt trong đó các đơn vị lưu lương riêng biệt là mối liên hệ mật thiết với các mô hình lưu lượng điều này nhằm để nắm bắt các cấu trúc các đơn vị lưu lượng riêng Kiểu đơn giản nhất của các mô hình lưu lượng lỏng lãe thừa nhận 2 trạng thái: một trạng thái bật khi lưu lượng đến tiền đinh ở một tốc độ cố định λ, và một trạng thái là OFF khi không có lưu lượng được mang Để giữ được tính dễ kiểm soát bằng phép phân tích, khoảng thời gian bật và tắt thường được cho cho là được phân phối theo luật mũ
và phụ thuộc lẫn nhau Nói cách khácm chúng định dạng một quá trình tái sinh qua lại.
Các mô hình lưu lương tự động thoái lui (autoregressive traffic models) xác đinh biến tiếp theo
trong chuỗi như một hàm hiện (explicit function) của các biến trước đó bên trong một cửa sổ bằng cách trải ra từ hiện tại tới quá khứ Các ví dụ tiêu biểu của các mô hình này là quá trình tự động thoái lui tuyến tính (linear autoegressive (AR) process), các quá trình trung bình động (moving average (MA) proceses), các quá trình trung bình động tự động thoái lui (autoregressive moving average (ARMA) processes) và các quá trình trung bình động tích hợp tự động thoái lui (autoregressive intergrated moving average (ARIMA) processes) Những mô hình này được tìm ra để dùng để mô tả lưu lượng video VBR.
Cách tiếp cận mẫu mở rộng chuyển đổi (TES: transform-expand-sample) nhằm để dựng một
mô hình làm thỏa mãn 3 yêu cầu: các phân bố ở lề nên phù hợp với bản sao của nó, tự tương quan nên xấp xỉ bản sao của nó có một khoảng trễ hợp lý và các đường mẫu được tạo bởi mô hình này nên giống các chuỗi thời gian Các mô hình TES có thể được dùng cho các mô hình video MPEG.
Nhiễu Gauss phân số (FGN: Fractional Gaussian Noise) là một quá trình tự đồng dạng bậc hai
chính xác với tham số tự đồng dạng H, miễn là ½ < H <1 Nó là một quá trình Gaussian Process, X=
một mô hình lưu lượng thích hợp cho việc mô tả lưu lượng LRD kết hợp ở các đường liên kết xương sống.
Mô hình ARIMA phân số (FARIMA) dựa trên mô hình ARIMA(p,q,d) cổ điẻn nhưng tham số d
được với dùng với toán tử được phép chọn các giá trị phân số Các mô hình FARIMA mềm dẻo hơn các mô hình FGN để bắt lưu lượng bởi vì chúng cũng có thể được điều chỉnh để tiếp nhận các tính chất phụ thuộc tầm ngắn
Mô hình M/pareto là một quá trình Poisson với tốc độ λ các cụm gối lên nhau được phân bố
Pareto Trong một cụm quá trình đến là hằng số với tốc độ r Chu kỳ chiều dài cum có một phân bố
Pareto với các tham số 1<γ<2, δ>0: p{X>x} = mô hình này tạo ra lưu lượng LRD với
tham số H=(3-γ)/2, do đó nó cũng thích hợp để mô hình hóa lưu lượng.
Dựa vào nhiều mô hình lưu lượng đã được phác thảo ở trên một mô hình có thể ứng dụng riêng hoặc kết hợp một vài mô hình để mô hình hóa lưu lượng cho ứng dụng cụ thể Ở đây chúng ta trình bày một nguyên tắc để lựa chọn mô hình hóa có thể của một vài ứng dụng phổ biến: