Hiện tượng lũ lụt, khô hạn, vấn đề điều khiển hệ thống thoát lũ và cung cấp nước, vấn đề chất lượng nước và môi trường là các vấn đề có ý nghĩa quan trọng trong thuỷ văn học hiện đại
Trang 1Chương 4
KHÁI NIỆM CƠ BẢN VỀ LÝ THUYẾT XÁC SUẤT THỐNG KÊ
Hiện tượng thuỷ văn có tính ngẫu nhiên nên việc tính toán các giá trị của đại lượng thuỷ văn được sử dụng lý thuyết xác suất thống kê
4.1 Hiện tượng và biến cố
4.1.1 Hiện tượng tất nhiên
Là những hiện tượng mà trong một điều kiện nhất định sự phát sinh và diễn biến của chúng tuân theo một quy luật nhất định, khi nó thay đổi từ trạng thái này sang trạng thái khác ta biết được qua trình và tính chất của chúng
VD: trong điều kiện áp suất bình thường nước sôi ở nhiệt độ 1000C; nước đóng băng ở nhiệt độ 00C
4.1.2 Hiện tượng ngẫu nhiên
Là hiện tượng mà trong điều kiện nhất định có thể xảy ra hoặc chưa chắc đã xảy ra Qui luật diễn biến của hiện tượng ngẫu nhiên không thể biết trước VD: Khi tung một đồng tiền cân đối và đồng chất có thể xuất hiện mặt sấp, mặt ngửa điều này không thể biết trước được
MN trên sông hàng năm ta không thể biết được bằng bao nhiêu?
4.1.3 Tính chất của hiện tượng ngẫu nhiên
Tính chất quan trọng của hiện tượng ngẫu nhiên là Tính chất đám đông Nếu quan
sát hiện tượng ngẫu nhiên một số ít lần thì thấy chúng không tuân theo một quy luật nào
cả, nhưng nếu quan sát rất nhiều lần có thể thấy khá rõ nét tính quy luật và ổn định của hiện tượng ấy
VD:
+ Gieo một đồng xu cân đối và đồng chất, khi số lần gieo n→∞ thì số lần xuất hiện mặt Sấp ≈ Ngửa
+ Lũ sông Hồng tuy xảy ra bất thường nhưng thường vào tháng 7, tháng 8
4.1.4 Biến cố
Do tính chất đám đông của hiện tượng ngẫu nhiên, muốn nghiên cứu quy luật của hiện tượng ngẫu nhiên nào đó cần phải lặp lại rất nhiều lần 1 thực nghiệm Để phân biệt các hiện tượng xảy ra một cách tự nhiên không phụ thuộc vào điều kiện của các thực nghiệm, gọi các hiện tượng có thể xảy ra trong khi tiến hành thực nghiệm là các biến cố Tập hợp các biến cố gọi là không gian biến cố
VD: + Quan sát sự biến đổi MN trên sông → MN là một biến cố
+ Quan sát V dòng chảy trên sông → V là một biến cố
4.1.5 Các loại biến cố
Có thể phân loại thành các dạng biến cố cơ bản như sau:
-Biến cố chắc chắn: là biến cố nhất định sẽ xảy ra trong mỗi lần thực nghiệm
4-1
Trang 2VD: biến cố “thu được số điểm từ 1 đến 6” mỗi khi tung xúc xắc
-Biến cố không: là biến cố nhất định không thể xảy ra trong mọi điều kiện thực nghiệm, ký hiệu Ф
VD: biến cố “thu được số điểm là 7” khi tung xúc xắc
-Biến cố tích: nếu biến cố C xảy ra khi biến cố A và B đồng thời xảy ra thì C được gọi là tích của 2 biến cố A và B
C = A.B
VD: biến cố A - “tung xúc xắc thu được số điểm chẵn”
biến cố B - “tung xúc xắc thu được số điểm < 3”
biến cố C - “tung xúc xắc thu được số điểm bằng 2” là tích của A và B
-Biến cố xung khắc: nếu A và B không thể cùng đồng thời xảy ra trong 1 lần thực nghiệm thì A và B là 2 biến cố xung khắc
A.B = Ф
-Biến cố tổng: biến cố C xuất hiện khi chỉ cần 1 trong 2 biến cố A, B xuất hiện thì C
là tổng của A và B
4.2 Xác suất và tần suất
4.2.1 Định nghĩa xác suất theo lối đồng khả năng
Nếu biến cố A có thể phân chia thành m biến cố trong nhóm đầy đủ n biến cố A1,
…, An có đồng khả năng xuất hiện thì xác suất xuất hiện biến cố A là:
% 100 n
m
pA =
Cũng có thể định nghĩa: Xác suất xuất hiện biến cố A nào đó là tỷ số giữa số biến
cố thuận lợi với tổng số biến cố có thể có
Trong đó:
m- số biến cố thuận lợi;
n - số biến cố có thể có
VD1: + Khi gieo một đồng tiền cân đối và đồng chất Khả năng xuất hiện mặt sấp ≈ mặt ngửa Vậy số đó khả năng ấy (xác suất) =1/2
VD2: + Gieo một con xúc xắc đồng chất cân đối Khả năng xuất hiện các mặt (xác suất) = 1/6
4.2.2 Định nghĩa xác xuất theo quan điểm thực nghiệm
Trong tự nhiên, các biến cố của nhiều đại lượng ngẫu nhiên không mang tính chất đồng khả năng vì các điều kiện thí nghiệm không thể đồng đều VD: Như sự hình thành mực nước lưu lượng tại trạm thuỷ văn ở các thời điểm khác nhau hoàn toàn không đồng nhất Vì vậy nguời ta tiến hành nhiều phép thử thí nghiệm (TN) để xác định khả năng xuất hiện của các biến cố VD: Kết quả các thí nghiệm tung đồng tiền
Người làm thí
nghiệm
Số lần gieo Số lần xuất hiện
mặt sấp (m)
Tần suất xuất hiện mặt sấp (m/n)
4-2
Trang 3Pearson 12000 6019 0,5016
Qua TN ta nhận thấy tỷ số giữa số lần xuất hiện 1 biến cố A nào đấy - ký hiệu m (ví
dụ biến cố xuất hiện mặt sấp) và tổng số lần thực nghiệm -ký hiệu n- dao động quanh 1 trị số cố định (VD: Trên trị số 1/2 ) Tỷ số
n
m gọi là tần suất xuất hiện biến cố A
Còn trị số cố định mà tần suất giao động quanh nó chính xác xuất → Định nghĩa xác suất theo quan điểm thực nghiệm là:
Xác suất xuất hiện của biến cố A là tần suất xuất hiện của biến cố đó khi số lần thực nghiệm tăng lên vô hạn
% 100 n
m lim
p(A) n ⎟
⎠
⎞
⎜
⎝
⎛
= →∞ Trong thực tế xác suất thường tính theo tỷ số %
+ Khi m = n → p(A) = 1 (hay 100%) lúc này ta có 1 biến cố chắc chắn
+ Khi m = 0 → p(A) = 0, tức là ta có 1 biến cố không, tức biến cố không thể xảy ra trong mỗi lần thực nghiệm
0 ≤ p(A) ≤1 vì 0 ≤ m ≤ n
4.3 Phân bố xác xuất của biến ngẫu nhiên
4.3.1 Biến số ngẫu nhiên
Trong phép thử ngẫu nhiên, kết quả của nó nhận những giá trị khác nhau mà ta không biết trước được Giả sử các trị số đó là X1, X2, Xn Qua nhiều lần thực nghiệm ta
có thể tìm được xác suất tương ứng của chúng là P(X1) , P(X2), P(Xn) Quan hệ giữa X1 và
P(X1) là quan hệ hàm số và X được gọi là biến số ngẫu nhiên
4.3.1.1 Biến số ngẫu nhiên liên tục
Nếu trong khoảng [X1,X2] nào đó, biến ngẫu nhiên có thể lấy giá trị tuỳ ý thì X được gọi là biến ngẫu nhiên liên tục
VD: Lưu lượng lớn nhất từ một trạm thuỷ văn sẽ nhận được giá trị bất kỳ từ [Qmax1;
Qmax2]
Nói chung giá trị của các đại lượng thuỷ văn khí tượng đều là dạng biến ngẫu nhiên liên tục
4.3.1.2 Biến số ngẫu nhiên gián đoạn
Nếu trong khoảng [X1,X2], biến ngẫu nhiên chỉ có thể lấy 1 số trị số rời rạc nhất định thì X được gọi là biến ngẫu nhiên không liên tục (gián đoạn hoặc rời rạc)
VD: Gieo con xúc xắc, số điểm thu được là một biến số ngẫu nhiên gián đoạn, vì chỉ có thể nhận các giá trị nguyên từ 1 đến 6
4.3.1.3 Hàm phân bố xác suất
Mỗi giá trị có thể của biến số ngẫu nhiên Xi ứng với một biến cố Các biến cố này
sẽ xuất hiện với các xác suất khác nhau Mối quan hệ giữa biến cố và xác suất xuất hiện tương ứng là quan hệ hàm số, hàm số đó được gọi là hàm phân bố xác suất của biến ngẫu 4-3
Trang 4nhiờn Do tập hợp tất cả cỏc giỏ trị cú thể cú của biến ngẫu nhiờn lập thành dóy đầy đủ cỏc biến cố nờn ΣP(Xi) = 1
4.3.2 Hàm tớch phõn phõn bố xỏc suất
Trong cỏc phộp thử ngẫu nhiờn, cỏc biến cố xảy ra mang cỏc giỏ trị ngẫu nhiờn là
X1, X2, Xi, Xn tương ứng cú xỏc suất P(X1) , P(X2), P(Xi) P(Xn)
Luật phõn bố xỏc suất biểu thị dưới bảng:
Bảng trờn biểu thị quan hệ rời rạc, từng đụi một giữa trị số ngẫu nhiờn và xỏc suất tương ứng của nú là khụng hợp lý vỡ trong khoảng [X1,X2] cú thể lấy được vụ số trị số X khỏc nhau trong khoảng biến thiờn đú
Để khắc phục điều này, trong lý thuyết xỏc suất núi chung và trong tớnh toỏn thuỷ văn núi riờng, người ta nghiờn cứu xỏc suất của cỏc giỏ trị biến ngẫu nhiờn lớn hơn hay nhỏ hơn một giỏ trị cho trước nào đú tức là:
P(X ≥ Xi) hoặc P(X ≤ Xi)
(Trong thuỷ văn người ta dựng loại P(X ≤ Xi) do tớnh chất của hiện tượng thuỷ văn
là khi xuất hiện giỏ trị lớn thỡ đó trải qua giỏ trị nhỏ hơn rồi)
Ta nhận thấy giỏ trị xỏc suất để cho X nằm trong khoảng [Xi, Xmax] với Xmax là cận trờn của biến ngẫu nhiờn liờn tục cần nghiờn cứu, chớnh là tổng xỏc suất xuất hiện của từng giỏ trị X trong khoảng [Xi, Xmax], vỡ vậy xỏc suất ở đõy mang tớnh chất lũy tớch (cộng dồn) Hàm số biểu thị quan hệ giữa xỏc suất luỹ tớch này và biến số ngẫu nhiờn nằm trong khoảng [Xi, Xmax] gọi là hàm tớch phõn phõn bố xỏc suất và được ký hiệu:
F(Xi) = P(X≥Xi)
Đường biễu diễn hàm số F(Xi) là 1 đường cong trơn, trong lý thuyết xỏc suất gọi là đường tần suất luỹ tớch Đơn giản cũn gọi là đường tần suất
Đường tần suất luỹ tích
y = F(Xi)
50% 100%
Xi
X
%
X
% Xi
Đường phân bố mật độ tần suất
y = f(Xi)
f(x)
Do giỏ trị của đại lượng thuỷ văn là biến ngẫu nhiờn liờn tục, nờn tần suất xuất hiện chớnh xỏc 1 giỏ trị nào đú là xấp xỉ bằng 0, do đú trong thuỷ văn thường dựng khỏi niệm tần suất lũy tớch Khi núi tần suất, trong thuỷ văn hiểu là tần suất luỹ tớch
4.3.3 Hàm mật độ xỏc suất
Hàm mật độ xỏc suất ký hiệu f(Xi) là đạo hàm bậc nhất của hàm tớch phõn phõn bố xỏc suất F(Xi), ta cú:
4-4
Trang 5) X ( F ) x X ( F lim ) X ( ' F )
X
0 x i i
∆
−
∆ +
=
=
→
∆
Đồ thị biễu diễn hàm mật độ xác suất f(Xi) là đường cong trơn hình quả chuông và
được gọi là đường mật độ xác suất
Trong thực tế, khi tính toán các đại lượng ngẫu nhiên theo quan điểm thực nghiệm
thì xác suất được định nghĩa theo tần suất, khi đó ta có đường tích phân phân phối xác
suất được gọi là đường tần suất lũy tích và đường mật độ xác suất sẽ là đường mật độ tần
suất
VD: Tài liệu về lưu lượng Qmax (m3/s) tại 1 trạm thuỷ văn trong 25 năm, viết theo
thứ tự hàng năm đo đạc ta có:
25; 35; 20; 40; 35; 55; 30; 15; 40; 45; 20; 25; 30; 25; 50; 35; 45; 30; 60; 35; 40; 50;
35; 30; 35
Hãy vẽ đường tần suất luỹ tích và đường mật độ tần suất
Trình tự tính toán như sau:
1/ Phân cấp tài liệu (ở đay độ lớn của 1 cấp đã cho là ∆Q = 5 đơn vị)
2/ Sắp xếp các số hạng từ lớn đến bé và thống kê số lần xuất hiện các trị số rơi vào
cấp tương ứng (mi =?)
3/ Tính tần suất P =
n
m i
100%
4/ Tìm mặt độ tần suất là tìm tỷ số giữa tần suất và độ lớn của 1 cấp: ( )
Q
P x
5/ Tính tần suất tích luỹ tức là cộng dồn các kết quả tính tần suất Pi
Bảng kết quả tính Qmax như sau
∆Q = 5 m3/s; n = 25
Cấp lưu lượng
Qmax (m3/s) Tần số m P% = (mi/n) 100 Tần suất (%) Mật độ tần suất Pi/∆Q (%) Tần suất tính luỹ ΣP(x ≥ xi) %
15 1 4
Tính P(x1) = P (x1=60) = (1/25) 100 = 4%
Tính f(x1=60) = P(xi) / ∆Q = 4/5 = 0,8%
4-5
Trang 6Dựa vào bảng trờn ta vẽ được đường tần suất và đường mật độ tần suất
Nhận xột:
Kinh nghiệm cho thấy, đường phõn bố mật độ tần suất MN, Q đều cú dạng ở giữa cao hai bờn thấp dần hay núi một cỏch khỏc đa số cỏc trị số đều dao động quanh trị
số TB của liệt số cũn cỏc trị số đặc biệt lớn hoặc nhỏ xuất hiện ớt
Như trờn đó biết, liệt tài liệu trờn là ngẫu nhiờn liờn tục trong khoảng từ Qmax =
60 m3/s đến Qmin = 15 m3/s trong 25 năm Nếu ta thu thập được rất nhiều số hạng (n→∞) thỡ ta sẽ chuyển đường cú dạng hỡnh thang thành đường cong trơn liờn tục (∆x→0)
0 15
20
25
30
35
40
45
50
55
60
y = f (xi) Qmax (m3/s)
Đường mật độ tần suất
35
15 20 25 30
50 40 45 55 60
0
Đường tần suất luỹ tích
P%
Qmax (m3/s)
y = F (xi)
Chương 4 1
4.1 Hiện tượng và biến cố 1
4.2 Xỏc suất và tần suất 2
4.3 Phõn bố xỏc xuất của biến ngẫu nhiờn 3
4-6