Bản chất của hiện tượng thủy văn rất phức tạp nó chịu ảnh hưởng nhiều tác động qua lại do đó nó mang tính ngẫu nhiên rõ rệt.Vì vậy, trong tính toán các đặc trưng thủy văn thiết kế người
Trang 1CHƯƠNG III
ỨNG DỤNG LÝ THUYẾT THỐNG KÊ XÁC SUẤT
THƯỜNG DÙNG TRONG TÍNH TOÁN THỦY VĂN
3.1- KHÁI NIỆM CHUNG
3.1.1 Bản chất của các hiện tượng tự nhiên
1. Các hiện tượng mang tính tất nhiên (tất định)
Là những hiện tượng mà trong những điều kiện nhất định nó phát sinh và diễn biến theo những qui luật nhất định, khi thay đổi từ trạng thái này sang trạng thái khác ta có thể biết trước quá trình và tính chất của chúng
Ví dụ: Sự xảy ra của các phản ứng hóa học, trong điều kiện bình thường nước đun
1000C là sôi.v.v
2. Các hiện tượng mang tính ngẫu nhiên
Là những hiện tượng người ta không thể khẳng định trước được sự xuất hiện cũng như quá trình diễn biến, trong một điều kiện nhất định nó có thể xảy ra thế này, thế khác và thậm chí không xảy ra Khi quan sát một vài lần thì hình như không thấy chúng tuân theo một qui luật nào cả, nhưng nếu quan sát rất nhiều lần ta có thể phát hiện thấy tính qui luật rõ rệt và ổn định (người ta gọi đó là đám đông của hiện tượng ngẫu nhiên)
Ví dụ: Khi gieo một đồng tiền thì mặt sấp hay mặt ngửa xuất hiện chúng ta không thể biết được, nhưng gieo rất nhiều lần ta thấy sự xuất hiện mặt sấp và mặt ngửa gần bằng nhau
3.1.2 Bản chất của hiện tượng thủy văn
Bản chất của hiện tượng thủy văn rất phức tạp nó chịu ảnh hưởng nhiều tác động qua lại do đó nó mang tính ngẫu nhiên rõ rệt.Vì vậy, trong tính toán các đặc trưng thủy văn thiết kế người ta thường dùng lý thuyết thống kê xác suất
3.2 XÁC SUẤT VÀ TẦN SUẤT
1 Khái niệm các biến cố
Để phân biệt các hiện tượng xảy ra một cách tự nhiên không lệ thuộc vào điều kiện thực nghiệm, ta gọi các hiện tượng có thể xảy ra là biến cố
Trong thực tế ta thường gặp không gian các biến cố sơ cấp (gọi là biến cố cơ bản) Biến cố sơ cấp là biến cố không thể phân chia nhỏ hơn Không gian biến cố sơ cấp được ký hiệu bằng chữ E
Ví dụ : Khi tung đồng tiền thì không gian biến cố sơ cấp là E={es , en}.Sự kết hợp giữa các biến cố sơ cấp (cơ bản) theo một tổ hợp nào đó sẽ tạo thành một biến cố phức hợp
2 Phân loại các biến cố
a) Biến cố chắc chắn (E) là biến cố nhất định sẽ xảy ra trong một phép thử (thực nghiệm).Ví dụ: khi tung một con xúc xắc thì biến cố chắïc chắn là E={e1,e2,e3,e4,e5,e6}
Trang 2Hình 3-1 Minh họa các biến cố.
b) Biến cố không: là biến cố không xảy ra trong một phép thử (thực nghiệm )
Ví dụ: Khi tung một con xúc sắc xuất hiện mặt lớn hơn 6 là biến cố không, vì con xúc sắc không có mặt {7 }
Kí hiệu :C = A ∪ hoặc C = A+ B (3-1) B
Ví dụ : Tung một con xúc sắc A = {e1,e2,e3}; B = {e3,e4,e5}thì C={e1,e2,e3,e4,e5}
3.2.2 Xác suất và tính chất của xác suất
Trong số học để biểu thị cụ thể số đo khả năng xuất hiện của biến cố nào đó người ta gọi là xác suất xuất hiện của biến cố đó
1. Tính xác suất trực tiếp
Trong nhiều trường hợp, điều kiện của phép thử ( thực nghiệm) có tính chất đối xứng
ta có thể đi tới kết luận: Các biến cố sơ cấp có số đo khả năng xuất hiện như nhau ( đồng khả năng) rồi từ đó suy ra tính xác suất của các biến cố phức tạp một cách dễ dàng
Ví du:û Khi gieo một đồng tiền cân đối thì xác suất xuất hiện mặt sấp và ngữa là như nhau và bằng 1/2
Định nghĩa 1: Giả sử trong mộüt phép thử (thực nghiệm) có n biến cố sơ cấp, trong đó
có m biến cố sơ cấp thuận lợi cho biến cố A xuất hiện, xác suất xuất hiện biến cố A là :
p (A) =
n
m
(3-3)
Khi m = n thì p (A) = 1 ⇒ A là một biến cố chắc chắn,
m = 0 thì p (A) = 0 ⇒ A là một biến cố không
Từ đó rút ra tính chất của xác suất như sau:
Trang 3- 0 ≤ p (A) ≤ 1 vì 0 ≤ m ≤ n (3-4)
- Nếu A & B là hai biến cố xung khắc và C là biến cố tổng của chúng ta có:
p (C) = p (A) + p (B) (3-5)
2 Tính xác suất theo tần suất
Trong thực tế ta thường gặp các biến cố sơ cấp trong một phép thử (thực nghiệm) khả năng xuất hiện các biến cố sơ cấp không giống nhau thì dùng định nghĩa 1 để tính xác suất không đúng nữa Do vậy ta phải thực hiện phép thử ( thực nghiệm) nhiều lần để xác định Sự xuất hiện của biến cố A ( Còn gọi là tần suất xuất hiện của biến cố A), thường chúng giao động xung quanh một hằng số cố định
Định nghĩa 2 : Xác suất xuất hiện biến cố A trong một phép thử ( thực nghiệm) là
tần suất xuất hiện của biến cố đó khi số lần thực nghiệm tăng lên vô hạn
Kí hiệu: p (A) =
n
m
( 3-6)
Ở đây: n tổng số phép thử (thực nghiệm) ,
m là số lần phép thử xuất hiện biến cố A
Trong thực tế người ta thường tính tần suất theo tỉ số phần trăm:
p (A)=
n
m
100% (3-7) Từ công thức (3-5) có dạng giống hoàn toàn công thức (3-6) do vậy tần suất có tính chất giống xác suất
Cách tính xác suất theo tần suất có ưu điểm lớn ở chổ nó thích nghi được với cả các điều kiện không cân đối của thực nghiệm, do đó được ứng dụng rộng rãi trong nhiều ngành thống kê
Trong tính toán thủy văn hiện nay chưa có cách nào để xác định được các biến cố sơ cấp của các đặc trưng thủy văn nên không thể tính xác suất trực tiếp mà dùng số liệu thu thập được trong nhiều năm để tính tần suất thiết kế xem đó giá trị gần đúng với xác suất
Ví dụ: Dựa vào số liệu thu thập được tại một trạm thủy văn trong 10 năm (đặc trưng mực nước) Hãy tính tần suất xuất hiện số năm có H ≥15 m?
Theo tài liệu thu thập được trong 10 năm ở bảng (3-1) ta thấy có 3 năm 92, 94, 96 có giá trị H ≥15m Vậy theo công thức (3-6) và (3-7) ta có: p (H ≥15 m) =
3.2.2 Xác suất có điều kiện và tính chất của nó
Khái niệm xác suất nêu ở phần trên chỉ liên quan đến điều kiện phép thử ngoài ra không phụ thuộc một yếu tố nào khác gọi là xác suất vô điều kiện
Trang 4Trong thực tế nhiều khi cần tính xác suất của biến cố A khi biết chắc chắn một biến cố B đã xảy ra làm ảnh hưởng đến xác suất của biến cố A.Ta gọi đó là xác suất có điều kiện của biến cố A khi biến cố B đã xảy ra và kí hiệu p (A/B)
Ví dụ: Lấy hai kiện hàng để kiểm tra mỗi kiện hàng có 10 sản phẩm, kiện hàng thứ nhất có 2 sản phẩm xấu và 8 sản phẩm tốt, kiện hàng thứ hai có 3 sản phẩm xấu và 7 sản phẩm tốt Khi kiểm tra lấy một sản phẩm tùy ý Hỏi xác suất lấy đúng sản phẩm xấu đựng trong kiện hàng thứ nhất là bao nhiêu?
Rỏ ràng ở đây có 20 sản phẩm đựng trong 2 kiện hàng có khả năng lấy như nhau, nên số biến cố sơ cấp là 20
Biến cố có điều kiện cho trước là B lấy đúng 1 sản phẩm xấu trong 2 lô hàng là:
)(
B p
B A
( 3-8) Định nghĩa 3: Xác suất có điều kiện của biến cố A khi biến cố B đã xẫy ra bằng tỉ số
của xác suất p (A ∩ B) và p (B) Kí hiệu: p (A/B) =
)(
)(
B p
B A
(3-8’) Từ (3-8) ⇒ p (A ∩ B) = p (A/B).p (B) (3-9) Nếu biến cố A & B độc lập tức là sự xuất hiện của biến này không ảnh hưởng sự xuất hiện của biến cố kia thì p (A/B) = p (A) và p (B/A) = p (B)
Từ (3-9) viết lại: p (A ∩ B) = p (A).p(B) (3-10)
Ví dụ: Ta gieo đồng thời 2 con xúc sắc.Tính xác suất để mặt số1 cùng xuất hiện là bao nhiêu ?
Vì 2 con xúc sắc xuất hiện hoàn toàn độc lập với nhau nên p (A) = 1/6 , p (B) = 1/6 Vậy: p (A ∩ B) = p (A).p (B) = 1/6.1/6 =1/36
3.3 PHÂN BỐ XÁC SUẤT CỦA BIẾN NGẪU NHIÊN
3.3.1 Biến số ngẫu nhiên
Một biến cố ngẫu nhiên có thể nhận nhiều trị số khác nhau x1, x2, xn trong một phép thử (thực nghiệm) Sự xuất hiện trị số nào đó hoàn toàn ngẫu nhiên, nhưng qua rất nhiều phép thử (thực nghiệm ) ta có thể tìm được xác suất (tần suất) tương ứng với mọi trị số: p (x1), p(x2), ,p(xn), thì x được gọi là một biến số ngẫu nhiên
Trong thực tế ta thường gặp các biến cố ngẫu nhiên:
- Biênú ngẫu nhiên rời rạc như: tung đồng tiền, xổ số v.v
- Biến ngẫu nhiên liên tục như: các đặc trưng thủy văn vì trong khoảng [ x1 xn] ta có thể lấy bất kỳ một giá trị nào đó
Khi xây dựng các công trình thủy lợi, giao thông, Xét các trường hợp xảy ra để có biện pháp công trình thỏa đáng, cho nên khi tính toán thủy văn thường tính xác suất của
x rơi vào khoảng [x1 xmax], nhưng vì hiện tượng vẫn đang còn tiếp diễn, trị số max là
Trang 5bao nhiêu hiện nay chưa xác định được do đó thường tính xác suất để cho x ≥ xi nào
đó và kí hiệu: p (x ≥ xi) Với hàm ý là xác suất hay tần suất để cho x nằm trong khoảng
[xi xmax]
3.3.2 Mẫu và tổng thể
Trong thống kê số học ta gọi n trị số riêng biệt x1,x2 xn quan trắc được của một biến
cố ngẫu nhiên nào đó là mẫu, số trị số của mẫu gọi là dung lượng của mẫu và gọi toàn
thể các trị số của biến số ngẫu nhiên x là tổng thể Trong thực tế các đặc trưng thủy văn
vẫn đang còn tiếp diễn do đó không thể xác định được tổng thể
Ứng dụng lí thuyết TKXS vào trong tính toán thủy văn thực chất là lợi dụng tài liệu
thu thập được của một đặc trưng thủy văn nào đó làm mẫu, phân tích qui luật của mẫu,
xét đến sai số lấy mẫu, nếu sai số nằm trong phạm vi cho phép thì có thể lấy qui luật của
mẫu thay cho qui luật của tổng thể để xác định các đặc trưng thủy văn trong tính toán
thiết kế
3.3.3 Khái niệm về phân bố xác suất của biến ngẫu nhiên
Để hiểu về phân bố xác suất của biến ngẫu nhiên theo qui luật nào Hãy xét một ví
dụ cụ thể về một đặc trưng thủy văn như sau:
Ví dụ: Xét sự phân bố tần suất về lưu lượng lớn nhất (Qmax) trong năm tại một trạm
thủy văn với mẫu tài liệu đo đạc được như sau ( số liệu đo đạc từ 1951- 2000) trong đó:
- Độ dài của mẫu (1951÷2000) là: 50 năm
- Trị số lớn nhất của mẫu là: 2950(m3/s)
- Trị số nhỏ nhất của mẫu là: 1160(m3/s)
- Trị số bình quân của mẫu là: 1750(m3/s)
Đây là biến ngẫu nhiên liên tục, để đơn giản trong tính toán thủy văn ta phân cấp độ
lớn mỗi cấp ∆Q = 300 (m3/s) và sắp xếp mẫu số liệu thực đo từ lớn đến nhỏ ( xem bảng
0,06 0,12 0,20 0,75 1,20 0,80 o,20
2,0 6,0 12,0 34,0 70,0 94,0 100,0
Σ 50 100 (%)
+ Lấy cột (4) tung độ và cột (1) hoành độ ta vẽ được đồ thị gọi là đường phân bố
mật độ tần suất (xem hình 3-2)
+ Lấy cột (1) tung độ và cột (5) hoành đô üta vẽ được đồ thị gọi là đường phân bố
tần suất lũy tích trong thủy văn gọi tắt là đường tần suất ( xem hình 3-3)
Trang 6Đối các biến ngẫu nhiên liên tục khi ta chia cấp ∆Q càng nhỏ ( ∆Q→0) thì trên hình vẽ quan hệ (3-2) và (3-3) trở thành đường cong liền nét biểu hiện đúng qui luật phân bố của bản chất hiện tượng
Đối dạng đường tần suất lũy tích lưu lượng cho ta biết được quan hệ giữa biến ngẫu nhiên và tần suất xuất hiện lại (x ∼ p) có nghĩa nếu ta biết trước một đại lượng này thì chúng ta xác định được đại lượng kia và ngược lại Trong tính toán thủy văn người ta gọi
tắt là đường tần suất
3.4 ĐƯỜNG TẦN SUẤT KINH NGHIỆM
3.4.1 Phương pháp vẽ đường tần suất kinh nghiệm
1 Chọn mẫu số liệu thống kê (theo yêu cầu tính toán)
2 Sắp xếp mẫu số liệu từ giá trị max đến min
3 Tính tần suất theo công thức kinh nghiệm
3,0+
n
m
100% (3-12) Trong đó: m là số thứ tự từ 1÷n, n là độ lớn của mẫu ( hay gọi là dung lượng mẫu)
4 Chấm các điểm quan hệ x i và p i vẽ đường tần suất kinh nghiệm.
Do mẫu số liệu thực đo có hạn do vậy giá trị tần suất cần tìm nằm ngoài phạm vi các điểm đo của đường tần suất kinh nghiệm, ví dụ: xác định giá trị ứng với tần suất p = 0,5% , p = 1% hoặc p = 95% v.v Do vậy đường tần suất kinh nghiệm cần phải kéo dài theo xu thế để nội suy số liệu
1 Phương pháp đồ giải: Vẽ đường tần suất kinh nghiệm lên giấy tần suất để kéo dài
nội suy các giá trị cần xác định
2 Phương pháp giải tích: Đi tìm phương trình toán học biễu diễn phù hợp dạng
đường tần suất kinh nghiệm làm tiêu chuẩn tính toán thiết kế người ta gọi đó là đường tần suất lý luận
Q(m 3 /s )
Trang 73.5 CÁC TRỊ SỐ ĐẶC TRƯNG THỐNG KÊ CỦA MẪU
3.5.1 Các trị số biểu thị xu thế tập trung
1 Trị số bình quân của mẫu: Xbq =
2 Trị số đông ( X đ ): Ứng với mật độ tần suất lớn nhất xác định Xđ
Chú ý: Trong trường hợp phân bố chuẩn (Cs = 0) thì trị số đông của đường phân bố mật
độ tần suất trùng với giá trị bình quân của mẫu
3.5.2 Các trị số đặc trưng biểu thị xu thế phân tán
1 Khoảng lệch lớn nhất của mẫu ( ∆X max )
∆Xmax = Xmax(mẫu) - Xmim (mẫu) (3-14)
2 Khoảng lệch quân phương: kí hiệu σ, tính theo công thức:
=
n
x
x i bq n
σ và:
1
)1
1
−
−Σ
)3(
)1(
V i n
S
C n
k C
−
−Σ
= (3-17)
3.5.2 Sai số lấy mẫu
Khi lấy mẫu tính toán sai số gặp phải xảy ra 1 trong 3 trường hợp sau:
1 Giá trị Max ( mẫu) < Max (tổng thể)
Giá trị Min ( mẫu) > Min (tổng thể)
2 Sai số ngẫu nhiên khi đo đạc thu thập số liệu thủy văn
3 Biến ngẫu nhiên thủy văn là liên tục nhưng mẫu số liệu thu thập được của các đặc
trưng thủy văn là rời rạc
Sai số chọn mẫu tính toán nó được thể hiện qua 3 đặc trưng thống kê Xbq, Cv, Cs.
Trong lí thuyết thống kê người ta đã tính được các sai aố tiêu chuẩn như sau:
- Sai số tiêu chuẩn của Xbq: εxbq =
n
σ (sai số tuyệt đối) (3-18)
Trang 8ε’xbq = 100 100 %
n
Cv n
100
V C
n + % (Sai số tương đối) (3-21)
- Sai số tiêu chuẩn của CS: εcs = ( 2 4)
561
V V S
C C n
Từ công thức (3-18) đến (3-23) ta thấy sai số chọn mẫu tính toán tỉ lệ nghịch với căn bậc hai của n (độ dài của mẫu), như vậy n càng nhỏ thì sai số càng lớn và ngược lại Do vậy khi tính toán thiết kế các công trình phải dựa vào sai số cho phép theo qui phạm để chọn độ dài của mẫu thỏa đáng
Chú ý: Công thức (3-22) và (3-23) được tính khi độ dài mẫu tài liệu thu thập n ≥ 100
thì sai số mới nằm trong phạm vi cho phép
3.6 ĐƯỜNG TẦN SUẤT LÝ LUẬN
Do số liệu thủy văn có hạn, đường tần suất kinh nghiệm không đáp ứng được yêu cầu tính toán các đặc trưng thiết kế đối với các tần suất nhỏ và lớn Để đáp ứng yêu cầu đó người ta tập trung nghiên cứu đường phân bố mật độ xác suất của tổng thể, tức là tìm dạng công thức toán học của hàm y = f(x), tích phân đường cong này ta có đường tần suất tương ứng gọi là đường tần suất “lí luận” Ở đây hàm y = f(x) gọi là hàm mật độ tần suất Trong thủy văn thường dùng hai loại đường sau
3.6.1 Đường phân bố mật độ xác suất Pearson III (P 3 )
1 Nguồn gốc của đường P 3
Năm 1795 Pearson là nhà thống kê sinh vật học người Anh, dựa vào kết quả thống
kê rất nhiều tài liệu, phát hiện thấy đường phân bố mật độ xác suất thường là hình quả chuông, chỉ có một trị số đôìng, còn hai đầu giảm dần tiến đến tiệm cận với trục hoành Ông đưa ra hai điềìu kiện để thành lập họ đường cong như sau:
- Tại vị trí Xđ hệ số góc tiếp tuyến = 0 Nếu gốc tọa độ đặt tại vị trí Xbq thì khi x = -d đạo hàm
dx
dy
= 0 Ở đây d là khoảng lệch giữa Xbq và Xđ (gọi là bán kính lệch)
- Hai đầu hoặc một đầu đường cong nhận trục hoành làm đường tiệm cận Nghĩa là khi y = 0 thì:
)(
x b x b b
y d x
+++
(3-24)
Trang 9Giải phương trình bậc hai: b1+ b1x + b2x = 0 được các nghiệm: thực, ảo, kép Pearson đưa ra13 họ đường cong khác nhau trong đó đường P3 có dạng b2= 0 Do đó:
x b b
y d x dx
dy
1 0
)(+
+
= (3-25)
Tích phân (3-25) ta có phương trình hàm phân bố mật độ xác suất P3là:
y = f(x) = y0(1 + x/a)- a/de-x/d (3-26) Trong đó: a là khoảng cách từ khởi điểm đến Xđ
y0 là xác suất hiện trị số đông
e là cơ số log tự nhiên
và 0 ≤ x ≤ ± ∞
2 Ứng dụng của đường P 3
Đường P3 hoàn toàn xác định khi chúng ta xác định được d , a , y0 như sau:
bq V
)1
4(2
2 4
4 2
2
2
S V
c
s s
C e C
C C
S C
- Khi CS < 0 vẫn dùng bảng trên nhưng lưu ý: ΦP(CS < 0) = - Φ100-P(CS >0) (3-33)
Ví dụ: Tra hàm Φ20( CS = -2) = - Φ(100 -20)(CS = 2)
Hình 3-4:Đường phân bố mật độ xác suất Pearson 3
x
y
y0
a
d
xd
xbq
Trang 103.6.2 Đường phân bố mật độ xác suất Kritxki-Menken (K-M)
1 Cơ sở xây dựng đường K-M
- Có thể dùng 3tham số: Xbq, CV, CS, để tính toán
- Đường phân bố mật độ xác suất chỉ có một trị số đông (Xđ)
- Biến ngẫu nhiên x nằm trong khoảng: ( 0≤ x ≤:∞)
2 Phương trình đường phân bố mật độ xác suất K-M
x x
b
b
b b
−
−
/ 1
1 / /
)(
α α α
α
αα
Ở đây: m = (1- 6) được chọn để đường TS lí luận phù hợp với đường TSKN
Để có cơ sở chọn được đường TS lí luận phù hợp với dường TSKN cần phải xét đến ảnh hướng của các tham số thống kê đối với đường tần suất như sau:
(1) Ảnh hưởng của Xbq (2) Ảnh hưởng của CV (3) Ảnh hướng của CS
3.7 PHƯƠNG PHÁP VẼ ĐƯỜNG TẦN SUẤT THƯỜNG DÙNG TRONG
TÍNH TOÁN THỦY VĂN
3.7.1 Phương pháp đường thích hợp
1 Chọn mẫu số liệu tính toán
2 Sắp xếp mẫu số liệu theo thứ tự từ giá trị Max ÷Min
3 Tính X bq , C V , và các sai số của nó
4 Tính tần suất p% theo công thức kinh nghiệm
5 Chấm các điểm quan hệ K p ~ p lên giấy tần suất
6 Chọn đường tần suất lý luận dựa trên cơ sở chọn: C S = mC V (m =1÷6) để đường
tần suất lý luận phù hợp với các điểm kinh nghiệm
Trang 11Ví dụ: xác định mực nước tính toán tại một trạm TV ứng với p =1%.Với mẫu số liệu
thu thập được như sau :
Bảng 3-3: Số liệu thu thập được của một trạm thủy văn
0,54 0,46 0,43 0,32 0,11 0,07
0,04 0,18 0,21 0,29 0,36 0,39 0,46
0,2916 0,2116 0,1849 0,1024 0,0121 0,0049 0,0016 0,0324 0,0441 0,0841 0,1296 0,1521 0,2116
7,14 14,29 21,43 28,57 35,71 42,86 50,00 57,14 64,29 71,43 78,57 85,71 92,86
1
−
−Σ
n
k i n
=
113
4630.1
2
2
+C v n
Cv
(3-39)