Một số khái niệm về kiểm dịnh giả thiết thống kê Như ở chương 1 đã trình bày, cơ sở để áp dụng các phương pháp thống kê là chuỗi phải đồng nhất và ngẫu nhiên.. Nói riêng đó là giả thiết
Trang 1Chương III Kiểm định các giả thiết thống kê
3.1.Khái niệm
3.1.1 Một số khái niệm về kiểm dịnh giả thiết thống kê
Như ở chương 1 đã trình bày, cơ sở để áp dụng các phương pháp thống kê là chuỗi phải đồng nhất và ngẫu nhiên Hơn nữa khi áp dụng các đường tần suất lý luận để mô tả phân bố của các đại lượng này phải đảm bảo sự phù hợp của giữa đường lý luận và
đường kinh nghiệm Chúng ta đã giả thiết rằng chuỗi quan trắc thoả mãn các tiêu chuẩn này để tiến hành các tính toán tiếp theo Đó chính là các giả thiết thống kê Tuy nhiên chuỗi quan trắc là một mẫu từ tổng thể, do tác động của nhiều nhân tố nên có thể chưa phản ảnh đúng bản chất của tổng thể Chính vì vậy cần tiến hành kiểm định các giả thiết trên
Vậy giả thiết thống kê là gì? Đó là giả thiết đưa ra để xem xét có công nhận hay không một kết luận về thống kê Nói riêng đó là giả thiết về tính đồng nhất, tính ngẫu nhiên và tính phù hợp với đường tần suất nào đó của chuỗi quan trắc thuỷ văn Kiểm
định giả thiết thống kê là thủ tục để đánh giá xem giả thiết đúng hay sai và để có thể chấp nhận hay bác bỏ giả thiết đó
Trong thủ tục kiểm định thống kê chúng ta cần biết một số khái niệm sau:
- Giả thiết không (Null Hypothesis-H0)
Giả thiết không là giả thiết ban đầu đưa ra để kiểm định Thường giả thiết thiên
về sự công nhận
- Giả thiết chệch (nghịch) (Anternative-Hypothesis)
Giả thiết chệch là giả thiết ngược lại với giả thiết không H0, giả thiết không công nhận
- Mức ý nghĩa (Level of significance)
Mức ý nghĩa là xác suất (khá nhỏ) khi loại bỏ không chính xác giả thiết H0, hay còn gọi là xác suất sai lầm loại 1
Ngược lại với mức ý nghĩa là mức tin cậy: = 1-
Giá trị càng nhỏ thì mức tin cậy càng lớn, giới hạn tin cậy càng mở rộng, càng ít phạm sai lầm loại 1, nhưng lại tăng sai lầm loại 2
- Miền tới hạn - Miền tin cậy: Mỗi chỉ tiêu xác định một tập hợp (miền) tới hạn
mà nếu giá trị lựa chọn rơi vào đó thì giả thiết H0 bị bác bỏ Phần bù của miền tới hạn gọi là miền tin cậy
Miền tới hạn được chọn sao cho xác suất rơi vào nó của chỉ tiêu xem xét là lớn nhất, khi đó giả thiết chệch đối lập với giả thiết H0 được chấp nhận
- Biên tới hạn - Biên tin cậy
Trang 2Biên tin cậy là giới hạn của miền tin cậy, là ranh giới giữa miền tới hạn và miền tin cậy Nó phụ thuộc dạng phân bố của chỉ tiêu và mức ý nghĩa
- Bậc tự do (Degree of Freedom): là số giá trị độc lập có thể xác định được, chính bằng dung lượng mẫu trừ đi số ràng buộc:
trong đó h là số thông số, n là dung lượng mẫu
- Các chỉ tiêu thống kê hay viết gọn là thống kê (Statistic) là chỉ tiêu để so sánh khi kiểm định
3.1.2.Các bước kiểm định giả thiết thống kê
Quá trình kiểm định bao gồm các bước sau:
1) Xác lập giả thiết không H0
2) Chọn mức ý nghĩa , thường chọn 1, 2, 5 và 10%
Khi kiểm định sẽ có 4 trường hợp xảy ra:
- Giả thiết là đúng và được chấp nhận
- Giả thiết đúng nhưng bị loại bỏ với mức , khi đó ta đã phạm sai lầm loại 1
- Giả thiết sai và bị loại bỏ
- Giả thiết sai nhưng được chấp nhận với mức , khi đó ta đã phạm sai lầm loại
2
3) Xác định miền tới hạn và biên tới hạn: Điều này phụ thuộc vào dạng phân bố của chỉ tiêu và mức ý nghĩa
4) Tính chỉ tiêu thống kê theo tài liệu quan trắc
5) So sánh chỉ tiêu với biên tới hạn và kết luận chấp nhận hay loại bỏ giả thiết
H0
3.2 Kiểm định các giả thiết thống kê
Có nhiều giả thiết thống kê cần kiểm định, nhưng trong thuỷ văn thường tiến hành kiểm định tính đồng nhất, tính ngẫu nhiên của chuỗi và tính phù hợp của đường
lí luận với đường kinh nghiệm Sau đây chúng ta sẽ tiến hành với từng giả thiết
3.2.1 Kiểm định tính đồng nhất của chuỗi
Chuỗi thuỷ văn đưa vào trong tính toán phải đảm bảo tính đồng nhất Có nhiều nguyên nhân, cả tự nhiên và nhân tạo, làm cho tính đồng nhất của chuỗi bị phá hoại Tuy nhiên phân tích bản chất vật lý của các đặc trưng thuỷ văn hoặc các nhân tố hình thành nó để chỉ ra sự đồng nhất là không đủ, vì chỉ mới là định tính Hợp lý hơn cần
sử dụng phương pháp thống kê, nó cho phép đánh giá tính đồng nhất của các chuỗi quan trắc trong dạng định lượng Hơn nữa cũng cần đánh giá tính đồng nhất của chuỗi khi không có thông tin về nguồn gốc gây ra sự không đồng nhất, khi đó phương pháp thống kê sẽ là duy nhất Mặt khác cũng có thể nguyên nhân vật lý đã biết nhưng không rõ ràng, và theo quan điểm thực tế có thể không tính đến, các phương pháp thống kê sẽ cho ta câu trả lời hợp lý nhất Phương pháp thống kê còn cho phép kiểm
định tính đồng nhất của các chuỗi theo không gian khi cần kết hợp chúng trong một khu vực địa vật lý đồng nhất
Trang 3Có nhiều chỉ tiêu thống kê được dùng để đánh giá tính đồng nhất của các thông số phân bố mẫu, nói riêng là giá trị trung bình và phương sai
a Đồng nhất về giá trị trung bình
Thường bắt đầu áp dụng cho trường hợp chuỗi có phân bố chuẩn
* Chỉ tiêu phân bố chuẩn z
Coi trị số trung bình có phân bố chuẩn Khi chuỗi gốc có phân bố chuẩn hay có dung lượng rất lớn Chúng ta thực hiện theo các bước kiểm định giả thiết thống kê
- Giả sử có 2 chuỗi x và y Xác lập giả thiết H0 :x y
- Giả sử 2 chuỗi x và y có dung lượng mẫu nx và ny, khi đó chỉ tiêu phân bố chuẩn
có dạng:
) (y x
x y z
x x
y
n n
2 2 ) (
- Xác định miền tới hạn Tra bảng phân bố chuẩn (phụ lục 2.7) với q=1/2 (vì phân
bố đối xứng) được giá trị zth Với = 0,05 ta có zth = 1,96
- Tính chỉ tiêu z từ tài liệu quan trắc theo công thức (3.1)
- So sánh: Nếu z z th thì ta chấp nhận giả thiết không H0, tức là có x y Khi
đó có thể đưa vào cùng một chuỗi để tính toán
Ngược lại, giả thiết H0 bị bác bỏ và ta tiếp nhận giả thiết chệch x y
Sau này với các chỉ tiêu kiểm định khác, không trình bày lại các bước kiểm định như trên mà chỉ đưa ra các chỉ tiêu cần tính và giá trị tới hạn để so sánh Tuy nhiên phải nhớ rằng các bước tiến hành kiểm định phải đầy đủ như đã nêu
* Chỉ tiêu Student
Khi chuỗi không dài thì chỉ tiêu phân bố chuẩn không dủ mạnh, cần phải áp dụng chỉ tiêu khác, trong đó có chỉ tiêu Student Chỉ tiêu này xuất phát từ phân bố Student hay phân bố t, do W.S.Gosset sử dụng lần đầu trong một bài toán thống kê (1908) (hình 3.1)
Hình 3.1: Phân bố Student
Trang 4Khi áp dụng chỉ tiêu này, phải thừa nhận phương sai là đồng nhất: x y
với là phương sai của tổng thể Tính đồng nhất của phương sai sẽ xem xét ở phần sau
Chỉ tiêu có dạng:
y x
y x y x y y x
n n n n n
n
x y t
y x
y x
y x c d
n n
n n S
y y x
x c
n n
n n
Các ký hiệu như đã nêu ở trên
Giá trị tới hạn t được tra theo bảng Student (phụ lục 3.1) ứng với số bậc tự do:
= nx + nY -2 và mức ý nghĩa Lưu ý rằng chỉ tiêu student đối xứng nên cần tra bảng phụ lục (3.1) với q= /2 Sau đây là một số giá trị t ứng với =:
(%) 5 1 0,1
t 1,96 2,58 3,29
Các bước kiểm định vẫn tiến hành như trên 2 chỉ tiêu phân bố chuẩn và Student
là những chỉ tiêu có tham số, áp dụng cho chuỗi quan trắc có phân bố chuẩn
* Chỉ tiêu cho nhiều chuỗi
Trong trường hợp kiểm định nhiều chuỗi đồng thời, dùng chỉ tiêu Student dưới dạng:
n m y t
1
, còn x m là
giá trị trung bình theo mẫu quan trắc thứ m, có độ lệch lớn nhất so với trung bình
chung; k là số mẫu quan trắc; là khoảng lệch chuẩn của chuỗi chung
Nếu t ứng với ym nằm trong miền tin cậy với mức ý nghĩa thì giá trị trung bình các mẫu xm là đồng nhất
Lưu ý rằng chúng ta cũng phải thừa nhận các khoảng lệch chuẩn (phương sai) của các mẫu m là đồng nhất
Trang 5Ví dụ 3.1: Cho số liệu Qnăm trạm Hoà Bình–sông Đà (bảng 1.7) từ 1956 đến
2002 Kiểm tra tính đồng nhất của chuỗi số liệu theo chỉ tiêu Student, biết rằng hồ chứa Hoà Bình bắt đầu hoạt động từ năm 1986
Ta chia chuỗi số liệu làm 2 phần, phần 1 từ 1956 đến 1985 gồm 30 số hạng, phần
2 gồm 17 số hạng còn lại
- Xác lập giả thiết H0: 2 chuỗi đồng nhất về giá trị trung bình: x y
- Giả thiết phương sai của 2 chuỗi là đồng nhất: x y
- Tính chỉ tiêu Student từ chuỗi quan trắc theo công thức (3.3) được: t=0,04
Chỉ tiêu khá nhạy đối với trung bình mẫu, nhưng không phản ứng với phương sai mẫu, nên thường dùng để đánh giá trung bình mẫu
Tiêu chuẩn này căn cứ trên việc thống kê số lượng nghịch thế xuất hiện do thuật toán sau:
1) Các giá trị quan trắc của 2 mẫu sắp xếp trong một chuỗi chung theo thứ tự (giảm dần hay tăng dần)
Ví dụ: y1 x1 x2 y2 y3 y4 x3 y5 y6 x4, (a)
hay: x1 x2 x3 y1 y2 x4 y3 y4 x5 y5, (b)
trong đó xi là các giá trị của chuỗi 1, còn yi là các giá trị của chuỗi 2
2) Nếu một giá trị x nào đó (hay y) xuất hiện sau giá trị y (hay x) thì cặp này hình thành một nghịch thế Như vậy trong dãy (a), x1 hình thành một nghịch thế (với y1) và
trong đó: m và n là số các số hạng của chuỗi x và y
4) Miền tới hạn được xác định trong phạm vi:
Trang 6u m n nm nm
U
12
12
)(
u q u t M u
t M u
)(
với u D u , (3.12)
tP là khoảng lệch chuẩn hoá ứng với mức ý nghĩa (q=1/2 vì khoảng tin cậy đối xứng) Ví dụ với = 0,1 có q=0,05 và thu dược tq = 2,58, còn với = 0,05 nhận được tq = 1,96
5) So sánh, nếu U tính được nằm trong miền tới hạn thì giả thiết không H0 bị bác
bỏ, chuỗi không đồng nhất
Còn ngược lại thì giả thiết không H0 được chấp nhận và chuỗi đồng nhất
Chỉ tiêu này chỉ thích hợp khi so sánh 2 mẫu hoặc từng cặp mẫu trong nhiều điểm
có cảnh quan đồng nhất Với số mẫu lớn hơn 2 thì rất phức tạp và kém hiệu quả
Chỉ tiêu Wilcoxon là chỉ tiêu không tham số có thể áp dụng cho chuỗi gốc có phân
bố bất kỳ
Ví dụ 3.2: Cũng với số liệu Qnăm trạm Hoà Bình–sông Đà (bảng 1.7) từ 1956 đến
2002 Kiểm tra tính đồng nhất của chuỗi số liệu theo chỉ tiêu Wilcoxon
Chúng ta cũng làm theo các bước như trên, nhưng không nhắc lại lần lượt các bước, mà chỉ tiến hành các bước chủ yếu:
- 2 chuỗi đã chia được gộp vào làm một và sắp xếp theo thứ tự giảm dần, đánh dấu phân biệt số hạng của chuỗi 1 và 2
Trang 7- Xác định miền tới hạn theo (3.11):
u m n nm nm
U
12
12
)(
121173017302
1730
,)(
hoặc theo (3.12): Hai giá trị tới hạn của U tính theo (3.12) là : U1=166 và U2=343
- So sánh với Ut tính được ta thấy nó thoả mãn điều kiện (3.11) hoặc (3.12), như vậy giả thiết H0 được chấp nhận và kết luận chuỗi Qnăm của trạm Hoà Bình-sông Đà
đồng nhất
* Chỉ tiêu theo dấu
Chỉ tiêu này cũng được áp dụng để kiểm định tính đồng nhất Trong trường hợp này chỉ xem xét dấu của sự chênh lệch giữa các số hạng của 2 chuỗi x và y:
xnếu)(dấumang
i i
So sánh: Nếu Kn(+) < m n,k thì chuỗi không đồng nhất;
Nếu Kn(+) > m ,k thì chuỗi đồng nhất
Chỉ tiêu theo dấu cũng là chỉ tiêu không tham số có thể áp dụng cho chuỗi gốc có phân bố bất kỳ Tuy nhiên chỉ tiêu này ít dùng
b Đồng nhất về phương sai
Khi kiểm định theo chỉ tiêu Student đã thừa nhận phương sai của các chuỗi là
đồng nhất và bằng phương sai tổng thể Tuy nhiên cũng cần đánh giá làm rõ điều này Việc kiểm định được tiến hành bằng các chỉ tiêu sau đây
* Chỉ tiêu Fisher
Hiện nay trong thuỷ văn thường dùng chỉ tiêu Fisher hay tỷ số phương sai để kiểm định về phương sai Chỉ tiêu xuất phát từ hàm mật độ xác suất do Fisher đưa ra (1941) (hình 3.2), có dạng:
2 2
y
x F
Trang 8Hình 3.2: Phân bố Fisher
Đây là tiêu chuẩn tham số nên yêu cầu chuỗi gốc phải có phân bố chuẩn Vì trong kiểm định luôn có x> ynên gọi là kiểm định chặn một đầu
Các bước kiểm định cũng thực hiện như ở phần đầu chương Sau khi tính được Ft
và Fth, tiến hành so sánh nếu thấy F F th thì chấp nhận giả thiết không và kết luận phương sai 2 chuỗi đồng nhất
Còn nếu F F th thì phương sai 2 chuỗi không đồng nhất
Ví dụ 3.3: Theo số liệu bảng (2.6), kiểm định phương sai chuỗi Qmax trạm Hoà Bình-sông Đà
- Chia chuỗi thành 2 phần như đã thực hiện ở các ví dụ kiểm định trước đây
- Tính chỉ tiêu Fisher theo công thức (3.16) được Ft=1,174
- Tra bảng Fisher (phụ lục 3.2A,B) với mức ý nghĩa 5% và các phương sai thành phần vừa tính, ta nhận được Fth=2,198 Cũng có thể tính bằng hàm trong Excel
- So sánh thấy rằng Ft<Fth do đó phương sai của 2 thành phần và cả chuỗi là đồng nhất
* Chỉ tiêu cho nhiều chuỗi
Trường hợp khi kiểm định cho nhiều chuỗi người ta dùng chỉ tiêu:
2 2 1
2 max 2
Lưu ý rằng chỉ tiêu này áp dụng cho các chuỗi cùng dung lượng
Người ta cũng sử dụng kiểm định Bartlett cho phương sai [10], khi mà số chuỗi lớn hơn 2
Đó là một áp dụng đặc biệt của kiểm định 2 và cho bởi phương trình:
( )log ,)
(lg,
m
k k
s
1
2 1
Trang 9k n
i i k
n
x x s
với k là số mẫu hay số phương sai được ước tính
Khi các mẫu có cùng dung lượng nk = n thì phương trình (3.18) dẫn tới:
2
13026
H0 với mức ý nghĩa đã chọn, nghĩa là các chuỗi đồng nhất
Trước khi kiểm định Bartlett nên tiến hành kiểm định theo chỉ tiêu Fisher cho phương sai lớn nhất và nhỏ nhất, nếu nó thoả mãn đồng nhất thì mới tiến hành theo Bartlett Nếu không thoả mãn thì không cần tính tiếp, vì ít nhất đã không đồng nhất ở 2 chuỗi có phương sai lớn nhất và nhỏ nhất vừa kiểm định và dĩ nhiên tất cả các chuỗi sẽ không đồng nhất
Các ví dụ trình bày chỉ kiểm định cho các thời đoạn khác nhau của chuỗi số liệu tại cùng một vị trí (đồng nhất về thời gian), tuy nhiên các chỉ tiêu cũng có thể áp dụng cho các chuỗi ở các vị trí khác nhau trong một khu vực địa vật lý đồng nhất (đồng nhất
về không gian)
c Xây dựng đường tần suất khi mẫu không đồng nhất
Trong một số trường hợp chuỗi quan trắc thu được là không đồng nhất Khi đó các phương pháp xây dựng đường tần suất đã trình bày ở chương 2 không thực hiện được Tuy nhiên muốn tận dụng các thông tin đã có từ số liệu quan trắc, chúng ta phải xây dựng đường tần suất cho chuỗi không đồng nhất Có nhiều phương pháp được giới thiệu, nhưng phương pháp đơn giản
và đủ chính xác là của Velicanov và Brokovits [32] Đây là phương pháp bán đồ giải Cơ sở của phương pháp như sau
Đường tần suất của chuỗi không đồng nhất được coi là tổng có trọng số của các chuỗi đồng nhất thành phần:
k
k k
n n
n
x P n x
P n x P n x P
)()
()(
'
2 1
2 2 1
trong đó: P'(x) là tần suất lí luận chung của toàn bộ chuỗi không đồng nhất; P1(x),
P2(x), ,Pk(x) là tần suất của các chuỗi đồng nhất thành phần; n là dung lượng chung; n=n1+n2+ +nk; n1,n2, ,nk là dung lượng các chuỗi thành phần
Để chứng mình công thức (3.22) chúng ta xem xét một trường hợp đơn giản, khi có 2 chuỗi thành phần, khi đó (3.22) có dạng sau:
2 1
2 2 1
1
n n
x P n x P n x P
)(
Trang 10Xác suất để biến x thuộc chuỗi thành phần thứ nhất P1(x), bằng
n
n n n
2 1
, tương tự xác suất để x thuộc chuỗi thành phần thứ hai P2(x), bằng
n
n2
Xác suất để giá trị cụ thể xi với tần suất P1(xi) thuộc chuỗi P1(x), theo định lý nhân xác suất sẽ là:
2 1
1
n n
()
(
n n
n x P n n
n x
2 1
2 1
2 1
Chia toàn bộ chuỗi thành 2 chuỗi thành phần theo các thời kỳ Như vậy chuỗi lưu lượng năm nhiều nước có 68 số hạng, còn chuỗi năm ít nước gồm 12 số hạng
Xây dựng các đường cong tần suất cho toàn bộ 80 năm số liệu và cho từng chuỗi thành phần theo đường tần suất Kritski-Menkel khi Cs=Cv như đã trình bày ở chương 2
Xây dựng đường tần suất tổng hợp tiến hành như sau Từ 80 số hạng của chuỗi chung và các chuỗi thành phần (68 và 12) tính được tỷ trọng xác suất:
n
n n n
n x
2 1
1
)
n x
2 1
2
)
80
12= 0,15
Bảng 3.2: Sơ đồ tính toán đường lí luận cho chuỗi không đồng nhất
Qmax trạm Xakmara sông Xakmara
Chuỗi thành phần 1 Chuỗi thành phần 2 Môđun
(l/skm2) P1(xi) 0,85.P1(xi) P2(xi) 0,15.P2(xi)
Tần suất tổng cộng P'(x)
Trang 11Trên hình (3.2) thấy rằng đường tần suất tổng hợp III phù hợp với tập hợp điểm kinh nghiệm hơn là đường tần suất xây dựng cho toàn bộ 80 năm số liệu
Cần lưu ý rằng nguyên nhân phá vỡ tính đồng nhất là muôn màu muôn vẻ Trong từng trường hợp cần tìm ra nguyên nhân chính để phân chia thành các chuỗi thành phần có tính
đồng nhất và đánh giá theo các chỉ tiêu thống kê đầy đủ
Trong thực tế có khi gặp trường hợp các chuỗi thành phần có cùng dung lượng Đối với mỗi chuỗi xây dựng đường tần suất như ở chương 2 Để có đường tần suất tổng hợp ta tính tần suất tổng hợp theo công thức của Kritski-Menkel:
2 1 2
p
Sau đó tiến hành các bước như đã trình bày ở trên
1 - Các điểm thực nghiệm ứng với các chuỗi đồng nhất
2 - Các điểm thực nghiệm của toàn chuỗi các đường tần suất Kriski - Menkel với Cs = Cv;
I - Thành phần thứ nhất M = 3,64; Cv = 0,46; h = 68, Cs = Cv; II - Thành phần thứ hai M = 3,64,
Cv = 0,11; n = 12; Cs = Cv;
3 - Đường tần suất tổ hợp dựa vào tổng xác suất có tỷ trọng của I và II - IV Đường tần suất tổ
hợp theo toàn những chuỗi quan trắc được M = 4,45; Cv = 0,56; n = 80; Cs = Cv
Hình 3.3: Đường tần suất chuỗi không đồng nhất và các chuỗi thành phần Qnăm
trạm Xakmara sông Xakmara 3.2.2 Kiểm định tính ngẫu nhiên
Chúng ta đã giả thiết rằng chuỗi số liệu quan trắc mang tính ngẫu nhiên, tuy vậy
điều này không phải luôn luôn đúng cho tất cả các chuỗi số liệu thuỷ văn Nhiều khi chúng có mối liên hệ bên trong như dòng chảy tháng, tuần, ngày v.v., thậm chí dòng chảy năm Và cũng có khi biểu hiện tính xu thế, chu kỳ Vì vậy trước khi áp dụng các phương pháp thống kê cũng cần kiểm tra tính ngẫu nhiên của chuỗi số liệu
Có nhiều chỉ tiêu khác nhau để kiểm định giả thiết này
a Chỉ tiêu điểm ngoặt
Trong một chuỗi quan trắc xi (i=1,2, ,n) sẽ xuất hiện một điểm ngoặt P tại thời gian i nếu, hoặc xi lớn hơn xi-1 và xi+1, hoặc xi nhỏ hơn xi-1 và xi+1
Trang 12Có 6 khả năng sau đây trong một chuỗi (hình 3.4)[10]:
6 trường hợp trên có xác suất xuất hiện bằng
nhau và các điểm ngoặt xuất hiện trong các
trường hợp từ (2) đến (5), nghĩa là số trường
hợp có điểm ngoặt ngẫu nhiên chiếm 4/6 = 2/3
trường hợp
Hình 3.4: Các trường hợp xuất hiện điểm ngoặt
Vì không xét được điểm ngoặt tại i =1 và i = n nên kỳ vọng (số điểm ngoặt có thể xét được) trong cả chuỗi (n-2) điểm là:
)()
P P
Đặt:
)(
)(
P
P E P Z
Tra phân bố chuẩn với mức ý nghĩa (tra với q=/2)
Nếu Z t Z th thì giả thiết không H0 về tính ngẫu nhiên được chấp nhận Ngược lại, giả thiết H0 bị bác bỏ
Ví dụ 3.5: Cho chuỗi số liệu Qnăm trạm Lai Châu, sông Đà từ 1959-2003 (bảng 2.3, chương 2), yêu cầu kiểm định tính ngẫu nhiên theo chỉ tiêu điểm ngoặt
- Tiến hành xác định số điểm ngoặt của chuỗi quan trắc (bảng 3.3), chữ số có gạch chân là điểm ngoặt
Tổng số điểm ngoặt của chuỗi thực đo là P=31
3
Xi-1 Xi X i+1 i-1 i i+1
4
Xi-1 Xi X i+1 i-1 i i+1
5 6
Xi-1 Xi X i+1 Xi-1 Xi Xi+1
i-1 i i+1 i-1 i i+1
Trang 13Bảng 3.3: Xác định số điểm ngoặt của Q năm trạm Lai châu-sông Đà
Năm Qmax Năm Qmax Năm Qmax Năm Qmax
2916
P P
33268
7
672831
2
,,
,)
(
)(
/
P
P E P Z
- Với mức ý nghĩa =5%, tra bảng với q=/2=2,5% có Zth=1,96
- So sánh thấy Z<Zth, như vậy giả thiết H0 về tính ngẫu nhiên được chấp nhận
b.Chỉ tiêu Neyman
Có thể dùng chênh lệch giữa các số hạng liên tiếp trong chuỗi để đánh giá tính ngẫu nhiên của nó Từ đó chỉ tiêu Neyman có dạng:
2 2
12
1
)(
)(
2 2
1
1
)(
Còn nếu thì giả thiết H0 được chấp nhận và chuỗi là ngẫu nhiên
Mức độ lệch khỏi đơn vị (1) của là độ đo đánh giá tính ngẫu nhiên Phân tích thấy rằng [32] khi =1 (hoặc xấp xỉ) thì chuỗi được chấp nhận là ngẫu nhiên Càng xa
1 thì tính ngẫu nhiên càng kém
Trang 14Các tính toán cho thấy [32] với chuỗi dòng chảy năm có dung luợng n>40, thì hầu hết có trong miền tới hạn với mức ý nghĩa , chứng tỏ chuỗi không ngẫu nhiên, còn với chuỗi dòng chảy lớn nhất 1 nên chuỗi là ngẫu nhiên Điều này phù hợp với phân tích vật lý
Bảng (3.4) cho ta thấy một số giá trị của dòng chảy năm và dòng chảy lớn nhất một số sông
Bảng 3.4: Trị số của dòng chảy năm và lớn nhất một số sông
c Chỉ tiêu tương quan hạng Kendal (chỉ tiêu )
Cho dãy xi ( i =1,N) Xác định số lần P trong toàn bộ cặp quan trắc mà x j> xi (j>i) Các cặp quan trắc lần lượt có thể là như sau (số sau lớn hơn số trước):
41)()(P N N
E , (3.32)
và:
P
E P E
P ( )
, (3.33) trong đó: P là số trường hợp thực tế mà số hạng sau lớn hơn số hạng trước
Nếu
21)(
)(
19
522
N N
N
Chỉ tiêu:
)(
Trang 15-Nếu Z t Z th thì giả thiết H0 đuợc chấp nhận và chuỗi là ngẫu nhiên (không có xu thế tăng hay giảm)
d Chỉ tiêu độ dài nhóm năm nhiều và ít nước
Chúng ta công nhận khái niệm "nhóm năm" là một đoạn bất kỳ gồm các phần tử của cùng một loại Độ dài nhóm năm là số phần tử có trong nhóm đó Thường người ta coi nhóm năm nhiều nước (ký hiệu là a) gồm các phần tử có lượng dòng chảy lớn hơn hoặc bằng dòng chảy trung bình nhiều năm (hay chuẩn), còn nhóm năm ít nước (ký hiệu là b) gồm các phần tử có dòng chảy nhỏ hơn chuẩn Tiến hành so sánh giữa độ dài và số nhóm năm của chuỗi thực đo với độ dài và số nhóm năm lý thuyết của chuỗi ngẫu nhiên thuần tuý để nhận định về tính ngẫu nhiên của chuỗi
Ký hiệu số nhóm năm của a có độ dài i là r1,i; số nhóm năm của b là r2,i, ri=r1,i+r2,i là tổng số nhóm năm có độ dài i
n
i i
B, , là số nhóm năm của a có độ dài lớn hơn k;
1
1 2 2
n
i i
Tiến hành nghiên cứu mức độ ngẫu nhiên của các chuỗi thực đo trên một số sông có độ dài lớn nhất trên các khu vực địa lý khác nhau cho thấy tổng số thực tế nhóm năm có độ dài khác nhau nhỏ hơn giá trị lý thuyết khá nhiều Ví dụ ở sông Neva trạm Petrokreposti có số nhóm năm là 8, trong khi theo lí thuyết nó là 54 Số nhóm năm thực tế với độ dài nhỏ (i=1-3) nhỏ hơn giá trị lý thuyết, còn số nhóm năm với độ dài lớn ((i=5-15) lớn hơn lí thuyết thực sự Sự khác biệt này càng tăng khi tăng độ dài nhóm năm Điều đó chứng tỏ rằng các chuỗi dòng chảy năm nói chung không phải là chuỗi ngẫu nhiên độc lập, và trong chuỗi đó có chứa những dao động chu kỳ vượt ra khỏi tính chất của một chuỗi ngẫu nhiên thuần tuý