1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc

31 793 8

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Trường học Đại Học Quốc Gia Hà Nội
Chuyên ngành Thủy văn
Thể loại Giáo trình
Thành phố Hà Nội
Định dạng
Số trang 31
Dung lượng 827,06 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Một số khái niệm về kiểm dịnh giả thiết thống kê Như ở chương 1 đã trình bày, cơ sở để áp dụng các phương pháp thống kê là chuỗi phải đồng nhất và ngẫu nhiên.. Nói riêng đó là giả thiết

Trang 1

Chương III Kiểm định các giả thiết thống kê

3.1.Khái niệm

3.1.1 Một số khái niệm về kiểm dịnh giả thiết thống kê

Như ở chương 1 đã trình bày, cơ sở để áp dụng các phương pháp thống kê là chuỗi phải đồng nhất và ngẫu nhiên Hơn nữa khi áp dụng các đường tần suất lý luận để mô tả phân bố của các đại lượng này phải đảm bảo sự phù hợp của giữa đường lý luận và

đường kinh nghiệm Chúng ta đã giả thiết rằng chuỗi quan trắc thoả mãn các tiêu chuẩn này để tiến hành các tính toán tiếp theo Đó chính là các giả thiết thống kê Tuy nhiên chuỗi quan trắc là một mẫu từ tổng thể, do tác động của nhiều nhân tố nên có thể chưa phản ảnh đúng bản chất của tổng thể Chính vì vậy cần tiến hành kiểm định các giả thiết trên

Vậy giả thiết thống kê là gì? Đó là giả thiết đưa ra để xem xét có công nhận hay không một kết luận về thống kê Nói riêng đó là giả thiết về tính đồng nhất, tính ngẫu nhiên và tính phù hợp với đường tần suất nào đó của chuỗi quan trắc thuỷ văn Kiểm

định giả thiết thống kê là thủ tục để đánh giá xem giả thiết đúng hay sai và để có thể chấp nhận hay bác bỏ giả thiết đó

Trong thủ tục kiểm định thống kê chúng ta cần biết một số khái niệm sau:

- Giả thiết không (Null Hypothesis-H0)

Giả thiết không là giả thiết ban đầu đưa ra để kiểm định Thường giả thiết thiên

về sự công nhận

- Giả thiết chệch (nghịch) (Anternative-Hypothesis)

Giả thiết chệch là giả thiết ngược lại với giả thiết không H0, giả thiết không công nhận

- Mức ý nghĩa  (Level of significance)

Mức ý nghĩa là xác suất (khá nhỏ) khi loại bỏ không chính xác giả thiết H0, hay còn gọi là xác suất sai lầm loại 1

Ngược lại với mức ý nghĩa  là mức tin cậy:  = 1-

Giá trị  càng nhỏ thì mức tin cậy càng lớn, giới hạn tin cậy càng mở rộng, càng ít phạm sai lầm loại 1, nhưng lại tăng sai lầm loại 2

- Miền tới hạn - Miền tin cậy: Mỗi chỉ tiêu xác định một tập hợp (miền) tới hạn

mà nếu giá trị lựa chọn rơi vào đó thì giả thiết H0 bị bác bỏ Phần bù của miền tới hạn gọi là miền tin cậy

Miền tới hạn được chọn sao cho xác suất rơi vào nó của chỉ tiêu xem xét là lớn nhất, khi đó giả thiết chệch đối lập với giả thiết H0 được chấp nhận

- Biên tới hạn - Biên tin cậy

Trang 2

Biên tin cậy là giới hạn của miền tin cậy, là ranh giới giữa miền tới hạn và miền tin cậy Nó phụ thuộc dạng phân bố của chỉ tiêu và mức ý nghĩa 

- Bậc tự do (Degree of Freedom): là số giá trị độc lập có thể xác định được, chính bằng dung lượng mẫu trừ đi số ràng buộc:

trong đó h là số thông số, n là dung lượng mẫu

- Các chỉ tiêu thống kê hay viết gọn là thống kê (Statistic) là chỉ tiêu để so sánh khi kiểm định

3.1.2.Các bước kiểm định giả thiết thống kê

Quá trình kiểm định bao gồm các bước sau:

1) Xác lập giả thiết không H0

2) Chọn mức ý nghĩa , thường chọn 1, 2, 5 và 10%

Khi kiểm định sẽ có 4 trường hợp xảy ra:

- Giả thiết là đúng và được chấp nhận

- Giả thiết đúng nhưng bị loại bỏ với mức , khi đó ta đã phạm sai lầm loại 1

- Giả thiết sai và bị loại bỏ

- Giả thiết sai nhưng được chấp nhận với mức , khi đó ta đã phạm sai lầm loại

2

3) Xác định miền tới hạn và biên tới hạn: Điều này phụ thuộc vào dạng phân bố của chỉ tiêu và mức ý nghĩa

4) Tính chỉ tiêu thống kê theo tài liệu quan trắc

5) So sánh chỉ tiêu với biên tới hạn và kết luận chấp nhận hay loại bỏ giả thiết

H0

3.2 Kiểm định các giả thiết thống kê

Có nhiều giả thiết thống kê cần kiểm định, nhưng trong thuỷ văn thường tiến hành kiểm định tính đồng nhất, tính ngẫu nhiên của chuỗi và tính phù hợp của đường

lí luận với đường kinh nghiệm Sau đây chúng ta sẽ tiến hành với từng giả thiết

3.2.1 Kiểm định tính đồng nhất của chuỗi

Chuỗi thuỷ văn đưa vào trong tính toán phải đảm bảo tính đồng nhất Có nhiều nguyên nhân, cả tự nhiên và nhân tạo, làm cho tính đồng nhất của chuỗi bị phá hoại Tuy nhiên phân tích bản chất vật lý của các đặc trưng thuỷ văn hoặc các nhân tố hình thành nó để chỉ ra sự đồng nhất là không đủ, vì chỉ mới là định tính Hợp lý hơn cần

sử dụng phương pháp thống kê, nó cho phép đánh giá tính đồng nhất của các chuỗi quan trắc trong dạng định lượng Hơn nữa cũng cần đánh giá tính đồng nhất của chuỗi khi không có thông tin về nguồn gốc gây ra sự không đồng nhất, khi đó phương pháp thống kê sẽ là duy nhất Mặt khác cũng có thể nguyên nhân vật lý đã biết nhưng không rõ ràng, và theo quan điểm thực tế có thể không tính đến, các phương pháp thống kê sẽ cho ta câu trả lời hợp lý nhất Phương pháp thống kê còn cho phép kiểm

định tính đồng nhất của các chuỗi theo không gian khi cần kết hợp chúng trong một khu vực địa vật lý đồng nhất

Trang 3

Có nhiều chỉ tiêu thống kê được dùng để đánh giá tính đồng nhất của các thông số phân bố mẫu, nói riêng là giá trị trung bình và phương sai

a Đồng nhất về giá trị trung bình

Thường bắt đầu áp dụng cho trường hợp chuỗi có phân bố chuẩn

* Chỉ tiêu phân bố chuẩn z

Coi trị số trung bình có phân bố chuẩn Khi chuỗi gốc có phân bố chuẩn hay có dung lượng rất lớn Chúng ta thực hiện theo các bước kiểm định giả thiết thống kê

- Giả sử có 2 chuỗi x và y Xác lập giả thiết H0 :x  y

- Giả sử 2 chuỗi x và y có dung lượng mẫu nx và ny, khi đó chỉ tiêu phân bố chuẩn

có dạng:

) (y x

x y z

x x

y

n n

2 2 ) (

- Xác định miền tới hạn Tra bảng phân bố chuẩn (phụ lục 2.7) với q=1/2 (vì phân

bố đối xứng) được giá trị zth Với = 0,05 ta có zth = 1,96

- Tính chỉ tiêu z từ tài liệu quan trắc theo công thức (3.1)

- So sánh: Nếu z  z th thì ta chấp nhận giả thiết không H0, tức là có x  y Khi

đó có thể đưa vào cùng một chuỗi để tính toán

Ngược lại, giả thiết H0 bị bác bỏ và ta tiếp nhận giả thiết chệch x  y

Sau này với các chỉ tiêu kiểm định khác, không trình bày lại các bước kiểm định như trên mà chỉ đưa ra các chỉ tiêu cần tính và giá trị tới hạn để so sánh Tuy nhiên phải nhớ rằng các bước tiến hành kiểm định phải đầy đủ như đã nêu

* Chỉ tiêu Student

Khi chuỗi không dài thì chỉ tiêu phân bố chuẩn không dủ mạnh, cần phải áp dụng chỉ tiêu khác, trong đó có chỉ tiêu Student Chỉ tiêu này xuất phát từ phân bố Student hay phân bố t, do W.S.Gosset sử dụng lần đầu trong một bài toán thống kê (1908) (hình 3.1)

Hình 3.1: Phân bố Student

Trang 4

Khi áp dụng chỉ tiêu này, phải thừa nhận phương sai là đồng nhất: x y 

với  là phương sai của tổng thể Tính đồng nhất của phương sai sẽ xem xét ở phần sau

Chỉ tiêu có dạng:

y x

y x y x y y x

n n n n n

n

x y t

y x

y x

y x c d

n n

n n S

y y x

x c

n n

n n

Các ký hiệu như đã nêu ở trên

Giá trị tới hạn t được tra theo bảng Student (phụ lục 3.1) ứng với số bậc tự do:

 = nx + nY -2 và mức ý nghĩa  Lưu ý rằng chỉ tiêu student đối xứng nên cần tra bảng phụ lục (3.1) với q= /2 Sau đây là một số giá trị t ứng với =:

(%) 5 1 0,1

t 1,96 2,58 3,29

Các bước kiểm định vẫn tiến hành như trên 2 chỉ tiêu phân bố chuẩn và Student

là những chỉ tiêu có tham số, áp dụng cho chuỗi quan trắc có phân bố chuẩn

* Chỉ tiêu cho nhiều chuỗi

Trong trường hợp kiểm định nhiều chuỗi đồng thời, dùng chỉ tiêu Student dưới dạng:

n m y t

1

, còn x m

giá trị trung bình theo mẫu quan trắc thứ m, có độ lệch lớn nhất so với trung bình

chung; k là số mẫu quan trắc;  là khoảng lệch chuẩn của chuỗi chung

Nếu t ứng với ym nằm trong miền tin cậy với mức ý nghĩa  thì giá trị trung bình các mẫu xm là đồng nhất

Lưu ý rằng chúng ta cũng phải thừa nhận các khoảng lệch chuẩn (phương sai) của các mẫu m là đồng nhất

Trang 5

Ví dụ 3.1: Cho số liệu Qnăm trạm Hoà Bình–sông Đà (bảng 1.7) từ 1956 đến

2002 Kiểm tra tính đồng nhất của chuỗi số liệu theo chỉ tiêu Student, biết rằng hồ chứa Hoà Bình bắt đầu hoạt động từ năm 1986

Ta chia chuỗi số liệu làm 2 phần, phần 1 từ 1956 đến 1985 gồm 30 số hạng, phần

2 gồm 17 số hạng còn lại

- Xác lập giả thiết H0: 2 chuỗi đồng nhất về giá trị trung bình: x  y

- Giả thiết phương sai của 2 chuỗi là đồng nhất: x y 

- Tính chỉ tiêu Student từ chuỗi quan trắc theo công thức (3.3) được: t=0,04

Chỉ tiêu khá nhạy đối với trung bình mẫu, nhưng không phản ứng với phương sai mẫu, nên thường dùng để đánh giá trung bình mẫu

Tiêu chuẩn này căn cứ trên việc thống kê số lượng nghịch thế xuất hiện do thuật toán sau:

1) Các giá trị quan trắc của 2 mẫu sắp xếp trong một chuỗi chung theo thứ tự (giảm dần hay tăng dần)

Ví dụ: y1 x1 x2 y2 y3 y4 x3 y5 y6 x4, (a)

hay: x1 x2 x3 y1 y2 x4 y3 y4 x5 y5, (b)

trong đó xi là các giá trị của chuỗi 1, còn yi là các giá trị của chuỗi 2

2) Nếu một giá trị x nào đó (hay y) xuất hiện sau giá trị y (hay x) thì cặp này hình thành một nghịch thế Như vậy trong dãy (a), x1 hình thành một nghịch thế (với y1) và

trong đó: m và n là số các số hạng của chuỗi x và y

4) Miền tới hạn được xác định trong phạm vi:

Trang 6

u m n nm nm

U

12

12

)(  

u q u t M u

t M u

)(

với uD u , (3.12)

tP là khoảng lệch chuẩn hoá ứng với mức ý nghĩa  (q=1/2  vì khoảng tin cậy đối xứng) Ví dụ với = 0,1 có q=0,05 và thu dược tq = 2,58, còn với = 0,05 nhận được tq = 1,96

5) So sánh, nếu U tính được nằm trong miền tới hạn thì giả thiết không H0 bị bác

bỏ, chuỗi không đồng nhất

Còn ngược lại thì giả thiết không H0 được chấp nhận và chuỗi đồng nhất

Chỉ tiêu này chỉ thích hợp khi so sánh 2 mẫu hoặc từng cặp mẫu trong nhiều điểm

có cảnh quan đồng nhất Với số mẫu lớn hơn 2 thì rất phức tạp và kém hiệu quả

Chỉ tiêu Wilcoxon là chỉ tiêu không tham số có thể áp dụng cho chuỗi gốc có phân

bố bất kỳ

Ví dụ 3.2: Cũng với số liệu Qnăm trạm Hoà Bình–sông Đà (bảng 1.7) từ 1956 đến

2002 Kiểm tra tính đồng nhất của chuỗi số liệu theo chỉ tiêu Wilcoxon

Chúng ta cũng làm theo các bước như trên, nhưng không nhắc lại lần lượt các bước, mà chỉ tiến hành các bước chủ yếu:

- 2 chuỗi đã chia được gộp vào làm một và sắp xếp theo thứ tự giảm dần, đánh dấu phân biệt số hạng của chuỗi 1 và 2

Trang 7

- Xác định miền tới hạn theo (3.11):

u m n nm nm

U

12

12

)(  

121173017302

1730

,)(

hoặc theo (3.12): Hai giá trị tới hạn của U tính theo (3.12) là : U1=166 và U2=343

- So sánh với Ut tính được ta thấy nó thoả mãn điều kiện (3.11) hoặc (3.12), như vậy giả thiết H0 được chấp nhận và kết luận chuỗi Qnăm của trạm Hoà Bình-sông Đà

đồng nhất

* Chỉ tiêu theo dấu

Chỉ tiêu này cũng được áp dụng để kiểm định tính đồng nhất Trong trường hợp này chỉ xem xét dấu của sự chênh lệch giữa các số hạng của 2 chuỗi x và y:

xnếu)(dấumang

i i

So sánh: Nếu Kn(+) < m n,k thì chuỗi không đồng nhất;

Nếu Kn(+) > m ,k thì chuỗi đồng nhất

Chỉ tiêu theo dấu cũng là chỉ tiêu không tham số có thể áp dụng cho chuỗi gốc có phân bố bất kỳ Tuy nhiên chỉ tiêu này ít dùng

b Đồng nhất về phương sai

Khi kiểm định theo chỉ tiêu Student đã thừa nhận phương sai của các chuỗi là

đồng nhất và bằng phương sai tổng thể Tuy nhiên cũng cần đánh giá làm rõ điều này Việc kiểm định được tiến hành bằng các chỉ tiêu sau đây

* Chỉ tiêu Fisher

Hiện nay trong thuỷ văn thường dùng chỉ tiêu Fisher hay tỷ số phương sai để kiểm định về phương sai Chỉ tiêu xuất phát từ hàm mật độ xác suất do Fisher đưa ra (1941) (hình 3.2), có dạng:

2 2

y

x F

Trang 8

Hình 3.2: Phân bố Fisher

Đây là tiêu chuẩn tham số nên yêu cầu chuỗi gốc phải có phân bố chuẩn Vì trong kiểm định luôn có x> ynên gọi là kiểm định chặn một đầu

Các bước kiểm định cũng thực hiện như ở phần đầu chương Sau khi tính được Ft

và Fth, tiến hành so sánh nếu thấy F  F th thì chấp nhận giả thiết không và kết luận phương sai 2 chuỗi đồng nhất

Còn nếu F  F th thì phương sai 2 chuỗi không đồng nhất

Ví dụ 3.3: Theo số liệu bảng (2.6), kiểm định phương sai chuỗi Qmax trạm Hoà Bình-sông Đà

- Chia chuỗi thành 2 phần như đã thực hiện ở các ví dụ kiểm định trước đây

- Tính chỉ tiêu Fisher theo công thức (3.16) được Ft=1,174

- Tra bảng Fisher (phụ lục 3.2A,B) với mức ý nghĩa 5% và các phương sai thành phần vừa tính, ta nhận được Fth=2,198 Cũng có thể tính bằng hàm trong Excel

- So sánh thấy rằng Ft<Fth do đó phương sai của 2 thành phần và cả chuỗi là đồng nhất

* Chỉ tiêu cho nhiều chuỗi

Trường hợp khi kiểm định cho nhiều chuỗi người ta dùng chỉ tiêu:

2 2 1

2 max 2

Lưu ý rằng chỉ tiêu này áp dụng cho các chuỗi cùng dung lượng

Người ta cũng sử dụng kiểm định Bartlett cho phương sai [10], khi mà số chuỗi lớn hơn 2

Đó là một áp dụng đặc biệt của kiểm định 2 và cho bởi phương trình:

( )log ,)

(lg,

m

k k

s

1

2 1

Trang 9

k n

i i k

n

x x s

với k là số mẫu hay số phương sai được ước tính

Khi các mẫu có cùng dung lượng nk = n thì phương trình (3.18) dẫn tới:

2

13026

H0 với mức ý nghĩa đã chọn, nghĩa là các chuỗi đồng nhất

Trước khi kiểm định Bartlett nên tiến hành kiểm định theo chỉ tiêu Fisher cho phương sai lớn nhất và nhỏ nhất, nếu nó thoả mãn đồng nhất thì mới tiến hành theo Bartlett Nếu không thoả mãn thì không cần tính tiếp, vì ít nhất đã không đồng nhất ở 2 chuỗi có phương sai lớn nhất và nhỏ nhất vừa kiểm định và dĩ nhiên tất cả các chuỗi sẽ không đồng nhất

Các ví dụ trình bày chỉ kiểm định cho các thời đoạn khác nhau của chuỗi số liệu tại cùng một vị trí (đồng nhất về thời gian), tuy nhiên các chỉ tiêu cũng có thể áp dụng cho các chuỗi ở các vị trí khác nhau trong một khu vực địa vật lý đồng nhất (đồng nhất

về không gian)

c Xây dựng đường tần suất khi mẫu không đồng nhất

Trong một số trường hợp chuỗi quan trắc thu được là không đồng nhất Khi đó các phương pháp xây dựng đường tần suất đã trình bày ở chương 2 không thực hiện được Tuy nhiên muốn tận dụng các thông tin đã có từ số liệu quan trắc, chúng ta phải xây dựng đường tần suất cho chuỗi không đồng nhất Có nhiều phương pháp được giới thiệu, nhưng phương pháp đơn giản

và đủ chính xác là của Velicanov và Brokovits [32] Đây là phương pháp bán đồ giải Cơ sở của phương pháp như sau

Đường tần suất của chuỗi không đồng nhất được coi là tổng có trọng số của các chuỗi đồng nhất thành phần:

k

k k

n n

n

x P n x

P n x P n x P

)()

()(

'

2 1

2 2 1

trong đó: P'(x) là tần suất lí luận chung của toàn bộ chuỗi không đồng nhất; P1(x),

P2(x), ,Pk(x) là tần suất của các chuỗi đồng nhất thành phần; n là dung lượng chung; n=n1+n2+ +nk; n1,n2, ,nk là dung lượng các chuỗi thành phần

Để chứng mình công thức (3.22) chúng ta xem xét một trường hợp đơn giản, khi có 2 chuỗi thành phần, khi đó (3.22) có dạng sau:

2 1

2 2 1

1

n n

x P n x P n x P

)(

Trang 10

Xác suất để biến x thuộc chuỗi thành phần thứ nhất P1(x), bằng

n

n n n

2 1

 , tương tự xác suất để x thuộc chuỗi thành phần thứ hai P2(x), bằng

n

n2

Xác suất để giá trị cụ thể xi với tần suất P1(xi) thuộc chuỗi P1(x), theo định lý nhân xác suất sẽ là:

2 1

1

n n

()

(

n n

n x P n n

n x

2 1

2 1

2 1

Chia toàn bộ chuỗi thành 2 chuỗi thành phần theo các thời kỳ Như vậy chuỗi lưu lượng năm nhiều nước có 68 số hạng, còn chuỗi năm ít nước gồm 12 số hạng

Xây dựng các đường cong tần suất cho toàn bộ 80 năm số liệu và cho từng chuỗi thành phần theo đường tần suất Kritski-Menkel khi Cs=Cv như đã trình bày ở chương 2

Xây dựng đường tần suất tổng hợp tiến hành như sau Từ 80 số hạng của chuỗi chung và các chuỗi thành phần (68 và 12) tính được tỷ trọng xác suất:

n

n n n

n x

2 1

1

)

n x

2 1

2

)

80

12= 0,15

Bảng 3.2: Sơ đồ tính toán đường lí luận cho chuỗi không đồng nhất

Qmax trạm Xakmara sông Xakmara

Chuỗi thành phần 1 Chuỗi thành phần 2 Môđun

(l/skm2) P1(xi) 0,85.P1(xi) P2(xi) 0,15.P2(xi)

Tần suất tổng cộng P'(x)

Trang 11

Trên hình (3.2) thấy rằng đường tần suất tổng hợp III phù hợp với tập hợp điểm kinh nghiệm hơn là đường tần suất xây dựng cho toàn bộ 80 năm số liệu

Cần lưu ý rằng nguyên nhân phá vỡ tính đồng nhất là muôn màu muôn vẻ Trong từng trường hợp cần tìm ra nguyên nhân chính để phân chia thành các chuỗi thành phần có tính

đồng nhất và đánh giá theo các chỉ tiêu thống kê đầy đủ

Trong thực tế có khi gặp trường hợp các chuỗi thành phần có cùng dung lượng Đối với mỗi chuỗi xây dựng đường tần suất như ở chương 2 Để có đường tần suất tổng hợp ta tính tần suất tổng hợp theo công thức của Kritski-Menkel:

2 1 2

p

Sau đó tiến hành các bước như đã trình bày ở trên

1 - Các điểm thực nghiệm ứng với các chuỗi đồng nhất

2 - Các điểm thực nghiệm của toàn chuỗi các đường tần suất Kriski - Menkel với Cs = Cv;

I - Thành phần thứ nhất M = 3,64; Cv = 0,46; h = 68, Cs = Cv; II - Thành phần thứ hai M = 3,64,

Cv = 0,11; n = 12; Cs = Cv;

3 - Đường tần suất tổ hợp dựa vào tổng xác suất có tỷ trọng của I và II - IV Đường tần suất tổ

hợp theo toàn những chuỗi quan trắc được M = 4,45; Cv = 0,56; n = 80; Cs = Cv

Hình 3.3: Đường tần suất chuỗi không đồng nhất và các chuỗi thành phần Qnăm

trạm Xakmara sông Xakmara 3.2.2 Kiểm định tính ngẫu nhiên

Chúng ta đã giả thiết rằng chuỗi số liệu quan trắc mang tính ngẫu nhiên, tuy vậy

điều này không phải luôn luôn đúng cho tất cả các chuỗi số liệu thuỷ văn Nhiều khi chúng có mối liên hệ bên trong như dòng chảy tháng, tuần, ngày v.v., thậm chí dòng chảy năm Và cũng có khi biểu hiện tính xu thế, chu kỳ Vì vậy trước khi áp dụng các phương pháp thống kê cũng cần kiểm tra tính ngẫu nhiên của chuỗi số liệu

Có nhiều chỉ tiêu khác nhau để kiểm định giả thiết này

a Chỉ tiêu điểm ngoặt

Trong một chuỗi quan trắc xi (i=1,2, ,n) sẽ xuất hiện một điểm ngoặt P tại thời gian i nếu, hoặc xi lớn hơn xi-1 và xi+1, hoặc xi nhỏ hơn xi-1 và xi+1

Trang 12

Có 6 khả năng sau đây trong một chuỗi (hình 3.4)[10]:

6 trường hợp trên có xác suất xuất hiện bằng

nhau và các điểm ngoặt xuất hiện trong các

trường hợp từ (2) đến (5), nghĩa là số trường

hợp có điểm ngoặt ngẫu nhiên chiếm 4/6 = 2/3

trường hợp

Hình 3.4: Các trường hợp xuất hiện điểm ngoặt

Vì không xét được điểm ngoặt tại i =1 và i = n nên kỳ vọng (số điểm ngoặt có thể xét được) trong cả chuỗi (n-2) điểm là:

)()

P P

Đặt:

)(

)(

P

P E P Z

Tra phân bố chuẩn với mức ý nghĩa  (tra với q=/2)

Nếu Z  t Z th thì giả thiết không H0 về tính ngẫu nhiên được chấp nhận Ngược lại, giả thiết H0 bị bác bỏ

Ví dụ 3.5: Cho chuỗi số liệu Qnăm trạm Lai Châu, sông Đà từ 1959-2003 (bảng 2.3, chương 2), yêu cầu kiểm định tính ngẫu nhiên theo chỉ tiêu điểm ngoặt

- Tiến hành xác định số điểm ngoặt của chuỗi quan trắc (bảng 3.3), chữ số có gạch chân là điểm ngoặt

Tổng số điểm ngoặt của chuỗi thực đo là P=31

3

Xi-1 Xi X i+1 i-1 i i+1

4

Xi-1 Xi X i+1 i-1 i i+1

5 6

Xi-1 Xi X i+1 Xi-1 Xi Xi+1

i-1 i i+1 i-1 i i+1

Trang 13

Bảng 3.3: Xác định số điểm ngoặt của Q năm trạm Lai châu-sông Đà

Năm Qmax Năm Qmax Năm Qmax Năm Qmax

2916

P P

33268

7

672831

2

,,

,)

(

)(

/

P

P E P Z

- Với mức ý nghĩa =5%, tra bảng với q=/2=2,5% có Zth=1,96

- So sánh thấy Z<Zth, như vậy giả thiết H0 về tính ngẫu nhiên được chấp nhận

b.Chỉ tiêu Neyman

Có thể dùng chênh lệch giữa các số hạng liên tiếp trong chuỗi để đánh giá tính ngẫu nhiên của nó Từ đó chỉ tiêu Neyman có dạng:

2 2

12

1

)(

)(

2 2

1

1

)(

Còn nếu   thì giả thiết H0 được chấp nhận và chuỗi là ngẫu nhiên

Mức độ lệch khỏi đơn vị (1) của  là độ đo đánh giá tính ngẫu nhiên Phân tích thấy rằng [32] khi  =1 (hoặc xấp xỉ) thì chuỗi được chấp nhận là ngẫu nhiên Càng xa

1 thì tính ngẫu nhiên càng kém

Trang 14

Các tính toán cho thấy [32] với chuỗi dòng chảy năm có dung luợng n>40, thì hầu hết có  trong miền tới hạn với mức ý nghĩa  , chứng tỏ chuỗi không ngẫu nhiên, còn với chuỗi dòng chảy lớn nhất   1 nên chuỗi là ngẫu nhiên Điều này phù hợp với phân tích vật lý

Bảng (3.4) cho ta thấy một số giá trị  của dòng chảy năm và dòng chảy lớn nhất một số sông

Bảng 3.4: Trị số  của dòng chảy năm và lớn nhất một số sông

c Chỉ tiêu tương quan hạng Kendal (chỉ tiêu )

Cho dãy xi ( i =1,N) Xác định số lần P trong toàn bộ cặp quan trắc mà x j> xi (j>i) Các cặp quan trắc lần lượt có thể là như sau (số sau lớn hơn số trước):

41)()(PN N

E , (3.32)

và:

P

E P E

P ( )

 , (3.33) trong đó: P là số trường hợp thực tế mà số hạng sau lớn hơn số hạng trước

Nếu

21)( 

)(

19

522

N N

N

Chỉ tiêu:

)(

Trang 15

-Nếu Z tZ th thì giả thiết H0 đuợc chấp nhận và chuỗi là ngẫu nhiên (không có xu thế tăng hay giảm)

d Chỉ tiêu độ dài nhóm năm nhiều và ít nước

Chúng ta công nhận khái niệm "nhóm năm" là một đoạn bất kỳ gồm các phần tử của cùng một loại Độ dài nhóm năm là số phần tử có trong nhóm đó Thường người ta coi nhóm năm nhiều nước (ký hiệu là a) gồm các phần tử có lượng dòng chảy lớn hơn hoặc bằng dòng chảy trung bình nhiều năm (hay chuẩn), còn nhóm năm ít nước (ký hiệu là b) gồm các phần tử có dòng chảy nhỏ hơn chuẩn Tiến hành so sánh giữa độ dài và số nhóm năm của chuỗi thực đo với độ dài và số nhóm năm lý thuyết của chuỗi ngẫu nhiên thuần tuý để nhận định về tính ngẫu nhiên của chuỗi

Ký hiệu số nhóm năm của a có độ dài i là r1,i; số nhóm năm của b là r2,i, ri=r1,i+r2,i là tổng số nhóm năm có độ dài i

n

i i

B, , là số nhóm năm của a có độ dài lớn hơn k; 

1

1 2 2

n

i i

Tiến hành nghiên cứu mức độ ngẫu nhiên của các chuỗi thực đo trên một số sông có độ dài lớn nhất trên các khu vực địa lý khác nhau cho thấy tổng số thực tế nhóm năm có độ dài khác nhau nhỏ hơn giá trị lý thuyết khá nhiều Ví dụ ở sông Neva trạm Petrokreposti có số nhóm năm là 8, trong khi theo lí thuyết nó là 54 Số nhóm năm thực tế với độ dài nhỏ (i=1-3) nhỏ hơn giá trị lý thuyết, còn số nhóm năm với độ dài lớn ((i=5-15) lớn hơn lí thuyết thực sự Sự khác biệt này càng tăng khi tăng độ dài nhóm năm Điều đó chứng tỏ rằng các chuỗi dòng chảy năm nói chung không phải là chuỗi ngẫu nhiên độc lập, và trong chuỗi đó có chứa những dao động chu kỳ vượt ra khỏi tính chất của một chuỗi ngẫu nhiên thuần tuý

Ngày đăng: 10/08/2014, 10:21

HÌNH ẢNH LIÊN QUAN

Hình 3.1: Phân bố Student - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Hình 3.1 Phân bố Student (Trang 3)
Bảng 3.1: Tính số nghịch thế U của chuỗi Q trạm Hoà Bình–sông Đà - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.1 Tính số nghịch thế U của chuỗi Q trạm Hoà Bình–sông Đà (Trang 6)
Hình 3.2: Phân bố Fisher - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Hình 3.2 Phân bố Fisher (Trang 8)
Hình 3.3: Đường tần suất chuỗi không đồng nhất và các chuỗi thành phần Qnăm - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Hình 3.3 Đường tần suất chuỗi không đồng nhất và các chuỗi thành phần Qnăm (Trang 11)
Hình 3.4: Các trường hợp xuất hiện điểm ngoặt - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Hình 3.4 Các trường hợp xuất hiện điểm ngoặt (Trang 12)
Bảng 3.3: Xác định số điểm ngoặt của Q năm trạm Lai châu-sông Đà - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.3 Xác định số điểm ngoặt của Q năm trạm Lai châu-sông Đà (Trang 13)
Bảng 3.4: Trị số  của dòng chảy năm và lớn nhất một số sông - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.4 Trị số  của dòng chảy năm và lớn nhất một số sông (Trang 14)
Bảng 3.6: Số nhóm năm B trong chuỗi ngẫu nhiên với độ dài n khác nhau - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.6 Số nhóm năm B trong chuỗi ngẫu nhiên với độ dài n khác nhau (Trang 15)
Bảng 3.5: Số năm dài nhất n để có bất dẳng thức trong bảng với xác suất 5% - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.5 Số năm dài nhất n để có bất dẳng thức trong bảng với xác suất 5% (Trang 15)
Hình 3.5: Phân bố   2 - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Hình 3.5 Phân bố  2 (Trang 16)
Bảng 3.7: Kiểm định chuỗi Qmax trạm Hoà Bình-sông Đà theo đường Kritski-Menkel - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.7 Kiểm định chuỗi Qmax trạm Hoà Bình-sông Đà theo đường Kritski-Menkel (Trang 18)
Bảng 3.9: Phân bố  n  2 - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.9 Phân bố n  2 (Trang 19)
Bảng 3.10: Đánh giá sự phù hợp đường tần suất Kritski-Menkel của Qmax - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.10 Đánh giá sự phù hợp đường tần suất Kritski-Menkel của Qmax (Trang 20)
Hình 3.7. Toán đồ xác định Cv và Cs đường P.III bằng phương pháp hiện thực tối đa - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Hình 3.7. Toán đồ xác định Cv và Cs đường P.III bằng phương pháp hiện thực tối đa (Trang 26)
Bảng 3.11 : Số liệu dòng chảy năm trạm Thượng Cát, sông Đuống (1957-2002) - Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc
Bảng 3.11 Số liệu dòng chảy năm trạm Thượng Cát, sông Đuống (1957-2002) (Trang 30)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w