Chương 4 Kiểm tra thống kê các giả thuyết về tính đồng nhất, ngẫu nhiên và phù hợp của thông tin khí tượng thuỷ văn Việc ứng dụng đường phân phối lý luận để mô tả các chuỗi thống kê , nó
Trang 1Chương 4 Kiểm tra thống kê các giả thuyết về tính đồng nhất, ngẫu nhiên và phù hợp của thông tin khí tượng thuỷ văn
Việc ứng dụng đường phân phối lý luận để mô tả các chuỗi thống kê , nói một cách nghiêm túc, chỉ có thể thực hiện được trong trường hợp nếu như chuỗi này
được tạo nên bởi các phần tử về định tính là đồng nhất và độc lập với nhau Vì vậy làm sáng tỏ tính đồng nhất thống kê của chuỗi nghiên cứu và tính ngẫu nhiên hình thành mẫu là yếu tố quan trọng của việc đánh giá mức độ tin cậy trong khái quát hoá thống kê
Ngoài ra, khi sử dụng đường phân phối lý luận cần phải trình bày đầy đủ rõ ràng mức độ đường phân phối lý luận để được dùng phù hợp với tài liệu thực nghiệm
Việc phân tích các phương pháp thống kê cho phép giải các bài toán trên và
là nội dung của chương này
4.1 Phân tích tính đồng nhất chuỗi đặc trưng thuỷ văn
4.1.1 Tổng quan
Các chuỗi đặc trưng thuỷ văn không phải là những tổng thể mà là các mẫu ngẫu nhiên của chúng Vì vậy không thể mặc nhiên coi các chuỗi đó thuộc một tổng thể được
Như đã biết, trong lý thuyết xác suất có rất nhiều chỉ tiêu đồng nhất mà ta có thể sử dụng để xác định tính đồng nhất của các tham số mẫu của phân phối trong đó
có trị bình quân và phương sai, hoặc xác định trực tiếp một số mẫu có thuộc cùng một tổng thể hay không Sau đây chúng ta sẽ xét một vài chỉ tiêu đó được dùng trong thực tế phân tích thuỷ văn
Ta biết rằng việc đánh giá tính đồng nhất về mặt thống kê của các chuỗi đặc trưng thuỷ văn là đặc biệt phức tạp, vì vậy trong nhiều trường hợp phép toán này trở nên không thể xác định được
Trang 2Thật vậy, do tính đa nhân tố của rất nhiều các đặc trưng thuỷ văn, thường khó tách ra được các nguyên nhân phá vỡ trạng thái đồng nhất của chuỗi tài liệu quan trắc được ra khỏi các yếu tố tạo nên chuỗi thuỷ văn như là một chuỗi của biến ngẫu nhiên
Thí dụ như lưu lượng nước lớn nhất trong năm, như ta đã biết rõ, được hình thành dưới tác động của rất nhiều nhân tố, trong đó có lớp tuyết phủ quyết định đến dòng chảy lũ mùa xuân, lượng mưa rơi sinh ra lũ do mưa Vì thế, một vấn đề tất nhiên sẽ xảy ra là đối với sông nghiên cứu, lớp tuyết phụ và lượng mưa rơi với nhiều nhân tố khác tạo nên tính chất ngẫu nhiên dao động nhiều năm của dòng chảy lũ mùa xuân, và ngược lại , một nhân tố đó trong những năm khác nhau tác động lên hiện tượng nghiên cứu rất độc lập với nhau điều đó đã gây nên tính không đồng nhất
về mặt hình thành nó
Trong trường hợp thứ nhất, lưu lượng lớn nhất không phụ thuộc vào điều kiện hình thành nó (lũ do mưa và lũ mùa xuân ) tạo nên một chuỗi thống kê duy nhất, còn trong trường hợp thứ hai do xét riêng biệt lũ do mưa và lũ mùa xuân như là hai chuỗi thống kê độc lập Vì thế một vấn đề nảy ra là sử dụng lượng thông tin tổng hợp có trong hai chuỗi thống kê đó như thế nào, nếu như thiết kế công trình thuỷ lợi cần tính lưu lượng nước lớn nhất ứng với tần suất cho trước không phụ thuộc vào
điều kiện hình thành nó (lũ do mưa hay lũ mùa xuân) ở chương này ta sẽ xét một trong số các phương pháp có thể mô tả thống kê các chuỗi như vậy
Trong một số trường hợp việc đánh giá tính đồng nhất của tài liệu thuỷ văn quan trắc có ý nghĩa rất quyết định Thí dụ như việc lựa chọn trạm tương tự, khi xác
định được tính đồng nhất của các yếu tố địa vật lý và khí hậu của dòng chảy dựa vào
sự phân tích định tính chung trên hai lưu vực
Trong các trường hợp khác cần phải đánh giá tính đồng nhất trong chuỗi đặc trưng dòng chảy của con sông khi nó bị phá vỡ bởi những nguyên nhân tự nhiên hoặc do con người, chẳng hạn như sự thay đổi dòng chảy tự nhiên do nó được điều tiết bằng kho nước Nguyên nhân tự nhiên phá vỡ tính đồng nhất của chuỗi tài liệu thuỷ văn quan trắc điển hình là ảnh hưởng của những chỗ trũng lớn nhỏ không thoát
được nước ở những vùng không đủ ẩm Việc làm sáng tỏ mức độ đồng nhất của các chuỗi dòng chảy đối với những sông khác nhau là điều râts quan trọng khi kết hợp các chuỗi đó lại thành một chuỗi không- thời gian thống nhất
Trang 3Trong tất cả các thí dụ trên cần phải đánh giá tính đồng nhất của các đặc trưng thuỷ văn khác nhau Điều đó đều được tiến hành đối với các trường hợp , khi
mà các nhân tố quyết định các đặc trưng thuỷ văn khác nhau (lượng mưa bốc hơi, nhiệt độ không khí v.v ) được phân tích đồng nhất Thường thường việc phân tích tính đồng nhất chỉ được thực hiện dựa vào những đánh giá định tính và không sử dụng các chỉ tiêu định lượng khách quan Trong nhiều trường hợp điều đó đã là đủ Thật vậy, chưa hẳn đã có sự nghi ngờ tính không đồng nhất của chuỗi dòng chảy lớn nhất trước và sau khi xây dựng kho nước điều tiết mùa Nếu nói đến ảnh hưởng điều tiết dòng chảy của kho nước trường hợp đó chắc hẳn là nhỏ Trong một số trường hợp theo quan điểm thực tế dòng chảy năm của một con sông trước và sau khi xây dựng nhà máy thuỷ điện có thể coi là đồng nhất
Khi phân tích bản chất tính đồng nhất của các đặc trưng thuỷ văn hoặc của các nhân tố tạo nên chúng, việc sử dụng các phương pháp thống kê cho phép ta đánh giá tính đồng nhất của chuỗi tài liệu nghiên cứu quan trắc dưới dạng định lượng là
điều cần thiết nhưng chưa đủ Hơn nữa, thường cần phải đánh giá tính đồng nhất của các chuỗi thuỷ văn, khi mà không có lượng thông tin về nguồn gốc phá vỡ trạng thái
đồng nhất Trong các trường hợp như vậy, các phương pháp thống kê tính đồng nhất của tài liệu thực nghiệm là những phương pháp duy nhất Hơn nữa nhờ các phương pháp đó ta có thể xác định được phạm vi cần phải tìm nguyên nhân vật lý phá vỡ tính đồng nhất của chuõi tài liệu quan trắc được và cũng chính các phương pháp này
sẽ giúp cho các nhà nghiên cưú tìm ra được nguyên nhân đó
Có thể xảy ra tình trạng, khi mà nguyên nhân vật lý làm phá vỡ trạng thái
đồng nhất thì đã biết nhưng theo quan điểm thực tế đến nay vẫn chưa biết trường hợp nguyên nhân này có thể không xét Các phương pháp thống kê cũng có thể giải
đáp được các vấn đề tương tự như vậy
Tóm lại, trong các thí dụ đã xét ở trên rõ ràng là phép phân tích vật lý và các phương pháp thống kê nghiên cứu tính đồng nhất các phương pháp khác nhau đối với cùng một quy luật (vật lý và thống kê) của các chuỗi quan trắc được Ngoài ra việc sử dụng đồng thời các phương pháp thống kê và vật lý vào phân tích tài liệu thực nghiệm khi đánh giá tính đồng nhất, vì các phương pháp này thường bổ sung và làm chính xác cho nhau Khi nghiên cứu tính đồng nhất của các chuỗi quan trắc
được theo quan điểm vật lý thông thường chỉ có thể đi đến các kết luận về định tính
Trang 4mà không có định lượng ; các phương pháp thống kê nghiên cứu tính đồng nhất cho phép các kết luận định tính đó được bổ sung vào các đánh giá về mặt định lượng
Để làm thí dụ, ta sẽ xét sự phân bố độ cao của một lớp tuyết phủ ở trong rừng
và ngoài đồng Xuất phát từ nhận thức vật lý thuần tuý về sự hình thành lớp tuyết phủ có thể đi đến một kết luận là trường hợp độ cao lớp tuyết phủ ở trong rừng phải lớn hơn và độ cao này ít thay đổi hơn so với ở ngoài đồng với các điều kiện khác như nhau Thật vậy, các kết quả quan trắc được đã khẳng định điều đó Song khi sử dụng các phương pháp thống kê phân tích tính đồng nhất có thể xác định được một vài sai khác đó Ngoài ra cấu trúc thống kê cuả lớp tuyết phủ trên khoảng không gian rất lớn ở trên đồng (hay trong rừng cũng chịu sự thay đổi dưới ảnh hưởng của các nhân tố như khí hậu chẳng hạn Trong trường hợp này các phương pháp thống kê
có thế ưu việt khi tách các đặc trưng đồng nhất của lớp tuyết phủ ở trên đồng (hay ở trong rừng )
Trước khi xét tới các phương pháp thống kê phân tích tính đồng nhất của tài liệu quan trắc ta phải xem xét một số những đặc tính và hạn chế của việc sử dụng các chỉ tiêu đồng nhất về mặt thống kê trong tính toán thuỷ văn
Đối với các chuỗi ngẫu nhiên độc lập trong chuỗi, người ta đã nghiên cứu
được một số chỉ tiêu thống kê của tính đồng nhất Các chuỗi thuỷ văn quan trắc, như chúng ta sẽ rõ ở các chương sau, thường không thoả mãn yêu cầu này Cho nên việc
sử dụng các chỉ tiêu tính đồng nhất đã biết đối với các chuỗi thuỷ văn có mối tương quan nội tại có thể đi đến những kết quả không đúng, vì mối tương quan nội tại của chuỗi đã làm giảm bớt dung lượng thông tin độc lập có trong tài liệu quan trắc được
Điều đó sẽ mở rộng phạm vi dao động (phân tán) các giá trị mâu thuẫn của tham số
đó được xác định theo chuỗi của các giá trị độc lập về mặt thống kê có cùng dung lượng Sự mở rộng độ phân tán dẫn tới sự mở rộng khoảng tin cậy tương ứng đối với chỉ tiêu đồng nhất
Vì vậy, việc sử dụng chỉ tiêu đồng nhất đã được nghiên cứu cho các chuỗi không có tương quan nội tại, vào các chuỗi thuỷ văn quan trắc có mối tương quan đó
đôi khi đối với các chuỗi tài liệu quan trắc ta đã biết chắc chắn là đồng nhất thì có thể bị coi là không đồng nhất, nghĩa là trong các trường hợp này chỉ tiêu đồng nhất
là thừa khi đánh giá tính đồng nhất
Trang 5Việc sử dụng không đúng như vậy các chỉ tiêu đồng nhất đôi khi còn gặp trong thực tế tính toán thuỷ văn sẽ đi đến những kết quả của đánh giá mức độ an toàn không cần thiết Sử dụng đúng đắn các chỉ tiêu đồng nhất đối với các giá trị tương quan đối với nhau là ở chỗ đánh giá được dung lượng thông tin độc lập cần phải tính đến khi tính toán đồng nhất
Sự đánh giá mức độ ngẫu nhiên của các chuỗi thuỷ văn sẽ được nghiên cứu ở mục sau của chương này ở đây ta chỉ đề cập đến nững hạn chế cần phải chú ý khi ứng dụng các chỉ tiêu thống kê của tính đồng nhất
Hạn chế thứ hai khi sử dụng các chỉ tiêu thống kê của tính đồng nhất đối với tài liệu thuỷ văn có mối tương quan giữa các chuỗi với nhau là khoảng tin cậy của các chỉ tiêu đồng nhất bị thu hẹp lại Điều đó sẽ dẫn đến sự ứng dụng chỉ tiêu thống
kê của tính đồng nhất, mà không xét đến mối tương quan giữa các chuỗi thuỷ văn quan trắc được thì các tài liệu ta đã biết chắc chắn là không đồng nhất có thể chấp nhận là đồng nhất Những sai lầm này rất thường gặp khi đánh giá tính đồng nhất tài liệu thuỷ văn, vì tài liệu thuỷ văn (dòng chảy năm, dòng chảy lớn nhất, dòng chảy mùa v.v ) ở các sông gần nhau thực ra là có tương quan với nhau Nếu không tính
đến các mối tương quan đó có thể là những tài liệu ta đã biết chắc là không đồng nhất lại được chấp nhận là đồng nhất
Như vậy, nếu như không tính đến mối quan hệ nội tại của các chuỗi tài liệu quan trắc sẽ đưa đến những lời giải của tính đồng nhất thiên về an toàn (tài liệu ta biết chắc là đồng nhất có thể xếp vào loại không đồng nhất) còn khi không xét đến mối tương quan giữa các chuỗi thuỷ văn quan trắc được thì ngược lại sẽ mở rộng khái niệm đồng nhất (tài liệu biết chắc là không đồng nhất có thể xếp vào loại đồng nhất.)
Ngoài những hạn chế trên thường bị bỏ qua khi sử dụng các chỉ tiêu thồng kê của tính đồng nhất, còn có một số hạn chế khác thường thường được phân tích khi mô tả các chỉ tiêu đó vì vậy ta phải chú ý khi sử dụng chúng Trong số các hạn chế
đó, chẳng hạn như điều kiện tuân theo luật phân phối lý luận này hay luật khác thường là chấm, của các chuỗi tài liệu thống kê nghiên cứu các chỉ tiêu loại này (thí
dụ như chỉ tiêu đồng nhất của giá trị bình quân Student hay chỉ tiêu đồng nhất của phương sai Fisher) được gọi là chỉ tiêu tham số, nó khác với các chỉ tiêu không tham
số là không phụ thuộc vào lượng phân bố của tài liệu gốc (thí dụ như chỉ tiêu
Trang 6Wincooson) Ta nhận thấy rằng các chỉ tiêu tham số thường có hiệu quả hơn so với các chỉ tiêu không tham số, vì nó sử dụng lượng thông tin gốc đầy đủ hơn, phân tích các chỉ tiêu thống kê của các giả thiết ra lại tham số và không tham số như trên, đều thuộc về phần sau của chương này Các chỉ tiêu không tham số thường đơn giản hơn
và không cần lập luận bổ xung của tính chất dúng đắn khi ứng dụng chúng đối với dạng phân phối gốc khi sử dụng các chỉ tỉêu tham số với tính đồng nhất người ta phải đánh giá các tham số của phân phối (trị bình quân, số biến đổi và hệ số không
đối xứng )
Sau đây ta sẽ xét một số chỉ tiêu cổ điển đánh giá tính đồng nhất (không kể chỉ tiêu tổng quát của Student và chỉ tiêu Bartlet đối với trường hợp nhiều chuỗi) chỉ thích hợp đối với phân tích của tính đồng nhất của hai chuỗi thực nghiệm Khi có nhiều chuỗi được đem đánh giá tính đồng nhất sự so sánh từng đôi một trị bình quân hoặc phương sai của chúng sẽ làm xuất hiện một loạt những giá trị của chỉ tiêu tương ứng chuỗi giá trị này cho phép ta đánh giá tính đồng nhất của các chuỗi nghiên cứu so với mức độ phù hợp của đường phân phối lý luận của các chỉ tiêu
đồng nhất được xét với đường thực nghiệm trong trường hợp các đường phân phối
đó phù hợp tất thì giả thiết đồng nhất được công nhận là đúng trong trường hợp các
đường phân phối đó không phù hợp thì giả thiết đồng nhất bị loại Mức độ giữa phân phối lý luận và thực nghiệm có thể đánh giá bằng các chỉ tiêu phù hợp mà ta sẽ xét ở bài 3 chương này
4.1.2 Các bước chính phân tích tính đồng nhất chuỗi tài liệu quan trắc
Sự phân tích thống kê tính đồng nhất của các chuỗi tài liệu quan trắc bao gồm các bước chính như sau: xây dựng các giả thiết không vì giả thiết chệch, định mức ý nghĩa, chọn miền giới hạn, loại bỏ hay chấp nhận giả thiết Vì các bước đó về nguyên tắc không thể tách khỏi bất kỳ công trình nghiên cứu thống kê tính đồng nhất của các chuỗi tài liệu quan trắc nên chúng ta phải điểm qua chúng Trước hết,
ta giả thiết rằng các kết quả quan trắc là đồng nhất, khi chúng đều thuộc cùng một tổng thể Trong đó, tất cả tài liệu quan trắc được coi là độc lập trong nội bộ (hay nói một cách khác điều kiện chọn ngẫu nhiên đã được chấp thuận) cũng như giữa các chuỗi tài liệu quan trắc được nghiên cứu
Xây dựng các giả thiết không và giả thiết chệch.Bất kỳ một kết luận thống kê nào về tính đồng nhất của các chuỗi tài liệu quan trắc được phân tích xác
Trang 7suất Sự phân tích thống kê tính đồng nhất của các chuỗi tài liệu quan trắc được bắt
đầu từ giả thiết không có sự khác nhau giữa các tham số của các chuỗi đem ra so sánh (giả thuyết không) Khi đó thông thường người ta giả thiết rằng các chuỗi nghiên cứu có cùng một luật phân phối, điều này được rút ra từ nhận thức về bản chất hay từ kinh nghiệm tích luỹ từ trước, nhưng có thể chỉ khác nhau ở các tham số phân phối: trị bình quân, hệ số biến đổi và hệ số không xứng đối xứng Trong nhiều trường hợp, tất cả các tham số được kiểm tra theo giả thiết không Giả thiết đối lập
với giả thiết không là giả thiết chệch
Giả sử, cần phải đánh giá tính đồng nhất trị bình quân lượng nước của lớp tuyết phủ theo tài liệu của hai tuyến đo tuyết Trong đó x1,x2 là trị bình quân lượng nước của lớp tuyết phủ trên hai tuyến Trong trường hợp này giả thiết không là
2
1 x
x = còn giả thiết chệch có thể có ba; x1 ≠x2 hoặc x1 >x2 hoặc x1 < x2
Chọn mức sử dụng Mức sử dụng là giá trị xác suất rất nhỏ mà trong trường
hợp cụ thể có thể dùng làm đặc trưng cho các biến đổi có thực tế không thể có Sự xuất hiện một biến cố hiếm cho thấy tính chất không đúng đắn của giả thiết không, khi xác suất không giả thiết vượt mức sử dụng cho trước Lúc này với xác suất bằng mức sử dụng, thì giả thiết không có thể bị loại, mặc dù nó có thể là đúng hay như người ta thường gọi là phạm sai lầm loại một Trong trường hợp khác khi cho mức
sử dụng khá nhỏ có thể thu được giả thiết chệch không đúng hay phạm sai lầm loại hai Rõ rànglà không thể tránh sai lầm loại một và loại hai được Lúc này thường có
sự liều lĩnh Sự liều lĩnh phạm sai lầm loại một chỉ có thể giảm đi bằng cách tăng sai lầm khác Thông thường người ta lấy mức sử dụng với xác suất là 5,2 hoặc 1% Trong những trường hợp riêng mức sử dụng có thể lấy 0,1% và nhỏ hơn hoặc lớn hơn 5%
Mức sử dụng càng giảm xác suất loại bỏ giả thiết không giảm theo, khi đó giả thiết là đúng do đó xác suất phạm sai lầm loại một giảm đi Nhưng mức sử dụng càng giảm, miền các giá trị cho phép càng tăng, do đó xác suất chấp nhận giả thiết không được tăng lên, khi đó giả thiết này không đúng, hay xác suất phạm sai lầm loại hai tăng lên Mặt khác khi tăng mức sử dụng chúng ta sẽ làm tăng xác suất phạm sai lầm loại một (nghĩa là gải thiết không ban đầu bị loại mặc dù nó là đúng)
và tương ứng ta làm cho xác suất phạm sai lầm loại hai giảm đi
Trang 8Việc chọn mức sử dụng cần phải đặt ra khi kiểm tra tính đồng nhất các chuỗi thuỷ văn, khi phối hợp các kết quả có phạm sai lầm loại một và sai lầm loại hai Ngoài ra trong đó phải thường xuyên chú ý đến sai số của tài liệu gốc
Chọn miền tới hạn Việc chọn miền tới hạn được thực hiện như thế nào đó
để cho xác suất rơi vào miền này với độ chímh xác bằng mức sử dụng khi giả thiết là
đúng Miền bổ xung cho miền tới hạn thường được gọi là miền các giá trị cho phép hay miền sử dụng Việc lựa chọn miền tới hạn ứng với mức sử dụng cho trước cần phải dựa vào những hiểu biết khác nhau về bản chất và sự khác biệt được giả thiết trong các tham số phân phối của đại lượng nghiên cứu Hay nói một cách khác miền tới hạn được chọn sao cho xác suất rơi vào nó của chỉ tiêu là lớn nhất, khi đó giả thiết chệch là đúng; nghĩa là giả thiết đối lập với giả thiết không, xác suất mà thường
gọi là sức mạnh của chỉ tiêu càng lớn thì xác suất phạm sai lầm loại hai càng nhỏ
Với mức sử dụng cho trước ta có thể xét những miền tới hạn như sau: (h.4.1): 1- Miền khoảng lệch dương lớn là (I) ; 2- Miền khoảng lệch âm lớn là (II) ; 3- Miền giá trị tuyệt đối của khoảng lệch lớn là (III) ; 4- Miền giá trị tuyệt đối của khoảng lệch nhỏ là (IV)
Hình 4.1 Các miền tới hạn của chỉ tiêu (x’)
Chúng ta giải thích những điều đó bằng thí dụ như sau; giả sử ta quan tâm
đến tính đồng nhất của độ cao bình quân lớp tuyết phủ theo tài liệu của các tuyến đo trong rừng và ngoài đồng nằm ở vùng đồng nhất về địa vật Mức sử dụng ta lấy bằng 1% Xuất phát từ nhận thức logic thuần tuý có thể giả thiết rằng độ cao bình quân của lớp tuyết phủ ở trong rừng (x1 ) lớn hơn ở ngoài đồng (x2 ), vì ở trong rừng tác
động của gió bị yếu đi do đó ở trong rừng mật độ của tuyết nhỏ hơn và không bị thổi
đi Lấy x1 =x2 làm giả thiết không và x1 >x2 làm giả thuyết chệch Trong trường
Trang 9hợp này miền tới hạn nên là miền khoảng lệch dương lớn, vì chỉ có trong trường hợp
dó xác suất của chỉ tiêu đồng nhất rơi vào miền tới hạn là lớn nhất
Nếu như giá trị mẫu của chỉ tiêu rơi vào miền tới hạn thì giả thiết không là
đúng, và cần phải chấp nhận giả thiết chệch Trong các trường hợp nếu giá trị của chỉ tiêu rơi vào miền cho phép thì điều đó nghĩa là với tài liệu thực nghiệm này, không có cơ sở để loại bỏ giả thiết không vì vậy nó được chấp nhận trong mọi trường hợp cho đến khi các tài liệu bổ sung quan trắc được loại bỏ nó
4.1.3 Những chỉ tiêu đánh giá tính đồng nhất của trị bình quân
Sự phân tích các chỉ tiêu đồng nhất của trị bình quân ta sẽ bắt đầu từ trường hợp mất hay gặp là trị bình quân mẫu được phân phối theo luật chuẩn ĐIều
đó xảy ra khi phân phối của các chuỗi gốc tuân theo luật chuẩn hoặc các chuỗi tài liệu quan trắc được rất dài, vì trong trường hợp này ngoài sự phụ thuộc vào luật phân phốicủa các chuỗi gốc, phân phối của trị bình quân mẫu tiệm cậnvới phân phối
chuẩn
Ta sẽ đánh giá tính đồng nhất của các chuỗi tài liệu quan trắc được gồm có:
nx và ny số hạng Giả sử các chuỗi đó là các mẫu của tổng thể phân phối chuẩn Khi
đó tính kiểm tra tính đồng nhất của trị bình quân có thể lấy giá trị chỉ tiêu (z)
) x y (
x y x
2 x x
y
(
nn
Trang 10Trị bình quân dối với miền gò đầm là x=20,28m, còn đối với miền cây bụi thông là y=10,34m
Ta lấy x=y làm giả thiết không Còn x khác y làm giả thiết chệch Miền tới hạn lấy là miền giá trị tuyệt đối của khoảng lệch lớn (miền III trên hình 4.1)
Khoảng lệch quân phương đối với các chuỗi thành phần quan trắc được
σx=8,6m và σy=4,6m theo công thức (4.2) ta tính được:
33,0024,0082,0900
6,4900
6,
) y
94,933
,0
34,1028,20
Với giả thiết không x= y chỉ tiêu này được phân phối theo luật chuẩn vì các
chuỗi nghiên cứu có số lượng số hạng khá lớn (900 lần đo) Trong trường hợp này sử dụng bảng phân phối chuẩn với mức sử dụng cho trước chẳng hạn bằng 5% ta sẽ tìm
được khoảng miền cho phép của các khoảng lệch được giới hạn từ -1,96 đến1,96 Miền tới hạn nằm về hai phía của miền đó(>1,96 và <-1,96) Chỉ tiêu vừa nhận được z=30 lớn hơn rất nhiều so với giới hạn trên của miền tới hạn do đó nó nằm trong miền này Trong trường hợp này giả thuyết không phải loại bỏ mà chấp nhận giả thuyết chệch x≠ y
Khi sử dụng chỉ tiêu ta đang nghiên cưú phải giả thuyết rằng các giá trị độ cao mặt cầu vì cảnh quan đo đạc được không có tương quan nội tại và giữa các chuỗi nối tương quan giữa các bề mặt của các vi cảnh quan khác nhau không có
được rút ra từ các nhận biết chung về sự hình thành địa hình nghiên cứu Với điều kiện đó thì những đo đạc bề mặt vi cảnh quan được tiến hành khá dày (cách 10cm ) theo trắc diện, ta có thể dự đoán là chuỗi độ cao bề mặt của đầm lầy có mối tương quan nội tại khá lớn, điều đó đã được tính toán xác nhận Vì vậy kết luận độ cao bình quân của các vi cảnh quan đầm lầy khác nhau không đồng nhất không xét tới mối tương quan nội tại của chuỗi , chỉ nên coi là sơ bộ
Trang 11Bất đẳng thức giữa độ cao bình quân bề mặt đầm lầy với mực gia định ngày nay là phù hợp với nhận thức vệ bản chất về sự hình thành vi cảnh quan trên các gò
đầm
Chỉ tiêu đánh giá tính đồng nhất của trị bình quân nên sử dụng đối với các chuỗi có số hạng khá lớn, khi đó mới có khả năng tính được khoảng lệch quân phương không có sai số lớn Trong trường hợp khi chuỗi quan trắc ngắn cần phải kiểm tra tính đồng nhất của trị bình quân, có thể dùng chỉ tiêu Student được Song khi đó cần phải chú ý rằng chỉ trong khoảng lệch quân phương của tổng thể và các chuỗi bằng nhau σx=σy=σ thì dùng nó mới đúng
Các phương pháp đánh giá tính đồng nhất của các chuỗi quan trắc được đối với sự cân bằng khoảng lệch quân phương với tổng thể của chúng sẽ được xét đến ở mục sau của phần này
Chỉ tiêu Student được viết dưới dạng
y x
y x y x y
2 x
)2nn(nnnn
xyt
+
ư++
Để minh hoạ điều vừa phân tích ta sẽ xét tính đồng nhất của các chuỗi bình quân dòng chảy năm sông Volga - trạm iarôxlavl trước và sau(năm 1940) xây dựng kho nước điều tiết dòng chảy theo mùa nằm ở tuyến đo này Trị bình quân dòng chảy năm trong thời đoạn thứ nhất (1877 - 1940) bằngx = = 1120m3/strong thời
đoạn thứ hai (1941 - 1955) bằng y = 1060m3/ s Ta lấy x = y làm giả thuyết không, còn x > ylàm giả thuyết chệch Khoảng lệch quân phương tương ứng bằng
75600
x =
phương sẽ được kiểm tra ở phần sau của mục này
Trang 12Theo công thức (4.3) ta đã tính được ghi nhận dược sự biến đổi của các phương sai mẫu Do đó, nói đúng hơn ,chỉ tiêu này được dùng để đánh giá tính đồng nhất của trị bình quân mẫu Chỉ tiêu Wincooson dựa vào sự kiểm kê số lượng nghịch thế xuất hiện trong kết quả của một thủ pháp này
Những tài liệu quan trắc được tạo nên hai mẫu (thí dụ như các tài liệu này thu nhập được ở hai trạm so sánh ), ta đem những giá trị của chúng phân bố trong chuỗi trung theo trật tự giảm dần (hoặc tăng dần ) thí dụ như: y1x1x2y2y3y4x3y5y6x4
Trong đó x1, x2, x3 và x4 những số lượng của mẫu thứ nhất ; y1, y2 y6những số hạng của mẫu thứ hai
Nếu như một giá trị y đứng trước giá trị x nào đó tạo nên sự nghịch thế (với
y4,y3, y2và y1, ) và x4 cho ở nghịch thế (với y6, y5, y4, y3, y2 và y1) trong trường hợp này toàn bộ nghịch thế sẽ bằng u = 1+1 + 4 + 6 = 12 Lý thuyết đã chứng minh được rằng trong các chuỗi đồng nhất, mỗi chuỗi được coi là một mẫu có dung lượng lớn hơn 10 số hạng, thì số lượng các nghịch thế được phân phối gần như luật chuẩn với
kỉ vọng toán
2
n m ) u
(
và phương sai
)1nm(12
n.m)
64
) 2 15 64 ( 15 64 72100
15 75600
64
1060 1120
+
ư + +
Trang 13So sánh t và tq,k ta thấy rằng ngay cả mức sử khá lớn bằng 5% tq,k > t cho nên các chuỗi đem đánh giá không thể coi là không đồng nhất được Trong trường hợp này giả thuyết không, được chấp nhận, còn giả thuyết chệch bị loại ở đây miền giá trị tuyệt đối lớn của khoảng chệch được lấy làm miền tới hạn
Vì vậy, kho nước Rưbinski điều tiết dòng chảy theo mùa không có ảnh hưởng
đến trị bình quân của dòng năm, còn sự khác biệt ở trị quân ở các thời đoạn nghiên cứu có thể là do những dao động ngẫu nhiên của các chuỗi có độ dài hữu hạn
Chỉ tiêu đồng nhất Student của trị bình quân đã xét ở trên thuộc loại chỉ tiêu tham số, cho nên ứng dụng nó cần phải dùng luật phân phối chuẩn đối với mẫu nghiên cứu
Trong số các chỉ tiêu không tham số đánh giá tính đồng nhất của trị bình quân, thì chỉ tiêu đồng nhất Wilcoxen thường dùng để ghép hai mẫu vào trong một tổng thể Thực tế, chỉ tiêu này khá nhậy đối với trị bình quân mẫu nhưng hầu như không
Bây giờ cần phải chọn giới hạn của các giá trị cho phép để tách miền tới hạn
ra Khi cho mức sử dụng q = 0.1;1,0; 5% v.v Ta tách ra được miền giá trị lớn nhất của khoảng lệch, trong trường hợp xác suất rơi vào miền đó, thì khi đó giả thuyết
đồng nhất là đúng với độ chính xác bằng mức sử dụng Lúc đó, xác suất rơi vào miền giá trị cho phép, với giả thuyết của chúng ta là đúng sẽ bằng:
β=(100-q).%
Xác suất β được gọi là mức tin cậy
Nếu giá trị của chỉ tiêu tính theo tài liệu quan trắc rơi vào miền tới hạn thì giả thuyết không của tính đồng nhất bị loậi, và giả thuyết chệch của tính đồng nhất được chấp nhận với xác suất β
Nếu chính giá trị đó của chỉ tiêu rơi vào miền khoảng lệch so với kì vọng toán cho phép, thì có thể khẳng định rằng giả thuyết - không là đúng
Miền tới hạn đối với giả thuyết - không của tính đồng nhất là miền giá trị tuyệt đối lớn của khoảng lệch
Trang 14u p
t ) u ( M
u p
t ) u ( M
Trong đó σu = D(u); tp - khoảng lệch chuẩn hoá ứng với mức sử dụng q
Ta nhận thấy rằng chỉ tiêu đồng nhất Wincooson chỉ thích ứng với bài toán so sánh hai mẫu (hai chuỗi quan trắc ) hoậc dùng để so sánh từng cặp mẫu của S điểm quan trắc trên một vùng được giả thiết là đồng nhất
Những khái quát hoá của chỉ tiêu này cho những trường hợp số mẫu lớn hơn hai là rất phức tạp và tốn công Sự mong muốn có độ chính xác toán học làm cho tính toán thống kê của các chỉ tiêu và giá trị tới hạn của nó trở nên rất phức tạp
ĐIều đó làm khó khăn cho việc ứng dụng các chỉ tiêu này và làm cho chúng kém hiệu quả Thí dụ như chỉ tiêu Kruxkal-Uolix chỉ có thể dùng đối với trường hợp số mẫu không lớn hơn ba (3) và dung lượng của các mẫu đó không nhiều hơn năm (5)
Ta sẽ minh hoạ việc sử dụng chỉ tiêu Wincooson để đánh giá tính đồng nhất của dòng chảy lớn hơn trong năm nước sông Volga - trạm iaroxlavl trong các thời
kỳ chảy tự nhiên (1877 - 1910) và được điều tiết (1941 - 1955)
Ta đem phân bố lưu lượng lớn nhất của toàn bộ thời kì kì quan trắc được theo trật tự giảm dần trong đó lưu lượng nước của thời kì từ 1941 đến 1955 được đưa vào trong dấu ngoặc:
1160, 1080, 1060, 976, 966, 960, 948, 931, 928, 92, 906, 906, 886, 881, 881,
875, 863, 859, 854, 850, 850, 813, 811, 809, 805, 803, 800, 781, 752, 723, 716, 694,
683, 669, 866, 662, 659, 638, 634, 630, 629, 626, 610, 605, 592, 589, 581, 577, 575,
564, 555, 551, 551, 52, 474, (459) , 453, 423, 419, 416, 416, 406, 367, (330), (210), (198), (193), (188), (182), (177), (163), (154), (148), (140), (133), (122)
Ta tính số lượng nghịch thế:
u = 57.1 + 64.14 = 953
Theo các công thức (4.4) và (4.5) tìm được M(u) và D(u):
480 2
15 64 ) u
(
Trang 1511564(12
15.64)
u
(
806400)
u(D
σ
Ta xác định miền tới hạn cho giả thuyết không, nghĩa là sự đồng nhất sự phân phối các trị bình quân dòng chảy lớn hơn nước sông Volga - trạm Iaroxlav trước và sau khi xây dựng nhà máy thuỷ điện Rubinxkaia Ta cho mức sử dụng bằng 1% và theo bảng tính sẵn cho công trình [89] tìm được tp = 2,58 khi p = 0,05 vì xét giới hạn tin cậy hai đầu Theo các phương trình (4.7) và (4.8) ta nhận dược các miền tới hạn đối với:
68680
.58,2480
u
27480
.58,2480
u
=+
Sự đánh giá hai trị bình quân mẫu cùng thuộc một tổng thể có thể thực hiện theo chỉ tiêu dấu Cũng như trường hợp trên coi trị bình quân mẫu của hai chuỗi cùng thuộc một tổng thể làm giả thuyết không Trong trường hợp này, các hiệu số xi
- yi =Ri, trong đó chỉ xét dấu của chúng, cần phải đấu nối quanh số không Xác suất xuất hiện dấu cộng hoặc dấu trừ đều bằng 1/2 Vì vậy, khoảng lệch của hiệu số quan trắc dược (chỉ xét dấu của chúng ) khác 1/2 thì giả thuyết không không được thực hiện Giá trị tới hạn của một số ít trường hợp khoảng lệch dương hoặc âm được tính theo công thức :
1Nk2
1N
Trong đó N - số hạngcủa các chuỗi đem so sánh ; k - giá trị lấy theo bảng đặc biệt ứng với mức sử dụng trong [89]
Thực tế sử dụng chỉ tiêu này khá đơn giản Song cần phải thấy rằng nó không
sử dụng toàn bộ lượng thông tin trong các chuỗi quan trắc được vì nó chỉ xét dấu của hiệu hai giá trị Chỉ tiêu này có ưu điểm là đơn giản và không có hạn chế nào về luật
Trang 16phân phối của các chuỗi nghiên cứu Khi sử dụng chỉ tiêu này các chuỗi quan trắc
được đem so sánh cần phải có dung lượng
Ta sẽ so sánh tài liệu về độ cao lớp tuyết phủ theo quan điểm đồng nhất chúng và có sử dụng chỉ tiêu dấu
Trong bản đo vẽ lớp tuyết phủ tiến hành đồng thời ngoài đồng và trong rừng
đã đo được độ cao của lớp tuyết phủ ở 120 điểm So sánh các chuỗi đó ta thấy có 26 trường hợp độ cao lớp tuyết phủ ngoài đồng lớn hơn trong rừng kN (+) còn 76 trường
- nhỏ hơn kN (-)
Theo công thức (4.9) ta xác định được giá trị tới hạn đối với số ít các trường hợp (26)
41110298,02
1102
Trong trường hợp không đồng nhất
k,m)
(
còn khi các chuỗi đồng nhất
k,m)(
điều kiện bổ xung tài liệu gốc (các chỉ tiêu tham số) ; các chỉ tiêu kém hiệu nghiệm hơn Nhưng đơn giản hơn chủ yếu là yêu cầu ít hơn đối với các điều kiện của lượng thông tin gốc ( các chỉ tiêu không tham số ) Sự phân tích khá đầy đủ và có hệ thống các chỉ tiêu đồng nhất đã được tiến hành chẳng hạn như trong cuốn sách của Van-
đen Var-đen [31]
Trang 17Trong thực tế nghiên cứu thuỷ văn người ta thường yêu cầu đánh giá tính
đồng nhất của số lớn trị bình quân để làm cơ sở cho việc kết hợp đứng đắn nhiều mẫu cụ thể vào một chuỗi
Trong các trường hợp đó, ngoài việc xác định tính đồng nhất của trị bình quân còn cần phải đánh giá tính đồng nhất của các hệ số biến đổi và hệ số không đối xứng
Chính trong trường hợp này, vấn đề được giải quyết là có sự khác nhau giữa các trị bình quân mẫu , hay chỉ là những dao động ngẫu nhiên của trị bình quân do các mẫu có đúng lượng ngắn
Để làm chỉ tiêu chúng ta sử dụng mối quan hệ tuân theo luật phân phối Student có số bậc tự do k = n - 2
2 m
m
my m n
) 2 n ( m y
= - trị bình quân mẫu tính theo m giá trị quan
trắc được ,là khoảng lệch lớn nhất so với trị bình quân của tất cả chuỗi liên kết, x - trị bình quân của tất cả chuỗi gồm n giá trị quan trắc được; n = ∑ mi; σ-khoảng lệch quân phương theo tài liệu của tất cả các chuỗi
Để đặc trưng cho tính đồng nhất của trị bình quân mẫu x m , thông thường người ta chọn giá trị ym lớn nhất nếu tham số t trong trường hợp ym này rơi vào miền các giá trị cho phép ứng với mức sử dụng q cho trước thì tất cả các trị bình quân xm
được coi là đồng nhất Trong trường hợp ngược lại, giá trị lớn nhất đó được coi là không đồng nhất đối với tất cả chuỗi tài liệu, và khi cần thiết phải nghiên cứu tính
đồng nhất của giá trị xm lớp tiếp sau
ứng dụng chỉ tiêu này vào đành giá tình đồng nhất của một số chuỗi cần phải
đánh giá sơ bộ tính đồng nhất của phương sai
Để làm thí dụ, chúng ta xét tính đồng nhất của các chuỗi đặc trưng lượng trữ nước trong lớp tuyết phủ ở những miền rừng trong lưu vực sông sêlôn đo đạc ở 5 tuyến Trên mỗi tuyến đo 8 điểm
Trang 18Bảng 4.1Trị bình quân và phương sai lượng trữ nước trong tuyết của các tuyến đo
Trị bình quân cho tất cả các chuỗi theo (1.6) bằng 104 mm
Phương sai chung có thể xác định theo công thức (1.18) dạng
2
k 1 i
2 ) i ( k
1 i
2 i 2
k
) x i x (
ư +
104113x
xy
chung
m 1
) 2 40 ( 5 30 , 0
sử dụng 5% cho nên các trị bình quân của những chuỗi nghiên cứu là đồng nhất
Việc đánh giá tính đồng nhất của phương sai của các chuỗi đó được trình bày
ở phần sau đây
4.1.4 Những chỉ tiêu đánh giá tính đồng nhất của độ lệch quân phương
Như đã thấy ở trên, khi đánh giá tính đồng nhất của mẫu trị bình quân theo phương pháp Student nhất thiết phải chứng tỏ độ lệch quân phương của chính các tổng thể đó, mà đại biểu các mẫu dưới dạng các chuỗi thuỷ văn, là bằng nhau Khi ta
Trang 19kết hợp các chuỗi thuỷ văn hay tham số của chúng vào một chuỗi hoặc đôi khi, chẳng hạn như, cần phải làm rõ phải chăng sự điều tiết dòng chảy làm thay đổi độ lệch quân phương của chuỗi v.v nhất thiết phải có sự phân tích như vậy
Ngày nay như đã biết không ít chỉ tiêu đánh giá tính đồng nhất của khoảng lệch quân phương Trong thuỷ văn người ta chỉ sử dụng một số ít trong các chỉ tiêu
đó, và thường hay dùng là chỉ tiêu Fisher dưới dạng :
2 2
ở tử số của biểu thức (4.11) là khoảng lệch quân phương lớn nhất trong hai chuỗi đem nghiên cứu phân phối Fisher phụ thuộc vào số bậc tự do k1 = n1 - 1 và k2
= n2 - 2 ; trong đó n1 và n2 - số số hạng trong mỗi chuỗi nghiên cứu
Để xác định những giá trị tới hạn Fk ta sử dụng bảng phân phối Fisher đã
từ năm 1941 đến năm
còn72100
được giữa các giá trị khoảng lệch quân phương mẫu là thực hay có thể là do những
x =σ
Trang 20dao động ngẫu nhiên của các mẫu có dung lượng hữu hạn trong tổng thể gây nên Ta lấy σ2x = σ2y làm giả thuyết không
Để đánh giá tính đồng nhất của khoảng lệch quân phương ta sử dụng chỉ tiêu này Theo công thức (4.1) ta tính được :
72100
75600
Chỉ tiêu này tuân theo phân phối Fisher có số bậc tự do k1 = 64 - 1 = 63 và k2
= 15 - 1 = 14 Cho bảng phân phối r[89] khi q = 10 và 2% ta định được miền tới hạn
Fth, mad đối với k = 63 được nội suy giữ các giá trị k1 = 50 và k1 = 75, với mức sử dụng 10% F10% = 2,23, với mức sử dụng2%; F2%=3,18 Vì vậy giá trị mẫu r = 1,05 nằm trong miền các giá trị cho phép ứng với bất kỳ mức sử dụng nào đó mà ta chọn, vì thế giả thiết về sự bằng nhau giữa các khoảng lệch quân phương là không mâu thuẫn với tài liệu dòng chảy năm quan sát được ở sông Volga - trạm Iarôxlav
Ta cũng sử dụng chỉ tiêu F để đánh giá tính đồng nhất của khoảng lệch quân phương lưu lượng lớn nhất trong năm nước sông Volga - trạm Iarôrlav trước và sau khi xây dựng kho nước điều tiết dòng chảy mùa Rưbinskj
Khoảng lệch quân phương lưu lượng lớn nhất trong giai đoạn 1877 - 1940 là 3354000
1 =
σ còn trong giai đoạn từ năm 1941-1955 là σ2 = 795200 Theo công thức (4.11) ta nhận được:
22,4795200
3354000
Để làm giả thuyết không ta lấy σ1 = σ2, còn giả thuyết chệch lấy σ1≠σ2 Do
số lượng của chuỗi trong mỗi thời kỳ cũng đúng như đối với dòng chảy năm, nên ta
có k1 = 63 và k2 = 14 Vì vậy những giá trị tới hạn Fth khi mức sử dụng bằng 10 và 2% cũng tương tự như thí dụ trên là F10% = 2,23 và F2% = 3,18
Giá trị nhận được của chỉ tiêu F bằng 4,22 ngay cả khi mức sử dụng là 2% nằm trong miền tới hạn (Fth<F) Từ đó, ta rút ra là khoảng lệch quân phương thực nghiệm nhận được từ những tổng thể khác nhau không thể coi là đồng nhất được Nói một cách khác giả thuyết ở trên bị loại, mà chấp nhận giả thuyết chệch vè tính
Trang 21không đồng nhất của khoảng lệch quân phương dòng chảy lớn nhất nước sông Volga
- trạm Iarôrlavl trước và sau khi xây dựng nhà máy thuỷ điện Rưbinskcia
Khi phân tích tài liệu thuỷ văn, thông thường phải đánh giá đồng nhất các khoảng lệch quân phương của một số các chuỗi quan trắc
Chỉ tiêu đơn giản kiểm tra tính đồng nhất của một khoảng lệch quân phương
ta có thể sử dụng chỉ tiêu G2 được biểu diễn bằng quan hệ:
2 k
1 2
2 1
max 2
G
σ + + σ + σ
σ
trong đó σ max - khoảng lệch quân phương lớn nhất trong các khoảng lệch quân phương thực nghiệm σ1, σ2, σk - các khoảng lệch quân phương tính theo các chuỗi tài liệu quan trắc được
Chỉ tiêu đồng nhất này ta sử dụng đối với các chuỗi nghiên cứu có cùng dung lượng Trong cuốn khả cổ [89] đã trình bày phân phối chỉ tiêu Gt2 với k mẫu và số hạng trong mỗi mâu là n ứng với các mức sử dụng là 5 và 1% Miền tới hạn là Gt2.h
<G2
Thí dụ sử dụng chỉ tiêu (4.12) để đánh giá tính đồng nhất của phương sai lượng trữ nước trong các lớp tuyết phủ theo tài liệu đã trình bày ở bảng 4.1
28 , 0 1129 676 967 218 590
1129
+ + + +
Cuối cùng ta sẽ sử dụng chỉ tiêu khác nhau để đánh giá tính đồng nhất đối với cùng một tài liệu về dòng chảy lớn nhất Việc xác định lưu lượng lớn nhất trong năm ứng với xác suất vượt cho trước là nằm trong số những bài toán rất phổ biến trong tính toán thuỷ văn Trong trường hợp này, khi chuỗi gốc không có nghi ngờ gì
về tính đồng nhất của các giá trị chứa trong nó, bài toán này giải bằng cách dựa vào toàn bộ mẫu có được mà xây dựng đường tần suất Tình trạng này có thể có, nếu như
Trang 22chuỗi tài liệu bao gồm các giá trị đồng nhất về pha đối với lũ mùa xuân hoặc ngược lại hoàn toàn thuộc về phạm trù lũ do mưa
Điều đó tất nhiên là đúng khi không có những nguyên nhân khác phá hoại trạng thái đồng nhất của tài liệu gốc (thí dụ như sự điều tiết dòng chảy bằng kho nước hoặc những tác động khác theo một hướng)
Song có những trường hợp hay gặp là trên cùng một tuyến đo, lưu lượng lớn nhất trong năm có những năm được hình thành do tuyết tan, có những năm là do mưa Sự khác nhau của điều kiện hình thành đó có thể tạo nên tính không đồng nhất
về mặt thống kê của chuỗi tài liệu gốc quan trắc được Điều đó làm phức tạp hoá bài toán xây dựng dường tần suất theo các mẫu, vì vậy mà những hàm phân phối lý luận xét ở chương II cũng như tất cả những hàm phân phối lý luận nói chung, đều được dùng mô tả các chuỗi thống kê đồng nhất
Trong những trường hợp cụ thể (tất nhiên không chỉ đối với mẫu thống kê lưu lượng lớn nhất) khi không có sự tin cẩytên nghiên cứu về tính đồng nhất của tài liệu gốc thì phải đánh giá tính đồng nhất của chúng Trong trường hợp nếu giả thuyết đồng nhất không được chấp nhận đường tần suất lại phù hợp tất cả chuỗi (không đồng nhất có thể nhận được bằng cách xếp chồng những phân đồng nhất hai,
ba có thể nhiều hơn ) được tách ra từ các chuỗi không đồng nhất Trong phương pháp xây dựng đường tần suất đó sẽ được phân tích ở phần sau của cưhơng này
Để làm thí dụ ta sẽ xét lưu lượng lớn nhất nước sông Xtrưi - trạm Turk và sông Alava - trạm Xixien đã được trình bày ở bảng 4.2 Từ những tài liệu đó ta thấy lưu lượng lớn nhất ở những tuyến nghiên cứu có những năm được hình thành do tuyết tan mùa xuân (đánh dấu bằng dấn ngoặc đơn), còn những năm khác là do mưa Với đặc trưng đó mỗi mẫu có thể tách ra làm 2 phần Đối với sông Xtrưi lưu lượng lớn nhất trong 43 năm quan trắc được có 24 lần được hình thành trong thời kỳ mùa xuân và 19 lần trong thời kỳ hè thu đối với sông Abava lưu lượng lớn nhất trong năm do tuyết tan mùa xuân quan trắc được 20 lần còn 15 lần là do mưa
Đối với các chuỗi đã đựoc tách ra lưu lượng lớn nhất mùa xuân và hè thu các thám số của phân phối đã được tính toán và trình bày trong bảng 4.3
Ta sẽ làm sang tỏ những giá trị tham số vừa nhận được thuộc các chuỗi đồng nhất hay không đồng nhất
Trang 23B¶ng 4.2 Sè liÖu gèc vª lưu lưîng dßng ch¶y lín nhÊt trong n¨m s.Xtrưi vµ S.Abava - tr¹m Xixien
SXtrưi - tr¹m Turk F = 897 km2 SXtrưi - tr¹m Turk F = 897 km2
N¨m Qmax (m3/s) Ngµy th¸ng N¨m Qmax (m3/s) Ngµy th¸ng
335 (143)
239 (114)
281 (174) 88,4 (446)
268
385
515 (238)
222
222 (330)
146
103
291 (107) (155) 57,8 89,1 (191) (188) (303)
30/IV 4/III 24/III 24/II 3/VIII 11/III 19,22/VII 1/IV 9/I 3/III 6/VI 25/III 28/VI 24/X 31/VIII 30/III 14/VII 26/IX 5/IV 8/VII 5/XI
8/III 20/V; 22/VI 20/XI 8/VIII 24/IV 9/IV 17/III 21/I 23/II 14/III 25/III 6/II 11/II 15/IV 16/IV 12/IV
119
239 (222)
198 (114) (222) (93) (299)
395 (359) (77,3) (137) (396)
155 (108) (206) (143)
190
213
121
108 61,0 (125) (119) (164) (146)
235 89,4 (306) (149) (158) 62,6
172 (258) 94,6 (174) (79,6) 88,6
101 (242)
12/III 12/IV 23/I 20/VIII 10/III 13/VI 20/IV 18/VI 6/IV 23/II 17/VII 8/IV 28/2 15/III 2/IV 1/I 5/III 25/III 15/IV 23/VI 23/IX 4/VIII 28/VII 18/II 11/V 4/IV 24/III 1/IV 4/II 16/XI 9/IV 12/IV 27/III 22/I 1/V 26/IV 21/IV 18/IV 9/III 7/XII 7/XII 8/IV
Chó thÝch: trong dÊu ngoÆc lµ lưu lưîng lín nhÊt nưíc lò mïa xu©n
Trang 24Sử dụng chỉ tiêu Fisher ta đánh giá tính đồng nhất các khoảng lệch quân
phương đối với sông Xtrưi
02,19777
2 mua
Miền tới hạn đối với chuỗi lưu lượng lớn nhất trong sông Xtrưi với mức sử
dụng 5% bằng F5%= 2,07; lấy theo bảng tính sẵn trong công trình [89] với số bậc tự
do đối với phương sai lớn bằng k1 = n1 - 1=18 đối với phương sai lớn bằng k2=n2
184
128
66,7 66,6
Đối với chuỗi lưu lượng lớn nhất trong năm sông Abava miền tới hạn bằng
k5% = 2,26 với k1 = 14 và k2 = 19 Trong cả hai trường hợp những giá trị của chỉ tiêu
F rới vào trong miền tới hạn ứng với mức sử dụng 5% điều lớn nhất giá trị ta vừa
nhận được Điều đó nghĩa là trong trường hợp này chỉ tiêu đồng nhất rơi vào miền
những giá trị cho phép Vì vậy, giả thuyết không ban đầu thừa nhận lưu lượng lớn
trong năm do lũ mùa xuân và lũ do mưa có phương sai đồng nhất, trong trường hợp
này không có gì mâu thuẫn vỡi tài liệu quan trắc có thể chấp nhận hơn nữa cho đến
nay những tài liệu thực nghiệm mới lại khẳng định phủ định đó
Bây giờ ta chuyển sang đánh giá tính đồng nhất của trị bình quan của các
chuỗi nghiên cứu, trong đó ta nhận thấy rằng trong các chuỗi nghiên cứu không có
tương quan nội tại và tương quan giữa các chuỗi vừa được tách ra của dòng chảy lớn
nhất do mưa và dòng chảy lớn nhất do lũ mùa xuân đối với mỗi tuyến nghiên cứu
Trang 25Để giải quyết vấn đề đồng nhất của trị bình quân ta sẽ sử dụng chỉ tiêu Student Khi sử dụng chỉ tiêu này như đã rõ ở trên, yêu cầu cần phải đảm bảo đồng nhất phương sai của tính chuẩn của luật phân phối của các chuỗi tài liệu gốc
Điều kiện đồng nhất của phương sai đã được xác minh ở trên Điều kiện chuẩn của luật phân phối có thể kiển tra bằng các chỉ tiêu phù hợp giữa phân phối thực nghiệm và lý luận, mà ta sẽ xét ở bài 3 của chương này ở đây ta chỉ nhấn mạnh rằng việc sử dụng các chỉ tiêu không tham số không phụ thuộc vào dạng các phân phối gốc, xác nhận những kết luận nhận được theo chỉ tiêu Student Điều đó chứng minh rằng: trong trường hợp này sự lệch so với luật chuẩn là không cơ bản,
để ảnh hưởng đến kết quả cuối cùng trong đánh giá tính đồng nhất của trị bình quân bằng cách sử dụng chỉ tiêu Student
Ta tính chỉ tỉêu Student cho sông Xtrưi - trạm Turk
09,119
24
)21924(19.249,99.199,98.24
210244n
n
)2nn(nnn
y x
y x y x 2 y y
2
x
x
≈+
ư++
ư
=+
ư+σ
20
) 2 15 20 ( 15 20 4455 15 4439 20
128 184
+
+ + +
Vì vậy, giả thuyết đồng nhất trị bình quân lưu lượng nước lớn nhất của lũ mùa xuân và lũ do mưa đối với sông Xtrưi - trạm Turk đã được xác nhận, còn đối với sông Abava trạm Xixien đã bị loại và chấp nhận giả thuyết - chệch Tính không
đồng nhất đó là do các điều kiện hình lũ mùa xuân và lũ do mưa khác nhau
Trang 26Với sự phân tích trên, đường tần suất lưu lượng lớn nhất nước sông Xtrưi có thể xây dựng bằng phương pháp bình thường có sử dụng tất cả các chuỗi, còn đối với sông Abava việc xây dựng đường tần suất lưu lượng nước lớn nhất cần phải xét
đến yếu tố không đồng nhất của mẫu Phương pháp xây dựng đường tần suất này đã
được phân tích ở mục sau của chương này
Để đánh giá tính đồng nhất của trị bình quân lưu lượng lớn nhất lũ mùa xuân
và lũ do mưa ta có thể sử dụng thêm chỉ tiêu không tham số Wincooson, ít ưu điểm hơn so với chỉ tiêu Student, nhưng do không bị giàng buộc bởi điều kiện các chuỗi tài liệu gốc phải tuân theo các luật phân phối chuẩn
Ta thấy rằng ưu điểm của chỉ tiêu Wincooson không kém mấy so với chỉ tiêu Student
Như vậy tài liệu của Vanđer [31] hiệu ích tiệm cận của chỉ tiêu Wincooson chiếm 3/π ≈21/22 so với chỉ tiêu Student
Vì vậy, chỉ tiêu Student cùng với các chuỗi có 21 số hạng, và chỉ tiêu Wincooson cùng với các chuỗi có 22 số hạng chỉ được ước lượng ngang nhau về ưu
Đối với sông Abava - trạm Xixien:
57,8; 61,0; 62,6; (79,6); 88,6; 89,1; 94,6; 101;
Trang 27103; 105; (107); (119); (125); (137); (146); (146)
(149); (155); (158); (164); 172; (174); 179; (183); (188) (191); (207); 235; (242); (258); (291); (303); (306); (316); Những lưu lượng lớn nhất nằm trong dấu ngoặc đơn và thuộc về lũ mùa xuân
Ta tính số lượng nghịch thế của các lưu lượng lớn nhất trong năm do mưa:
Đối với sông Xtrưi:
n m
; 2
n m
Đối với sông Xtrưi
57 39
; 228 2
19 24
Trang 28Ta tính giới hạn tới hạn ứng với các mức sử dụng là 5% cho sông Abava
30
; 150 2
15 20
Không xét các chỉ tiêu đồng nhất của trị bình quân khác nữa, ta nhận thấy rằng, khi sử dụng tất cả các chỉ tiêu đó thường nhận được cùng một kết quả, và vì vậy nếu sử dụng những chỉ tiêu có ít hạn chế trơn về lượng thông tin gốc (thí dụ như các chỉ tiêu không tham số không phụ thuộc vào các dạng của phân phối gốc, và đơn giản trong tính toán hay dễ dàng đưa vào MTĐT) Tất nhiên khi đó phải chú ý đến hiệu lực của chỉ tiêu trong các điều kiện giống nhau khác, nên chọn các chỉ tiêu có hiệu lực hơn
Như vậy cuối dòng chảy lớn nhất trong năm nước sông Strưi - trạm Turk
được công nhận là đồng nhất, trong khi đó lưu lượng lớn nhất trong năm nước sông Abava - trạm Xixien không thể coi là đồng nhất đựơc ở trường hợp sau, việc xây dựng đường tần suất lý luận không thể thực hiện bằng cách thông thường được
4.1.5 Xây dựng đường tần suất theo các mẫu không đồng nhất
Trong các trường hợp khi các chuỗi tài liệu quan trắc được là những chuỗi thống kê không đồng nhất, việc ứng dụng các đường phân phối lý luận dưới dạng như phân tích ở chương II sẽ không đạt được sự phù hợp giữa đường tần suất lý luận với sự phân bố cá điểm thực nghiệm Nói một cách khác, các đường tần suất lý luận,
được xây dựng trên giả thuyết đồng nhất sẽ không thoả mãn với luật phân phối phức tạp Với tình hình đó ta nhận sử dụng phương pháp tổ hợp do A.V.Nôsdestvenski [110] đưa ra sau đây sẽ được phân tích
Trang 29Ta biết rằng các phương pháp thống kê mô tả các phân phối không đồng nhất
có thể chia ra làm 2 loại giải tích về bản đồ giải
Những cơ sở có tính nguyên tắc của các phương pháp giải tích mô tả những phân phối không đồng nhất có sử dụng những phân phối thành phần, đọan (đồng nhất) đã được phan tích trong các công trình của G.H Brôkôvich và G.M.Vêlicanôv [30]; D.D.Kvaxôva và I.ta.Lêvin [62] và D.G.Blôkhinôv [23]
Song theo quan điển thực tế giải quyết vẫn đề đó đoen giản hơn cả và khá chính xác ta có thể sử dụng phương pháp bán đồ giải để chỉnh lý các chuỗi không
đồng nhất Thực chất của phương pháp này là tiến hành đồ thị hoá bổ đề của Brôcôvich và Vêlicnôv[30], theo bổ đề đường phan phối lý luận không đồng nhất
được coi như là tổng xác suất tỷ trọng theo dung lượng của các phân phối đồng nhất
k 2
1
k k 2
2 1
1 x
n
nn
)x(Pn
)x(Pn)x(Pn)x
(
P
+++
+++
trong đó p*x - đường tích phân phân phối lý luận hay đường tần suất của chuỗi - tổng không đồng nhất; n1; n2 nn - dung lượng của các chuỗi đồng nhất;
P1(x), P2(x) Pk(x) - đường tần suất của các phân phối đồng nhất
Chứng minh công thức (4.13) phải dựa vào việc sử dụng các định lý cộng và nhân xác suất
Vậy, ta sẽ xét một trường hợp đơn giản nhất, tổ hợp hàm phân phối không
đồng nhất Lúc này ta có:
2 1
2 2 1
1
n n
) x ( P n ) x ( P n ) x
2 1
2 1
2 =+
Xác suất của một giá trị cụ thể x1 ứng với tần suất P1(x1) thuộpc chuỗi P1(x) theo định lý nhân xác suất bằng:
Trang 30) x ( P n n
n
i 1 2 1
+
vì
2 1
1
n n
n + là xác suất của biến ngẫu nhiên x thuộc chuỗi P1(x) còn p1(xi) là xác suất xuất hiện xi trong chuỗi P1(x)
Tương tự như vậy, xác suất của một giá trị cụ thể xi thuộc chuỗi P2(x) bằng
) x ( P n n
n
i 2 2 1
n )
xi ( P n n
n )
x
(
2 1
2 1
2 1
1
vì một giá trị cụ thể xi bất kỳ có thể thuộc chuỗi P1(x) hoặc chuỗi P2(x) Khái quát hoá chứng minh trên cho trường hợp chuỗi không đồng nhất ta nhận được đẳng thức (4.13) mà Brôcôvich và Vêlicanôv [30] đã sử dụng để đánh giá
sự phù hợp của các phương trình đường phân phối với taì liệu thực nghiệm dòng chảy sông ngòi
Biển thức (4.13) có thể sử dụng để mô tả toán học các chuỗi thống kê không
đồng nhất, điều đó sẽ được minh hoạ ở một số ví dụ sau
ở bài 1 chương II khi phân tích các đường tần suất tiêu biểu, chúng ta sẽ xét những đặc điểm hình thành dòng chảy lũ mùa xuân gây nên tính không đồng nhất của các chuỗi dòng chảy lũ mùa xuân ở một số vùng Tính không đồng nhất đó đem
đến cho các đường phân phối thực nghiệm có hình dạng riêng Kỹ thuật xây dựng các đường phân phối lý luận thành phần để mô tả các chuỗi, thực nghiệm không
đồng nhất chúng ta sẽ xét ở trong các ví dụ tính toán theo dòng chảy sông ngòi
ở phần trên kết quả đánh giá tính đồng nhất chuỗi lưu lượng lớn nhất nước sông Abava trạm Xixien đã xác định là lưu lượng lớn nhất của mùa xuân và do mưa thuộc về các chuỗi thống kê khác nhau Với tính hình đóviệc xây dựng các đường
Trang 31tần suất ứng với cả chuỗi có thể tiến hành bằng cách sử dụng phương pháp đang xét này
Trong chuỗi nghiên cứu có 20 lưu lượng lớn nhất trong năm thuộc về thời kỳ
lũ mùa xuân và 15 lưu lượng lớn nhất trong năm hình thành do mưa
Hình 4.2 Đường tần suất lưu lượng lớn nhất nước sông; Abava - trạm Xixien
1 Các điểm thực nghiệm ứng với đường tần suất tổ hợp của lưu lượng nước lớn nhất; 2 - Các điểm thực nghiệm ứng với đường tần suất ở đỉnh lũ do tuyết tan (đường trên) và đỉnh
lũ do mưa (đường dưới); 3 - Đường tần suất lý luận Krski - Melkel ứng với chuỗi lưu lượng lớn nhất của lũ mùa xuân với Q =18m3/s; Cv = 0,36, Cs = 2Cv; 4 - đường tần suất lý luận ứng với chuỗi lưu lượng lớn nhất do mưa sinh ra với Q = 128m3/s; Cv = 0,52; Cs = 2Cv; 5 -
Đường tần suất lý luận được tính bằng cách tổ hợp các đường 3 và 4vào chuỗi đồng nhất Trục tung lưu lượng giảm nhỏ 100 lần
Trên hình 4.2 đã vẽ các điểm thực nghiệm ứng với các chuỗi nghiên cứu và các đường tần suất lý luận Các đường 3 và 4 được xây dựng bằng phương pháp thông thường xuất phát từ những tham số trình bày ở bản vẽ
Bây giờ ta sẽ xét trình tự xây dựng đường 5 từ dung lượng chung của chuỗi (35 số hạng) và của các chuỗi đồng nhất (20 và 15 số hạng) ta tính được tỷ trọng của mỗi chuỗi
43 , 0 35
Trang 32Sử dụng các đường tần suất (3 và 4) vừa xây dựng các chuỗi đồng nhất, ta tiến hành tính toán đường tần suất lý luận của chuỗi không đồng nhất theo lược đồ
đã được trình bày trong bảng 4.4
Hình 4.3 Đường cong đảm bảo dòng chảy năm trạm Xakmarư sông Xakmarư
1 - Các điểm thực nghiệm ứng với các chuỗi đồng nhất
2 - Các điểm thực nghiệm của toàn chuỗi các đường tần suất Kriski - Menkel với Cs = Cv; I - Thành phần thứ nhất M = 3,64; Cv = 0,46; h = 68, Cs = Cv; II - Thành phần thứ hai M = 3,64, Cv = 0,11; n = 12; Cs = Cv; 3 - - Đường tần suất tổ hợp dựa vào tổng xác suất có tỷ trọng của I và II - IV Đường tần
suất tổ hợp theo toàn những chuỗi quan trắc được M = 4,45; Cv = 0,56; n = 80;
Cs = Cv
Trên hình 4.3 đã biểu diễn đường tần suất thực nghiệm dòng chảy năm sông Xakmar - trạm Xckmar (các điểm thực nghiệm của toàn chuỗi) và tiện cận lý luận của nó dưới dạng đường Kriski - menkel khi Cs,Cv (đường IV) Các tham số của
đường này nhận được bằng cách sử dụng tất cả mẫu tài liệu
Ta nhận thấy rằng đường tần suất lý luận tốt nhất là trung bình hoá điểm thực nghiệm, so với các đường tần suất lý luận cộng với quan hệ Cs/Cv khác nhau Hơn nữa đường phân tích Kriski - Menkel khi Cs = 2Cv thử nghiệm đối với phân lớn tài liệu dòng chảy của các sông trong vùng nghiên cứu cho thấy khá phù hợp với các
đường tần suất thực nghiệm Mặc dù như vậy theo hình 4.3 dễ dàng phát hiện được
Trang 33những phân phối tích phân vẽ trên tất cả các chuỗi trên một số đoạn thực tế nằm cách xa các điểm thực nghiệm; ở những tần suất lớn nó lệch xuống so với chúng, và
ở phần trên ngoại suy của đường này nó lệch lên trên Sự không phụ thuộc đó chỉ có thể giải thích được là do viẹc sai lệch "ngẫu nhiên" của các điểm thực nghiệm so với
đường lý luận Hơn nữa ta cũng thấy có sự không phù hợp tương tự giữa các tài liệu thực nghiệm của dòng chảy với các đường phân phối lý luận đối với các sông khác của lãnh thổ nghiên cứu
Như vậy, xuất phát từ phân tích bản chất và có tính đến sự lệch có hệ thống của các điểm thực nghiệm so với các đường lý luận, ta có thể giả thuyết rằng chuỗi này không thể coi là đồng nhất hoàn toàn được Vì nó được cấu thành từ một vài chuỗi tương đối đồng nhất
Những kết luận đầu tiên có thể phát biểu như sau:
1 - ở lần tiệm cận thứ nhất, thuỗi thống kê này có thể chia ra làm hai chuỗi
Nguồn gốc phá vỡ tính đồng nhất của chuỗi lưu lượng bình quân năm đang
được nghiên cứu như chúng ta rõ ở chương III là do sự hạ thấp lượng nước đọng lại trên lãnh thổ đã làm tăng dòng chảy cuả những năm ít nước Điều đó đã giải thích
được hình dạng riêng biệt của đường tần suất thực nghiệm
Khi chấp nhận tính không đồng nhất của chuỗi dòng chảy năm sông Xakman chúng ta tiến hành phân chia phân phối không đồng nhất ra làm những chuỗi tương
đối đồng nhát có xét đến những phan tích bản chất hình thành dòng chảy và sự phân
bố của các điẻm trên đường tần suất tưực nghiệm
Trên hình 4.3 có biẻu diễn các điểm thực nghiệm các đường phân phối Kriski
- Menkel khi Cs = Cv đối với các chuỗi đồng nhất Trong trường hợp này, ta chú ý rằng tài liệu thực nghiệm với các đường phân phối lý luận đã được chọn phù hợp
Trang 34hơn nhiều so với sự chỉnh lý thống kê lần đầu đối với toàn bộ chuỗi dòng chảy, điều
đó càng thể hiện đúng đắn của việc chia chuỗi thống kê đó
Đường tần suất tổng hợp có thể nhận được theo khi chuỗi tương đối đồng nhất bao gồm 68 và 12 số hạng Trong trường hợp này, chuỗi thứ nhất sẽ tham gia vào trong tính toán với tỷ trọng là 0,85 và chuỗi thứ hai là 0,15
Khi tiến hành tính toán ta lấy một số điểm tuỳ ý trên trục tung chẳng hạn như những giá trị sau đây cuả môdul dòng chảy năm 12; 10; 9; ; 4; 2 l/skm2
Trình tự tính toán đã được trình bày dưới dạng bảng 4.5
Trên hình 4.3 ta thấy đường tần suất tổng hợp III bình quân hoá rất tốt đối với tưrờng hợp thực nghiệm, so với đường tần suất lý luận IV nhận được theo chuỗi không đồng nhất
Sự tản mạn các điểm của tất cả các chuỗi trhực nghiệm so với đường tổng hợp III có thể là do sai só ngẫu nhiên Trong trường hợp này ở phạm vi môdul 5,0 - 6,5 l/skm2 ta thấy sự chệch so với các điểm so với đường tổng hợp III có hệ thống Tiếp theo, lại chia chuỗi đó ra làm hai chuỗi tương đối đồng nhất ta có thể khử được
sự trùng hợp nhỏ đó của đường tần suất III với tài liệu thực nghiệm Song khi sai lệch không lớn giữa đường lý luận tổng hợp với tài liệu thực nghiệm thì không thể tiến hành chia thêm chuỗi ra làm nhiều chuỗi để đạt được sự phù hợp hoàn toàn hơn giữa sự phân bố của các điểm thực nghệm với đường lý luận tính toán được
Chúng ta sẽ xét thêm một số thí dụ nữa đối với sông Bôlsôi uzen trạm Nôvơuzenski ta thấy rằng trên lưu vực này vùng nước đọng nhiều hơn so với lưu vực sông Xakmar Ngoài ra trên lưu vực sông Nôlsôi uzen có rất nhiều ao hồ và những nước lớn chúng càng làm giảm dòng chảy vào những năm ít nước, khi số lượng chúng tăng lên sẽ đưa đến dòng chảy những năm ít nước giảm đến hết (bằng
Trang 350,007 0,09 0,28 0,85 2,27 5,92 13,7 26,2 39,3 40,9 42,88
0,04 0,48 1,7 5,2 14,3 35,8 66,0 91,5 99,75 99,96
100
0,023 0,27 0,98 2,97 8,17 20,4 37,7 52,2 56,96 56,98 57,00
0,03 0,36 1,25 3,82 10,04 26,3 51,4 78,4 96,3 97,7 99,98
Hình 4.4 Đường tần suất dòng chảy năm s Bolsôi Uzen tp Novoyzensk
1.Các điểm thực nghiên ứng với các chuỗi đồng nhất; 2 Các điểm thực nghiệm của toàn chuỗi; I, II, III - Các đường tần suất lý luận ứng với các chuỗi đồng nhất; IV -
Đường tần suất lý luận dựa vào tổng xác suất có tỷ trọng của các đường I, II, III; V -
Đường tần suất lý luận tính theo tài liệu không đồng nhất của toàn chuỗi
Do đó chuỗi dòng chảy này nên chia ra làm 3 chuỗi tương đối đồng nhất của những năm ít nước, nhiều nước và trung bình (hình 4.4) Trên hình 4.4 ta thấy nếu cường lý luận tính theo toàn bộ chuỗi quan trắc được, rất khác so với tài liệu thực nghiệm, thì đường tần suất nhận được là tổng xác suất có tỷ trọng của ba chuỗi tương đối đồng nhất hoàn toàn thoả mãn bình quân hoá được các điểm thực nghiệm
Phương pháp xây dựng đường tần suất của những chuỗi không đồng nhất trên dựa vào những phần đồng nhất của tấtt cả chuỗi, thường thường được dùng khi chỉnh
Trang 36những số hạng đó của chuỗi đặc trưng cho hiện tượng nghiên cứu không xuất hiện (thí dụ không có dòng chảy là do sông cạn hoặc bị đóng băng) mà còn giá trị rất khác chuỗi còn lại Thí dụ như khi tách ra chuỗi lưu lượng chuỗi lưu lượng đồng nhất đo được hàng trăm lít trên giây hoặc lớn hơn thì những giá trị bằng không có thể bỏ đi là những lưu lượng khoảng 1l/s Khi đó tất nhiên việc xác định những nguyên nhân có thể gây nên tính không đồng nhất của chuỗi nghiên cứu, và những nguyên nhân có thể cắt nghĩa được tính đồng nhất của các chuỗi thành phân của nó
là điều quan trọng lúc tách một chuỗi nghiên cứu ra làm những chuỗi đồng nhất Nếu như chuỗi có được dung lượng đủ lớn thì sự cong đột ngột của đường tần suất
được bắt đầu từ một giá trị nào đó của hệ môdul, có thể dùng làm căn cứ khá tốt về mặt thống kê để tính đường tần suất tổng hợp theo hai (hoặc nhiều hơn) đường tần suất của các chuỗi đồng nhất Những đặc điểm không đồng nhất của chuỗi về mặt
định tính trên đây nên coi như là những điểm bổ sung cho các chỉ tiêu đánh giá tính
đồng nhất về mặt thống kê của các chuỗi trình bày trên
Bảng 4.5 Lược đồ tính toán đường tần suất lý luận không đồng nhất của dòng chảy năm S Xakmara - tr.Xakmara
Chuỗi thứ nhất Chuỗi thứ hai Môdul dòng
chảy 1/s.km2 P1% 0,85 P1% P2% 0,15 P2%
Phân phối tổng hợp (%)P=0,85P1+0,15P2
0,008 0,034 0,85 7,9 30,6 69,3
0,18 14,5 83,5 99,91 99,99 99,99
0,027 2,18 12,53 14,87 15,0 15,0
0,033 2,21 13,38 22,77 45,6 84,3 Phương pháp này sử dụng đối với chuỗi thống kê có chứa những giá trị bằng nhau, thì công thức (4.14) có thể viết dưới dạng:
2 1
1 1 2
1
2 21 2
1
1 1
n n
) x ( P n n
n
) x ( P n n n
) x ( P n )
+ +
Vì x = 0 thì P2(x)=0;
Sau đây ta sẽ xét một thí dụ xây dựng đường tần suất lưu lượng bình quân tháng nhỏ nhất, có xét đến những giá trị bằng 0 trong chuỗi
Trang 37Trên sông Xrêđnhi Pêrôrluc - trạm Sôblievski (F = 2710 km2) đã quan trắc 28 năm thì 7 năm trị lưu lượng bình quân tháng nhỏ nhất mùa đông bằng không Theo tài liệu quan trắc được trong 21 năm ta tính được những gí trị của các tham số Qbq = 0,243m3/s, Cv = 0,93; Cs = 2Cv Với các tham số đó ta sẽ nhận được đường tần suất
I trên hình 4.5
Hình 4.5 Đường tần suất của lưu lượng nhỏ nhất trong 30 ngày S.Xređnhi Egorluc - tr Sôblievski (F = 2170 Km2)
1 - Điểm thực nghiệm của chuỗi các giá trị lớn hơn 0;
2- Điểm thực nghiệm của toàn chuỗi kể cả các giá trị bằng 0 của chuỗi , I
- Đường tần suất lý luận của chuỗi các hạng lớn hơn 0 , II - Đường tần suất lý luận có tính cả các giá trị bằng 0 của chuỗi
Để chuyển từ đường tần suất này sang đường tần suất tính toán ứng với tất cả chuỗi nghiên cứu (28 năm) ta sử dụng công thức (4.15) Những tính toán đó đã được trình bày ở bảng 4.6
Bảng 4.6 Lược đồ tính toán đường tần suất lý luận không đồng nhất của lưu lượng bình quân tháng nhỏ nhất A.Kređnhi Iêgôrluc tr Sôblievski
Trang 381,35 2,25 3,35 5,56 9,0 14,5 22,2 34,5 43,5 52,5 62,2 72,8 Như trên hình 4.5 ta thấy việc xây dựng đường tần suất có xét đến những gí trị bằng không, theo phương pháp xét ở trên, thì với cùng một giá trị của tần suất sẽ nhận được những giá trị của đại lượng càn nghiên cứu Sự giảm nhỏ đó càng lớn trong thành phần của chuỗi càng nhiều những gía trị của biến ngẫu nhiên bằng không
Phương pháp bản đồ giải xây dựng đường tần suất theo chuỗi có chứa những gía trị của biến ngẫu nhiên bằng không, thực chất là xây dựng những phân phối cắt
đoạn Tương tự như vậy, về nguyên tắc có thể cắt ra đường phân phối thực nghiệm
từ giá trị bất kỳ cho trước trở lên (x≥a)
Phương pháp bản đồ giải chỉnh lý các phân phối thống kê không đồng nhất tiện lợi so với các lược đồ giải những bài toán tương tự
Dựa vào những thí dụ phân tích thống kê các chuỗi không đồng nhất người
ta chia sự phân tích đó ra làm những giai đoạn cơ bản sau đây
1 Xác lập các phương pháp thống kê đối với chuỗi nghiên cứu có khả năng không đồng nhất và tìm những nguyên nhân vật lý gây nen tính không đồng nhất có trong mọi trường hợp mà điều đó có khả năng xảy ra dẫn phải sử dụng cần chỉ tiêu thống kê của tính đồng nhất các đánh giá tính đồng nhất của các chuỗ thời gian quan trắc được
Trang 392 Chia chuỗi nghiên cứu ra làm các chuỗi đồng nhất , Việc phân chia này nên dựa vào các nguyên nhân vật lý đã biết và chỉ khi chuỗi tài liệu quan trắc được rất dài mới có thể chỉ dựa vào phân tích thống kê
3 Việc chỉnh lý thống kê các chuỗi đồng nhất đã được tách ra và vẽ đường tần suất tổng hợp được tiến hành theo phương pháp đã trình bày ở trên
Cuối cùng ta thấy rằng những nguyên nhân phá vỡ tình đồng nhất trong các chuỗi tài liệu quan trắc được có thể là muôn màu muôn vẻ Trong trường hợp cụ thể
ta cần phải tìm ra được những nguyên nhân đó và chú ý đến nó khi chia chuỗi tài liệu không đồng nhất ra làm các chuỗi đồng nhất Tiếp theo khi sử dụng các chỉ tiêu thống kê của tính đồng nhất cần phải xác đình tính đồng nhát của chuỗi tài liệu gốc
và trong trường hợp cần thiết nhận đường tần suất lý luạn tổng hợp trên cơ sở mô tả
lý luận của các đường phân phối thành phần đồng nhất
Những lược đồ xây dựng đường tần suất trên được dùng đối với những trường hợp khi có chuỗi không đồng nhất có thể tách rời làm những chuỗi đồng nhất Khi
đó dung lượng chung của tài liệu không điồng nhát quan trắc chung được (n) được chia ra làm n1 và n2 =n Trong trường hợp ba phân không đồng nhất n1+n2+n3 = n
Trong thực tế tính toán thuỷ văn có thể gặp trường hợp các tài liệu không
đồng nhất có cùng một dung lượng nghĩa là n1 = n2 = n Thí dụ tài liệu quan trắc dòng chảy lớn nhất lũ mùa xuân n năm và lũ do mưa cung trong n năm Khi đó đối với mỗi chuỗi sẽ được xây dựng đường tần suất đồng nhất bằng phương pháp đã
được nghiên ưứu ở chương II và III Trong trường hợp này, để nó được dường tần suất tổng hợp theo đề nghị của Kriski - Menkel sử dụng công thức:
P = p1+p2-p1p2trong đó p1 tần suất của một chuỗi đồng nhất; P2- tần suất của chuỗi đồng nhất khác; p tần suất của phân phối không đồng nhất
Hiện thực hoá công thức này trên toàn bộ miền lưu lượng quan trắc được và miền ngoại suy chung ta sẽ nhận được đường tần suất tổng hợp của chuỗi không
đồng nhất Ngày nay công thức này đã được phép dùng trong cuối "Hướng dẫn xác
định tính toán các đặc trưng thuỷ văn”
Trang 40Ngày nay, dựa vào việc đánh giá hàng loạt những phân phối của đặc trưng thuỷ văn và các yếu tố tạo nên được chúng theo lanh thổ cho nên việc phân vùng thuỷ văn được tiến hành có nhiều thuận lợi Thông thường khi phân tích những quy
định biến thiên theo lãnh thổ của dòng chảy sông ngòi người ta đều phải xét đến những điều kiện khí hậu và các đặc tính cấu thành của mặt đệm
Song khi nhận xét đặc tính tổng hợp của những nghiên cứu phân vùng thuỷ văn nhất thiết phải nêu lên vai trò chủ đạo trong các lược đồ đó của những đánh giá
được rút ra trước hết là từ sự phân tích các quy luật phân phối đặc trưng thuỷ văn
đang được nghiên cứu Quan niệm trên về phân vùng thuỷ văn gắn liền với việc giải một bài toán bao gồm chẳng hạn như: hợp lý hoá mạng lưới thuỷ văn, khai quát hoá
đặc trưng thống kê từ những tài liệu của những vùng đồng nhất về mặt thống kê, nội suy các yếu tố thuỷ văn theo lãnh thổ và v.v
Vì vậy có thể cho rằng việc phân vùng theo các đặc tính thống kê đới cho phép ta nắm được những quy luật nghiên cứu không chỉ đánh giá về mặt định tính các đại lượng đó còn định lượng nữa ở trong các vùng đồng nhất về mặt thuỷ văn
ở phân này ta không xét tất cả những vấn đề có liên quan đến việc phân vùng thống kê mà còn chỉ đề cập đến việc sử dụng các chỉ tiêu đồng nhất
Vùng thuỷ văn được gọi là đồng nhất nếu trong vùng đó các đặc trưng thống
kê (x, Cs, Cv ) của các chuỗi yếu tố nghiên cứu thuộc cùng một tổng thể
Để loại trừ ảnh hưởng của những nhân tố phi địa chỉ, thông thường (đối với dòng chảy sông ngòi) là diện tích lưu vực, mức hồ ao và rừng v.v Việc phân tích tính đồng nhất trong phạm vi những vùng nhất định có thể dùng không nhất thiết là
đối với những giá trị gốc (thí dụ như lưu lượng) mà đối với hàm của chúng (môdul) dòng chảy, các tham số của công thức tính toán v v