1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy

22 370 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 1,51 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

GIỚI THIỆU.Vấn đề quản lý tài nguyên nước tại các nước phát triển luôn được quan tâm, vìvậy việc phân tích, tổng hợp các dữ liệu thủy văn để đưa ra các mô hình dự báo chophép dự báo chín

Trang 1

1 GIỚI THIỆU.

Vấn đề quản lý tài nguyên nước tại các nước phát triển luôn được quan tâm, vìvậy việc phân tích, tổng hợp các dữ liệu thủy văn để đưa ra các mô hình dự báo chophép dự báo chính xác tình hình khí tượng thủy văn trên từng con sông theo mùa, đặcbiệt là cho phép dự báo và đánh giá tình hình lũ lụt và hạn hán tại các con sông để kịpthời có những chính sách thích hợp để hạn chế thấp thất mức thiệt hại có thể

Ngoài các phương pháp phân tích tổng hợp dựa rên phương pháp thống kêtruyền thống, T Kojiri và các cộng sự đã đề xuất phương pháp phân tích, tổng hợpdòng chảy dựa trên kỹ thuật gom cụm, cụ thể là dựa trên thuật toán gom cụm K-means Do kỹ thuật gom cụm K-means sử dụng một hàm đánh giá để “hướng dẫn”gom cụm Hiệu quả của thuật toán này cũng bị ảnh hưởng bởi hàm đánh giá đượcchọn Vì vậy, T Kojiri cùng các cộng sự đã đề xuất các hàm mục tiêu dùng để đokhoảng cách giữa các vector mẫu dữ liệu thủy văn, mỗi một hàm mục tiêu tương ứngvới một đặc trưng quan trắc được, ngoài ra, các tác giả cũng đề xuất phương pháp xâydựng các hàm mục tiêu tương tự để đánh giá các đặc trưng dữ liệu thủy văn một cáchthích hợp nhất Trên cơ sở đề xuất các hàm mục tiêu, các tác giả đã đi sâu nghiên cứu,thử nghiệm với dữ liệu thủy văn quan trắc được tại lưu vực sông Themes ởThemesville, đồng thời, đã tập trung phân tích, so sánh phương pháp phân cụm dữ liệudựa trên kỹ thuật gom cụm K-means với các phương pháp phân tích thống kê truyềnthống

Bài báo này được đăng trên tạp chí “Stochastic and Statistical Methods in Hydrology and Environmental Engineering: Time Series Analysis in Hydrology and Environmental Engineering Vol 10/3, 1994” Tức là cũng đã khá lâu Ngoài ra, lĩnh

vực nghiên cứu của bài báo là kỹ thuật môi trường, vì vậy, trong khuôn khổ thời gian

có hạn, nhóm chỉ nghiên cứu, làm rõ ý tưởng giải pháp đề xuất của các tác giả, đặc biệt

là kỹ thuật gom gụm K-means – một nội dung quan trọng trong môn học Data miningthuộc chuyên ngành Khoa học máy tính mà không đi sâu làm rõ các phương phápphân tích thống kê Do bài báo đã được đăng khá lâu, nên về bố cục của bài báo có hơikhác so với các bài báo khoa học được đăng trên các tạp chí hiện nay, các mục, phầntrình bày không được sáng sủa, rõ ràng, không có phần kiến thức nền, phần giải pháp

đề xuất không được trình bày trong 1 phần riêng mà trình bày dàn trải, phần kết quảthử nghiệm và đánh giá cũng được trình bày dàn trải Hơn nữa, bài báo ra đời khi sựphát triển của ngành khoa học máy tính còn hạn chế, tốc độ xử lý cũng như khả nănglưu trữ còn thấp nên số vector trong tập vector mẫu cần gom cụm nhỏ (15 mẫu), trongkhi hiện nay, giải thuật K-means làm việc trên tập mẫu có lực lượng rất lớn

Để hiểu rõ về nội dung của bài báo, ngoài kiến thức được học về kỹ thuật gomcụm trong lĩnh vực khoa học máy tính, đòi hỏi người đọc phải có kiến thức chuyên sâu

về các phương pháp phân tích thống kê Việc nghiên cứu sâu về các phương pháp phântích thống kê đòi hỏi phải có thời gian Trong khuôn khổ nội dung của môn học, dothời lượng có hạn, nên nhóm đã không đi tìm hiểu về các phương pháp phân tích thống

kê, mà chỉ tập trung làm rõ nội dung của giải pháp mà các tác giả của bài báo đề xuất

Vì vậy trong phần còn lại, nhóm sẽ đi sâu làm rõ các nội dung sau:

- Kiến thức cơ bản về dữ liệu thủy văn, các phương pháp quan trắc, … phầnnày do Trần Văn Triết đảm nhiệm

Trang 2

- Phần thứ 2 là phần giải pháp đề xuất, phần này sẽ tập trung trình bày cáchàm mục tiêu do các tác giả bài báo đề xuất, thủ tục gom cụm; mối quan hệ

về cấu trúc của dữ liệu đa biến; phát triển và mô phỏng các thuật toán dựbáo Phần này do Cù Huy Hoàng Long đảm nhiệm

- Phần kết quả thử nghiệm và đánh giá giải pháp đề xuất cho dữ liệu thủy văn

cụ thể, phân tích, đánh giá giải pháp đề xuất so với các phương pháp phântích tổng hợp dữ liệu thủy văn theo phương pháp phân tích thống kê truyềnthống do Đặng Quốc Huỳnh đảm nhiệm

Trang 3

2 KHÁI QUÁT CHUNG VỀ DỮ LIỆU THỦY VĂN.

2.1 Thủy văn (Hydrologic)

Là khoa học về đất, nước và giải quyết các vấn đề liên quan, để đáp ứng nhucầu tìm hiểu các hệ thống phức tạp của đất, nước và giúp giải quyết các vấn đề liênquan Cung cấp cho chúng ta thông tin về sự tham gia các và sử dụng nguồn nước trêntrái đất

Nhiều loại dữ liệu khác nhau liên quan đến thủy văn như: sự kết tủa, tuyết rơi

và những dòng chảy được đo lường tại một số trạm dùng những thiết bị khác nhau vớiviệc theo dõi truy xuất và điều khiển hệ thống nguồn nước Một số kỹ thuật tồn tại choviệc phân ra để xử lý dữ liệu chuỗi thời gian và nhiều điểm Tuy nhiên một cái có thể

mở rộng chẳng hạn như kỹ thuật dữ liệu chuỗi thời gian và đa điểm bằng cách xem xéttất cả loại dữ liệu tại thời điểm đo để định hình vector dữ liệu chuỗi thời gian Chẳnghạn những vetor có thể sau đó dễ dàng hàng xử và phân tích như vector mẫu

Dựa trên sự xem xét sự tương quan không gian và thời gian, người ta có thểphân loại những vector mẫu không gian chuỗi thời gian tương ứng với kết tủa haydòng chảy cho trích xuất của những vector tham chiếu đại diện Tương tự, sự khácnhau giữa vector mẫu có thể được sử dụng để phân loại chúng bằng cách kết hợp cácthông tin liên quan đến kết tủa, khí tượng học, địa chất học, sinh học…

Sự xem xét nhóm dữ liệu làm cho quá trình ước lượng và dự báo dễ dàng hơn.Phần chính này là: khả năng kỹ thuật nhận dạng mẫu trong xử lý dữ liệu đa điểm chuỗithời gian trở nên hữu dụng

Hệ thống nhận dạng mẫu được sử dụng bởi Panu và cộng sự (1978), Unny vàcộng sự (1981) cho tổng hợp và phân tích dòng chảy dựa trên khái niệm tối thiềukhoản cách Euclidean

Dữ liệu cho bài báo này được lấy từ các trạm quan trắc trên sông Thames tạiThamesville, Toronto, Canada Do bài báo này thực hiện năm 1994, nên có những cáichỉ phù hợp và kỹ thuật là tốt cho thời điểm đó

2.2 Phân bố lượng nước trên trái đất

Phần lớn diện tích trên trái đất là đại dương, chiếm đến ¾ diện tích trái đất Do

đó nguồn nước chiếm nhiều nhất là nước biển (nước mặn) 96.5%, phần nước ngọtdùng cho sinh hoạt của con người và thực vật chỉ chiếm tỷ lệ rất nhỏ 2.5%, trong số đó

có những nguồn không thể sử dụng như: băng, nguồn nước ô nhiễm Do đó vấn đềnguồn nước là mối quan tâm hàng đầu của các nước trên thế giới hiện nay, để đảm bảo

đủ để cung cấp sự sống trên trái đất

Trang 4

Hình 1:Phân bố lượng nước trên trái đất (nguồn: http://waterdata.usgs.gov/)

2.3 Vòng đời của nguồn nước

Hình 2: Chu kỳ của nguồn nước (nguồn: http://waterdata.usgs.gov/)

Trang 5

2.4 Các thống kê dòng chảy trước đây

Phương pháp phân tích dòng chảy dựa vào các thông tin riêng lẻ mà bỏ qua cácthông tin trong và giữa các nhóm dữ liệu có liên quan với nhau

2.5 Các khái niệm liên quan

2.5.1 Phân cụm (Clustering)

Là công việc nhóm tập các đối tượng sao cho các đối tượng trong cùng nhómthì có các thuộc tính giống nhau so với các đối tượng của nhóm khác

 Khoảng cách nội cụm (intra-cluster distance)

Là khoảng cách xa nhất của hai đối tượng thuộc cùng một cụm

 Khoảng cách liên cụm (inter-cluster distance)

Là khoảng cách gần nhất giữa hai đối tượng thuộc về hai cụm khác nhau

2.5.2 Dòng chảy (Stremflows)

Là khối lượng nước chảy qua một điểm xác định trong một khoảng thời gianxác định, thường tính bằng m3/s Dòng chảy liên quan trực tiếp với lượng nước dichuyển ra khỏi đầu nguồn vào kênh, suối Nó ảnh hưởng bởi thời tiết, tăng mạnh vàomùa mưa và giảm vào mùa khô Dòng chảy là thành phần quan trọng trong chu kỳ củanước được chỉ ở hình 2

2.5.3 Nhận dạng mẫu (Pattern recognition)

Là ngành thuộc lĩnh vực máy học, là việc thực hiện tác động vào dữ liệu thô (dữliệu thu thập chưa qua xử lý), cụ thể tác động như thế nào tùy thuộc vào từng loại dữliệu Nó là tập hợp phương pháp học có giám sát (supervised learning) Nhận dạngmẫu nhẳm mục đích phân loại dữ liệu dựa trên: kiến thức tiên nghiệm (a priori) hoặcdựa vào thông tin thống kê được rút trích từ mẫu có sẵn Các mẫu cần phân loạithường được biểu diễn thành các nhóm của các dữ liệu quan trắc được, mỗi nhóm làmột điểm trong không gian đa chiều phù hợp Đó là không gian các đặc tính của đốitượng để dựa vào đó ta có thể phân loại

Một hệ thống nhận dạng mẫu gồm có:

- Các thiết bị cảm nhận (sensor): để thu thập dữ liệu cho phân loại

- Cơ chế rút trích đặc trưng (feature extraction): tính toán các thông tin dướidạng số hay dạng đặc trưng (sysbolic) từ các dữ liệu quan trắc được

- Bộ phân loại: thực hiện công việc phân loại dựa vào các đặc trưng đã rút trích

từ dữ liệu quan trắc được

Trang 6

 Vector mẫu (pattern vector):

Mẫu dữ liệu dùng để gom cụm, là vector chứa d phép đo: X=(x1,x2,…,xd), ta cóvector mẫu thứ i: xi = (xi,1;xi,2;…xi,d)

 Vector tham chiếu (reference vector):

Mẫu dữ liệu của tâm cụm

2.6 Thu thập dữ liệu

Để thu thập dữ liệu, phân tích và đưa ra các mô hình dự báo, người ta đặt cáctrạm quan trắc trên các sông, một sông có thể có nhiều trạm quan trắc tùy thuộc vào vịtrí, địa hình thời tiết có khác nhau không Tại mỗi trạm quan trắc, người ta đặt nhiềuthiết bị đo khác nhau cho nhiều thông số khác nhau, mỗi thông số quan trắc ứng với 1đặc trưng của dữ liệu thủy văn, ví dụ như: dòng chảy, lượng mưa, độ ẩm, nồng độ PH,sức gió…Các dữ liệu này thu thập theo thời gian: giờ, ngày, tháng, năm và truyền trựctiếp về trung tâm xử lý số liệu thủy văn

2.7 Giải thuật K-Means

 Các phương pháp gom cụm hiện có:

Hình 3: Các phương pháp gom cụm

Thuật toán K-Means dùng để phân hoạch 1 tập mẫu thành các cụm, trong đómỗi cụm có tâm cụm là giá trị trung bình của các đối tượng trong cụm đó

− Bước 1: Chọn tùy ý k đối tượng từ tập X làm các tâm cụm ban đầu;

− Bước 2: Gán mỗi vector mẫu cho cụm mà vector đó và tâm của cụm tươngứng có độ tương tự nhất (“gần nhau nhất”)

− Bước 3: Cập nhật lại tâm cụm (từ các đối tượng mới được gán cho cụm)

Trang 7

− Bước 4: Nếu tâm cụm không thay đổi thì xuất ra kết quả Ngược lại, quaylại bước 2

Đặc điểm của thuật toán K-Means [5]

− Phương pháp K-Means không đảm bảo hội tụ về tối ưu toàn cục mà thườngchỉ đạt tới 1 tối ưu cục bộ

− Kết quả phụ thuộc vào việc chọn k tâm cụm ban đầu

− Để thu được các kết quả tốt thường phải chạy K-Means nhiều lần, mỗi lầnvới k tâm cụm ban đầu khác nhau

− Độ phức tạp thời gian của thuật toán K-Means là O(nkt) Trong đó:

o n: kích thước không gian mẫu

o k: số cụm

o t: số lần lặp

Đây là giải thuật dùng trong bài báo này, giải thuật được MacQueen giới thiệutrong tài liệu “J Some Methods for Classification and Analysis of MultivariateObservations” (1967

Thuật toán K-mean để phân cụm dữ liệu được thực hiện dựa trên một hàm độ

đo để đánh giá khoảng cách (hay đánh giá độ tương tự) của các phần tử, các hàm độ đonày thường là hàm khoảng cách Manhatan hay hàm khoảng cách Euclidean nhỏ nhấtgiữa đối tượng đến phần tử tâm cụm

 Khoảng cách Euclidean:

ai = (xí1,xi2, xim): đối tượng thứ i cần phân loại

cj=(xj1, xj2, xjm) j=1 k: phần tử trung tâm của cụm j

Khoảng cách Euclidean từ đối tượng ai đến phần tử trung tâm cụm thứ j: cjđược xác định theo công thức:

Dji: Khoảng cách Euclidean từ ai đến cj

xis: thuộc tính thứ s của đối tượng ai

xjs: thuộc tính thứ s của tâm cụm thứ j, cj

 Phần tử tâm cụm:

k phần tử trung tâm (k tâm cụm) ban đầu được chọn ngẫu nhiên, hoặc theo 1tiêu chuẩn nào đó, sau mỗi lần phân hoạch các đối tượng vào các cụm, các phần tử tâm

Trang 8

cụm sẽ được cập nhật lại dựa trên các phần tử thuộc cụm tương ứng.

3.1 Các hàm mục tiêu dùng cho bài toán gom cụm.

Các vector mẫu dòng chảy có một số đặc điểm cố hữu Trong số đó, rõ ràngnhất là lưu lượng đỉnh Những đặc tính khác có thể là các khoảng thời gian dài của cácdòng thấp Các hàm mục tiêu dưới đây được xây dựng dựa trên các đặc điểm này Mỗimột hàm xem xét một đặc điểm cụ thể của mô hình dòng chảy Các hàm này về sau đãcho thấy tính hiệu quả trong việc đối phó với các vấn đề cụ thể của bài toán phân tích

và tổng hợp dòng chảy ví dụ như trong các điều kiện lũ lụt và hạn hán

Hàm này sẽ kiểm tra các khía cạnh hình dạng của mô hình dòng chảy dưới dạng

Trang 9

các khoảng cách riêng lẻ như sau.

OF1[X¿¿i , Z j

]=max

t [ |x i (t )−z j(t)|

z j(t ) ]¿ (1)Trong đó, xi(t) giá trị dữ liệu thu được hoặc dữ liệu được biến đổi tại thời điểm tcủa các vector mẫu thứ i; zj(t) là giá trị của các vector tham chiếu thứ j (hoặc tâm cụmthứ j) tại thời điểm t Sai số tuyệt đối ở mỗi phần tử được chuẩn hóa Mức độ tương tựgiữa hai vector mẫu quan trắc được và vector tham chiếu được đánh giá thông qua độlớn của hàm OF1, giá trị của OF1 càng nhỏ thì mức độ tương tự lớn giữa 2 vector nàycàng lớn Lưu ý rằng OF1 xác định mức độ tương tự dựa trên những thay đổi trong mỗiphần tử hơn là toàn bộ hình dạng của vector mẫu

Lưu lượng đỉnh là đặc tính quan trọng nhất ảnh hưởng đến bất kỳ phân tíchdòng chảy lũ và bất kỳ việc kế hoạch của các công trình kiểm soát lũ Hàm mục tiêunày được định nghĩa dưới đây xem xét thành phần lưu lượng đỉnh của một vector mẫu

và do đó làm thuận tiện cho việc phân loại của tất cả các mô hình liên quan đến dòngchảy lũ

OF2[X¿¿i , Z j]=|x i p

(t )−z p j

(t )|

z p j (t ) ¿ (2)Chỉ số dưới p biểu thị vị trí của đỉnh

Các dòng chảy có xu hướng tăng mạnh và giảm mạnh (ví dụ, độ dốc quá cao)

để đáp ứng với điều kiện mưa hoặc tuyết tan Sự tăng giảm như vậy trong ngày rõ néthơn là theo dòng chảy hàng tháng Hơn nữa, sự tăng và giảm nhẹ hơn (tức là, độ dốcnhẹ) trong suốt thời gian dòng chảy thấp Độ dốc do đó có thể phân biệt được cácvector mẫu có những biến động mạnh so với các mẫu dòng chảy có biến động thấp,trong khi các vector mẫu dòng chảy như vậy có thể có cùng giá trị của hàm OFl Hàmmục tiêu OF3 dựa trên độ dốc đã được chuẩn hóa được đưa ra dưới đây

OFa[Xi, Zj] = max[OF1(Xi, Zj), OF2(Xi, Zj), OF3(Xi, Zj)] (4)Hàm mục tiêu tổng hợp bao gồm chung cả ba hàm mục tiêu trên Vì vậy, hàmnày có thể được sử dụng để đồng thời phân loại mẫu dòng chảy tương ứng với các sựkiện khác nhau, các điểm quan trắc khác nhau và thay đổi theo mùa

3.2 Thủ tục gom cụm mẫu dòng chảy

Các hàm mục tiêu OFl, OF2, OF3, và OFA được sử dụng trong thuật toán mean để phân loại các vector mẫu dòng chảy Cách thức mà các thuật toán K-meanđược áp dụng cho việc phân loại được mô tả trong phần kết quả thử nghiệm và đánhgiá Hơn nữa, xu hướng trong việc lựa chọn các tâm cụm ban đầu được tránh bằngcách sử dụng phương pháp khởi tạo ngẫu nhiên của thuật toán K-mean do Ismail vàKamel (1986) đề xuất

K-3.3 Mối quan hệ có cấu trúc trong dữ liệu đa biến

Trang 10

Đối với quy trình tuân theo phép biến đổi tuyến tính giữa các dữ liệu quan trắcđược tại các thời điểm khác nhau, người ta có thể thu được cùng số cụm (hay cácvector tham chiếu) có chứa cùng một số vectơ mẫu trong một khoảng thời gian xácđịnh Hầu hết các quá trình thủy văn vốn có tính chất phi tuyến và kết quả là một quátrình thực tế, người ta có thể thu được số cụm khác nhau, hoặc các cụm có thể có sựkết hợp khác nhau của các vector mẫu Mối quan hệ về mặt cấu trúc giữa các cụmkhác nhau trong một quá trình hay giữa các quá trình được đánh giá thông qua cáckhái niệm về tín hiệu tốt của sự phù hợp Thứ hai, người ta định nghĩa xác suất có điềukiện xảy ra, p(j/j') của một vector tham chiếu [Suzuki (1973)] như sau:

Trong đó, n(j/j’) là số vector mẫu kết hợp với các cụm thứ j khi đã biết cụm thứ j' k(j)

là số cụm được xem xét để phân tích Đó là lợi thế để phát triển các mối quan hệ vềmặt cấu trúc giữa các cụm biểu hiện mức độ tương quan cao hơn trong một quy trìnhhay giữa các quy trình Các mối quan hệ về mặt cấu trúc như vậy, lần lượt, sử dụngtrong dự báo hoặc mô phỏng các mô hình dòng chảy Cấu trúc Markov giữa các cụmthu được như sau:

p( j/ j’)=

u

k (u)

p(u /u ') ∀ u ngoại trừ j (6)nghĩa là,

3.4 Phát triển mô phỏng và thuật toán dự báo

Một quy trình không có cấu trúc tương quan giữa các điểm, các sự kiện, và /hoặc các mùa quan trắc có thể được mô phỏng một cách độc lập Tuy nhiên, các mẫuchảy biểu hiện mối tương quan giữa chúng và do đó, có thể được tổng hợp bằng cáchlàm theo một thủ tục được Panu và unny (1980a, 1980b) đề xuất, trong đó xác suất cóđiều kiện của sự xuất hiện các vectơ mẫu và phân phối chuẩn của các khoảng cách nộicụm được sử dụng Theo các tác giả của bài báo, các vector mẫu dòng chảy được cho

là thuộc về hai mùa và được mô phỏng như sau:

Bước 1: Tạo ra một dãy các cụm theo xác suất xuất hiện Markov của nó

Bước 2: Tổng hợp mỗi cụm với vector mẫu của nó bằng cách sử dụng phân

phối chuẩn đa biến

Bước 3: Kiểm tra xem các phần tử của một vector mẫu được tổng hợp nằm

trong giới hạn quy định của chúng Nếu không, tổng hợp vector mẫukhác cho đến khi các phần tử của nó được tìm thấy trong giới hạn.Bước 4: Quay trở lại bước 3, cho đến khi một vector mẫu chấp nhận được tương

ứng với mỗi cụm trong bước 1 được tìm thấy

Giả sử các hàm thành viên có phân phối lũy thừavà sử dụng khái niệm về suydiễn mờ, các vectơ mẫu được dự đoán [Kojiri và Ikebuchi (1988)] Các mùa khôngđược quan trắc, các dãy nối tiếp được dự đoán bằng cách kết hợp suy diễn mờ vớiphương pháp kỳ vọng

Nói chung, dự báo thời gian thực của vector mẫu được sử dụng để dự báo lũ lụt

Trang 11

hoặc hạn hán Một vector mẫu được dự báo dựa trên giá trị của OFl giữa các vectormẫu quan sát thực tế và vector tham chiếu đại diện của nó như sau:

Xj predicted = [1+ D j observed ] [X j] (8)Trong đó, Dj observed = (X j p - X j ) / Xj (9)Hơn nữa, giả sử rằng hàm thành viên mờ của mỗi cụm có cùng trọng số như tầnsuất xuất hiện của một cụm, hàm thành viên đó được biểu diễn như sau:

Vj = exp {( -aj hj Dj observed) / ∑

i

k(i)

h(i) } (10)Trong đó hj biểu thị tần suất đạt được trong thủ tục gom cụm và aj là một hằng

số phụ thuộc các tính huống khoảng cách luận lý đến Dj observed, nghĩa là lớn, vừa và nhỏ.Sau đó người ta có thể dự đoán vector mẫu dựa trên kỹ thuật suy diễn mờ [Kojiri et al(1988)] như sau:

Predicted Pattern Vector = ∑

4 KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ GIẢI PHÁP ĐỀ XUẤT.

a Ứng dụng của phương pháp đề xuất:

Các tác giả đã chọn dữ liệu quan trắc trên lưu vực sông Thames (Canada) đểkiểm tra khả năng áp dụng của giải pháp được đề xuất ở trên Dữ liệu được thu thậphàng tháng từ tháng 10 năm 1952 đến tháng 9 năm 1967 gồm dữ liệu về lượng mưa vàlưu lượng dòng chảy Giá trị được dùng để phân tích là trị số lưu lượng dòng chảytrung bình hàng tháng Dựa trên biểu đồ thống kê và phép phân tích phổ, dữ liệu lưulượng dòng chảy được chia thành 2 mùa: Mùa mưa từ tháng 10 năm trước đến tháng 4năm sau, mùa khô bắt đầu từ tháng 4 đến tháng 9 hằng năm Nói chung, biểu hiện mỗiphân mùa khác biệt hoàn toàn với phân mùa còn lại, và sự biến thiên của độ lệchchuẩn đối với một số tháng trong năm rất lớn

Hình 5: Dãy các giá trị của hàm mục tiêu OF1

Ngày đăng: 10/02/2016, 00:14

HÌNH ẢNH LIÊN QUAN

Hình 2: Chu kỳ của nguồn nước (nguồn: http://waterdata.usgs.gov/) - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 2 Chu kỳ của nguồn nước (nguồn: http://waterdata.usgs.gov/) (Trang 4)
Hình 1:Phân bố lượng nước trên trái đất (nguồn: http://waterdata.usgs.gov/) - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 1 Phân bố lượng nước trên trái đất (nguồn: http://waterdata.usgs.gov/) (Trang 4)
Hình 3: Các phương pháp gom cụm - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 3 Các phương pháp gom cụm (Trang 6)
Hình 4: Khoảng cách Euclidean - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 4 Khoảng cách Euclidean (Trang 8)
Hình 7: Số cụm tối ưu dưới dạng hàm của tiêu chuẩn đa tối ưu - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 7 Số cụm tối ưu dưới dạng hàm của tiêu chuẩn đa tối ưu (Trang 13)
Bảng 2: Các ràng buộc được dùng trong các phương pháp AIC, khoảng cách - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Bảng 2 Các ràng buộc được dùng trong các phương pháp AIC, khoảng cách (Trang 14)
Hình 10: Các vector tham chiếu đại diện : - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 10 Các vector tham chiếu đại diện : (Trang 16)
Hình 11: Các vector mẫu ban đầu - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 11 Các vector mẫu ban đầu (Trang 17)
Hình 13: Đánh giá độ tương tự của từng vector mẫu với k tâm cụm để gom các - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 13 Đánh giá độ tương tự của từng vector mẫu với k tâm cụm để gom các (Trang 18)
Hình 14: Kết quả gom cụm ở bước thứ i - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 14 Kết quả gom cụm ở bước thứ i (Trang 18)
Hình 15: Đánh giá bán kính các cụm - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 15 Đánh giá bán kính các cụm (Trang 19)
Hình 17: Đánh giá độ tương tự của từng vector mẫu với k tâm cụm mới để gom - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 17 Đánh giá độ tương tự của từng vector mẫu với k tâm cụm mới để gom (Trang 19)
Hình 18: Đánh giá bán kính các cụm - Tiểu luận Phân cụm dựa trên nhận dạng mẫu và phân tích dòng chảy
Hình 18 Đánh giá bán kính các cụm (Trang 20)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w