NXB Đại học Quốc gia Hà Nội - Hà Nội - 2005 Từ khóa: Quá trình hải dương học, chẩn đoán, dự báo, thống kê, phương pháp hồi quy, thành phần chính, nhân tố, phương pháp phân loại, cấu trú
Trang 1
NXB Đại học Quốc gia Hà Nội - Hà Nội - 2005
Từ khóa: Quá trình hải dương học, chẩn đoán, dự báo, thống kê, phương pháp hồi quy, thành phần chính, nhân tố, phương pháp phân loại, cấu trúc, biến động, ma trận số liệu, nhận biết phân biệt, khai triển trường, mô hình tuyến tính, đa chiều, phân tích quan hệ, dự báo tổ hợp
Tài liệu trong Thư viện điện tử Trường Đại học Khoa học Tự nhiên có thể được sử dụng cho mục đích học tập và nghiên cứu cá nhân Nghiêm cấm mọi hình thức sao chép, in ấn phục vụ các mục đích khác nếu không được sự chấp thuận của nhà xuất bản và tác giả
CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ
CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC
Smirnov N P., Vainovsky P A., Titov Iu E
Biêndịch: Phạm Văn Huấn
Trang 2SMIRNOV N P., VAINOVSKY P A., TITOV Iu E
CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ
CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC
BIÊN DỊCH : PHẠM VĂN HUẤN
NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI - 2005
Н П СМИРНОВ, П А ВАЙНОВСКИЙ, Ю Э ТИТОВ
ДИАГНОЗ
И ПРОГНОЗ ОКЕАНОЛОГИЧЕСКИХ
ПРОЦЕССОВ
Санкт-Петербург
ГИДРОМЕТЕОИЗДАТ - 1998
Trang 3Cuốn sách Chẩn đoán và dự báo thống kê các quá trình hải
dương học tổng kết những kinh nghiệm ứng dụng các phương pháp
thống kê nhiều biến vào nghiên cứu trường các yếu tố hải dương học diễn
ra trong đại dương Các tác giả giới thiệu tóm tắt về bản chất và ý nghĩa
của các phương pháp phân tích thống kê hiện đại, quy trình tính toán
thực tế khi áp dụng chúng vào các nhiệm vụ nghiên cứu cụ thể, không đi
sâu vào khía cạnh toán học của vấn đề Do đó cuốn sách sẽ là một tài
liệu chỉ dẫn phù hợp cho những người không chuyên toán muốn ứng
dụng công cụ thống kê toán học vào công việc nghiên cứu của mình Đặc
biệt, khi diễn đạt những bài toán nghiên cứu và dự báo thống kê các quá
trình hải dương, các tác giả luôn chú trọng phương diện phương pháp
luận nghiên cứu, cách đặt vấn đề, cách lý giải nội hàm của những kết quả
nhận được, nhờ đó giúp chúng ta biết cách ứng dụng công cụ thống kê
một cách khéo léo và hiệu quả
Các phương pháp thống kê nhiều biến cho phép người nghiên cứu
phân tích toàn diện, đồng thời nhiều quá trình, nhiều đặc trưng hải
dương học, từ đó nhận được quan niệm đầy đủ về những gì đang và sẽ
diễn ra trong biển và đại dương, hình thành những mô hình về cấu trúc
và biến động của quá trình, hiện tượng mà ta quan tâm Hiện nay ở Việt
Nam nguồn dữ liệu về các yếu tố thủy văn, thủy hoá, khí tượng, sinh học
biển ngày càng được thu thập thêm, dần dần trở nên đồng bộ, phong phú
Với phương tiện tính toán ngày càng hiện đại, chắc chắn hướng nghiên
cứu phân tích thống kê tự động sẽ phát triển và cuốn sách này sẽ hữu ích
cho nhiều người nghiên cứu
Người biên dịch
Trang 4MỤC LỤC
1.1 PHÂN TÍCH HỒI QUY ĐA CHIỀU HỒI QUY TUYẾN TÍNH ĐA CHIỀU
18
Chương 4 - NỘI DUNG DỰ BÁO CỦA CÁC PHƯƠNG PHÁP PHÂN TÍCH
4.4 TÍNH KHẢ BÁO THỐNG KÊ CỦA CÁC QUÁ TRÌNH HẢI DƯƠNG
Chương 5 - NHỮNG KẾT QUẢ CHẨN ĐOÁN THỐNG KÊ CÁC QUÁ
5.3 CHẨN ĐOÁN CẤU TRÚC CÁC KHỐI NƯỚC Ở BIỂN
Chương 6 - NHỮNG KẾT QUẢ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH
6.3 DỰ BÁO PHÂN BỐ KHÔNG GIAN CỦA PHÙ DU SINH VẬT Ở BIỂN
MỞ ĐẦU
Tính đa chiều và ngẫu nhiên trong biến động của các quá trình đại dương không cho phép người ta ngay tức khắc theo dõi, mô tả định lượng
và lý giải cơ chế vật lý của chúng một cách đơn trị Các phương pháp phân tích thống kê sẽ là một công cụ phát hiện và mô tả những mối quan
hệ tương hỗ phức tạp đó để giải quyết các bài toán chẩn đoán và dự báo những quá trình đại dương Độ chính xác và tin cậy của những kết luận nhận được phụ thuộc rất nhiều vào số lượng và sự đa dạng của thông tin ban đầu được đưa vào xử lý
Thực tế ta thấy toàn bộ cơ sở thông tin được tích luỹ trên ba mặt phẳng: không gian − thời gian X ( t l, ), không gian − dấu hiệu )X ( z l, , dấu hiệu − thời gian X ( t z, ); tập hợp những thông tin này làm thành một khối lập phương dữ liệu với các trục: không gian (l ), thời gian ( t ), các
biến số ( z ) (hình 0.1) Vậy các dữ liệu được sắp xếp trong khối lập
phương đó như thế nào? Một quan trắc riêng lẻ x về một biến số nào đó,
tại một điểm không gian, vào một thời điểm cho trước, sẽ là một ô duy nhất trong khối lập phương dữ liệu Một chuỗi gồm N quan trắc
{x1 ,x2 , ,x N} sẽ là một vectơ nằm dọc theo trục tương ứng của khối lập phương
Thí dụ, bản ghi nhiệt độ nước ở một điểm tại những thời điểm
N t t
t1 ,2 , , sẽ cho ta một vectơ quan trắc )X(t , trong khối lập phương
dữ liệu nó sẽ song song với trục thời gian Một quan trắc phân bố thẳng đứng của nhiệt độ nước sẽ là một vectơ dữ liệu song song với trục không gian: )X(l Nếu ta quan trắc liên tiếp theo thời gian về phân bố thẳng đứng của nhiệt độ nước tại một điểm, ta sẽ nhận được một mặt phẳng dữ liệu nằm trong khối lập phương song song với mặt phẳng các dấu hiệu:
Trang 5,
( l t
Còn nếu như đồng thời với nhiệt độ, ta quan trắc nhiều lần các tham số
trạng thái đại dương khác (độ muối, vận tốc dòng chảy, các yếu tố hoá
học), thì kết quả là ta nhận được khối lập phương dữ liệu phủ đầy tất cả
các trục tọa độ đã chọn: )X(t,l,z
Trong các phương pháp phân tích dữ liệu đơn chiều, người ta xét
chuỗi quan trắc trong thời gian hoặc trong không gian và nghiên cứu
được tính chất của sự biến động (tuần hoàn, ngẫu nhiên ), sự đồng nhất
của các dao động, sự liên hệ của vectơ quan trắc [104, 123, 201] Khi đó
thực tế ta không xét tới mặt phẳng quan trắc về những tham số khác nhau
Và mặc dù có những hiệu quả nhất định, các phương pháp thống kê đơn
chiều không cho phép phân tích một cách đầy đủ cần thiết về quá trình
phức tạp đa tham số
X(t,l,z)
X(l) X(z) X(t) X(z) X(t) X(l) X(l,z) X(z,t) X(l,t)
Hình 0.1 Khối lập phương dữ liệu hải dương học:
Các mặt phẳng và vectơ quan trắc hợp phần
Các phương pháp phân tích cặp các chuỗi (phân tích tương quan, hồi
quy, phổ) nhằm mục đích mô tả thống kê về mối liên hệ tương hỗ của hai
vectơ quan trắc trong thời gian hay trong không gian: X1(t), )X2(t ;
)
(
1 l
X , )X2(l Ở đây người ta vừa phân tích từng vectơ riêng biệt, vừa
phân tích mức độ quan hệ cặp đồng bộ hay bất đồng bộ giữa chúng Vậy
là người ta đã nghiên cứu cấu trúc thống kê của quá trình một cách đầy
đủ hơn so với phân tích đơn chiều
Nhưng chỉ trong các phương pháp phân tích thống kê đa chiều thì mới thực sự có khả năng khảo sát đồng thời một tập hợp các vectơ quan trắc Các phương pháp phân tích thống kê đa chiều hướng tới giải quyết các bài toán phân tích thống kê đối với những ma trận gồm N quan trắc
(các đối tượng) về M biến số (các dấu hiệu) Ở đây, những ma trận có
thể là những bảng số nhận được bằng cách cắt khối lập phương dữ liệu dọc theo một mặt bất kỳ nào đó Đây có thể là những ma trận quan trắc trong các mặt phẳng: các biến số − thời gian X( t z, ), các biến số − không gian )X( l z, hoặc thời gian − không gian X( l t, ) Ta có thể đưa trục các dấu hiệu vào phân tích thì cũng hoàn toàn như vậy, đó là ưu điểm rõ rệt của phân tích thống kê đa chiều, nó cho phép khảo sát khối lập phương
dữ liệu một cách toàn thể Những tập phân bố đồng thời của các đặc trưng quan trắc được phân tích bằng các phương pháp phân tích các vectơ
và các ma trận, với chúng, bằng phép phân tích thống kê đa chiều sẽ đưa
ra sự mô tả định lượng về những mối liên hệ tương hỗ ẩn bên trong các tham số ban đầu và phát hiện ra nội hàm của các mô hình chẩn đoán và
dự báo các quá trình hải dương đa chiều được nghiên cứu
Khái niệm chẩn đoán
Theo từ điển các từ nước ngoài, thì chẩn đoán là quá trình xác định thực chất của bệnh và trạng thái của bệnh nhân trên cơ sở khám xét toàn diện về anh ta Áp dụng vào hải dương học thực hành, bản chất của thuật ngữ này không có gì đổi khác nhiều lắm Ta có thể định nghĩa như sau: Chẩn đoán là tuần tự những thủ tục tổng kết, hệ thống hoá và lý giải về sự biến động quan sát thấy của các đặc trưng hải dương nhằm hình thành một mô hình tin cậy về các quá trình đang diễn ra
Chẩn đoán đòi hỏi hai giai đoạn cơ bản: phân tích và tổng hợp Phân tích, tức tách bạch đối tượng nghiên cứu thành những hợp phần, là giai
Trang 6đoạn nghiên cứu đầu tiên Giai đoạn này có thể bao gồm nhiều phương
pháp biến đổi dữ liệu quan trắc và các tính toán để mô tả các hợp phần và
những hiện tượng riêng lẻ của các quá trình Nội dung chính của một
phương pháp phân tích bất kỳ − phương pháp vật lý, thực nghiệm, thống
kê hay số trị − là làm sao phát hiện và mô tả những yếu tố hợp thành các
quá trình đang diễn ra
Tổng hợp là giai đoạn kết thúc của chẩn đoán và hướng tới liên kết
những bộ phận cấu thành đơn lẻ, hay những tính chất đơn giản nhất đã
phát hiện được, thành một chỉnh thể nào đó Nguyên tắc cơ bản của sự
liên kết này là hình thành một cách lôgic bức tranh hoàn chỉnh về các sự
kiện đang diễn ra trên cơ sở những quy luật và những mối liên hệ của các
yếu tố đã phát hiện được ở giai đoạn phân tích Thực chất thì tổng hợp
bao gồm nhiều phương pháp trong số các phương pháp phân tích, nhưng
chúng được áp dụng với chức năng nội dung và mục tiêu khác − để liên
kết và hệ thống hoá những hợp phần đã biết Ngoài ra, tổng hợp gồm cả
sự lý giải về hệ thống các quy luật đã thấy được Lý giải được hiểu là sự
giải thích vật lý về những quy luật đã phát hiện, nêu ra cơ chế vật lý
chung trong sự xuất hiện và phát triển của các hiện tượng đang diễn ra
trong đại dương
Tác giả công trình này gộp vào khái niệm chẩn đoán toàn bộ những
thủ tục biến đổi thông tin hải dương học đa dạng trong quá trình nghiên
cứu sự vận hành của hệ thống "đại dương" trong quá khứ hay hiện tại Vì
vậy, có hai loại thủ tục chẩn đoán sau đây với tư cách là những bộ phận
cấu thành của chẩn đoán: chẩn đoán vật lý và chẩn đoán thống kê Những
khái niệm này khác nhau về dấu hiệu kỹ thuật hay dấu hiệu tính toán
Chẩn đoán vật lý bao gồm các thủ tục và phương pháp xác định
trạng thái đại dương, được xây dựng trên cơ sở mô tả những hiện tượng
và quá trình hải dương bằng cách tính toán và phân tích những đặc trưng
thủy vật lý Theo nội dung, chẩn đoán vật lý có tính truyền thống Trước
hết, nó gồm những phương pháp hải dương học tính toán những đặc
trưng trạng thái đại dương không trực tiếp quan trắc, những đặc trưng thứ
sinh Đó là những tham số đặc trưng cho các trường vật lý, động lực, năng lượng, ta có thể kể ra rất nhiều May thay, tất cả những tham số đó liên hệ với những đặc trưng nguyên sinh thông qua những quy luật vật lý
đã biết và tạo thành một tập hợp các biến đặc trưng một cách đơn trị cho những dạng quá trình hải dương cụ thể
Ý nghĩa của chẩn đoán vật lý còn ở chỗ nó khái quát những biến đổi đang diễn ra trong đại dương thông qua một hệ thống những thuật ngữ và phạm trù đã biết và chấp nhận trong hải dương học Đó là những yếu tố cân bằng nhiệt (entalpy, các dòng nhiệt), những yếu tố cấu trúc ngang và thẳng đứng của nước (các khối nước, front và đới chuyển tiếp, các xoáy nước và các hệ thống hoàn lưu) v.v Đối với những loại thuật ngữ cụ thể
đã có những hệ phương pháp phân tích chuyên biệt
Thông thường, hệ phương pháp phân tích vật lý là một tổ hợp gồm những phương pháp kinh nghiệm phân tích định lượng kết hợp với những phương pháp thực tiễn xử lý và mô tả định tính Có sự liên kết đó là nhờ kinh nghiệm nhiều năm nghiên cứu thực tế, thường thì không phải là kết quả của những nghiên cứu một cách hệ thống và có định hướng, mà là do người ta khái quát những điều đáng quan tâm từ hoạt động thực tiễn Thí dụ, phương pháp luận phân tích T , đối với các khối nước S
[23,125] là một thành tựu cơ bản của khoa học, cho phép hiểu và mô tả những quá trình quan trọng nhất hình thành cấu trúc khối nước Trong khi
đó hệ phương pháp mô tả điều kiện băng và trạng thái mặt biển theo thang điểm là đúc rút từ những nhu cầu thực tiễn hàng hải
Phần lớn những phương pháp phân tích vật lý các quá trình hải dương kết hợp những cơ sở của phép phân tích định lượng các quan trắc với những giải pháp lý luận tập hợp, chuẩn bị và xử lý thông tin hải dương học Những quy tắc lý thuyết đồng thời là cơ sở để lý giải tiếp theo
về những ước lượng định lượng về phương diện hải dương học
Về toàn cục thì thực tiễn phân tích vật lý đối với những quá trình hải
Trang 7dương là một phương pháp luận đã hình thành, hoàn chỉnh và rất hiệu quả
trong xử lý thông tin hải dương học
Những nguyên tắc của chẩn đoán thống kê
Chẩn đoán thống kê yêu cầu sử dụng các phương pháp thống kê để
xử lý, phân tích và lý giải thông tin hải dương học đa dạng Phương pháp
luận của chẩn đoán thống kê dựa trên nhiều phương pháp phân tích thống
kê và thể hiện dữ liệu
Chẩn đoán thống kê có nhiều triển vọng ứng dụng thực tế trong
nghiên cứu hải dương học Đó là do hiện nay có rất nhiều phương pháp
thống kê biến đổi thông tin Song việc sử dụng chẩn đoán thống kê trong
thực tế hiện còn rất hạn chế Về điều này có một số nguyên nhân
Thứ nhất, rõ ràng rằng trong giới những người nghiên cứu ứng dụng
chưa hiểu sâu sắc về chính hệ thống các tính toán thống kê và sự liên hệ
ràng buộc bên trong của các phương pháp thống kê khác nhau Thực chất
điều này cản trở việc sử dụng nhiều phương pháp để hình thành và kiểm
tra các giả thuyết thống kê, chấp nhận những quyết định có căn cứ thống
kê để khảo sát định lượng toàn diện về những mối liên hệ lẫn nhau giữa
các đặc trưng hải dương học Chúng tôi cho rằng chính là sự thiếu hiểu
biết thực dụng về bản chất của phương pháp luận thống kê đã làm nảy
sinh sự hoài nghi đối với nó Kết quả là sự chẩn đoán bị quy về ứng dụng
thực tế một số thủ pháp phương pháp luận riêng biệt, những thủ pháp này
mặc dù chưa phải là tối ưu để giải quyết các bài toán cụ thể, nhưng chúng
được dùng quen, ổn định, thành tập tục lịch sử, không gây cho nhà nghiên
cứu những bất trắc nào
Thứ hai, áp dụng những phương pháp phân tích thống kê hiện đại
phải đi kèm với cơ sở kỹ thuật tương ứng Những tính năng của các máy
tính hiện có đôi khi quyết định giới hạn của việc phân tích thống kê thông
tin trong thực tế Khác với những tính toán thủy động lực, thống kê đòi
hỏi không chỉ tốc độ máy tính, mà chủ yếu là dung lượng nhớ lớn Bộ
nhớ trong và bộ nhớ ngoài quy định khả năng áp dụng nhiều phương
pháp tiếp cận hữu hiệu, trong đó có những phương pháp phân tích thống
kê nhiều biến
Cuối cùng, nguyên nhân thứ ba là do tình trạng lưu giữ thông tin hải dương học vào máy tính rất chậm trễ Như đã biết, hiệu quả của việc xử
lý những mảng dữ liệu lớn tuỳ thuộc rất nhiều vào trình độ tổ chức thông tin Tính tin cậy của những kết luận thống kê liên quan với độ dài tập mẫu nghiên cứu Vì vậy, sự tích luỹ thông tin và lưu giữ chúng một cách
có tổ chức có thể xem là con đường nhanh nhất để phát triển các phương pháp chẩn đoán thống kê
Bản chất của chẩn đoán thống kê là phân tích định lượng một tập hợp những đặc trưng hải dương học, thành lập những mô hình thống kê tối ưu về những quá trình được quan trắc, mô tả tiếp và lý giải những quy luật và cơ chế vật lý hình thành nên tính biến động đại dương Phương pháp luận phân tích thống kê được phổ biến rộng rãi nhất trong phân tích
sơ bộ những chuỗi quan trắc (dựng tổ chức đồ, ước lượng các mômen thống kê bậc thấp), mô tả quan hệ các chuỗi (tương quan cặp và hồi quy), phát hiện quy luật biến động thời gian của các đặc trưng hải dương học (phân tích điều hoà, phổ, hiệp phổ) Trong khi đó các phương pháp phân tích nhiều biến nói chung hiện còn ít được dùng hơn, điều này hoàn toàn không tương xứng với sức mạnh thực tế của các phương pháp đó
Ta sẽ khái quát hoá những nhận xét trên đây về chẩn đoán vật lý và thống kê dưới dạng một sơ đồ trực quan đơn giản sao cho có thể tóm lược được những ý tưởng phương pháp luận của các hướng nghiên cứu khác nhau (hình 0.2)
Thấy rằng khối chẩn đoán thống kê liên quan trực tiếp với ba khâu của hệ thống xử lý: các cơ sở dữ liệu, chẩn đoán vật lý và hình thành tri thức của người dùng Tương ứng với những mối liên hệ qua lại đó, có thể phát biểu những bài toán cơ bản của chẩn đoán thống kê gồm ba nhóm sau đây
1 Những bài toán về xử lý sơ bộ các số liệu, bao gồm các thủ tục
Trang 8hỡnh thành những mảng thụng tin ban đầu từ cỏc cơ sở dữ liệu gốc và trờn
cơ sở những kết quả tớnh toỏn cỏc đặc trưng hải dương học thứ sinh trong
khối chẩn đoỏn vật lý
2 Những bài toỏn phõn tớch thống kờ thụng tin, thể hiện dưới dạng
một loạt vấn đề cụ thể về phõn tớch thống kờ tối ưu đối với tài liệu Thớ
dụ, những bài toỏn về phỏt hiện những hợp phần tuần hoàn trong biến
thiờn thời gian và khụng gian, đỏnh giỏ định lượng mối liờn hệ giữa cỏc
dao động của những đặc trưng hải dương học trong khụng gian hay trong
thời gian
Cơ sở
dữ liệu Chẩn đoán thống kê
Chẩn đoán vật lý
Hình thμnh bμi toán
Tính các đặc trưng vật lý
↓
Phân tích vật lý các quá trình
↓
Lập các mô hình vật lý
↓
Lý giải kết quả
Tính các đặc trưng thống kê
↓
Phân tích thống kê các quá trình
↓
Lập mô hình thống kê
↓
Lý giải kết quả
Tri thức
↓
Người sử dụng
↓
Chấp nhận quyết định
↓
Dự báo
Hỡnh 0.2 Sơ đồ chức năng chẩn đoỏn cỏc quỏ trỡnh hải dương học
3 Những bài toỏn ở giai đoạn tổng hợp, khi những ước lượng định
lượng thu được về cỏc mối liờn hệ thống kờ cần phải thống nhất lại dưới hỡnh thức những mụ hỡnh về hiện tượng, đỏng tin về mặt thống kờ, sau đú
lý giải theo tinh thần vật lý về cơ chế hoạt động của những mụ hỡnh nhận được theo thuật ngữ hải dương học và phự hợp với những tiờn đề vật lý
đó chấp nhận khi phõn tớch
Sơ đồ khối trờn đõy vận hành thành cụng hay khụng tuỳ thuộc vào tương quan giữa trỡnh độ tri thức của người sử dụng những kết quả chẩn đoỏn và tớnh hiệu quả của những quyết định thực tiễn chấp nhận trờn cơ
sở tri thức đú Nếu hiệu số giữa hai hợp phần này õm thỡ sẽ phỏt sinh yờu cầu tiếp tục nghiờn cứu Nếu hiệu dương sẽ nảy sinh khả năng tiếp tục sử dụng tri thức, thớ dụ, dưới dạng cỏc dự bỏo sự phỏt triển của những quỏ trỡnh hải dương trong thời gian hay trong khụng gian
Sự thành cụng trong giải quyết những bài toỏn chẩn đoỏn thống kờ cỏc quỏ trỡnh hải dương tuỳ thuộc rất nhiều vào tớnh hiệu quả của việc ỏp dụng cỏc phương phỏp cụ thể xử lý thống kờ thụng tin Về hỡnh thức, khối chẩn đoỏn thống kờ là một tuần tự nhiều phương phỏp của thống kờ học, việc chọn và cụ thể hoỏ chỳng được thực hiện phự hợp với những mục tiờu chung của người nghiờn cứu Tuy nhiờn, cú thể nờu ra một số nguyờn tắc cơ bản trong khi chọn và ứng dụng cỏc phương phỏp thống kờ trong chuỗi chung chẩn đoỏn cỏc quỏ trỡnh hải dương
Nguyờn tắc bổ sung Theo nguyờn tắc này, những phương phỏp được
chọn phải dẫn tới những kết quả sao cho cú thể xõy dựng được bức tranh đầy đủ nhất về cỏc hiện tượng đang diễn ra Như vậy cũng chớnh là nhấn mạnh rằng phải loại trừ sự lặp lại nhiều lần những kết quả Cú cần phõn loại một tập mẫu mà về tập mẫu đú tất cả những chỉ tiờu đồng nhất đó được khẳng định trước khụng? Tuy nhiờn, trong thực tế cũng cú thể cần phõn loại nhiều lần một tập mẫu theo nhiều chỉ tiờu và quy tắc phõn loại khỏc nhau để làm sao chọn được một cấu trỳc lớp ổn định nhất và cú căn
cứ vật lý nhất í nghĩa của quy tắc này là ở chỗ sao cho kết quả ở lần sau mở rộng những quan niệm của chỳng ta về đối tượng nghiờn cứu đó thu được ở lần chẩn đoỏn trước
Trang 9Nguyên tắc kết hợp các phương pháp để liên tục áp dụng những
phương pháp nghiên cứu phức tạp hơn Những phương pháp xử lý thống
kê đơn sơ hơn thì cho những kết quả thô, gần đúng, nhưng ít tốn thời
gian Phương pháp chính xác hơn thường phức tạp hơn và ít kinh tế hơn
Thông thường, sự phức tạp tính toán và tăng độ chính xác kết quả luôn
dẫn tới thu hẹp phạm vi ứng dụng của hệ phương pháp Độ tin cậy cao
của một ước lượng thống kê chủ yếu là do tuân thủ nghiêm ngặt những
điều giới hạn trong khi tính toán Bài toán quen thuộc trong khí tượng
thủy văn về tính các chuẩn nhiều năm của nhiệt độ nước là một minh hoạ
về điều vừa nêu Ước lượng gần đúng trung bình số học theo chuỗi quan
trắc dài tỏ ra không có gì kém so với những ước lượng tinh xảo kỳ vọng
toán học thực hiện bằng nhiều phương pháp phức tạp với xấp xỉ không
dừng
Nguyên tắc kế thừa cho phép dần dần đạt tới độ tin cậy cực đại của
kết quả tính toán với độ mạo hiểm tối thiểu Nguyên tắc này tạo ra khả
năng phân chia thành từng pha các phương pháp chẩn đoán thống kê
những quá trình hải dương Một pha là một nhóm các phương pháp xử lý
thống kê gồm một số những tính toán khép kín, người sử dụng kiểm soát
tính hiệu quả của nó Thí dụ, khi tính các thành phần chính, có thể tổ
chức một pha tính mỗi thành phần và khôi phục giá trị của thành phần đó
Sau khi kiểm tra tính hội tụ và tính lý giải được của các thành phần,
người sử dụng quyết định cần tiếp tục khai triển hay kết thúc các thủ tục
tính toán
Trình tự chẩn đoán thống kê
Trong thực tế có thể thực hiện những nguyên tắc chẩn đoán thống kê
chung nhất đã liệt kê trên đây dưới dạng những sơ đồ tính toán thống kê
Ta sẽ dừng lại ở một trong những phương án khả dĩ tỏ ra rất hiệu quả
trong nghiên cứu các quá trình hải dương quy mô lớn
Sơ đồ chẩn đoán thống kê này (hình 0.3) hình thành trên cơ sở
những nguyên tắc đã xét ở trên như một bộ phận hợp thành của một quá
trình chung xử lý thông tin hải dương học Giai đoạn phân tích gồm bốn nhóm phương pháp xử lý Xử lý bước đầu được chia thành một khối độc lập để nhấn mạnh tầm quan trọng và sự cần thiết của việc lựa chọn ban đầu thật cẩn thận các tham số phân tích thống kê
Rõ ràng, việc chọn lựa cụ thể những tham số phải xuất phát từ các điều kiện phát biểu bài toán chẩn đoán Sau khi có kết quả chẩn đoán vật
lý, ở mức định tính chúng ta đã có thể tiên đoán khả năng đưa thêm những tham số bổ sung vào danh sách các mối liên hệ cần nghiên cứu Trong danh sách đã có thể đưa thêm những biến không trực tiếp quan trắc, nhưng có thể tính được trong quá trình chẩn đoán vật lý
Phân tích thống kê ban đầu trong chẩn đoán thống kê có thể được xem vừa như là mục tiêu nghiên cứu, vừa như là giai đoạn tính toán trung gian Trong mọi trường hợp thì kết quả phân tích thống kê ban đầu là nền tảng để lý giải về tính ổn định và tính biến động của các tham số, tính đồng nhất và tính dừng của các thành phần riêng biệt của các quá trình được nghiên cứu
Cần tách riêng các phương pháp ước lượng trị số của những mômen thống kê đầu tiên và thuật toán tính toán các tổ chức đồ thực nghiệm một chiều và hai chiều như là những thủ tục tính toán các đặc trưng thực nghiệm quan trọng của những quá trình hải dương Các ước lượng thống
kê − trung bình, phương sai, các hệ số biến phân, độ bất đối xứng, độ nhọn, các tham số phân bố xác suất, là thông tin quan trọng về cấu trúc nội tại của biến động thời gian hay không gian của các quá trình Trên cơ
sở đó hình thành quan niệm ban đầu về biến động nền của các hiện tượng nghiên cứu nói chung
Phân tích các chuỗi thời gian được tách thành một khối riêng biệt, vì trong đó những thuật toán ước lượng định lượng về mức độ có quy luật trong sự biến thiên các đặc trưng hải dương học theo thời gian được liên kết thành một chuỗi những tính toán liên quan nhau một cách lôgic Những ý tưởng phân tích chuỗi thời gian đã được xét chi tiết và toàn diện
Trang 10trong nhiều chuyờn khảo về những vấn đề phõn tớch xỏc suất cỏc quỏ
trỡnh hải dương [69, 151, 193] Ở đõy cần nhấn mạnh ý nghĩa to lớn của
phộp phõn tớch thống kờ tổng hợp đối với cỏc quỏ trỡnh hải dương đa
chiều trong hệ phương phỏp này
Phân tích
Xử lý bước đầu
↓
Chọn các tham số
Hình thμnh các tập mẫu Phân tích thống kê ban đầu
↓
Phân tích các chuỗi thời gian
↓
Phân tích thống kê đa chiều
Lựa chọn mô hình thống kê
↓ ↑
Lý giải các đặc trưng thống kê Tổng hợp
Hỡnh 0.3 Sơ đồ chức năng của chẩn đoỏn thống kờ
cỏc quỏ trỡnh hải dương
Tỏch ra tớnh biến thiờn cú quy luật của chuỗi thời gian cú nghĩa là
nhận những ước lượng tin cậy của những đặc trưng về tớnh ngẫu nhiờn
hay tớnh cú quy luật trong biến thiờn thời gian Rừ ràng, phỏt hiện ra
những quy luật là kết quả quan trọng khi phõn tớch cỏc chuỗi thời gian
Trước hết quy luật được hiểu là sự tuần hoàn lặp lại tiềm ẩn trong cỏc dao
động của cỏc đặc trưng hải dương học mà người ta giải thớch như là sự
biểu hiện của cỏc cơ chế hỡnh thành cỏc quỏ trỡnh nghiờn cứu bởi những
nhõn tố bờn ngoài hay bờn trong Vỡ vậy cỏc phương phỏp phõn tớch điều
hoà của Fourier, phương phỏp phõn tớch biểu đồ chu kỳ, phõn tớch phổ
được phỏt triển mạnh mẽ nhất
Đại dương là một hệ thống phức tạp gồm những mối liờn hệ cấu trỳc
nhiều tầng, gồm cả một dải rộng tần số dao động riờng và dao động cưỡng bức Chớnh tớnh cú cấu trỳc của hệ thống đó cho phộp chỳng ta sau khi xấp xỉ đỏnh giỏ được cấu trỳc tần số của cỏc quỏ trỡnh, cú thể ngay tức khắc xếp cỏc hiện tượng đang xột vào một thang bậc nhất định trong
sự đa tầng biến động đại dương Tuy nhiờn, kinh nghiệm cho thấy rằng tập hợp cỏc tần số dao động đặc trưng là cú hạn và thực tế nú nằm gọn trong dải biến động từ cỡ vài phỳt đến vài nghỡn năm, điều khẳng định này đủ chớnh xỏc và đủ tin cậy đối với những nhu cầu thực tiễn và lý thuyết hiện nay
Ta đó biết rằng cấu trỳc tần số trong sự tương tỏc giữa cỏc thành
tố của hệ thống khớ hậu cú số bậc tự do rất khỏc nhau Việc mụ tả những mối liờn hệ qua lại trong cỏc dao động của những đặc trưng hải dương học trong miền tần số được thực hiện bằng cỏc phương phỏp phõn tớch phổ tương hỗ; theo phương phỏp này, từ cỏc ước lượng phổ dao động đồng pha và khụng đồng pha, độ hiệp biến và pha cỏc dao động, ta sẽ cú được quan niệm về sự hiện diện hay khụng hiện diện của những tương tỏc cú tớnh tuần hoàn giữa hai chuỗi thời gian
Cũn cú một nhúm cỏc bài toỏn phõn tớch chuỗi thời gian liờn quan tới việc mụ tả những dao động tuần hoàn chu kỳ dài trong cỏc quỏ trỡnh ban đầu, gọi là "xu thế" Bài toỏn mụ tả xu thế chắc chắn khụng nờn coi là bài toỏn tầm thường và cú lẽ nú cũng là bài toỏn cũn lõu mới hoàn thiện
Theo truyền thống thỡ cỏc nhà nghiờn cứu xem xu thế là một thứ nhiễu khụng mong muốn Nguyờn nhõn là do xu thế phỏ huỷ điều kiện dừng của cỏc chuỗi thời gian, làm giảm mạnh hiệu quả của cỏc phương phỏp phõn tớch tương quan và phổ kinh điển Thực vậy, tớnh khụng dừng
về kỳ vọng toỏn học, về cỏc đặc trưng biờn độ và pha dao động làm giảm
độ tin cậy của những ước lượng của cỏc thành phần tất định, vỡ phần lớn trường hợp trong thực tế cỏc ước lượng này được tớnh theo những thuật toỏn ỏp dụng đối với những tập mẫu dừng Chớnh vỡ vậy mà người ta thường muốn bằng mọi cỏch loại bỏ cỏc xu thế trong cỏc chuỗi