3 Lời mở đầu Bài toán phân lớp trong địa hóa môi trường biển là bài toán xác định xem các dữ liệu đo các thông số từ trạm quan trắc sẽ nằm trong các mức nào theo qui định về môi trường.
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐOÀN THUỲ LINH
NGHIÊN CỨU GIẢI QUYẾT PHÂN LỚP ĐỊA HOÁ MÔI TRƯỜNG BIỂN VÀ ÁP DỤNG VÀO BÀI TOÁN ĐÁNH GIÁ ĐỊA HOÁ MÔI TRƯỜNG BIỂN VIỆT NAM
LUẬN VĂN THẠC SĨ
HÀ NỘI - 2011
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐOÀN THUỲ LINH
NGHIÊN CỨU GIẢI QUYẾT PHÂN LỚP ĐỊA HOÁ MÔI TRƯỜNG BIỂN VÀ ÁP DỤNG VÀO BÀI TOÁN ĐÁNH GIÁ ĐỊA HOÁ MÔI TRƯỜNG BIỂN VIỆT NAM
Ngành: Công nghệ Thông tin
Chuyên ngành: Hệ thống Thông tin
Trang 33
Lời mở đầu
Bài toán phân lớp trong địa hóa môi trường biển là bài toán xác định xem các
dữ liệu đo các thông số từ trạm quan trắc sẽ nằm trong các mức nào theo qui định
về môi trường Đây hiện là một trong những vấn đề đang được quan tâm vì thông qua việc phân lớp địa hóa môi trường, ta có thể đưa ra các hướng xử lý nhanh cho vùng môi trường vừa được thực hiện công tác đo đạc, khảo sát Cũng từ đó có thể đưa ra được các chiến lược nhằm khắc phục, hạn chế và bảo vệ các tác động do thiên nhiên hoặc con người gây ảnh hưởng đến môi trường biển
Dựa trên cơ sở những yêu cầu của bài toán, dựa trên các đặc trưng của dữ liệu mà luận văn chọn hai hướng tiếp cận sử dụng máy hỗ trợ vector (SVM) và Naive Bayes để giải quyết bài toán phân lớp địa hóa môi trường biển Ý tưởng của hướng tiếp cận là biểu diễn mỗi số liệu trong mỗi kết quả đo là một vectơ đặc trưng Sau đó được đưa vào bộ phân lớp SVM, Naive Bayes để xác định tính chất tương đồng và đưa ra kết luận Nguồn dữ liệu sử dụng là các file dữ liệu về kết quả quan trắc môi trường biển thuộc các đơn vị có liên quan để xây dựng dữ liệu học cho mô hình đề xuất
Kết quả phần thực nghiệm bước đầu trên mô hình đề xuất đối với thuật toán Naive Bayes và mô hình đề xuất đối với thuật toán SVM đạt độ chính xác là trên 80% Tuy nhiên, dựa vào kết quả thu được có thể cho thấy việc sử dụng thuật toán SVM cho kết quả cao hơn so với thuật toán Naive Bayes và dựa kết quả này cũng
có thể xem mô hình là khả thi và có khả năng ứng dụng thực tế
Nội dung của khóa luận bao gồm có 3 chương:
Chương 1: Giới thiệu các khái niệm về môi trường biển, ô nhiễm môi trường
và tổng quan về địa hóa môi trường biển Trình bày một số đặc trưng của địa hóa môi trường biển (các thông số về trầm tích biển)
Chương 2: Trên cơ sở những phương pháp tiếp cận trình bày ở chương 1 và thông qua khảo sát miền dữ liệu về quan trắc môi trường biển, luận văn đã tìm hiểu các thuật toán liên quan đến hướng nghiên cứu về giải pháp phân lớp địa hóa môi trường biển Việt Nam Đây cũng là cơ sở lý thuyết, phương pháp luận quan trọng
để luận văn đưa ra mô hình đề xuất giải quyết bài toán phân lớp địa hóa môi trường biển Việt Nam và đưa ra phương pháp giải quyết bài toán phân lớp địa hóa môi trường biển Việt Nam dựa trên phương pháp máy hỗ trợ vector (SVM) và phương pháp Naive Bayes
Trang 44
Chương 3: Thực nghiệm, kết quả và đánh giá Tiến hành thực nghiệm việc
xây dựng bộ dữ liệu học, xây dựng bộ phân lớp SVM và Naive Bayes
Kết luận và định hướng phát triển: Tóm lược những kết quả đạt được của
luận văn Đồng thời đưa ra những hạn chế, những điểm cần khắc phục và đưa ra định hướng nghiên cứu trong thời gian tới
Trang 55
Mục lục
Danh sách các hình vẽ 7
Danh sách các bảng 7
Bảng các kí hiệu viết tắt 8
Chương 1: Khái quát về địa hóa môi trường biển Việt Nam và giải pháp phân lớp 9
1.1 Địa hóa môi trường biển 9
1.1.1 Một số khái niệm cơ bản trong môi trường biển [3, 4, 5] 9
1.1.2 Khái quát về địa hóa môi trường biển 13
1.2 Tầm quan trọng của việc phân lớp địa hóa môi trường biển 14
1.3 Bài toán đánh giá địa hóa môi trường biển 15
1.3.1 Các đặc trưng của địa hóa môi trường biển 15
1.3.2 Quan trắc địa hóa môi trường biển [4] 15
Chương 2: Mô hình giải quyết bài toán bài toán đánh giá địa hóa môi trường biển Việt nam dựa trên các phương pháp phân lớp 20
2.1 Nghiên cứu giải pháp phân lớp địa hóa môi trường biển Việt nam 20
2.1.1 Giới thiệu bài toán phân lớp và một số phương pháp điển hình 20
2.1.2 Thuật toán phân lớp Bayes 21
2.1.3 Thuật toán phân lớp SVM 26
2.2 Mô hình đánh giá địa hóa môi trường biển Việt nam dựa trên các phương pháp phân lớp 31
2.2.1 Phát biểu bài toán đánh giá địa hóa môi trường biển 31
2.2.2 Mô hình giải quyết bài toán đánh giá địa hóa môi trường biển Việt Nam 32
Chương 3: Thực nghiệm và đánh giá 37
3.1 Môi trường thực nghiệm 37
3.1.1 Cấu hình sử dụng 37
3.1.2 Công cụ phần mềm 37
3.2 Dữ liệu thực nghiệm 37
3.2.1 Mô tả cài đặt chương trình 37
3.2.2 Xây dựng tập dữ liệu học 38
Trang 66
3.3 Thi hành thực nghiệm 40
3.3.1 Thực hành trên Weka đối với thuật toán phân lớp Naive Bayes 40
3.3.2 Thực hành trên Weka đối với thuật toán phân lớp SVM 42
3.4 Đánh giá, so sánh 45
3.4.1 Đánh giá hệ thống 45
3.4.2 Nhận xét 46
Kết luận 47
Tài liệu tham khảo 48
Trang 77
Danh sách các hình vẽ
Hình 1 Mối liên quan hữu cơ giữa địa hóa với các ngành khoa học khác 13
Hình 2 Mô hình bảo đảm phát triển bền vững 15
Hình 3 Biểu diễn của mặt phẳng siêu phẳng của SVM 27
Hình 4 Mô hình phân lớp đề xuất 32
Hình 5 Các lựa chọn tham số đối với thuật toán phân lớp Naive Bayes với kịch bản 1 41
Hình 6 Các lựa chọn tham số đối với thuật toán phân lớp Naive Bayes với kịch bản 1 42
Danh sách các bảng Bảng 1 Thông số quan trắc và đơn vị đo 16
Bảng 2 Bảng mẫu kết quả đo chất lượng trầm tích của một vùng biển miền Trung 18
Bảng 3 Thông số quan trắc trầm tích 23
Bảng 4 Đánh giá thông số quan trắc trầm tích qua tiêu chuẩn tham khảo Trung Quốc 25 Bảng 5 Cấu hình phần cứng 37
Bảng 6 Danh sách các phần mềm sử dụng 37
Bảng 7 Kết quả thực nghiệm sử dụng phương pháp Naive Bayes với kịch bản 1 41
Bảng 8 Kết quả thực nghiệm sử dụng phương pháp Naive Bayes với kịch bản 2 42
Bảng 9 Kết quả thực nghiệm sử dụng phương pháp SVM với kịch bản 1 43
Bảng 10 Kết quả thực nghiệm sử dụng phương pháp SVM với kịch bản 2 44
Trang 88
Bảng các kí hiệu viết tắt
Từ hoặc cụm từ Kí hiệu viết tắt
Trang 99
Chương 1: Khái quát về địa hóa môi trường biển Việt Nam và giải pháp
phân lớp
1.1 Địa hóa môi trường biển
1.1.1 Một số khái niệm cơ bản trong môi trường biển [3, 4, 5]
a) Khái niệm về môi trường biển
Môi trường tự nhiên có thể đươ ̣c định nghĩa như là tổ hợp của các yếu tố khí
hậu, sinh thái học, hoá học và thổ nhưỡng tác động lên con người và các cơ thể sống khác và xác định các hình thức sinh tồn của chúng Vì thế, môi trường bao gồm tất cả các yếu tố mà có thể có ảnh hưởng trực tiếp đến sự trao đổi chất hay các hành vi của con người và các cơ thể sống hay các loài, bao gồm ánh sáng, không khí, nước, đất và các cơ thể sống khác
Môi trường biển có thể đươ ̣c định nghĩa như là tổ hợp của các yếu tố vật lý,
hóa học và sinh học đặc trưng cho nước biển, đất ven biển, trầm tích dưới biển, không khí trên mặt biển và các hệ sinh thái biển tồn tại một cách khách quan, ảnh hưởng đến con người và sinh vật
Hay nói một cách cụ thể hơn, môi trường biển bao gồm tất cả yếu tố mà có
thể có ảnh hưởng trực tiếp đến sự trao đổi chất hay các hành vi của con người và các sinh vật sống trong biển, bao gồm ánh sáng, không khí trên biển, nước biển, đất ven biển, đất tại đáy biển (trầm tích biển) và các cơ thể sống trong biển
Thành phần môi trường biển là các yếu tố vật chất tạo thành môi trường
biển như nước biển, đất ven biển, trầm tích dưới đáy biển, không khí, âm thanh, ánh sáng, sinh vật biển, các hệ sinh thái biển và các hình thái vật chất khác
b) Các yếu tố đặc trưng của nước biển ven bờ
Hàm lượng TSS trong nước (TSS - Total Suspended Solid) là tổng chất rắn
lơ lửng trong nước được tính bằng cách cân trọng lượng những chất còn lại trên giấy lọc khi lọc nước phân tích chất rắn hoà tan TSS biểu thị lượng vật chất không
hòa tan lơ lửng trong nước và được biểu thị (đo) bằng miligam trên lít (mg/l)
Nhu cầu ôxy hoá học (COD - Chemical Oxygen Demand) là lượng oxy có
trong Kali bicromat (K2Cr2O7) được sử dụng để oxy hoá chất hữu cơ trong nước Chỉ số COD được sử dụng rộng rãi để đo gián tiếp khối lượng các hợp chất hữu cơ
có trong nước Phần lớn các ứng dụng của COD xác định khối lượng của các chất ô
Trang 1010
nhiễm hữu cơ tìm thấy trong nước bề mặt (ví dụ trong các con sông hay hồ), làm cho COD là một phép đo hữu ích về chất lượng nước Nó được biểu diễn theo đơn
vị đo là mg/l, chỉ ra khối lượng ôxy cần tiêu hao trên một lít dung dịch
Nhu cầu ôxy sinh học (BOD - Biochemical /Biological Oxygen Demand) là
lượng oxy cần cung cấp để oxy hoá các chất hữu cơ trong nước bởi vi sinh vật BOD là một chỉ số và đồng thời là một thủ tục được sử dụng để xác định xem các sinh vật sử dụng hết ôxy trong nước nhanh hay chậm ra sao BOD được sử dụng trong quản lý và khảo sát chất lượng nước cũng như trong sinh thái học hay khoa học môi trường
Chỉ tiêu BOD phản ánh mức độ ô nhiễm hữu cơ của nước thải hoă ̣c nước nguồn, BOD càng lớn thì nước thải/nước nguồn bị ô nhiễm càng cao và ngược lại
Hàm lượng Amôni (N-NH4) là hàm lượng nitơ amoni, đơn vị tính là mg/l
Tổng coliform (ngắn go ̣n là Coliforms) là số lượng coliform được biểu diễn
bằng số khả hữu MPN (Most Probable Number)
Tổng c oliform là số vi khuẩn dạng coli trong 100ml nước thải có khả năng lên men sinh hơi đường lactose ở nhiệt độ 370C/24-48 giờ ở điều kiện hiếu khí, được tính bằng MPN/100ml Coliforms gồm 4 giống E.coli, Citrobacter, Enterobacter, Klebsiela Coliforms được xem như một chỉ điểm vi sinh vật thích hợp về chất lượng nước
Hàm lượng Xyanua: là lượng số miligram (mg) xyanua có trong một mili lít (ml) nước; xyanua là CN, ở đây chỉ tính các nhóm CN của các hợp chất có chứa
các ion xyanua hoặc axit hidroxyanic không tính đến các nitril đơn (R-CN), xyanat
(muối của CN) và các ion thioxyanat và xyan clorua
Hàm lượng các kim loại nặng: số mg ion kim loại trong 1 ml nước
c) Ô nhiễm môi trường biển
(1) Tổng quan về ô nhiễm môi trường biển
Ô nhiễm môi trường biển là quá trình biến đổi các thành phần môi trường
nước, trầm tích biển không phù hợp với Quy chuẩn kỹ thuật quốc gia về Môi trường, gây ảnh hưởng xấu đến sức khỏe con người, các sinh vật [5]
Hội nghị của Liên hợp quốc về các vấn đề môi trường tại Stockholm, Thụy
Điển (năm 1972) thống nhất định nghĩa về ô nhiễm môi trường biển: ―Tất cả các
Trang 1111
chất hoặc năng lượng do con người trực tiếp hay gián tiếp đưa vào môi trường biển (kể cả các vùng cửa sông) kéo theo những hậu quả tai hại, như gây thiệt hại tài nguyên sinh vật, nguy hiểm với sức khỏe con người, khó khăn cho hoạt động trên biển (kể cả đánh bắt cá), làm suy thoái chất lượng và giảm các tính chất hữu ích của nước biển‖
(2) Các nguyên nhân chính dẫn đến ô nhiễm môi trường biển
Trong thực tế, môi trường biển có thể bị ô nhiễm do nhiều nguyên nhân khác nhau Nguyên nhân đầu tiên và phổ biến nhất là do sự gia tăng nồng độ chất dinh dưỡng trong biển Các chất dinh dưỡng này có thể có nguồn gốc từ lục địa, là chất thải sinh hoạt và các hoạt động sản xuất công nghiệp, nông nghiệp được sông tải ra biển, hoặc có thể có nguồn gốc trên biển, thải ra biển do các hoạt động của con người Đặc biệt, hầu hết nước thải sinh hoạt từ các khu dân cư và đô thị, các làng nghề và các tàu du lịch hoạt động trên biển chưa qua xử lý
Hiện nay, môi trường biển nước ta đang có dấu hiệu bị ô nhiễm và suy thoái Báo cáo hiện trạng môi trường năm 2003 (đã trình Quốc hội) và Báo cáo hiện trạng môi trường năm 2010 do Bộ Tài nguyên và Môi trường xây dựng đã chỉ ra rằng: Chất lượng môi trường biển và vùng ven bờ tiếp tục suy giảm theo chiều hướng xấu Môi trường vùng nước ven bờ đã bị ô nhiễm dầu, kẽm và chất thải sinh hoạt Còn chất rắn lơ lửng như Si, NO3, NH4 và PO4 cũng ở mức đáng lo ngại Chất lượng trầm tích đáy biển ven bờ - nơi cư trú của nhiều loài thủy hải sản - cũng bị ô nhiễm Dưới đây là mô ̣t số nguyên nhân chính dẫn tới tình tra ̣ng ô nhiễm môi
trường biển ở nước ta
- Các nguồn ô nhiễm từ lục địa theo sông mang ra biển như dầu thải, nước thải chưa xử lý, hoá chất, thuốc trừ sâu, thuốc diệt cỏ, phân bón, chất thải công nghiệp, nông nghiệp, làng nghề, thuốc súng, chất phóng xạ, các chất thải rắn như đất cát, rác, phế thải vật liệu xây dựng, dẫn tới ô nhiễm môi trường biển Có những loại không phân huỷ được đọng lại ở ven bờ, chìm xuống đáy biển, những chất phân huỷ đươ ̣c thì hoà tan trong toàn khối nước biển
- Trong thời gian ngắn, nước ta đã xây dựng thêm nhiều bến cảng, một số cảng trong số đó được xây dựng ở những nơi có các hệ sinh thái nhạy cảm và có giá trị Sự tăng trưởng các cảng biển ẩn chứa nguy cơ ô nhiễm môi trường từ các bến cảng Các công trình cảng biển và hoạt động của cảng biển đều tác động tiêu cực đến môi trường tự nhiên, như mất các nơi sinh cư do lấy đất xây dựng, ô nhiễm
Trang 1212
nước, đất, không khí, tiếng ồn, trong khu vực cảng và phụ cận Tương tự, các công trình sản xuất, nhà máy đóng tàu biển, các công trình đảm bảo du lịch, và rất nhiều các hoạt động khác đều tác động xấu đến môi trường tự nhiên của biển Ô nhiễm của hoạt động hàng hải và công nghiệp đóng tàu gây ra chủ yếu là ô nhiễm nguồn nước do dầu và ô nhiễm trầm tích do lắng đọng các kim loại nặng Chính ô nhiễm môi trường đã tác động xấu cản trở sự phát triển kinh tế - xã hội
- Ngoài ra, việc xây dựng hệ thống hạ tầng cơ sở giao thông, nạo vét luồng lạch để phát triển ngành vận tải biển, dẫn đến phá hoại sinh thái vùng cửa sông, ven biển ngập mặn, vùng đất chua phèn, tạo nên một sự đảo lộn, cùng với việc đổ phế thải dầu, mỡ Hệ thống đường thuỷ phát triển, phương tiện vận tải ngày càng nhiều, lượng dầu mỡ gây ô nhiễm tới 50% nguồn gây ô nhiễm
- Một nguyên nhân gây ô nhiễm môi trường nữa là tràn dầu Sự rò rỉ dầu ra môi trường biển do hoạt động của các tàu và do các sự cố hư hỏng hay đắm tàu chở dầu, do sự cố tại lỗ khoan thăm dò và dàn khoan khai thác dầu đã khiến môi trường biển bị ô nhiễm nặng nề Tại khu vực ngoài khơi và ven biển nước ta, ô nhiễm dầu
đã và đang xảy ra ngày càng nhiều hơn với mức độ ảnh hưởng ngày càng gia tăng
và khu vực chịu ảnh hưởng ngày càng rộng lớn
- Ngoài ra, môi trường biển còn bị ảnh hưởng về ô nhiễm không khí, nguyên nhân là do các hoạt động bốc xếp hàng hoá, sữa chữa, phá dỡ tàu, xây dựng các công trình và giao thông đã làm các cảng ô nhiễm bụi với hàm lượng rất cao
Từ những phân tích trên cho thấy môi trường biển Việt Nam đang suy thoái,
ô nhiễm bởi bụi, tiếng ồn, dầu, chất hữu cơ kể cả trong nước, không khí, đất Thực tế đó đang đòi hỏi cần có một hệ thống có chức năng đánh giá nhanh và đánh giá một cách tổng quát hiện trạng môi trường biển Việt nam
Khi phân tích về hiện trạng môi trường biển, hai yếu tố được quan tâm:
(1) Các thông số về chất lượng nước
Trang 1313
bảo vệ môi trường và phòng chống các nguy cơ gây ô nhiễm môi trường biển Việt nam
1.1.2 Khái quát về địa hóa môi trường biển
a) Khái niệm chung về địa hóa môi trường
Địa hoá học, theo định nghĩa đơn giản của thuật ngữ này là hoá học Trái
Đất, bao gồm việc ứng dụng những nguyên lý cơ bản của hoá học để giải quyết các vấn đề địa chất Địa hóa học là một ngành khoa học mới về Trái Đất Địa hoá học
ra đời làm cầu nối giữa mô ̣t số ngành khoa học tự nhiên cơ bản như vật lý, hoá học với các ngành khoa học về trái đất như khoáng vật học, thạch học, địa chất học
Hình 1 Mối liên quan hữu cơ giữa địa hóa với các ngành khoa học khác
Địa hóa học môi trường (địa hóa môi trường) là việc áp dụng các nguyên lý
hóa học để dự đoán các thành phần của các chất ô nhiễm hữu cơ và vô cơ ở bề mặt của trái đất và trong khí quyển
Do mục đích của đề tài luâ ̣n văn liên quan đến các vấn đề về địa hóa môi trường nên các số liệu và thông số chỉ liên quan đến trầm tích đáy biển ven bờ b) Chất lượng trầm tích đáy biển ven bờ [4]
Hiện tại Việt Nam chưa có quy chuẩn kỹ thuật quốc gia về chất lượng trầm tích biển, cho nên các chuyên gia thường tham khảo tiêu chuẩn của Trung Quốc cho kim loại nặng và hóa chất bảo vệ thực vật với 3 mức độ:
Trang 1414
(1) Cho vùng nuôi trồng thuỷ sản; vùng đánh bắt cá trên biển; khu vực bảo
vệ môi trường tự nhiên, bảo tồn thiên nhiên; khu vực giữ gìn sinh vật tự nhiên, các hoạt động tiếp xúc trực tiếp của con người với trầm tích
(2) Cho khu công nghiệp, cảnh quan và khu du lịch ven biển
(3) Cho vùng cảng, khu phát triển kinh tế, đặc biệt là vùng khai thác công nghiệp trên biển được dùng để đánh giá chất trầm tích
1.2 Tầm quan trọng của việc phân lớp địa hóa môi trường biển
Hiện nay, môi trường, đặc biệt là môi trường biển, là vấn đề nhận được sự quan tâm rất lớn của cộng đồng Các hoạt động của con người cũng như sự thay đổi
về mặt tự nhiên đã làm cho môi trường bị ảnh hưởng nghiêm trọng Và cũng chính
từ sự ảnh hưởng nghiêm trọng này đã dẫn đến một loạt các khó khăn lớn mà con người đang phải đối mặt Sự nguy hại về mặt ô nhiễm của trầm tích biển nếu không được đánh giá kịp thời sẽ là mối nguy hiểm lớn và lâu dài cho chất lượng môi trường biển Chính vì vậy việc đánh giá và phân loại chất lượng trầm tích biển là một công việc quan trọng và thiết thực nhằm góp phần đưa ra các chiến lược, biện pháp nhằm bảo vệ và giảm thiểu các tác hại gây ô nhiễm môi trường
Chất lượng môi trường biển thay đổi, các nơi cư trú tự nhiên của loài bị phá hủy cũng đã gây ra tổn thất lớn về đa dạng sinh học vùng bờ; giảm số lượng loài, một số loài bị tiêu diệt, dẫn đến giảm năng suất khai thác tự nhiên ở vùng biển
Ðã có khoảng 85 loài hải sản có mức độ nguy cấp khác nhau, trong đó có nhiều loại vẫn đang là đối tượng bị tập trung khai thác và trên 70 loài đã được đưa vào sách
đỏ Việt Nam Do đó việc đánh giá và phân loại chất lượng trầm tích biển còn góp phần tạo ra các hoạch định chiến lược cho các tổ chức, cơ quan và người dân có những định hướng phát triển kinh tế trên biển cho phù hợp, mang lại hiệu quả cao
Bên cạnh đó, nó còn đảm bảo phát triển bền vững Kể từ khi khái niệm phát
triển bền vững của Ủy ban môi trường và phát triển thế giới (WCED) ra đời năm
1987, đã có nhiều cách phát biểu khác nhau về phát triển bền vững Tuy có nhiều
cách hiểu khác nhau nhưng hầu hết đều công nhận phát triển bền vững là sự phát
triển hài hòa giữa các mục tiêu tăng trưởng kinh tế với các mục tiêu xã hội và bảo
vệ môi trường; phát triển bền vững còn bao hàm cả khía cạnh phát triển hài hoà,
phát triển trong sự quản lý tốt các mâu thuẫn lợi ích nảy sinh trong quá trình phát triển đó
Trang 1515
Hình 2.Mô hình bảo đảm phát triển bền vững
Việc phân loại địa hóa môi trường ko nằm ngoài mục tiêu bảo vệ môi trường bằng cách đưa ra những đánh giá, dự báo và cảnh báo về chất lượng môi trường biển để có những điều chỉnh hợp lý, kịp thời và đúng hướng trong phát triển kinh tế
- xã hội một cách hài hoà với bảo vệ môi trường nhằm phát triển bền vững
1.3 Bài toán đánh giá địa hóa môi trường biển
1.3.1 Các đặc trưng của địa hóa môi trường biển
Để đánh giá địa hóa môi trường biển cần dựa trên các thông số liên quan đến việc đánh giá các thông số về trầm tích biển hay nói cách khác là các đặc trưng của địa hóa môi trường biển
Trong khuôn khổ của đề tài luâ ̣n văn , chỉ quan tâm đến các đặc trưng sau: hàm lượng dầu trong trầm tích, CN-, hàm lượng kim loại nặng trong trầm tích biển ven bờ: Pb, Zn, As, Cd, Hg, …
Việc đánh giá các đặc trưng của địa hóa môi trường biển dựa trên tiêu chuẩn tham khảo của Trung Quốc Đối với từng thông số riêng, tiêu chuẩn tham khảo của Trung Quốc có những qui định riêng về tiêu chuẩn chất lượng trầm tích biển do vậy đối với từng thông số đặc trưng của địa hóa môi trường biển có thể phân ra từng nhóm riêng
1.3.2 Quan trắc địa hóa môi trường biển [4]
Việc xác định được các thông số liên quan đến chất lượng trầm tích biển như hàm lượng dầu trong trầm tích; CN-; hàm lượng kim loại nặng trong trầm tích biển
Trang 1616
ven bờ: Cu, Pb, Zn, As, … được lấy thông qua các kết quả đo được từ các trạm quan trắc môi trường biển Việt Nam
a) Hiện trạng hệ thống quan trắc môi trường Việt nam
Đến giữa năm 2010, có 42 địa phương trong cả nước đã thành lập Trung tâm quan trắc môi trường
Trung tâm thực hiện các chương trình quan trắc các thành phần môi trường (nước mặt lục địa, nước mưa, nước biển, không khí và tiếng ồn, phóng xạ, đất, chất thải rắn, ) với hàng nghìn điểm quan trắc, trong đó tập trung vào các điểm nóng
về môi trường và các khu vực, các vùng sinh thái đặc biệt nhạy cảm ở hầu hết các địa phương trong cả nước
b) Hệ thống quan trắc môi trường biển
Mạng lưới quan trắc môi trường biển do Tổng cục Bảo vệ Môi trường (Bộ Tài nguyên và Môi trường) điều hành Mạng lưới này đã thực hiện quan trắc chất lượng nước và trầm tích ở ven bờ từ năm 1995 đến nay tại 7 điểm đo miền Bắc (Trà Cổ, Cửa Lục, Đồ Sơn, Ba Lạt, Sầm Sơn, Cửa Lò và Bạch Long Vĩ), 8 điểm miền Trung (Đèo Ngang, Cồn Cỏ, Đồng Hới, Thuận An, Đà Nẵng, Dung Quất, Sa Huỳnh và Quy Nhơn), 7 điểm miền Nam (Nha Trang, Phan Thiết, Phú Quý, Vũng Tàu, Định An, Cà Mau và Rạch Giá), 87 điểm biển khơi Đông Nam (khu vực khai thác dầu khí, vùng dầu khí tiềm tàng (DK), đến tuyến dọc phía Tây quần đảo Trường Sa) và 17 điểm biển khơi Tây Nam Bộ và Côn Sơn
Các trạm ven bờ được quan trắc 4 lần/năm, ngoài khơi 2 lần/năm với các thông số, phương pháp lấy và phân tích mẫu thống nhất (trong đó có thực hiện chương trình đảm bảo và kiểm soát chất lượng)
Bảng 1 Thông số quan trắc và đơn vị đo
Khí tượng thủy văn Đặc điểm thủy văn
Trang 1818
Sinh vật biển Thực vật phù du
c) Dữ liệu địa hóa từ quan trắc môi trường biển
Dưới đây là một bảng đo kết quả trầm tích của một vùng biển miền Trung
Bảng 2 Bảng mẫu kết quả đo chất lượng trầm tích của một vùng biển miền Trung
BIỂU GHI KẾT QUẢ PHÂN TÍCH CHẤT LƯỢNG TRẦM TÍCH
Trạm QT&PTMT: vùng ven biển 2 - Miền Trung
Trang 1919
BIỂU GHI KẾT QUẢ PHÂN TÍCH CHẤT LƯỢNG TRẦM TÍCH
Thời gian lấy mẫu
Mô tả trầm tích
Cấp hạt
Mầu sắc
Mùi
Vỏ sinh vật
Các tạp chất
Nhiệt độ 0C
Độ ẩm %
pH
Eh mV
COD mg/kg
Tổng N mg/kg
Tổng P mg/kg
Dầu trong trầm tích mg/l 69 1128.33 522 458 1222 1195.67 266.67 74.67 CN- mg/l 0.1 0.01 0.06 0.09 0.04 0.08 0.02 0.02 Kim loại nặng Pb mg/l 40.67 111 34.67 91 140 117.33 129.67 222 Zn mg/l 125.67 172 244.67 139.67 217.67 349.33 341.67 538.33 Hg mg/l 0.8 0.17 0.5 0.4 0.43 0.18 0.7 0.72 Cd mg/l 1.17 3.9 1 1.93 0.38 0.13 2.17 3.57 As mg/l 70 21 31.67 177.67 35.67 125 41 97.67 Dư lượng thuốc BVTV trong trầm tích Tổng dư lượng thuốc BVTV mg/kg
Lindane mg/kg
Dieldrin mg/kg
Aldrin mg/kg
Endrin mg/kg
4,4 DDT mg/kg
4,4 DDE mg/kg
4,4 DDD mg/kg
Heptachlor mg/kg
Endosunfan mg/kg
Ghi chú
1: Đèo Ngang 3: Cồn Cỏ 5: Đà Nẵng 7: Sa Huỳnh
2: Đồng Hới 4: Thuận An 6: Dung Quất 8: Quy Nhơn
Trên đây là kết quả đo tại 8 điểm thuộc vùng biển ven bờ miền Trung Các kết quả này
được đo thông qua các thiết bị dùng cho đo đạc tại hiện trường đã nêu ở phần trên
Trang 2020
Chương 2: Mô hình giải quyết bài toán bài toán đánh giá địa hóa môi trường biển Việt nam dựa trên các phương pháp phân lớp
2.1 Nghiên cứu giải pháp phân lớp địa hóa môi trường biển Việt nam
2.1.1 Giới thiệu bài toán phân lớp và một số phương pháp điển hình
Phân lớp là một trong những mối quan tâm nhiều nhất của con người trong
quá trình làm việc với một tập hợp đối tượng Điều này giúp con người có thể tiến hành việc sắp xếp, tìm kiếm các đối tượng một cách thuận lợi Khi biểu diễn đối tượng vào các hệ thống thông tin, tính chất lớp vốn có của đối tượng trong thực tế thường được biểu diễn tương ứng bằng một thuộc tính ―lớp‖ riêng biệt [1]
Phân lớp dữ liệu là kĩ thuật sử dụng tập huấn luyện bao gồm dữ liê ̣u với
nhãn lớp trong một thuộc tính phân lớp trong việc phân lớp dữ liệu mới
Một số thuật toán được sử dụng trong phân lớp như:
- K người láng giềng gần nhất (K – Nearst neighbours);
- Naive Bayes;
- Support Vector Machines (SVM);
- Cây quyết định (Decision Tree);
Thuật toán SVM được lựa chọn là do thuật toán này có một nền tảng lý thuyết vững chắc bên cạnh đó có nhiều nghiên cứu chứng minh thuật toán này có hiệu suất cao
Trang 2121
Việc phân lớp địa hóa môi trường biển sẽ góp phần giúp cho công tác đánh giá, bảo vệ và ngăn chặn các hoạt động nhằm gia tăng ô nhiễm môi trường biển Như đã trình bày ở phần trên, Việt Nam chưa có quy chuẩn kỹ thuật quốc gia về chất lượng trầm tích biển nên việc đánh giá địa hóa môi trường biển Hiện nay, việc đánh giá chất lượng trầm tích biển thường được dựa trên các tiêu chuẩn tham khảo của Trung Quốc và tiêu chuẩn của Canada Trong khuôn khổ của luận văn, các dữ liệu về quan trắc được thu về sau đợt đo đa ̣c sẽ được đánh giá dựa vào tiêu chuẩn tham khảo của Trung Quốc cho kim loại nặng và hóa chất bảo vệ thực vật Tiêu chuẩn này chia ra 3 mức độ như được giới thiệu ở trên
Việc phân lớp cho địa hóa môi trường cũng dựa trên ba mức độ của tiêu chuẩn này Qua đó, có thể phân lớp địa hóa môi trường thành ba lớp Việc đưa một điểm hoặc một vùng nào đó vào lớp nào là dựa vào các thông số liên quan như: hàm lượng dầu, hàm lượng xyanua trong trầm tích biển, hàm lượng kim loại nặng trong trầm tích biển ven bờ: Pb, Zn, As, …
2.1.2 Thuật toán phân lớp Bayes
Thuật toán phân lớp Bayes là một trong những thuật toán phân lớp điển hình nhất trong học máy và khai phá dữ liệu, đây cũng là thuật toán được sử dụng rộng rãi nhất trong phân lớp văn bản Học máy Bayes thường được coi như thuật toán học máy chuẩn để so sánh với các thuật toán khác
a) Công thức xác suất có điều kiện
Xác suất điều kiện của biến cố A với điều kiện biến cố B đã xảy ra là một
số không âm
Ký hiệu là P(A/B) biểu thị khả năng xảy ra biến cố A trong tình huống biến cố B đã xảy ra Ký hiệu là P(B/A) nó biểu thị khả năng xảy ra biến cố B trong tình huống biến A đã xảy ra
Công thức xác suất có điều kiê ̣n Bayes :
Trang 2222
P(A) = ∑ P(B i )*P(A/B i ) c) Công thức xác suất Bayes
Từ các công thức ở trên ta có công thức xác suất Bayes:
P(B k /A) = (P(AB k ))/(P(A)) = (P(B k )*P(A/B k ) )/(ΣP(B i )*P(A/Bi i ) d) Phân lớp Naive Bayes
Phân lớp Naive Bayes là phương pháp phân loại sử dụng tri thức các xác suất
đã qua huấn luyện Phương pháp này thích hợp với những lớp bài toán đòi hỏi phải
dự đoán chính xác lớp của mẫu cần kiểm tra dựa trên những thông tin từ tập huấn luyện ban đầu
Ý tưởng chính của thuật toán là tính xác suất hậu nghiệm của sự kiện c xuất hiện khi sự kiện x đã có trong không gian ngữ cảnh 𝜏 thông qua tổng hợp các xác suất tiên nghiệm của sự kiện c xuất hiện khi sự kiện x đã có trong tất cả các điều kiện riêng T thuộc không gian 𝜏:
𝑝 𝑐 𝑥, 𝜏 = 𝑇 𝑖𝑛 𝜏𝑝 𝑐 𝑥, 𝑇 𝑝(𝑇|𝑥 ) Cho một lớp c và một kết quả X đo chất lượng trầm tích gồm nhiều thông
số, nếu xác suất p(X|a) tính được lớn hơn hoặc bằng giá trị ngưỡng CTshc của lớp
c thì kết luận chất lượng trầm tích đó thuộc lớp c
Kết quả X đo chất lượng trầm tích được biểu diễn như một vectơ có kích thước bằng số thông số của trầm tích Mỗi thành phần này chứa một thông số trong kết quả đo X và tần suất xuất hiện của thông số đó trong kết quả đo X, tính toán p(c|X) và quyết định xem kết quả X sẽ thuộc lớp nào
Xác suất p(c|X) được tính theo công thức sau:
Trang 2323
Fj: tham số thứ j trong tập tham số V;
TF(Fj|X): tần suất xuất hiện của Fj trong kết quả đo X;
TF(Fj|c): tần suất xuất hiện của Fj trong lớp c;
p(Fj|c: xác suất có điều kiện để Fj xuất hiện trong kết quả đo X của lớp c
Để giảm sự phức tạp và thời gian tính toán, công thức trên được viết lại như sau: