Lời mở đầu Tài toán phân lớp trong địa hóa môi trường biển là bài toán xác định xem các đữ liệu đo các thông số Lừ trạm quan trắc sẽ nằm trong sáo mức nao theo qui định về mỗi trường..
Trang 1ĐẠI HỌC QUỐC GIÁ HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐOÀN THUỶ LINIT
NGHIÊN CỨU GIẢI QUYẾT PHÂN LỚP DIA HOA MOI
TRƯỜNG BIẾN VÀ ÀP DỤNG VÀO BÀI TOÁN ĐÁNH
GIA DIA HOA MOT TRUONG BIEN VIET NAM
LUAN VAN THAC Si
TẢ NỘI - 2011
Trang 2ĐẠI HỌC QUỐC GIÁ HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐOÀN THUỲ LINH
NGHIÊN CỨU GIẢI QUYÉT PHÂN LỚP ĐỊA HOÁ MÔI TRƯỜNG BIÊN VÀ ÁP DỤNG VÀO BÀI TOÁN ĐÁNH
GIÁ ĐỊA HOÁ MÔI TRƯỜNG BIẾN VIỆT NAM
Ngành: Công nghệ Thông tin
Chuyên ngành: Hệ thống Thông tin
Trang 3Lời mở đầu
Tài toán phân lớp trong địa hóa môi trường biển là bài toán xác định xem các
đữ liệu đo các thông số Lừ trạm quan trắc sẽ nằm trong sáo mức nao theo qui định
về mỗi trường Đây hiện là một trong những vấn đề đang được quan lâm vì thông
qua việc phân lớp dịa hóa môi trường, la có thể dưa ra các hưởng xử lý nhanh cho vùng môi trường vừa dược thực hiện công tác do dạo, khảo sát Cũng từ đó có thể
đưa ra được các chiến lược nhằm khắc phục, hạn chế và bảo vệ các tác đông đo
thiên nhiên hoặc con người gây ảnh hưởng đến môi trường biển
Dựa trên cơ sở những yêu cầu của bài toán, dựa trên các đặc trưng của dữ liệu mả luận văn chọn hai hướng tiếp cận sử dụng máy hỗ trợ vector (SVM) và
Naive Bayes để giải quyết bải toán phân lớp địa hóa môi trường biển Ý tưởng của hướng tiếp cận là biểu điễn mỗi số liệu trong mỗi kết quả đo là một vectơ đặc
trưng Sau đó được đưa vào bộ phân lớp SVMI, Maive Dayes để xác định tính chất
tương đồng và đưa ra kết luận Nguồn dữ liệu sử đụng là các file đữ liệu về kết quả
quan trắc môi trường biển thuộc các đơn vị có liên quan để xây dựng dữ liệu học
cho mô hình đề xuất
Kết quả phân thực nghiệm bước đâu trên mô hình đề xuất đôi với thuật toán
Naive Bayes va md hinh đề xuất đối với thuật toán SVMI đạt độ chính xác là trên 80% Tuy nhiên, đựa vào kết quả thu được có thể cho thấy việc sử đụng thuật toán SVM cho kết quả cao hơn so với thuật toán Naive Payes vá dựa kết quá này cũng
có thể xem mô hình là khả thi và có khả năng img dụng thực tế
Nội dung của khóa luận bao gỗm có 3 chương,
Chương 1: Giới thiêu các khái niệm về môi trường biến, ô nhiễm môi trường
và tổng quan về địa hóa môi trường biển Trinh bày một số đặc trưng của địa hóa
môi Irường biển (cáo (hông số về trầm tích biển)
Chương 2: Trên cơ sở những phương pháp tiếp cận trình bảy ở chương l và thông qua khảo sát miền dữ liệu về quan trắc môi trường biển, luận văn đã tìm hiểu
các thuật toán liên quan đến hướng nghiên cứu về giải nháp phân lớp địa hỏa môi trưởng biển Việt Nam Đây cũng là cơ sử lý thuyết, phương pháp luận quan trọng
để luận văn dưa ra mô hình để xuất giải quyết bài toán phân lớp dịa hỏa mỗi trường biển Việt Nam và đưa ra phương pháp giải quyết bài toán phân lớp dịa hóa môi
trường biển Việt Nam dựa trên phương pháp máy hỗ trợ vector (SVM) và phương pháp Naive Bayes.
Trang 4Chương 3: Thực nghiệm, kết quả và dánh giá Tiến hành thực nghiệm việc
xây dựng bộ dữ liệu học, xây dựng bộ phân lớp SVM và Naive Bayes
Kết luận và dịnh hướng nhát triển: Tóm lược những kết quả đạt được của luận văn Đồng thời đưa ra những hạn chế, những điểm cần khắc phục và đưa ra
định hướng nghiên cứu trong thời gian tới.
Trang 51.1.1 Một số khái niệm cơ bản ương môi trường biển (3, 4, SỊ
1.2 Tâm quan trọng của việc phân lớp dịa hỏa môi trường biển -.14 1.3 Bài toán đánh giá địa hóa môi trường biển co sec we LS
1.3.1 Các đặc trưng của địa hóa môi (udng bIGR essences - 18
Chương 2: Mô hình giải quyết hài toán bài toán dánh giá
3.1 Nghiên cứu giải pháp phân lớp địa hóa môi trường biển Việt nam 20
2.1.1 Giới thiệu bài toản phân lớp và một số phương pháp điển hình 20
2.1.3 Thuật toàn phân lớp 8VM Hee rreeree - 26
2 Mô hình đánh giá địa hóa môi trường biển Việt nam dựa trên các phông pháp
3.2.1 Phát biển bài toán đánh giả địa hóa mỗi trường biển 31 2.3.2 Mô hình giải quyết bài toán đánh giá dia hoa méi trường biển Việt Nam 32
Chương 3: Thực nghiệm và đánh giá 37
Trang 7Môi liên quan hữu cơ giữa địa hóa với các ngành khoa học khác 13
Biểu diễn của mặt phẳng siêu phing cia SVM 27
Các lựa chọn tham sẽ đối với thuật toán phân lớp Naive Bayes với kịch
Bảng mẫu kết quả do chất lượng trầm tich của một vùng biên miễn Trung 18
Đánh giá thông 36 quan trắc warn tích qua Liêu chuẩn thang khảo Trung Quốc 25 Câu hình phần cứng, 37 Danh sách các phần mềm sữ dụng, 37 Kết quả thực nghiệm sử đụng phương pháp Naive Iayes với kịch bản 1 41 Kết quả thực nghiệm sử dụng phương pháp Naive Bayes với kịch bán 2 42
Kết quả thực nghiệm sử đụng phương pháp SVM với kịch bản 1 4
Kết quả thực nghiệm sử dụng phương pháp SVM với kịch bản 2 we 4
Trang 8'Tử hoặc cụm từ Kí hiệu viết tắt
Most Probable Number MPN
Trang 9
Chuong 1: Khai quát về địa hóa môi trường biển Việt Nam và giải pháp
phân lớp
1.1 Dịa hảa môi trường biển
1.1.1 Một số khái niệm cơ bản trong môi trường biển [3, 4, 5]
a) Khải niệm về mỗi trường biển
Mãi trường tự nhiên có thể được định nghĩa như là tổ hợp của các yếu tổ khí
hậu, sinh thái hoc, hoá học và thổ nhưỡng tác động lên con người và các cơ thể
sống khác và xác định các hình thức sinh tồn của chúng Vì thế, môi trường bao
Ất hay các hành vi của con người và các cơ thể sống hay các loài, bao gầm ảnh sảng, không
gồm tất cá các yếu Lỗ mà có thể có ảnh hưởng trực tiếp đến sự trao đổi cÌ
khi, nước, đất và các cơ thể sống khác
Mãi trường biẫn có thé được định nghĩa như là tổ hợn của các yếu lễ vật lý, hỏa học và sinh học đặc trưng cho nước biển, đất vơn biển, trầm tích dưới biển, không khí trên mặt biển và các hệ sinh thải biển tôn tại một cách khách quan, anh
hưởng đến con người và sinh vật
Hay nói một cach cu thé hon, mdi trưởng biển bao gầm tắt cả yếu tổ mà có thể có ảnh hướng trực tiếp dến sự trao đổi chất hay các hành vi của con người và
các sinh vật sống trong biển, bao gồm ánh sáng, không khí trên biển, nước biển, đất
ven biển, đất tại đáy biển (trầm tích biển) và các cơ thể sống trong biển
Thành phẫn môi trường biển là các yêu tố vất chất tạo thành môi trường, biến như nước biển, đất ven biển, trầm tích dưới day biển, không khí, âm thanh, anh sáng sinh vật biển, các hề sinh thái biển và các hình thái vật chất khác
°) Các yếu tố đặc trưng của nước hiển ven bo
Ham long TSS trong nue (TSS - Total Suspcndcd Solid) là tổng chất rắn
lơ lửng trong nước được tính bằng cách cân trọng lượng những chất còn lại trên
giấy lọc khi lọc nước phân tích chất rắn hoả tan T88 biểu thị lượng vật chất không
hỏa tan lơ lững trong nước và dược biểu thị (do) hằng, miligam trên lít (mp/D)
Nhu cau éxy hoa hoc (COD - Chemical Oxygen Demand) là lượng oxy cd
trong Kali bicromat (K;Or2O;) được sử dụng dễ oxy hoá chất hữu cơ trong nước Chỉ số (O1) được sử dụng rộng rãi để đo gián tiếp khối lượng các hợp chất hữu cơ
có trong nước Phần lớn các ứng dụng của COI xác dịnh khối lượng của các chất ô
Trang 10nhiễm hữu cơ tìm thấy trong nước bể mặt (ví dụ trong cáo con sông hay hồ), làm cho COD la một phép đo hữu ích về
vị đo là mạ/I, chỉ ra khối lượng ôxy cẦn tiêu hao trên một lit dung dich
ất lượng nước Nó được biểu diễn theo đơn
Nhu chu day sinh học (BOD - Biochemical Biological Oxygen Demand) là luong oxy cần cung cấp để oxy hoá các chất hữu cơ trong nước bởi vị sinh vật
BOD là một chỉ số và dễng thời là mệt thủ tục được sở dụng dễ xác dịnh xem các
sinh vật sử dụng hết ôxy trong nước nhanh hay chậm ra sao BOI được sử dụng
à khảo sát chất lượng nước cũng như trong sinh thái học hay khoa
trong quân lý
học mỗi trường
Chi tigu BOD phan anh mite độ ô nhiễm hữu cơ của nước thải hoặc nước
nguôn, BOD cảng lớn thì nước thải/nước nguôn bị ô nhiễm càng cao và ngược lại
Hàm lượng Amôni (N-NH,) là hàm lượng nitơ amoni, đơn vị tính là mụ/1
Tổng colifurm (ngắn gọn lả Coliforms) là số lượng coliform được biểu diễn bing sé kha hitu MPN (Most Probable Number)
Téng coliform là số vi khuẩn dạng col trong 100ml nước thải só khả năng
lên men sinh hơi đường lactose ở nhiệt độ 370C/24-4§ giờ ờ điều kiện hiếu khi, được tính bằng MDN/100ml Colioms gồm 4 giống E.coli, Citrobacter,
Enterobacter, Klcbsicla Coliforms dược xem rửnz một chỉ điểm vi sinh vật thích
hợp về chất lượng nước
Hăm lượng Xyanua: là lượng số miligram (mg) xyanua có trong một mili
lít (ml) nước; xyanua là ƠN, ở dây chỉ tính các nhóm ƠN của các hợp chất có chứa các ion xyanua hoặc axit hidroxyanic không tỉnh đến các nitril dơn (R-ƠN), xyanat
(muối của CN) và các lon thioxyanat và xyan clorua
Ham lượng các kim loại nặng: số mg ion kim loại trong ] mÌ nước
€) Ô nhiễm môi trường biến
(1) Tang quan vé ô nhiễm môi trường biển
Ô nhiễm mỗi trường biển là quá trình biển dổi các thành phần môi trưởng
nước, trầm tích biển không phủ hợp với Quy chuẩn kỹ thuật quốc gia về Môi
trường, gây ảnh hưởng xấu đến sức khỏe con người, các sinh vật [5]
Hội nghị của Liên hợp quốc về các vấn để môi trường tại Stockholm, ‘Thuy
Diễn (năm 1972) thống nhất định nghĩa về ô nhiễm môi trường biến: “Tắt cả các
10
Trang 11chất hoặc năng lượng do con người trực tiếp hay gián tiếp dưa vào môi trường biển
(kể cá các vùng cửa sông) kéo theo những hậu quả tai hại, như gây thiệt bại tải nguyên sinh vật, nguy hiểm với sức khóc con người, khó khăn cho hoạt dộng trên
biển (kể cả đánh bắt cá), làm suy thoái chất lượng và giảm các tính chất hữu ích của
nước biển”
Œ) Các nguyên nhân chính dẫn đến 6 nhiễm mỗi trường biến
Trong thực tế, môi trưởng biển có thể bị ô nhiễm do nhiều nguyên nhân kháu nhau Nguyên nhân dầu tiên và phổ biến nhất là do sự gia tăng nồng độ chất dinh
dưỡng trong biển Các chất đinh dưỡng này có thể có nguồn pốc từ lục dịa, là chất
thải sinh hoạt vả các hoạt động sản xuất công nghiệp, nông nghiệp dược sông tải ra
biển, hoặc có thể có nguồn gốc trên biển, thải ra biển do các hoạt đông của con
người Đặc biệt, hâu tiết nước thải sinh hoạt từ các khu đân cư và đô thị, các lang
nghề và các tàu đu lịch hoạt động trên biển chưa qua xứ lý
Hiện nay, môi trường biển nước ta đang có đâu hiệu bị ô nhiễm vả suy thoái Báo cáo hiện trạng môi trường năm 2003 (đã trình Quốc hội) và Báo cáo hiện trạng môi trường năm 2010 do Bộ Tải nguyên và Mỗi tường xây dựng đã chi ra ring: Chất lượng môi trường biển và vùng ven bờ tiếp tục suy giảm theo chiều hướng
xấu Môi trường vùng nước ven bờ đã bị ô nhiễm đầu, kẽm và chất thải sinh hoại Còn chất rắn lơ lửng như 8i, NO;, NHạ vá PO¿ cũng ở mức dang lo ngại Chất lượng trầm tích đáy biển ven bờ - nơi cư trú của nhiều loài thủy hải sản - cũng bị õ nhiễm Dưới dây là một số nguyễn nhân chính dẫn tới tình trạng ô nhiễm môi
trường biển ở nước ta
- Các nguồn ö nhiễm tử lục địa thoo sông mang ra biển như dầu thải, nước thải chưa xử lý, hoá chất thuốc trừ sâu, thuốc điệt có, phân bón, chất thải công,
nghiệp, nông nghiệp, lang nghé, thuốc súng, chất phóng xạ, các chất thải rắn như
đất cát, rác, phể thải vật liêu xây dựng dẫn tới ô nhiễm môi trường biển _ Có
những loại không phân huỷ được đọng lại ở ven bờ, chìm xuống đáy biển, những chất phân huỷ được thì hoả tan trong toàn khối nước biển
- Trong thời gian ngắn, nước ta đã xây dựng thêm nhiều bến cảng, một số cảng trong số đó được xây dựng ở những nơi có các hệ sinh thái nhạy cảm và có giá trị Sự tăng trưởng các câng biển ẩn chứa nguy cơ ô nhiễm môi trường từ các bến cảng Các công trình cảng biển và hoạt động của cảng biến đều tác động tiêu
cực đến môi trường tự nhiên, như mắt các nơi sinh cư do lẫy đái xây dựng, ô nhiễm
11
Trang 12nước, đất, không khí, tiếng én, trong khu vue cáng và phụ cần Tương tự, các công trình sản xuất, nhà máy đóng tàu biển, các công trình đám báo du lịch, vả rất nhiều các hoạt động khác déu tac động xấu dến mỗi trường tự nhiên của biển Ổ
nhiễm của hoạt đông hàng hải vả công nghiệp đóng tu gây ra chủ yếu lả ô nhiễm nguồn nước đo dầu và ô nhiễm trâm tích do lắng đọng các kim loại nặng Chính 6 nhiễm môi trường đã tác động xấu cản trở sự phát triển kinh tế - xã hội
- Ngoài ra, việc xây dựng hệ thông ha ting co sở giao thông, nạo vét luồng
lạch để phát triển ngành vận tải biển, dẫn đến phá hoại sinh thái vũng cửa sông, ven
biển ngập mặn, vùng đất chua phèn, tạo nên một sự đảo lộn, cùng với việc dé phê thải dầu, mỡ IIệ thống đường thuỷ phát triển, phương tiện vận tải ngày càng nhiều,
lượng dầu mỡ gây ô nhiễm tới 50% nguồn gây ô nhiễm
- Một nguyên nhân gây ô nhiễm môi trường nữa là trần đầu Sự rỏ rỉ đầu ra môi trường biển đo hoạt động của các tàu và do các sự cố hư hỏng hay đắm tàu chở
đầu, đo sự cố tại lỗ khoan thăm đè và đàn khoan khai thác đầu đã khiến môi trường
hiển bị ô nhiễm nặng nề Tại khu vực ngoài khơi và ven biển nước La, 6 nhiễm dầu
dã và đang xây ra ngay cảng nhiều hơn với mức dộ ảnh hưởng ngày cảng gia lắng
và khu vực chịu ảnh hướng ngày cảng rộng lớn
- Ngoài ra, môi trường biên còn bị ảnh hưởng về ô nhiễm không khí, nguyên
ép hang hoa, sữa chữa, phá đỡ tảu, xây dựng các
nhân là do các hoạt động bắc
công trinh và giao thông đã làm các căng õ nhiễm bụi với hàm lượng rẤL cao
Từ những phân tích trên cho thấy môi trường biển Viêt Nam đang suy thoái,
ô nhiễm bởi bụi, tiếng ôn, dầu, chất hữu cơ kể cả trong nước, không khí, đãi
Thực tế dó dang dỏi hỏi cần có một hệ thống có chức năng đánh giá nhanh vả đánh
giả một cách tẳng quát hiện trạng môi trường biển Việt nam
Khi phân tích về hiện trạng môi trường biển, hai yếu tổ được quan tâm
(1) Các thông số về chất lượng nước
(2) Các thông số về chất lượng trầm tích
Tựa vào hai yếu tổ này, các chuyên gia có thể dưa ra đánh giá về chất lượng,
môi trường biên Việt nam
ất lượng rằm
Trong khuôn khổ luận văn , chỉ đề cập dến các thông số
tích Dựa vào các thông số về chất lượng trầm tích có thể đưa ra các đánh giá nhanh
về dịa hóa môi trường biển Việt nam, từ đỏ có các phương hướng, chiến lược nhằm
12
Trang 13bảo vệ môi trường va phòng chống các nguy cơ gây ô nhiễm môi trường biển Việt
nam
1.1.2 Khái quát về địa hóa môi trường biển
a) Khải niệm chung về địa hóa môi trường
Địa hoá học, theo định nghĩa đơn giản của thuật ngữ này là hoá học Trái
Đất, bao gồm việc ứng dụng những nguyên lý cơ bản của hoá học để giải quyết các
vấn đề địa chất Địa hóa học là một ngành khoa học mới về Trái Đất Địa hoá học
ra đời làm cầu nối giữa một số ngành khoa học tự nhiên cơ bản như vật lý, hoá học
với các ngành khoa học về trái đất như khoáng vật học, thạch học, địa chất học
Hình 1 Mối liên quan hữu cơ giữa địa hóa với các ngành khoa học khác
Địa hóa học môi trường (địa hóa môi trường) là việc áp dụng các nguyên lý
hóa học đề dự đoán các thành phần của các chất ô nhiễm hữu cơ và vô cơ ở bề mặt của trái đất và trong khí quyền
Do mục đích của đề tài luận văn liên quan đến các vấn đề về địa hóa môi
trường nên các số liêu và thông số chỉ liên quan đến trầm tích đáy biên ven bờ
b) Chất lượng trầm tích đáy biển ven bờ [4]
Hiên tại Việt Nam chưa có quy chuẩn kỹ thuật quốc gia về chất lượng trầm
tích biển, cho nên các chuyên gia thường tham khảo tiêu chuẩn của Trung Quốc
cho kim loại nặng và hóa chất bảo vệ thực vật với 3 mức độ
13
Trang 14(1) Cho vùng nuôi trồng thuy san, ving dánh bat cá trên biển, khu vực báo
vệ môi trường tự nhiên, bão Lồn thiên nhiên; khu vực giữ gìn sinh vật tự nhiên, các hoạt đông tiếp xúc trực tiếp của con người với trầm tích
(2) Cho khu công nghiệp, cảnh quan và khu du lịch ven biển
() Cho vùng cảng, khu phát triển kinh tế, đặc biệt là vùng khai thác công nghiệp trên biển được đùng để đánh giá chất trầm tích
1.2 Tam quan trọng của việc phân lớp dịa hóa môi trường biển
Hiện nay, môi trường, đặo biệt là mỗi trường biển, là vấn đề nhận được sự
quan tâm rất lớn của cộng đồng Các hoạt động của con người cũng như sự thay đổi
về mặt tự nhiên đã làm cho môi trường bị ảnh hưởng nghiễm trọng Vả cũng chỉnh
từ sự ảnh hưởng nghiêm lrọng này đã dẫn đến một loạt các khó khăn lớn ma con
người đang phải đối mặt Sự nguy hại về mặt ô nhiễm của trầm tích biển nêu không,
được đánh giá kịp thời sẽ là mỗi nguy hiểm lớn và lâu dai cho chất lượng môi
trường biển Chính vi vậy việc đánh giá và phân loại chất lượng trầm tích biển là một cỗng việc quan trọng và thiết thực nhằm góp phần đưa ra các chiến lược, biện
pháp nhăm bảo vệ vả giảm thiểu các tác hại gây ô nhiễm môi trường
Chất lượng môi trường biển thay đổi, các nơi cư trú tự nhiên của loài bị phá thủy cũng đã gây ra tên thất lớn về đa đạng sinh học vùng bờ; giảm số lượng loái,
một số loài bị tiêu diệt, dẫn đến giảm năng suất khai thác lự nhiên ở vùng biển
Đã có khoảng 85 loài hải sản có mức độ nguy cấp khác nhau, trong đỏ có nhiều loại vẫn đang lá đối tượng bị lập trung khai tháo vả trên 70 loài đã được đưa vào sách
đỗ Việt Nam Do đỏ việc dánh má và phân loại chất lượng trầm tich biển còn pop
phần tạo ra các hoạch định chiến lược cho các tổ chức, cơ quan vả người dân có những định hướng phát triển kinh tế trên biển cho phù hợp, mang lại hiệu quả cao
Bên cạnh đó, nó còn đấm bảo phí: triển bên vững Kễ từ khi khái niệm phát triển bền vững của Ủy ban môi trường vả phát triển thể giới (WCED) ra dời năm
1987, đã có nhiễu cách phát biểu khác nhau về phát triển bền vững Tuy có nhiều cách hiểu khác nhau nhưng hẳu hết đều công nhận phát triển bên vững là sự phát triển hài hòa giữa các mục tiêu tăng trường kinh tễ với các mục tiêu xã hội và bảo
vệ môi trường, phát triên bên vững còn bao hàm cả khía cạnh phát triển hài hoà,
phát triển trong sự quán lý Lốt các mâu thuẫn lợi ích nảy sinh trong quá trình phát
triển đó
14
Trang 15
Hình 2.Mô hình bảo đảm phát triển bền vững
Việc phân loại địa hóa môi trường ko nằm ngoài mục tiêu bảo vệ môi trường
bằng cách đưa ra những đánh giá, dự bảo và cảnh báo về chất lượng môi trường
biển để có những điều chỉnh hop ly, kịp thời vả đúng hướng trong phát triển kinh tế
~ xã hội một cách hài hoà với bảo vệ môi trường nhằm phát triển bền vững
1.3 Bài toán đánh giá địa hóa môi trường biển
1.3.1 Các đặc trưng của địa hóa môi trường biển
Để đánh giá địa hóa môi trường biển cần dựa trên các thông số liên quan đến
việc đánh giá các thông số về trầm tích biển hay nói cách khác là các đặc trưng của
địa hóa môi trường biển
Trong khuôn khổ của đề tài luận văn, chỉ quan tâm đến các đặc trưng sau:
hàm lượng dâu trong trầm tích, CN-, hàm lượng kim loại nặng trong trầm tích biển
ven bo: Pb, Zn, As, Cd, Hg,
Việc đánh giá các đặc trưng của địa hóa môi trường biển dựa trên tiêu chuẩn
tham khảo của Trung Quốc Đối với từng thông số riêng, tiêu chuẩn tham khảo của
Trung Quốc có những qui định riêng về tiêu chuẩn chất lượng trầm tích biển do vậy đối với từng thông số đặc trưng của địa hóa môi trường biển có thể phân ra từng
nhóm riêng
1.3.2 Quan trắc địa hóa môi trường biển [4]
Việc xác định được các thông số liên quan đến chất lượng trầm tích biển như
hàm lượng dầu trong trầm tích; CN-; ham lượng kim loại nặng trong trằm tích biển
15
Trang 16ven ba: Cu, Pb, Zn, As, dược lấy thông qua các kết quả do được từ các trạm quan trắc môi trường biển Việt Nam
4) Hiện trạng hệ thống quan trắc môi trường Việt nam
Tến giữa năm 2010, có 42 địa phương trong cã nước đã thành lập Trung tâm quan trắc môi trường
‘Trung tâm thực hiện các chương trinh quan trắc các thành phần môi trường
(nước mặt lục địa, nước mưa, nước biển, không khí và tiếng én, phóng xạ, đất, chất
thải rắn, ) với hàng nghìn điểm quan trắc, trong đó tập trung vào các điểm nóng
về môi trường và các khu vực, các vùng sinh thái đặc biệt nhạy cảm ở hầu hết các
địa phương trong cả nước
b) Hé théng quan trắc môi trường biển
Mạng lưới quan trắc môi trường biển do Tổng cục Bảo vệ Môi trường (Bê
‘Tai nguyên và Môi trường) điều hành Mạng lưới nay đã thực hiện quan trắc chất lượng nước và trầm tích ở ven bờ tử năm 1995 đến nay tại 7 điểm đo miền Dắc
(Trả Cả, Cửa Lục, Đồ Sơn, Ba Lat, Sam Son, Cita LO va Bach Long Vi), 8 điểm
miền Trung (Đẻo Ngang, Cồn Cỏ, Đồng lIới, Thuận An, Đà Nẵng, Dung Quất, Sa
Huỳnh và Quy Nhơn), 7 điểm miền Nam (Nha Trang, Phan Thiết, Phú Quý, Vũng
Tau, Dinh An, Ca Mau va Rạch Giá), 87 điểm biển khơi Đông Nam (khu vực khai
thác dầu khi, ving dầu khí tiềm tang (19K), đến tuyển dọc phía Tây quân đảo Trường,
Sa) và 17 diểm biển khơi Tây Nam Hộ và Côn Sơn
Các trạm ven hờ được quan trắc 4 lằn/năm, ngoài khơi 2 lần/năm với các thông số, phương pháp lẫy và phần tích mẫu thống nhất (trong dó có thực hiện chương trình đảm bảo và kiểm soát chất lượng)
Bảng 1 Thông số quan trắc và đơn vị do
Khí tượng thủy vẫn Dặc điểm thủy văn
Trang 1820 | Khôi lượng mại
lượng dâu trong tram tich, CN-, các thông sô về kim loại nặng (Pb, Zn, As, Hg, .)
€) Dữ liệu địa hóa từ quan trắc mỗi trường biển
Tưới đây là một bảng đo kết quả trằm tích của một ving biển miền Trung
Bang 2 Bang mẫu kết quả áo chất lượng trầm tích của một vùng biển miễn Trung
BIEU GHI KET QUA PHAN TiCH CHAT LUGNG TRAM TICE
Trạm QT&PTMT: vùng ven bién 2 Miễn Trưng
VỊ trí quan trắc Hiển ven bờ Miễn Trung,
Viện Tia hoe 'Nơĩ phân ch:
14/3/2006 'Ngây hoàn thành phân tich
Người kiểm tra Nguyễn Vũ Tưởng
Mẫu
Hon
Thông số a 1 2 3 4 £ 6 8
Trang 19
BIEU GHI KET QUA PHAN TiCH CHAT LUGNG TRAM TICH
‘Kim leai nang
Dư lượng thudc BVTV trong trim tich
Tông dư lượng thuốc
Trên dây là qua do tai 8 diễm thuộc vũng biển ven bở miễn Trung Các kết quã này
được đo thông qua các thiết bị đùng cho đo đạc tại hiện trường đã rêu ở phần trên
19
Trang 20Chương 2: Mô hình giải quyết bài toán bài toán đánh giá địa hóa môi trường biến Việt nam dựa trên các phương pháp nhân lớp
2.1 Nghiên cứu giải pháp phân láp địa hỏa môi trưởng biên Liệt nam
2.1.1 Giới thiệu bài toán phân lớp và một số phương pháp điển hình
Phân lớp là một trong những mỗi quan tâm nhiều nhất của con người trong, quá trình lảm việc với một tập hợp dối tượng Điều nảy giúp con người có thể tiến hành việc sắp xếp, tìm kiếm các đối tượng một cách thuận lợi Khi hiểu diễn đối
tượng vào các hệ thông thông tin, tính chất lớp vốn có của đổi tượng trong thực tế thường được biểu điễn tương ứng bằng một thuộc tính “lớp” riêng biệt [ L]
Phân lớp dữ liệu là kĩ thuật sử dụng tập huấn luyện bao gồm dữ liệu với
nhãn lớp trong một thuộc tính phân lớp trong việc phân lớp đữ liệu mới
Một số thuật toán dược sử dụng trong phân lớp như:
- K người lắng giềng gan nhat (K — Nearst neighbours),
- Naive Bayes,
- Support Vector Machines (SVM);
- Cây quyét dinh (Decision 'Tree),
- Mạng Nơron:
Trong khuôn khổ đề tài, chỉ tập trung tìm hiểu va cải đặt 2 thuật toán dùng
trong phân lớp là: Naive Bayes và §VML
Việc lựa chọn thuật toán phân lớp Narve Bayes là do thuật toán này được
đánh giá là cài đặt đơn giản, tốc đệ thực hiên thuật toán nhanh, dễ dàng cập nhật dữ
liệu huấn luyện mới và có tính độc lập cao đối với tập huấn luyện goải ra, thuật
toản phân lớp Bayes cũng là một trong những thuật toán phân lớp điển hình nhật
trong học máy và khai phá đữ liệu Trang học máy, ayes thường được coi như
thuật toán học máy chuẩn để so sánh với các thuật toán khác
Thuật toán SVM được lựa chọn là do thuật toán này có một nến tảng lý
thuyết vững chắc bên cạnh đó có nhiều nghiên cứu chứng m¡nh thuật toán này có
hiệu suất cao.
Trang 21Việc phân lớp địa hóa môi trường biển sẽ góp phần giúp cho công tác dánh giá, bão vệ và ngăn chặn sáo hoạt động nhằm gia tăng ô nhiễm môi trường biển Nhu di trinh bay ở phần trên, Việt Nam chưa có quy chuẩn kỹ thuật quốc gia về
chất lượng trằm tích biển nên việc đánh giá địa hóa môi trường biển Hiện nay, việc đánh giá chất lượng trầm tỉch biển thường được dựa trên các tiêu chuẩn tham khảo
của 1rung Quốc và tiêu chuẩn của Canada rong khuôn khổ của luận văn, các đữ liệu về quan trắc được thu về sau đợt đo đạc sẽ được đánh giá đựa vào tiêu chuẩn
tham khảo của Trung Quốc cho kim loại nặng và hóa chất bảo vệ thực vật Tiêu
chuẩn này chia ra 3 mức độ như được giới thiệu ở trên
Việc phân lớp cho địa hóa môi trường cũng đựa trên ba mức độ của tiêu
chuẩn nảy Qua đó, có thể phân lớp địa hóa môi trường thành ba lớp Việc đưa một
điểm hoặc một vùng nào đó vào lớp nào là dựa vào các thông số liên quan như
hảm lượng dầu, hàm lượng xyanua trong trâm tích biển, hàm lượng kim loại nặng trong trầm tích biển ven bờ: Pb, Zn, As,
2.1.2 Thuật toán phân lớp Bayes
Thuật toán phân lớp Bayes là một trong những thuật toán phân lớp điển
hình nhất trong học máy và khai phá dữ liệu, đây cũng là thuật toán được sử đụng
rộng rãi nhất trong phân lớp văn bản llọc máy Iayes thường được coi như thuật
toán học máy chuẩn để so sánh với các thuật toán kháu
a) Công thức xác suất có điều kiện Xác suất diều kiện của biến cổ A với diễu kiện biển cổ B đã xảy ra là một
số không âm
Tý hiệu là P(A/B) biểu thị khả năng xấy ra biển cổ A trong tỉnh huỗng biến
cổ B đã xảy ra Ký hiệu là P(3/A) nó biểu thị khả năng xây ra biển cổ H trong tinh
huéng biến A đã xây ra
Công thức xác suất có diễu kiện Bayes
TẠP) = f(AP)/Œ@))
Suy ra
P(A/R) P(B) = PQB/A) P(A) = P(AR)
b) Công thức xác suất đầy đủ
Giả sử Dụ, Dạ, Bạ là một nhóm đầy đủ các biến cổ Khi đó:
21
Trang 22PA)= 2 PByY PB)
c) Công thức xác suất Hayes
'Lừ các công thức ở trên ta có công thức xác suất Bayes:
PGRự/A) = (P(ABi)/Œ(A)) = PB)*PAMB) VEP(B)*PCAIBE)
d) Phân lớp Naive Bayes
Phân lớp Naive Bayes la phương pháp phân loại sử đụng trị thức các xác suất
đã qua huấn luyện Phương pháp này thích hợp với những lớp bài toán đỏi hồi phải
đự đoán chính xác lớp của mẫu cần kiểm tra đựa trên những thông tin từ tập huấn
luyện ban đầu
ý tưởng chính của thuật toán là tính xác suất hậu nghiệm của sự kiện e
xuất hiện khi sự kiện x đã có trang không gian ngữ cảnh 7 thông qua Lông hợp
các xác suất tiên nghiệm của sự kiện c xuất hiện khi sự kiện x đã có trong tắt cả các điều kiện riêng T thuộc không gian r:
p(|x,) = ø p(c|x,T3pŒ |8) Cho một lớp c và mật kết quả X do chất lượng trầm tích gồm nhiều thông
số, nếu xác suất p(X|a) tính dược lớn hơn hoặc bằng piá trị ngưỡng †sh, của lớp
e thì kết luận chất lượng trầm tích dó thuộc lớp ơ
Két qua X do chất lượng trầm tích dược biểu điễn như một vcolơ có kích thước bằng số thông số của trằm tích Mỗi thánh phần này chữa một thông số trong kết quả do X va tần suất xuất hiện của thông số đỏ trong kết quả đo X, tỉnh toản
?(IX) và quyết định xem kết quả X sẽ thuộc lớp nào
Xác suất p(c[X) dược tính theo công thức sau
Trang 23Fj; tham sé thir j trong 1p tham sé V,
TTŒI|X): tần suất xuất hiện của I¡ trong kết quả đo X;
'TEŒ“|c): tần suất xuất hiện của K; trong lớp c;
pŒilc: xác quất có điều kiện để F; xuất hiện trong kết quá do X của lớp e
Để giảm sự phức tạp và thời gian tính loán, công thức trên dược viết lại như sau
? ple) * Tacx (Rilo)? 19
Nhu vay, trong qué trình phân lớp không dựa vào toàn bộ tập tham số dưa vào mà chỉ dựa vào các tham số xuất hiện trong kết quả đo X
6) Ví dụ mình họa
Dữ liệu đầu vào:
Bang 3 Thông số quan trắc trâm lích
Trang 24
Tiảng Thông số quan trắc trầm tích đựa vào tiêu chuẩn tham khảo của Trung
Quốc được biểu diễn như sau:
STT | Ham brong dầu | CN- Ph in Hg Cd AS Chass