Bên cạnh những ưu điểm thì phương pháp này vẫn còn những hạn chế như đối với những thủy vực nước chảy các chỉ tiêu lý hóa dễ thay đổi nên lấy mẫu hông đúng thời điểm, trong một số trường
Trang 1MỤC LỤC
MỤC LỤC i
DANH MỤC HÌNH viii
DANH MỤC BẢNG viiv
DANH MỤC TỪ VIẾT TẮT viiv
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN 3
1.1 Mối quan hệ giữa chất lượng môi trường nước và quần xã sinh vật nước ngọt 3
1.1.1 Ảnh hưởng của nhiệt độ 4
1.1.2 Ảnh hưởng của pH 4
1.1.3 Tác động của ô nhiễm chất hữu cơ 5
1.1.4 Ảnh hưởng của ô nhiễm các độc tố 5
1.2 Sinh vật chỉ thị 7
1.2.1 Định nghĩa sinh vật chỉ thị 7
1.2.2 Nguyên tắc chọn sinh vật chỉ thị 7
1.2.3 Phương pháp đánh giá chất lượng nước dựa vào chỉ số sinh học 8
1.3 Mô hình sinh thái 11
1.3.1 Mô hình hóa trong môi trường 11
1.3.2 Giới thiệu mô hình sinh thái 11
1.3.3 Thuật toán dựa trên ứng dụng giải số 13
1.3.4 Hệ sinh thái sông suối 16
CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU 21
2.1 Mục đích và nội dung nghiên cứu 21
2.2 Đối tượng và phạm vi nghiên cứu 21
2.2.1 Đặc điểm và hiện trạng môi trường của khu vực nghiên cứu 21
2.2.2 Lựa chọn và mô tả đặc điểm tự nhiên của các vị trí lấy mẫu 23
2.3 Phương pháp nghiên cứu 2827
2.3.1 Đánh giá chất lượng 2827
2.3.2 Phân tích tương quan số liệu 2827
2.3.3 Tính toán chỉ số sinh học 2928
Field Code Changed
Trang 22.3.4 Phương pháp phát triển mô hình sinh thái dạng cây phân loại 3029
CHƯƠNG 3: KẾT QUẢ VÀ THẢO LUẬN 4543
3.1 Đánh giá chất lượng nước sông Cầu dựa trên các chỉ tiêu hóa lý 4543
3.2 Phân loại chất lượng thủy vực dựa trên chỉ số sinh học 4745
3.2.1 Lựa chọn và tính toán các thông số đầu vào và đầu ra 4745
3.2.2 Phân loại theo sự có mặt của các taxa ĐVKXSCL 5048
3.2.3 Phân loại theo các chỉ số sinh học 5048
3.3 Phát triển mô hình cây phân loại cho đánh giá chất lượng nước sông Cầu 5250
3.3.1 Phân tích tương quan bộ số liệu 5250
3.2.2 Mô hình cây phân loại và kết quả thu được 5250
3.3 Các tham số chất lượng môi trường ảnh hướng đến mô hình cây phân loại 6260 3.4 Đề xuất khác nhằm tăng cường hiệu quả ứng dụng mô hình cây phân loại trong môi trường 6260
KẾT LUẬN 6462
TÀI LIỆU THAM KHẢO 6563
PHỤ LỤC 1: 6866
PHỤ LỤC 2: MỘT SỐ KẾT QUẢ CỦA MÔ HÌNH ĐỐI VỚI SỰ CÓ MẶT CỦA CÁC TAXA 7068
PHỤ LỤC 3: MỘT SỐ KẾT QUẢ CỦA MÔ HÌNH ĐỐI VỚI CÁC CHỈ SỐ BMWP-Viet và ASPT-Viet 7371
MỤC LỤC i
DANH MỤC HÌNH iii
DANH MỤC BẢNG iv
DANH MỤC TỪ VIẾT TẮT v
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN 3
1.1 Mối quan hệ giữa chất lượng môi trường nước và quần xã sinh vật nước ngọt 3
1.1.1 Ảnh hưởng của nhiệt độ 4
1.1.2 Ảnh hưởng của pH 4
1.1.3 Tác động của ô nhiễm chất hữu cơ 5
Trang 31.1.4 Ảnh hưởng của ô nhiễm các độc tố 5
1.2 Sinh vật chỉ thị 7
1.2.1 Định nghĩa sinh vật chỉ thị 7
1.2.2 Nguyên tắc chọn sinh vật chỉ thị 7
1.2.3 Phương pháp đánh giá chất lượng nước dựa vào chỉ số sinh học 8
1.3 Mô hình sinh thái 11
1.3.1 Mô hình hóa trong môi trường 11
1.3.2 Giới thiệu mô hình sinh thái 11
1.3.3 Thuật toán dựa trên ứng dụng giải số 13
1.3.4 Hệ sinh thái sông suối 16
CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU 21
2.1 Mục đích và nội dung nghiên cứu 21
2.2 Đối tượng và phạm vi nghiên cứu 21
2.2.1 Đặc điểm và hiện trạng môi trường của khu vực nghiên cứu 21
2.2.2 Lựa chọn và mô tả đặc điểm tự nhiên của các vị trí lấy mẫu 23
2.3 Phương pháp nghiên cứu 27
2.3.1 Đánh giá chất lượng 27
2.3.2 Phân tích tương quan số liệu 27
2.3.3 Tính toán chỉ số sinh học 28
2.3.4 Phương pháp phát triển mô hình sinh thái dạng cây phân loại 29
CHƯƠNG 3: KẾT QUẢ VÀ THẢO LUẬN 47
3.1 Đánh giá chất lượng nước sông Cầu dựa trên các chỉ tiêu hóa lý 47
3.2 Phân loại chất lượng thủy vực dựa trên chỉ số sinh học 49
3.2.1 Lựa chọn và tính toán các thông số đầu vào và đầu ra 49
3.2.2 Phân loại theo sự có mặt của các taxa ĐVKXSCL 52
3.2.3 Phân loại theo các chỉ số sinh học 52
3.3 Phát triển mô hình cây phân loại cho đánh giá chất lượng nước sông Cầu 54
3.3.1 Phân tích tương quan bộ số liệu 54
3.2.2 Mô hình cây phân loại và kết quả thu được 54
Trang 43.3 Khảo sát các tham số chất lượng môi trường ảnh hướng đến mô hình cây phân loại 64
3.4 Đề xuất khác nhằm tăng cường hiệu quả ứng dụng mô hình cây phân loại trong
môi trường 65
KẾT LUẬN 67
KIẾN NGHỊ 68
TÀI LIỆU THAM KHẢO 69
PHỤ LỤC 1: 72
PHỤ LỤC 2: MỘT SỐ KẾT QUẢ CỦA MÔ HÌNH ĐỐI VỚI SỰ CÓ MẶT CỦA CÁC TAXA 74
PHỤ LỤC 3: MỘT SỐ KẾT QUẢ CỦA MÔ HÌNH ĐỐI VỚI CÁC CHỈ SỐ BMWP-Viet và ASPT-Viet 77
Trang 5DANH MỤC HÌNH
Hình 1.1 Hệ thống tính điểm BMWP (Biological Monitoring Working Party) 8
Hình 1 2 Các giai đoạn phát triển mô hình sinh thái 12
Hình 2.1 Bản đồ vị trí lấy mẫu sông Cầu 2625
Hình 2.2 Cấu trúc cây quyết định 363436
Hình 2.3 Mô hình cây quyết định dự báo, đánh giá 413943
Hình 2.4: Giao diện đồ họa của e a 424144
Hình 3.1: Diễn biến hàm lƣợng DO trên sông Cầu 454347
Hình 3.2: Diễn biến COD trên sông Cầu 464448
Hình 3.3 Diễn biến N- NH4 dọc sông Cầu 474549
Hình 3.4 Lệnh huấn luyện dữ liệu 575559
Trang 6DANH MỤC BẢNG
Bảng 2.1 Các điểm quan trắc trên lưu vực sông Cầu [15] 23
Bảng 2.2: Hệ số tương quan 2928
Bảng 2.3 Thang điểm BMWP [25] 2928
Bảng 2.4 Mối liên hệ giữa chỉ số sinh học (ASPT) và mức độ ô nhiễm [1] 3029
Bảng 2.5 Giải thuật ID3 xây dựng cây quyết định: 3130
Bảng 3.1 Các giá trị đầu vào của bộ số liệu 484650
Bảng 3.2 Tổng hợp các chỉ số BMWP-Viet và ASPT-Viet 484650
Bảng 3.3: Các taxa ĐVKXSCL được lựa chọn để khảo sát 504852
Dựa trên kết quả tính toán các chỉ số sinh học có thể có giá trị đầu ra của mô hình như trên Bảng 3.4 và 3.5 504852
Bảng 3.4 Phân loại các điểm nghiên cứu theo BMWP-Viet 504852
Bảng 3.5 Phân loại các điểm nghiên cứu theo chỉ số ASPT-Viet 514953
Bảng 3.6 Hệ số tương quan Pearson (r) tính toán giữa các tham số môi trường đối với lưu vực sông Cầu 525054
Bảng 3.7 Giá trị CCI và K của các mô hình 535155
Bảng 3.8 Bảng tổng hợp các giá trị chính xác của bộ số liệu được lựa chọn 575559
Bảng 3.9 Bảng kết quả hi thay đổi các tham số -C, -M với bộ dữ liệu BMWP và ASPT 595761
Bảng 3.10 Giá trị CCI và K của các mô hình với bộ số liệu BMWP và ASPT 595761
Trang 7DANH MỤC TỪ VIẾT TẮT
BMWP-Viet Biological Monitoring Working Party of Vietnam
Trang 8MỞ ĐẦU
Sự phát triển nhanh chóng của quá trình công nghiệp hóa, đô thị hóa và sự gia tăng dân số đã làm cho chất lượng nước mặt cũng như nước ngầm có những biểu hiện suy thoái nghiêm trọng ở nhiều nơi trên thế giới trong đó Việt Nam cũng không ngoại lệ Hiện nay, lượng nước thải từ sản xuất công nghiệp, nông nghiệp và sinh hoạt hầu như hông qua xử lý mà đổ trực tiếp vào các thủy vực đã làm cho nhiều con sông ô nhiễm nặng ở vùng hạ lưu Chính vì vậy, các ao, hồ, ênh mương trong đô thị trở đã thành các bể chứa nước thải bất đắc dĩ
Mọi sự biến đổi chất lượng môi trường nước đều có tác động đến quần xã sinh vật sống Trong đó, sự thay đổi sinh lý bất thường, hay sự hiện diện hoặc vắng mặt của một số loài đặc biệt là động vật bậc thấp có thể phản ánh được mức độ ô nhiễm của nước Nhiều nghiên cứu trên thế giới đã chứng minh có thể sử dụng sinh vật đó như loài chỉ thị trong phương pháp mới đó để đánh giá chất lượng nước
Để giám sát chất lượng môi trường nước, Việt Nam cũng như nhiều nước trên thế giới thường dùng phương pháp phổ biến là phân tích hóa học Bên cạnh những
ưu điểm thì phương pháp này vẫn còn những hạn chế như đối với những thủy vực nước chảy các chỉ tiêu lý hóa dễ thay đổi nên lấy mẫu hông đúng thời điểm, trong một số trường hợp sẽ không phát hiện đúng nguyên nhân gây ô nhiễm và khó dự báo chắc chắn về tác động của ô nhiễm lên hệ sinh thái Chính vì vậy, hiện nay nhiều nước tiên tiến như Mỹ, các nước chau Âu, Úc … đã phát triển rộng một số
mô hình để xác định các chỉ tiêu cơ bản để giám sát môi trường nước khu vực đó Trong số các công cụ sử dụng để đánh giá phân loại chất lượng môi trường,
mô hình cây phân loại được đánh giá là một quy trình đánh giá tổng hợp về môi trường với bộ số liệu đầu vào tổi thiếu Mô hình cây phân loại cho một bức tranh khái quát về chất lượng môi trường khu vực nghiên cứu với việc sử dụng số liệu đầu vào là các thông số hóa lý của môi trường khu vực đó, đầu ra là phân loại dựa trên chỉ thị sinh học Để góp phần tiếp tục vào sự phát triển kỹ thuật đó, đề tài nghiên cứu trong khuôn khổ luận văn cao học: “Nghiên cứu sử dụng mô hình sinh thái phân loại chất lượng thủy vực trên lưu vực sông miền Bắc” đã được thực hiện
Trang 9Nghiên cứu nhằm mục đích đánh giá chất lượng nước lưu vực sông Cầu qua các chỉ tiêu hóa lý và các chỉ số sinh học dựa trên ĐVKXSCL thông qua mô hình cây phân loại áp dụng trên phần mềm WEKA Dựa trên đó để đánh giá và xác định các chỉ tiêu cơ bản giúp các cơ quan quản lý giảm thiểu chi phí quan trắc môi trường thường niên
Trang 10CHƯƠNG 1: TỔNG QUAN
Tất cả các cơ thể sống trong đó có con người đều chịu ảnh hưởng bởi các điều kiện môi trường sống xung quanh Trên cơ sở những hiểu biết về tác động của các yếu tố vật lý, hóa học lên những có thể sống có thể xác định được những thông tin về sự có mặt và cả định lượng của nhiều thành phần môi trường Những sinh vật tác động của các chất gây ô nhiễm hoặc các chất tự nhiên ở nồng độ cao trong môi trường sẽ có thể là chỉ thị cho bản thân và mức độ gây ô nhiễm thông qua những biểu hiện của chúng Sự tác động và biến đổi này có thể quan sát được thông qua một số biểu hiện thường gặp [1]:
- Thay đổi về đa dạng loài trong quần xã
- Thay đổi về thành phần loài hoặc nhóm ưu thế trong quần xã vi sinh vật
- Tỷ lệ chết trong quần thể gia tăng đặc biệt ở giai đoạn non, mẫn cảm như trứng và ấu trùng
- Thay đổi sinh lý và tập tính của các cá thể
- Những khiếm khuyết về hình thái và tế bào trong các cá thể
- Sự tích lũy dần các chất ô nhiễm hoặc sự trao đổi chất của chúng trong các
mô của những cá thể
Do đó trên thế giới, việc nghiên cứu các sinh vật để đánh giá, iểm soát và cải thiện chất lượng môi trường đã đạt được nhiều thành tựu có nghĩa hoa học và thực tiễn, đặc biệt là trong đánh giá chất lượng môi trường nước ngọt
1.1 Mối quan hệ giữa chất lượng môi trường nước và quần xã sinh vật nước ngọt
Mỗi sinh vật đều chịu sự tác động trực tiếp hoặc gián tiếp từ các yếu tố môi trường như ánh sáng, nhiệt độ, nguồn thức ăn, thành phần hoáng … Sự biến động của các yếu tố này làm cho sinh vật bị lệch khỏi ngưỡng thích nghi tối ưu của mình Tuy nhiên các sinh vật có khả năng tự điều chỉnh bằng những phản ứng thích nghi
về hình thái, trạng thái sinh lý và các tập tính sinh thái, nhằm giảm nhẹ hậu quả của tác động, đồng thời còn cải tạo môi trường theo hướng có lợi cho các hoạt động sống của chúng Tuy nhiên nếu môi trường bị suy thoái mạnh thì các sinh vật có xu
Trang 11thế suy giảm về số lượng và đa dạng sinh học Khi môi trường được tái tạo lại thì quần xã sinh vật đã thay đổi cũng hó có thể phục hồi trở lại trạng thái ban đầu [2] Các yếu tố cơ bản tác động đến đời sống thủy sinh vật bao gồm:
1.1.1 Ảnh hưởng của nhiệt độ
Nhiệt độ nước tự nhiên phụ thuộc vào điều kiện khí hậu, thời tiết hay môi trường khu vực Nước thải công nghiệp, đặc biệt là như nhà máy điện hạt nhân thường có nhiệt độ cao hơn nước tự nhiên làm tăng nhiệt độ của thủy vực tiếp nhận Nhiệt độ cao của nước làm thay đổi quá trình sinh, hóa, lý học, ảnh hưởng đến cân bằng của hệ sinh thái nước Một số loài sinh vật không chịu được sẽ chết hoặc phải
di chuyển đi nơi hác, trong hi một số ít loài khác lại phát triển mạnh mẽ [3]
1.1.2 Ảnh hưởng của pH
Hầu hết các sinh vật chỉ có khả năng sinh trưởng trong một khoảng điều kiện
pH nhất định Nếu giá trị pH của môi trường thay đổi ngoài ra khoảng thích nghi đó thì sinh vật không tồn tại được
Số lượng loài ĐVKXS trong môi trường nước có tính axit thấp hơn nhiều so với nước có pH gần trung tính Trong đó các công trùng, phù du là một trong những nhóm nhạy cảm nhất với pH thấp Loài Cánh lông và Cánh úp ít nhạy cảm hơn với
pH thấp [22]
Mức pH trong khoảng 5,8 – 7,2 thì loài phù du Ephemerella funeralis và loài Cánh cứng Oulimnius latiusculus ở các suối vùng núi Adirondack ( Mỹ ) là những
loài ưu thế Nhưng ở sông, suối có mức pH thấp 4,4 – 5 thì không có mặt 2 loài này,
số lượng các taxon của quần xã ĐVKXS cũng bị giảm đi một nửa và các loài Cánh
úp chiếm ưu thế [24]
Cấu trúc quần xã ĐVKXS đáy cũng bị thay đổi hi môi trường nước bị ô nhiễm axit Do có vỏ đá vôi, nên các loài Hai mảnh vỏ và Chân bụng ở 1500 hồ vùng Norwegian đều biến mất khi pH<6 không thích hợp cho việc hình thành lớp
vỏ Hai loài giáp xác Lepidurus arcticus và Gammaus lacustrus là những loài rất nhạy cảm với môi trường nước axit, ngược lại loài Asllus aquaticus lại có thể tồn tại
trong môi trường nước có pH = 5,2 thậm chí cả pH = 4,8 [23]
Trang 12Nguyên nhân của mọi sự thay đổi cấu trúc quần xã vi sinh vật hi môi trường nước bị ô nhiễm axit là do hi nước bị axit hàm lượng các ion Na+
, Cl-,K+, Ca2+trong nước quá thấp, trong khi H+
và Al3+ lại cao Trong hi đó các sinh vật lại cần nhận những ion này để duy trì hoạt động sinh lý của cơ thể Ngoài ra pH thấp ảnh hưởng đến cân bằng ion Al3+
và Cl- trong máu động vật thủy sinh Ở giá trị pH thấp ion H+ có thể thẩm thấu vào màng tế bào, Al3+ bị đào thải ra ngoài Do đó chức năng thẩm thấu của màng tế bào bị rối loạn, cơ thể bị mất cân bằng muối và khoáng, kết quả làm tăng nguy cơ tử vong cho sinh vật [22]
1.1.3 Tác động của ô nhiễm chất hữu cơ
Nước bị ô nhiễm hữu cơ chủ yếu do tiếp nhận các chất thải từ sinh hoạt nông nghiệp và công nghiệp thực phẩm Thành phần chất hữu cơ ô nhiễm gồm chất dễ phân hủy sinh học như cacbonhydrat, Protein, chất béo và các chất hữu cơ hó phân hủy sinh học như hydrocacbon vòng thơm, các chất đa vòng nghưng tụ, các chất clo hữu cơ Những thủy vực bị ô nhiễm hữu cơ thường có những đặc tính như hàm lượng oxy hòa tan thấp, hàm lượng cặn lơ lửng cao, đây là những yếu tố chủ yếu tác động lên quần xã ĐVKXS [4]
Tại các thủy vực bị ô nhiễm hữu cơ nặng thì giun ít tơ Oligochaeta và ấu trùng muỗi lắc Chironomuc riparius xuất hiện với số lượng lớn Thêm vào đó các
loài ăn thịt chúng lại biến mất nên số lượng quần thể của chúng tăng lên với tốc độ lớn nhất [4]
Ấu trùng cánh úp nhạy cảm với ô nhiễm hữu cơ nhất so với ấu trùng của các loài côn trùng khác, chúng biến mất ngay cả hi môi trường bị ô nhiễm nhẹ Ấu trùng Phù du cũng nhạy cảm với ô nhiễm hữu cơ nhưng ở mức độ thấp hơn Trong
số các loài ấu trùng Cánh úp và ấu trùng Phù du thì Amphinemura sulcicollis (Plecoptera) và Baetis rhodani, Caenis hoaria (Ephemeroptera) là các loài có khả
năng chống chịu với ô nhiễm hữu cơ so với các loài khác cùng bộ [21]
1.1.4 Ảnh hưởng của ô nhiễm các độc tố
Trong thành phần các chất thải công nghiệp, nông nghiệp và sinh hoạt chứa nhiều chất có độc tính cao đối với sinh vật của thủy vực tiếp nhận như: im loại nặng (Ni en, đồng, thủy ngân, mangan …) các hợp chất hữu cơ độc từ thuốc trừ
Trang 13sâu, thuốc diệt cỏ, Polychlorinated biphenyl (PCBs), các hợp chất có chứa phenol, formaldehyde, các hí độc như ammoniac, …
Mức độ tác động của độc tính phụ thuộc vào mỗi loại chất độc, phụ thuộc vào loài và tuổi, giới tính, ích thước cơ thể, các giai đoạn sống trong vòng đời của mỗi sinh vật …
Những kim loại ở dạng vết như chì, cadmi và đồng có trong nước thải chế biến khoáng sản là độc tố ngay ở nồng độ rất thấp, có thể loại bỏ sự phát triển của tảo và ảnh hưởng đến cá và động vật đáy Kết tủa sắt và nhôm hydroxyt vó thể bao phủ mang và cơ thể cá, làm ngạt trứng, bao phủ nền đáy suối, lấp đầy vết rạn của đá làm thay đổi nền đáy hông còn phù hợp với môi trường sống của sinh vật đáy [22] Ảnh hưởng của nhôm và pH thấp được nhiều nhà khoa học nghiên cứu Sự kết hợp pH <5 và nồng độ Al3+ > 0,5 mg/l sẽ tiêu diệt các loài cá và nhiều loài ĐVKXS cỡ lỡn Loài Phù du Ameletus và Ephemerella funeralis chỉ chịu được môi trường axit nhẹ, với nồng độ Al3+
thấp ( < 0,2 mg/l) Al3+ độc hầu hết với cá ở pH = 5,2 – 5,4 Ngoài ra Al3+ có thể trực tiếp gây độc cho cá và ĐVKXS cỡ lớn Kết tủa nhôm tích lũy trong mang cá làm ảnh hưởng đến sự hô hấp của chúng [22]
Nhiều loài cá và ĐVKXS cỡ lớn có khả năng chịu đựng ion sắt trong điều kiện pH kiềm nhưng hông chịu được trong môi trường axit, như loài Phù du
Ephemerella Baetis, Attenella và Acentrella, loài bướm đá Acroneuria và Paragnetina
Độc tính của kẽm và cadimi trên 2 loài giáp xác: Atyephyra desmarestii (Decapoda) ở sông Eca và Echinogammus meridionalis ( Amphipoda) ở sông Lena
thuộc Bồ Đào Nha thể hiện như sau: LC50 trong 96h của Cd và Zn lần lượt là 42,2 mg/l và 5,43 mg/l ở A.desmarestii, còn ở E.meridionalis và 36,7 µg/l và 4,61 mg/l [22]
Thuốc trừ sâu và diệt cỏ cũng là những độc tố mạnh, chúng có giá trị LC50 ( 96h) đối với ĐVKXS trong hoảng 1 – 30 µg/l Đối với sinh vật có khả năng chịu đựng ô nhiễm tốt như ấu trùng Chironomidae thuốc trừ sâu vẫn là hợp chất có độc tính mạnh Sau khi phun một số loại thuốc trừ sâu ( olfatox, DDT….) thì ấu trùng
Chironomidae, tôm (Caridina, palaemonetes tonkinensis) mất hẳn Ấu trùng
Trang 14Chironomidae chỉ xuất hiện trở lại sau 8 – 12h ngày, còn tôm thì sau 50 ngày vẫn
chưa xuất hiện [5]
1.2 Sinh vật chỉ thị
1.2.1 Định nghĩa sinh vật chỉ thị
Là những cá thể, quần thể hay quần xã có khả năng thích ứng hoặc rất nhạy cảm với môi trường hông hí Các động vật chỉ thị có thể là một loài, một nhóm loài, có thể tương quan giữa các nhóm loài hoặc tổng số loài trong quần xã và chỉ số
Tỷ lệ số lượng của các loài và cả quần xã cũng cần chú ý trong hi xác định động vật chỉ thị
Khi lựa chọn động vật chỉ thị cần tìm hiểu ảnh hưởng của sự phát triển động vật có lợi hay có hại cho môi trường sống của con người và môi trường sinh thái Khi xem xét một số yếu tố đặc trưng cho vùng sinh thái nào đó thì việc nghiên cứu tổng thể sẽ mang lại hiệu quả cao hơn là hảo sát từng bộ phận riêng rẽ Sức chịu đựng của động vật với các điều kiện của môi trường sinh thái Đặc tính sinh vật học của động vật chỉ thị: Những đặc tính sinh lý,sinh hóa của động vật được thể hiện qua mức độ chịu đựng về các yếu tố môi trường sống Do đó, để xác định động vật chỉ thị, điều quan trọng là phải biết những đặc tính sinh học của các loài động vật trong quần xã.[7]
Trang 151.2.3 Phương pháp đánh giá chất lượng nước dựa vào chỉ số sinh học
Trong nghiên cứu chỉ số sinh học, mỗi đơn vị sinh vật nghiên cứu được gọi
là 1 taxa Chỉ số sinh học bao gồm cả các chỉ số dùng để quan trắc chất lượng nước trên cơ sở các loài chỉ thị và mức độ mẫn cảm của các taxa chỉ thị đối với sự ô nhiễm của môi trường Rất nhiều loại chỉ số sinh học được nghiên cứu và áp dụng trên thế giới, trong đó nhóm các chỉ số sinh học được xây dựng bắt nguồn từ chỉ số TRENT ở Anh là được sử dụng rộng rãi hơn cả [1]
Chỉ số TRENT được xây dựng bắt nguồn từ các nghiên cứu trên sông TRENT của Anh, dựa trên những số liệu về sự có mặt hay vắng mặt của các nhóm ĐVKXS ở đáy liên quan đến 6 sinh vật chìa khóa phát hiện được trong khu hệ động vật ở điểm thu mẫu Chỉ số TRENT có thang điểm từ 1 đến 10 với điểm càng cao thi chất lượng nước càng sạch Thang điểm này được tính dựa trên cơ sở bảng phân loại đã được xác định sẵn [1]
Từ chỉ số sinh học TRENT, nhiều loại chỉ số sinh học hác đã được xây dựng và ứng dụng rộng rãi Hình dưới đây cho thấy sự phát triển của các chỉ số sinh học và những hệ điểm ở Châu Âu
Hình 1.1 Hệ thống tính điểm BMWP (Biological Monitoring Working Party)
Chỉ số sinh học TRENT
Chỉ số sinh học
TRENT
Chỉ số sinh học TRENT
Chỉ số sinh học TRENT
Chỉ số sinh học TRENT
Điểm số Chander của Anh
Điểm số BMWP của Anh
Điểm số ASPT
Trang 16Để đưa ra phương pháp nghiên cứu chuẩn, tổ chức nghiên cứu về quan trắc
sinh học (Biological Monitoring Working Party) thành lập ở Anh năm 1976 và đã
đưa ra hệ thống mới đó là hệ thống tính điểm BMWP Hệ thống tính điểm BMWP được phát triển dựa trên hệ thống tính điểm Chandler để giám sát sinh học chất lượng nước sông ở Anh [25]
Trong hệ thống điểm BMWP trừ lớp giun ít tơ Oligochaeta, hệ thống này sử dụng số liệu taxa ở cập độ họ Mỗi một taxa ĐVKXS cỡ lớn được nhận một giá trị điểm tương ứng với từ 1 đến 10 tương ứng với khả năng chống chịu ô nhiễm của họ
đó Các họ điểm có điểm cao là họ nhạy cảm với ô nhiễm, ngược lại điểm thấp ứng với họ có khả năng chịu đựng ô nhiễm
Hệ thống tính điểm BM P được áp dụng rộng rãi trên thế giới, từ Châu Âu (Tây Ban Nha, Hà Lan, …) đến Châu Á (Ấn Độ, Thái Lan và Việt Nam …) Tuy nhiên ở mỗi nước thì BMWP lại được thay đổi và bổ sung cho phù hợp với điều kiện tự nhiên của mỗi nước để đảm bảo tính chính xác của phương pháp Việc áp dụng điểm số BMWP có những ưu nhược điểm như sau:
Ưu điểm: hệ thống điểm BMWP chứa thông tin về phân bố của hầu hết các taxa ĐVKXS nằm trong toàn bộ chuỗi thực phẩm trong thủy vực nước ngọt nên có tính tổng quát cao Phân bố điểm rộng có thể giúp việc phân loại thủy vực nước ngọt dễ dàng hơn Ngoài ra BM P đã cho thấy tính ứng dụng cao do yêu cầu kỹ năng lấy mẫu và định đoạt của cán bộ kỹ thuật cao
Nhược điểm: Hệ thống điểm số BM P là đơn vị nghiên cứu chỉ dừng ở mức
họ, trong khi trong cùng một họ có các giống hoặc loài có tính mẫn cảm và chống chịu hoàn số sinh học được xây dựng nhằm hạn chế nhược điểm này của chỉ số sinh học Tuy nhiên việc áp dụng trong điều kiện Việt Nam có nhiều hạn chế do thiếu hụt các khóa phân loại
ASPT không phụ thuộc vào sự đa dạng loài và sự thay đổi mùa trong năm
Do đó đánh giá chất lượng nước bằng ASPT cho kết quả tốt hơn điểm BMWP trong một số trường hợp
Tuy nhiên ASPT hầu như chỉ phản ánh ô nhiễm hữu cơ Vì hông tính số các đơn vị phân loại nên ASPT ít phản ánh được sự ô nhiễm độc tố Hạn chế này được
Trang 17khắc phục bằng cách sử dụng kết hợp cả hệ thống BMWP và ASPT ASPT tháp và điểm BMWP tháp chỉ thị cho sự ô nhiễm hữu cơ ASPT cao hơn và điểm BMWP tháp chỉ thị cho sự ô nhiễm do độc tố và các tác động vật lý
Ở Việt Nam đã được sử dụng trong nghiên cứu ứng dụng ĐVKXSCL để đánh giá chất lượng nước trên 4 hệ thống kênh chính tại TP Hồ Chí Minh Hầu hết các kênh chính tại Tp Hồ Chí Minh đều bị ô nhiễm nhất là kênh Nhiêu Lộc – Thị Nghè Nghiên cứu đã cho thấy có 28 họ ĐVKXSCL 19 họ thuộc 08 bộ của ngành Chân khớp, 07 họ thuộc 02 lớp của ngành Thân mềm, 01 họ thuộc phân lớp Đỉa và
01 họ thuộc ngành Giun dẹp Sử dụng ĐVKXSCL để đánh giá chất lượng nước cho thấy hầu hết các kênh tại Tp Hồ Chí Minh đều ô nhiễm Mức độ ô nhiễm từ trung bình đến rất bẩn Đánh giá này trùng với các đánh giá bằng các chỉ tiêu hóa lý [6]
Sử dụng ĐVKXSCL đánh giá chất lượng nước sông Cầu Đỏ tại thành phố
Đà Nẵng Chỉ số BMWP-Viet trung bình giữa các đợt hông hác nhau có ý nghĩa
ở mức α = 0,05, chỉ số BMWP-Viet giao động trong khoảng 23,5 – 30,83 điểm Chỉ
số ASPT trung bình giữa các đợt hác nhau có ý nghĩa và dao động trong khoảng 3,72 – 4,34 điểm Chất lượng nước ở các khu vực nghiên cứu hầu hết ở mức nước bẩn vừa chứng tỏ nước sông Cầu Đỏ đang bị ô nhiễm nghiêm trọng Hệ thống BMWP-Viet khẳng định tính ưu việt trong việc phẩn ánh chất lượng nước do đó khả năng áp dụng vào quy trình quan trắc sinh học môi trường nước sông [9]
Sử dụng ĐVKXSCL đánh giá chất lượng nước sông Bồ tại tỉnh Thừa Thiên Huế Qua nghiên cứu cho thấy sử dụng ĐVKXSCL để đánh giá chất lượng nước cho thấy chất lượng nước mặt sông Bồ tương đối tốt Mức ô nhiễm chỉ ở mức vừa bẩn đến bẩn vừa có thể cấp nước cho sinh hoạt sau khi xử lý tiếp Kết quả nghiên cứu chất lượng nước dựa vào chỉ thị ĐVKXSCL cho thấy tương ứng hi đánh giá bằng các chỉ tiêu hóa lý Theo đó để sử dụng ĐVKXSCL đánh giá mức độ ô nhiễm của các nguồn nước mặt tại Thừa Thiên Huế Đây là phương pháp có nhiều ưu điểm góp phần đa dạng hóa các phương pháp đánh giá trong nội địa [10]
Sử dụng chỉ số sinh học ASPT đánh giá nhanh chất lượng sinh học nước ở lưu vực sông Cầu Kết quả nghiên cứu cho thấy chất lượng nước mặt tại 28 điểm quan trắc lưu vực sông Cầu thuộc loại ô nhiễm vừa đến ô nhiễm nặng, ASPT trung
Trang 18bình nằm trong khoảng 2 đến 6, mức độ ô nhiễm tăng dần từ các tháng đầu năm đến mùa hè [11]
1.3 Mô hình sinh thái
1.3.1 Mô hình hóa trong môi trường
Định nghĩa mô hình hóa
Mô hình hóa (Modelling) là thay thế đối tượng gốc bằng một mô hình nhằm thu nhận các thông tin quan trọng về đối tượng bằng cách tiến hành các thực nghiệm trên mô hình
Mô hình sau khi thực thi cần đạt được các tính chất sau:
- Tính đồng nhất: Mô hình phải đồng nhất với đối tượng mà nó phản ánh theo những tiêu chuẩn định trước
- Tính thực dụng: Có khả năng sử dụng mô hình để nghiên cứu đối tượng Ngày nay, mô hình hóa trong môi trường trở thành một công cụ quan trọng
để tính toán và đánh giá các đối tượng cụ thể tương ứng với mô hình, nhằm lên kế hoạch quản lý tài nguyên thiên nhiên nói riêng, và môi trường nói chung Về bản chất, các mô hình hóa trong môi trường đều dựa trên các phương trình bảo toàn vật chất Ví dụ: để tính toán sự phân bố ô nhiễm trong sông, người ta dựa vào phương trình mô tả các quá trình lý hóa sinh như: vận chuyển, khuếch tán, tự làm sạch
1.3.2 Giới thiệu mô hình sinh thái
Mô hình sinh thái có thể xem như một bức tranh mô phỏng về cấu trúc, chức năng, các quá trình cơ bản của hệ sinh thái Mô hình nói chung hay mô hình sinh thái nói riêng được xem như công cụ hiệu quả vì nó dễ được tiếp cận, mô phỏng dễ nghiên cứu hơn là trên hệ thống thực vốn dĩ thường rất phức tạp Do vậy, ngày nay,
mô hình sinh thái ngày càng trở nên phổ biến và không nghừng phát triển Mô hình sinh thái có ưu thế trong việc kiểm tra, đánh giá các giả thuyết khoa học về cá phản ứng của hệ sinh thái Vì hệ sinh thái là hệ thống phức tạp nên thường không thể thực nghiệm trên toàn bộ hệ Vì thế có thể tạo ra những thay đổi trên hàm lực để hiểu hơn về hệ sinh thái thông qua các biến trạng thái
Trang 19Cho đến nay mô hình sinh thái đã trải qua 6 giai đoạn với sự mở đầu là mô hình sinh thái ứng dụng Lotka-Volterra và mô hình Streeter-Phelps trong những năm 1920, phát triển đến hiện tại là các mô hình 3D tích hợp
Giai đoạn thứ 6 là thời kỳ phát triển rực rỡ của mô hình sinh thái cả chiều rộng lẫn chiều sâu Trong thời kỳ này một số kiểu mô hình mới được ứng dụng rộng
rãi tiêu biểu như mô hình dựa vào cá thể (IBMs), mạng lưới trí tuệ nhân tạo (ANNs)
và mô hình động học cấu trúc … Với khả năng máy tính ngày càng mạnh có thể phát triển nhứng mô hình phức tạp Trong quản lý môi trường, phát triển các mô hình kinh tế - xã hội – sinh thái cũng trở nên cần thiết vì mối quan hệ kinh tế xã hội của các cây quyết định quản lý môi trường cần được quan tậm
Hình 1 2 Các giai đoạn phát triển mô hình sinh thái
Ứng dụng mô hình sinh thái
Một số kết quả bước đầu ứng dụng mô hình sinh thái ở vùng ven biển Cát Bà – Hạ Long Trên cơ sở các kết quả của mô hình thủy động lực và chất lượng nước, các kết quả của mô hình sinh thái đã cho thấy những tác động khác nhau của các điều kiện môi trường lên quá trình hình thành của các thủy vực Ảnh hưởng của các điều kiện nguồn thải, ảnh hưởng của các điều kiện hí tượng thủy văn, của doa động mực nước, theo độ sâu Trong hai yếu tố ảnh hưởng lớn đến phaanb ố và biến động
ở vùng này là tác động của nguồn vật chất từ lục địa và dao động mực nước Khu vực ven biển Cát Bà – Hạ Long có số lượng tảo giáp chiếm ưu thế khá lớn so với
hình ID
Tác động nhân sinh được kết hợp trong
mô hình
Đặc trưng
thái được phản ánh
3D
Trang 20các loại tảo khác với giá trị mật độ phổ biến 0,05 – 3 mgC/l Mật độ tảo khác biến động chủ yếu trong khoảng 0,02-0,15 mgC/l mùa mưa và 0 – 0,01 mgC/l mùa khô
1.3.3 Thuật toán dựa trên ứng dụng giải số
Kiến thức về mối quan hệ giữa các yếu tố môi trường và sự xuất hiện của các sinh vật nước ngọt là vấn đề chính trong quản lý bảo tồn và phục hồi sông Đánh giá các khu vực để dự báo tác động của loài tới sự thay đổi sử dụng đất hoặc cấu trúc sông là một trong những ý nghĩa của việc nghiên cứu mối quan hệ môi trường và loài Trong bối cảnh này, mô hình hóa đang trở thành một công cụ cần thiết để hỗ trợ ra quyết định trong quản lý nước Mặc dù vậy, bản chất phi tuyến tính và phức tạp của hệ sinh thái làm cho sự nghiên cứu trở nên hó hăn đòi hỏi một quá trình nghiên cứu lâu dài trong mô hình hóa hệ sinh thái Sự có sẵn của các dữ liệu phù hợp và kỹ thuật mô hình, tuy nhiên, cho phép sự phát triển của mô hình hệ sinh thái với độ tin cậy cao hơn Gần đây, những khái niệm mới đang trở nên phổ biến để phân tích dữ liệu sinh thái và đưa ra dự báo cho quản lý sông Mạng Bayesian là một trong những phương pháp tiếp cận đã chứng minh tiềm năng cao trong việc mô hình hóa độ phù hợp môi sinh, khi chúng kết hợp với các dự báo có độ tin cậy với
một sự giải thích phù hợp với các kết quả được dự báo [18]
Lý thuyết mạng Bayes
Mạng Bayesian còn gọi là mạng niềm tin (BNs) được phát triển cuối những năm 1970 ở đại học Stanford BNs là mô hình đồ thị thể hiện mối quan hệ nhân quả giữa các biến BNs chủ yếu dựa trên lý thuyết xác suất có điều kiện (luật Bayes) BNs còn là một dạng của biểu đồ ảnh hưởng, kết hợp hài hòa giữa lý thuyết xác suất
và đồ thì để giải quyết 2 vấn đề quan trọng: tính không chắn chán và tính phức tạp Phương trình đơn giản nhất như sau:
)(
)()/()/(
B P
A P x A B P B A
Trong đó, A, B là 2 sự kiện có thể xảy ra và phụ thuộc nhau, P(A) là xác suất xảy ra A, P(B) là xác suất xảy ra B, P(A│B) là xác suất có điều kiện của A hi đã biết B xảy ra
Trang 21Cấu trúc mạng BNs bao gồm các nút cha, nút con, thể hiện mối quan hệ nhân quả bằng dấu mũi tên hướng từ nút cha đến nút con Mỗi nút có một trạng thái khác nhau, tùy theo đặc trưng của biến đó Mỗi núi được gắn với 1 bảng xác suất có điều kiện (CPTs), được lấy từ những thông tin ban đầu hoặc dữ liệu, kinh nghiệm trong quá khứ.[27]
Cùng với lý thuyết BNs, các lý thuyết hác như lô gic mờ (Fuzzy logic), mạng nơ ron nhân tạo (Artificial Neural Networks – ANNs), thuật toán gen (Genitic Algorithms – GAs), cây quyết định (DTs) là các phương pháp chủ yếu dựa trên xác suất có điều kiện để dự báo hoặc chẩn đoán một sự việc, một vấn đề đã, đang hoặc sắp xảy ra Ví dụ, đối với dự báo lũ cho một khu vực, ta dựa vào dữ liệu các lần xảy
ra lũ trước đó và những bằng chứng hiện tại liên quan, từ đó xây dựng mạng BNs và
dự báo có hay không việc xảy ra lũ trong thời điểm cần xét Cùng với sự phát triển của các lý thuyết trên, tính ưu việt của chúng ngày càng được chứng minh trong cách tiếp cận mô hình sinh thái [26]
Lý thuyết cây phân loại (Classification trees (CTs)
Tài liệu nghiên cứu ứng dụng cây phân loại và hồi suy trong mô hình sinh
thái nói chung còn đang rất hạn chế [19] Dzecos i, người đầu tiên sử dụng cây
phân loại trong phân tích quần thể trong sông Cây phân loại này bao gồm sự phân loại sinh học của sông British dựa trên dữ liệu chỉ thị sinh học, phân tích ảnh hưởng của các yếu tố lý hóa lên qúa trình sinh học của các sinh vật được lựa chọn ở sông Slovenian Một số nghiên cứu khác ứng dụng cây phân loại để tính toán độ phù hợp môi sinh thông qua thuật ngữ “xuất hiện/vắng mặt” của một loài tại một khu vực sinh sống đã được tiến hành Đầu tiên, mô hình được phát triển dựa theo cây phân loại nhằm dự báo giá trị của biến số phụ thuộc rời rạc với 1 dãy cố định các giá trị
từ các biến độc lập Thuật toán C4.5 (còn gọi là „Top-Down Induction of Decision Trees”) là một trong những cách được sử dụng rộng rãi trong cây phân loại Cấu trúc cây bao gồm nhiều nhánh, tại mỗi nhánh, giá trị hữu ích nhất được lựa chọn làm rễ của cây và nốt này được chia ra thành các nhánh con theo các giá trị được lựa chọn
Trang 22Tiếp theo mô hình này được kết hợp với thuật toán di truyền, cái mà sử dụng
để lựa chọn các biến số đầu vào liên quan Các biến đầu vào của mô hình bao gồm các biến số lý hóa và cấu trúc sông, một số là liên tục, và số khác là rời rạc, trong
hi đầu ra của mô hình là dữ liệu về động vật hông xương sống, chính là dữ liệu rời rạc (xuất hiện hoặc vắng mặt)
Mô hình dự báo được ước tính dựa trên cơ sở của 2 phương pháp Điều này đòi hỏi đạo hàm ma trận, cái mà có thể chỉ ra các trường hợp: đúng dương (true positive (TP)), sai dương (false positive (FP)), sai âm (false negative (FN)) và đúng
âm (true negative (TN)) Theo cách này, các mẫu vắng mặt/ xuất hiện được lập bảng
Thông thường, để giảm thiểu độ nhiễu của dữ liệu và cải thiện các kết quả dự đoán liên quan tới độ chính xác và độ phức tạp, người ta sử dụng các phương pháp tối ưu hóa: tree-pruning, bagging and boosting Phương pháp “tree-pruning” là cơ chế quan trọng khi nó cải thiện tính minh bạch của cây bằng việc giảm thiểu kích cỡ của chúng, cũng như nâng cao độ chính xác trong phân loại bằng việc ước tính lỗi xuất hiện do độ nhiễu của dữ liệu
Có thể thấy, mô hình cây phân loại là một công cụ hỗ trợ ra quyết định quản
lý sông để cải thiện hiệu suất quan trắc và đánh giá, ví dụ: có thể lựa chọn phương
Trang 23pháp phục hồi tối ưu nhất từ dãy kịch bản phục hồi sông đã cho trước bằng việc dự đoán tác động của các kịch bản khác nhau này lên độ phù hợp môi trường
1.3.4 Hệ sinh thái sông suối
a/ Đặc tính tự nhiên
Sông (river) và suối (stream) là thuật ngữ chung chỉ kiểu thủy vực nước chảy
ở lục địa Suối là loại hình thuỷ vực nước chảy phổ biến ở vùng núi Suối có thể coi
là sông cấp 1, một số suối lớn là sông cấp 2 Suối đặc trưng ở lòng hẹp và nông, mực nước thấp và có nền đáy đá, đá tảng hoặc sỏi cuội
Dọc theo dòng suối chính thường có các nhánh phụ đổ vào Nước suối chảy với tốc độ lớn, nhưng giảm dần từ đầu nguồn tới cuối nguồn Phần khởi nguyên của các con sông vùng núi (phần đầu của đầu nguồn sông) đều có dạng những dòng suối Đặc tính quan trọng nhất của suối là mực nước biến đổi thất thường Do dòng suối chảy xiết, bờ thấp và không vững chắc nên dòng chảy của suối thường luôn thay đổi nhất là ở phần đầu nguồn, do tác động của mưa lũ Mực nước ở suối biến đổi rất đột ngột, mùa mưa lũ nước dâng cao rất nhanh, chảy mạnh, có khi cuốn trôi
cả nền đáy Sau một vài ngày mức nước lại hạ thấp, nước trong lại và chảy với tốc
độ bình thường
Các suối ở vùng thấp hơn thì nền đáy có cả bùn-cát Nhìn chung, môi trường nước sông-suối biến động rất lớn theo mùa, theo sự biến đổi của thời tiết, của cường
độ bức xạ mặt trời Dòng chảy làm gia tăng mối tương tác giữa mặt nước với không
hí cho nên nước thường bão hòa ô xy hòa tan Sự tương tác giữa nước với đất làm gia tăng sự sói mòn, độ đục và chất dinh dưỡng Nhiều khu vực suối đầu nguồn bị bóng cây che lấp ngăn cản bức xạ nhiệt của mặt trời Nhiệt độ nước của suối thường thấp hơn so với các thủy vực khác Trên cơ sở các yếu tố địa hình và chế độ dòng chảy, suối có các kiểu nơi cư trú cơ bản: thác nước (waterfall), ghềnh (riffles) và vực suối (pool)
Tại các khu vực có ghềnh, mực nước nông, nước chảy xiết qua bãi đá, sỏi
Do nước chảy mạnh, không khí luôn được xâm nhập vào nước nên hàm lượng ô xy bao giờ cũng ở mức cao Thực vật ở ghềnh chủ yếu là các nhóm tảo bám bề mặt đá,
Trang 24sỏi (Periphyton), có thể là dạng sợi và phát triển thành thảm hoặc có thể là nhóm tảo
si líc sống bám trên tảo khác hoặc trên đá, sỏi
Trên một số chỗ nhất định của suối, có các vũng nông, nước tù hoặc quẩn gọi
là vũng suối Tại đây, tốc độ dòng nước chậm hơn, cát, bùn từ vùng thượng lưu được lắng động, bởi vậy nền đáy ở đây thường là mềm: cát hoặc bùn Một đặc điểm đáng lưu ý là ở vũng suối thường tích tụ các mảnh vụn đã được phân hủy được cung cấp từ trên vùng lưu vực Mặc dầu có sự phân biệt nhưng hai iểu nơi cư trú này thường có quan hệ mật thiết với nhau
Sông là thuỷ vực nước chảy tiêu biểu với đặc điểm: khối nước luôn chảy theo một chiều nhất định, từ thượng lưu đến hạ lưu do sự chênh lệch về độ cao so với mực nước biển của lòng sông Dòng chảy của một đoạn sông hi nước đầy, giữa hai bờ sông được gọi là dòng chảy nền Khi nước cạn, dòng chảy của sông thu vào dòng chảy gốc, cách xa hai bờ sông Bãi đất cạn hở ra trong mùa nước cạn nằm giữa
bờ sông và dòng chảy gốc gọi là bãi sông, có thể phân thành nhiều tầng Sông là hợp lưu của nhiều dòng suối, có ích thước rộng hơn và thường có độ đục cao hơn ngăn cản sự truyền ánh sáng Nhiệt độ nước sông thường cao hơn suối, độ sâu lớn hơn, nền đáy thường là cát, cát-bùn ở vùng thượng và trung lưu hoặc bùn cát ở vùng đồng bằng Do độ rộng lớn, dòng chảy trung bình cũng như lượng nước chảy của sông lớn hơn so với suối mặc dù độ dốc của sông có thể không bằng suối
Hành lang ngập lụt ven sông, suối (Riparian Corridor): là một dải bờ chạy dọc sông, suối Dải bờ này hẹp ở suối, rộng hơn ở sông, đặc biệt có thể thành các bãi rộng lớn ở hai bờ sông vùng đồng bằng Trên hành lang ngập lụt là thảm thực vật Kiểu thảm thực vật phụ thuộc vào điều kiện khí hậu, thuỷ văn, địa chất và độ kiềm của đất và một số yếu tố khác Thảm thực vật này có tác dụng như là cơ sở cung cấp chất dinh dưỡng cho thuỷ vực, là nguồn thức ăn, che mát, đồng thời là nơi
đẻ trứng, hoặc cư trú cho nhiều loài cá và thuỷ sinh khác vào thời kỳ ngập lụt
b/ Quần xã thuỷ sinh vật của suối-sông
Suối và sông là một kiểu nơi cư trú phức hợp: từ một dòng chảy bé ở vùng đầu nguồn tập hợp thành suối và cuối cùng thành sông Sinh vật suối thường rất giống với thuỷ sinh vật ở thượng lưu sông, về thành phần loài cũng như về số
Trang 25lượng Hai bên bờ suối thường có thực vật lớn phát triển, mọc thành bụi Do nước chảy mạnh và có nền đáy đá là chủ yếu, quần xã thuỷ sinh vật suối có sinh vật nổi nghèo nàn, thực vật ven bờ phát triển mạnh, động vật đáy há phong phú, chủ yếu gồm các loài sống bám ở đáy đá và ở nước chảy mạnh (tôm, cua, ấu trùng côn trùng Trichoptera, Ephemeroptera, bọ cánh cứng Psephenidae, ấu trùng muỗi Anophene , các loài ốc ích thước nhỏ họ ốc Pomatiopsidae, Ancylidae, Thiaridae,
họ ốc tháp có ích thước lớn hơn như Pachychilidae) Hệ cá suối bao gồm các các loài cá ích thước nhỏ Do độ trong lớn nên các nhóm tảo bám đá phát triển là cơ sở thức ăn quan trọng cho cá và động vật không xương sống Theo đánh giá của nhiều tác giả, khu hệ thuỷ sinh vật hệ sinh thái suối có tỷ lệ các loài đặc hữu cao và trong kiểu hệ sinh thái này, còn nhiều loài chưa được phát hiện Mùa nước lũ lớn, khu hệ sinh vật đáy ở suối bị huỷ diệt đi rất nhanh, nhưng rồi lại hồi phục nhanh, ngay sau khi hết cơn lũ
Đặc điểm quan trọng của sông là chế độ nước chảy, sự phân chia thành nhiều đoạn sinh cảnh hác nhau: thượng lưu, trung lưu và hạ lưu có nhiều nhánh sông chảy qua nhiều địa phương Phù hợp với đặc điểm trên, quần xã thuỷ sinh vật sông
có cấu tạo hông đồng nhất, sai khác nhau giữa thương lưu và hạ lưu Thành phần loài cũng mang tính chất pha trộn, có nhiều loài ngoại lai từ các thuỷ vực khác di nhập vào
Sông là nơi cư trú rất quan trọng của các quần thể cá Nơi cư trú này được đặc trưng bởi hàm lượng ô xy hoà tan thấp hơn so với suối, nhiệt độ cao hơn, độ đục cao hơn, hàm lượng dinh dưỡng cũng cao hơn, đáy bùn và có mùa lụt Nền đáy sông thay đổi từ cát vùng thượng và trung lưu đến cát-bùn, bùn cát ở vùng hạ lưu Trong thành phần sinh vật nổi của sông phát triển mạnh: vi khuẩn, tảo khuê, tảo lam, tảo lục, giáp xác nhỏ kém phát triển Thành phần loài và số lượng nghèo ở thượng lưu và giàu dần lên ở hạ lưu Do chế độ nước chảy mạnh, nên sinh vật nổi phân bố tương đối đồng đều theo chiều ngang cũng như thẳng đứng Số lượng sinh vật nổi nhiều nhất vào kỳ nước thấp và nghèo đi ở ì nước cao
Trong thành phần sinh vật đáy ở sông , thực vật kém phát triển, động vật đáy rất đa dạng tuỳ thuộc vào tính chất nền đáy: đáy cát, đáy đá hay đáy bùn Sinh vật
Trang 26đáy đá thường thấy ở thượng lưu sông thuộc vùng núi, thành phần đặc trưng là ấu trùng Trichoptera, ấu trùng Ephemeroptera, các loài ốc núi Ngoài ra, còn có thể gặp hải miên nước ngọt, sán tiêm mao, những nhóm này ít thấy ở các sông vùng đồng bằng Sinh vật đáy cát và đáy bùn thường thấy ở trung và hạ lưu sông, thành phần gồm ấu trùng côn trùng, giun ít tơ, ốc, trai họ Unionidae Sinh vật tự bơi ở sông gồm có cá, bò sát ở nước và động vật có vú ở nước Các loài cá sông có thể là cá thường trú, có thể là cá từ biển di nhập vào từng thời gian để sinh sản Thành phần khu hệ cá sông thường hông đồng nhất từ thượng lưu về trung lưu, ở mỗi quãng sông có một khu hệ cá đặc trưng Vùng thượng lưu có nhiều loài cá đặc trưng cho vùng núi như: cá bống, cá sỉnh, cá hoả, cá chát, cá loà…, trong hi đó ở vùng hạ lưu, hu hệ cá gồm các loài phổ biến ở vùng đồng bằng (cá chép, cá diếc, cá chày,
cá mè…) và các loài cá từ biển di cư vào (cá mòi, cá cháy…) Một số loài cá khác phân bố từ vùng thượng lưu tới hạ lưu sông, như cá mương, cá trạch, cá nheo, cá măng… Mùa lụt là sự kiện quan trọng của nhiều loài cá sông Nhiều loài cá có tập tính đẻ trứng trong mùa lụt hoặc trước khi, hoặc ngay sau khi mùa lụt
c/ Nơi cư trú ở suối, sông
Trong thuỷ vực sông, các yếu tố môi trường như chế độ thuỷ văn, nhiệt độ và ánh sáng quyết định năng suất sơ cấp Trong các sông nghèo dinh dưỡng, năng suất
sơ cấp thường cao nhất ở kiểu sinh cảnh thác nước (waterfall) và ghềnh (rapid) Ở các sinh cảnh này, nhờ có ánh sáng mặt trời, quần xã tảo đáy (peryphyton) phát triển trên các giá thể đáy đá tảng Chúng sử dụng các chất dinh dưỡng trong nước với nồng độ thấp có hiệu quả hơn so với quần xã thực vật nổi (phytoplankton) Cá phải sử dụng sản lượng sơ cấp hoặc sản lượng thứ cấp như động vật nổi (zooplan ton) như là nguồn thức ăn trực tiếp Động vật nổi cũng là nguồn thức ăn của nhiều loài động vật KXS cỡ lớn và các loài cá Ngược lại, các loài động vật KXS và cá lại là nguồn thức ăn cho các loài cá ăn thịt khác Đây chính là biểu thị đặc điểm cơ bản của chuỗi thức ăn tự nhiên trong thuỷ vực
Các mức dinh dưỡng quyết định sản lượng cá và đa dạng các loài cá Các thuỷ vực nghèo dưỡng sẽ làm gia tăng sự đa dạng khu hệ cá cho tới lúc thuỷ vực đạt tới sự phú dưỡng và hi đó số lượng các loài cá lại giảm đi Trong mùa hô, các nơi
Trang 27cư trú của cá bao gồm thác nước, ghềnh, suối trong rừng, các vực sâu, vùng nước quẩn, mạch nước ngầm Đến mùa mưa, mực nước cao hầu hết những nơi cư trú như trên hoàn toàn thay đổi hoặc biến mất
Tại các khúc sông, suối có dòng chảy nhanh, thực vật nổi hông đủ thời gian
để sinh trưởng và phát triển để hình thành các quần thể tảo nổi để góp phần tạo ra năng xuất sơ cấp ở đây Bởi vậy, tại đây trữ lượng tức thời cúa cá phụ thuộc chính vào nguồn tảo đáy Trữ lượng tức thời của cá ở vùng hạ lưu sẽ tăng lên hi mà ở đó, dòng chảy chậm lại, năng xuất sơ cấp tăng do thực vật nổi có điều kiện phát triển với sự tích luỹ các nguồn dinh dưỡng và trầm tích đáy
Kết luận: Với những đối tượng đã được nêu ở trên ta có thể thấy các chỉ số sinh
học hiện đang được ứng dụng rất nhiều đánh giá hiện trạng môi trường các thủy vực Mô hình hóa có thể là công cụ hỗ trợ trong việc đánh giá mối tương quan giữa các thông số môi trường với các chỉ số sinh học nhằm đề xuất giải pháp quản lý hệ thống thủy vực có hiệu quả
Trang 28CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Mục đích và nội dung nghiên cứu
Nội dung nghiên cứu cụ thể
- Đánh giá chất lượng nước lưu vực sông Cầu dựa trên các chỉ tiêu hóa lý
- Đánh giá tương quan giữa các thông số chất lượng môi trường
- Tính toán chỉ số sinh học là tập đích để phân loại chất lượng nước
- Phát triển mô hình phân loại chất lượng nước dựa trên các ĐVKXSCL
- Phát triển mô hình phân loại chất lượng nước dựa trên chỉ số sinh học
- Đề xuất các giải pháp nâng cao hiệu quả mô hình cây phân loại
2.2 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu:
Chất lượng nước lưu vực sông Cầu bao gồm:
- Các thông số điều kiện môi trường bao gồm thông số hóa lý, hóa học
2.2.1 Đặc điểm và hiện trạng môi trường của khu vực nghiên cứu
Khái quát về sông Cầu
Trang 29Sông Cầu là phụ lưu của hệ thống sông Hồng; lưu vực sông Cầu có diện tích 6.030 km2, là một phần của lưu vực hệ thống sông Hồng-Thái Bình (chiếm khoảng 8% diện tích lưu vực sông Hồng-Thái Bình trong lãnh thổ Việt Nam) Lưu vực sông Cầu có tổng chiều dài các nhánh sông khoảng 1.600 m Lưu vực nằm trong vùng Đông bắc Bắc Bộ bao gồm gần như toàn bộ các tỉnh Bắc Kạn, Thái Nguyên và một phần các tỉnh Bắc Ninh, Bắc Giang, Vĩnh Phúc, Hải Dương và Hà Nội (huyện Đông Anh, Sóc Sơn) [12]
Dòng chính sông Cầu với chiều dài khoảng 290 km, độ cao bình quân lưu vực: 190 m, độ dốc bình quân 16,1%, chiều rộng lưu vực trung bình: 31 km, mật độ lưới sông 0,95 km/km² và hệ số uốn khúc 2,02 Dòng chính bắt nguồn từ núi Văn
Ôn (Vạn On) ở độ cao 1.170 m trong địa phận xã Phương Viên huyện Chợ Đồn tỉnh Bắc Kạn, chảy ngoằn ngoèo giữa hai dãy núi Ngân Sơn và dãy núi Sông Gâm theo hướng Bắc Tây - Đông Nam tới địa phận xã Dương Phong, huyện Bạch Thông rồi đổi hướng để chảy theo hướng Tây nam-Đông bắc qua thị xã Bắc Kạn tới xã Mỹ Thanh huyện Bạch Thông
Tại xã Nông Hạ huyện Chợ Mới nó nhận một chi lưu phía hữu ngạn, chảy về
từ xã Mai Lạp cùng huyện theo hướng Tây bắc-Đông nam Tới địa phận thị trấn Chợ Mới, nó nhận một chi lưu nữa phía hữu ngạn rồi đổi hướng sang Tây Bắc-Đông Nam Tới địa phận xã Văn Lãng (huyện Đồng Hỷ, tỉnh Thái Nguyên), nhận một chi lưu phía tả ngạn rồi đổi hướng sang Đông bắc-Tây nam Tới xã Sơn Cẩm huyện Phú Lương nhận tiếp một chi lưu phía hữu ngạn là sông Đu rồi chảy qua phía đông thành phố Thái Nguyên Chảy tới xã Nga My huyện Phú Bình thì đổi sang hướng Đông Bắc-Tây Nam tới xã Thuận Thành, huyện Phổ Yên nhận tiếp một chi lưu là sông Công Tới ranh giới xã Mai Đình huyện Hiệp Hoà và xã Việt Long huyện Sóc Sơn, Hà Nội, nó nhận một chi lưu nhỏ phía hữu ngạn là sông Cà Lồ rồi chảy tiếp về phía đông qua ranh giới của hai huyện Việt Yên, Bắc Giang và Yên Phong, Bắc Ninh rồi hợp lưu với sông Thương tại ngã ba Lác ở ranh giới của xã Đồng Phúc (huyện Yên Dũng) với thị trấn Phả Lại (huyện Chí Linh, tỉnh Hải Dương) để tạo thành sông Thái Bình
Trang 30Trong lưu vực sông Cầu, có VQG Ba Bể và VQG Tam Đảo, khu BTTN Kim
Hỷ, và các hu văn hóa - lịch sử môi trường với giá trị sinh thái cao Lưu vực sông Cầu khá giầu các nguồn tài nguyên thiên nhiên: tài nguyên rừng đa dạng, tài nguyên nước dồi dào, tài nguyên khoáng sản phong phú Độ che phủ của rừng trong lưu vực sông Cầu được đánh giá là trung bình, đạt khoảng 45% Tuy nhiên, rừng bị phá hủy mạnh mẽ cùng những hoạt động phát triển kinh tế, xã hội hác như công nghiệp, khai thác mỏ, làng nghề thủ công và hoạt động nông nghiệp gây áp lực lớn
lên môi trường trong lưu vực [16]
Ảnh hưởng của các yếu tố địa hình đến đa dạng sinh học trên lưu vực sông Cầu
Các đặc điểm về địa hình và chế độ khí hậu, thuỷ văn được xem là những yếu tố tự nhiên có những tác động cơ bản tới đặc trưng về quần xã và đa dạng thuỷ sinh vật sông Cầu Những tác động này thông qua diễn biến hình thành và phát triển các kiểu nơi cư trú (habitats) trong các iểu HST sông, suối với các đặc trưng về thủy văn, cấu tạo nền đáy và chất lượng nước Để thấy được những tác động tự
nhiên tới ĐDSH sông Cầu, cần biết khái quát về hệ sinh thái sông, suối [16]
2.2.2 Lựa chọn và mô tả đặc điểm tự nhiên của các vị trí lấy mẫu
Cấu trúc bộ số liệu, thời gian lấy mẫu
Các vị trí thu mẫu phân bố thành các điểm nghiên cứu dọc theo toàn bộ lưu vực sông Cầu từ Bắc Kạn đến Thái Nguyên
Bảng 2.1 Các điểm quan trắc trên lưu vực sông Cầu [15]
1 Cầu Phà (Cầu Bắc Kạn) -Phường Đức Xuân-Thị xã
009‟18.1 105050‟48.7
3 Sông Chu-Cầu Chợ Mới-Yên Ninh-Chợ Mới-Bắc
052‟55.0 105046‟10.0
4 Văn Lăng-Đồng Hỷ-Thái Nguyên (mới) SCA-1-3 21050‟48.8 105049‟05.6
5 Suối Nghinh Tường-Thần Sa- Võ Nhai- Thái Nguyên SNT-1-16 21045‟37.7 105056‟59.6
6 Cầu Huy Ngạc-Hùng Sơn-Đại Từ-Thái Nguyên SCO-2-8 21038‟082 105038‟983
Trang 31STT Tên trạm Kí hiệu Vĩ độ Kinh độ
7 Sông Đu-cầu Giang Tiên-Thị trấn Đu-Phú
0
40‟10.9 105044‟17.8
8 Suối Phượng Hoàng, phường Tân Long-TP Thái
11 Cầu Mây-Nhã Lộng-Phú Bình-Thái Nguyên SCA-1-6 21028‟22.2 105056‟56.4
12 Nam hồ Núi Cốc-Xã Phúc Trìu-TP Thái Nguyên SCO-2-9 21033‟12.6 105043‟58.4
13 Cầu treo Sông Công-Phường Mỏ Chè-TX Sông
Công
SCO-2-11
21028‟17.6 105049‟14.1
14 Cầu Bến Đẫm- Phổ Yên- Thái Nguyên SCO-2-12 21025‟13.2 105050‟17.9
15 Cầu Đa Phúc-Thuận Thành-Phổ Yên-Thái Nguyên SCO-1-14 21019‟46.8 105052‟04.5
Trang 33Hình 2.1 Bản đồ vị trí lấy mẫu sông Cầu
Các vị trí hình tròn có mày da cam thể hiện vị trí lấy mẫu của sông Cầu
Đặc điểm các vị trí quan trắc [14]
1 Vị trí: SCA 1-1: Vị trí này được lấy thuộc địa phận phường Đức Xuân – Thị xã
Bắc Cạn Vị trí này ít chịu tác động của con người
Trang 342 Vị trí: SCA -2-1:Cầu Thác Giềng nằm trên địa phận xã Xuất Hóa, thị xã Bắc
Kạn Khu vực hông có đông dân cư nên hai bên bờ khu vực này hông được khai thác nhiều Hiện trạng môi trường khu vực này không bị ảnh hưởng
3 Vị trí: SCC-1-15: Sông Chợ Chu là một phụ lưu của sông Cầu tại miền
Bắc Việt Nam Hệ thống sông Chợ Chu là hệ thống sông lớn nhất trên địa bàn huyện Định Hóa, tỉnh Thái Nguyên Văn Lăng-Đồng Hỷ-Thái Nguyên (mới)
4 Vị trí: SCA-1-3: Văn Lăng - Đồng Hỷ - Thái Nguyên Khu vực này có sự khai
thác cát sỏi Do vậy môi trường khu vực này bị ảnh hưởng bởi hoạt động khai thác khoáng sản này
5 Vị trí: SNT-1-16: Sông Nghinh Tường là một phụ lưu của sông Cầu thuộc
tỉnh Thái Nguyên tại miền bắc Việt Nam Việc khai thác cát, sỏi, khai thác lâm sản trái phép tại khu vực có thể ảnh hưởng xấu đến chất lượng môi trường nước sông
6 Vị trí: SCO-2-8: Nằm trên địa phận xã Hùng Sơn huyện Đại Từ - Thái Nguyên
Cầu Huy Ngạc nằm trên QL37 Khu vực này gần như hông chịu tác động của hoạt
động sản xuất đến môi trường
7 Vị trí: SDU-1-17: Sông Đu bắt nguồn từ vùng Lương Can, ở độ cao khoảng
275 m thuộc tỉnh Thái Nguyên, chảy theo hướng tây bắc - đông nam và nhập vào Sông Cầu ở xã Sơn Cẩm, huyện Phú Lương Khu vực này chịu ảnh hưởng của hoạt động khai thác than, khai thác khoáng sản có ảnh hướng xấu tới chất lượng nước
8 Vị trí: SPH-2-23: Tân Long là một phường thuộc thành phố Thái Nguyên,
tỉnh Thái Nguyên, Việt Nam Khu vực này chịu tác động của nước thải do nhà máy giấy xuất khẩu thải ra Do vậy chất lượng môi trường khu vực này bị ảnh hưởng
9 Vị trí: SCA-2-3: Vị trí lấy mẫu nằm ở phường Quán Triều – TP Thái Nguyên –
tỉnh Thái Nguyên Khu vực lấy mẫu chịu ảnh hưởng của nước thải công nghiệp và nước thải sinh hoạt Tuy vậy qua quan sát không thấy môi trường khu vực bị ảnh hưởng nhiều
10 Vị trí: SCA-1-5:Nằm trên tuyến đường đi Bắc Kạn, nơi bắt đầu hướng đi Đồng
Hỷ, hang Phượng Hoàng và Lạng sơn Nguồn nước khu vực này chịu tác động của nước thải sinh hoạt hai bên bờ Chất lượng môi trường khu vực này bị ảnh hưởng bởi nhiều yếu tố tác động
Trang 3511 Vị trí: SCO-2-9:Phúc Trìu là một xã thuộc thành phố Thái Nguyên, tỉnh Thái
Nguyên, Việt Nam
12 Vị trí: SCA-1-6: Cầu Mây nằm trên tuyến đường từ Bắc Giang đi Thái Nguyên
Chất lượng môi trường khu vực này chịu ảnh hưởng của hoạt động khai thác cát cùng với hoạt động nông nghiệp
13 Vị trí: SCO-2-11: Hai bên bờ sông khu vực lấy mẫu là khu vực chứa cát khai
thác, phía trên hai bên bờ trồng tre và có nhiều đá sỏi nhô lên gần khu vực bờ sông Chất lượng nước khu vực này chịu ảnh hưởng của hoạt động khai thác cát và hoạt động nông nghiệp của người dân
14 Vị trí: SCO-2-12:Cầu Đẫm nằm trên đường 261 thuộc xã Đắc Sơn huyện Phổ
Yên – Thái Nguyên Xã Đắc Sơn nằm ở phía Tây của huyện Phổ Yên, cách thị trấn
Ba Hàng 3 km về phía Tây, trên tuyến đường liên tỉnh nối liền từ Phổ Yên tới huyện Đại Từ
15 Vị trí: SCO-1-14: Cầu Đa Phúc nằm trên QL3 nối Thái Nguyên và Hà Nội Khu
vực lấy mẫu chịu ảnh hưởng của hoạt động khai thác tài nguyên và hoạt động của người dân hai bên bờ Chất lượng môi trường khu vực này chịu ảnh hưởng nhiều từ các hoạt động trên
2.3 Phương pháp nghiên cứu
2.3.1 Đánh giá chất lượng
- Đánh giá chất lượng nước lưu vực sông Cầu dựa trên các chỉ số hóa lý, hóa học trên cơ sở so sánh chất lượng nước tại các điểm nghiên cứu với QCVN 08-2008/BTNMT về chất lượng nước mặt
2.3.2 Phân tích tương quan số liệu
Phân tích tương quan là phép đo mối quan hệ giữa hai dữ liệu Mối tương quan chỉ ra độ mạnh và chiều hướng của đường quan hệ giữa hai giá trị ngẫu nhiên Công thức tính hệ số tương quan
R=
SxSy n
y yi x xi
)1(
))(
Trang 36X,y: là các giá trị
,
x y,là các giá trị trung bình của x và y
Sx, Sy là giá trị lệch chuẩn của x và y
Hệ số tương quan có hoảng giá trị từ -1 đến + 1 Dựa trên hệ số tương quan
có thể chia mối liên hệ thành 5 loại, còn gọi là phân loại Fowler [18]
Bảng 2.2: Hệ số tương quan
i
BMWP
1Trong đó: n: Tổng số taxa xuất hiện tại vị trí nghiên cứu
BMWPi: Điểm BMWP của taxon thứ i theo bảng cho điểm BMWP
Trang 3771 - 100 Tốt Sạch hoặc bị tác động nhẹ
động ASPT (Average Score Per Taxon) là điểm số trung bình cho các đơn vị phân loại được tính bằng cách chia điểm số tổng BMWP cho số họ tham gia tính điểm
ASPT =
n BMWP
Trong đó: n: Tổng số taxa xuất hiện tại vị trí nghiên cứu
2.3.4 Phương pháp phát triển mô hình sinh thái dạng cây phân loại
2.3.4.1 Thuật toán ứng dụng mô hình cây phân loại
Giải thuật ID3 xây dựng cây quyết định từ trên xuống
ID3 xây dựng cây quyết định theo cách từ trên xuống Lưu ý rằng đối với bất
kỳ thuộc tính nào, chúng ta cũng có thể phân vùng tập hợp các ví dụ rèn luyện thành những tập con tách rời, mà ở đó mọi ví dụ trong một phân vùng (partition) có một giá trị chung cho thuộc tính đó ID3 chọn một thuộc tính để kiểm tra tại nút hiện tại của cây và dùng trắc nghiệm này để phân vùng tập hợp các ví dụ; thuật toán hi đó xây dựng theo cách đệ quy một cây con cho từng phân vùng Việc này tiếp tục cho đến khi mọi thành viên của phân vùng đều nằm trong cùng một lớp; lớp đó trở thành nút lá của cây
Trang 38Vì thứ tự của các trắc nghiệm là rất quan trọng đối với việc xây dựng một cây quyết định đơn giản, ID3 phụ thuộc rất nhiều vào tiêu chuẩn chọn lựa trắc nghiệm để làm gốc của cây
Bảng 2.5 Giải thuật ID3 xây dựng cây quyết định:
Function induce_tree(tập_ví_dụ, tập_thuộc_tính)
begin
if mọi ví dụ trong tập_ví_dụ đều nằm trong cùng một lớp then
return một nút lá được gán nhãn bởi lớp đó
else if tập_thuộc_tính là rỗng then
return nút lá được gán nhãn bởi tuyển của tất cả các lớp trong tập_ví_dụ
else
begin
chọn một thuộc tính P, lấy nó làm gốc cho cây hiện tại;
xóa P ra khỏi tập_thuộc_tính;
với mỗi giá trị V của P
begin
Tạo một nhánh của cây gán nhãn V;
Đặt vào phân_vùngV các ví dụ trong tập_ví_dụ có giá trị V tại thuộc tính P;
Gọi induce_tree(phân_vùngV, tập_thuộc_tính), gắn kết quả vào nhánh V
end
end
Các khả năng có thể có của các phân vùng (partition):
Trong quá trình xây dựng cây quyết định, phân vùng của một nhánh mới có thể có các dạng sau:
Có các ví dụ thuộc các lớp khác nhau, chẳng hạn như có cả ví dụ âm và dương
Tất cả các ví dụ đều thuộc cùng một lớp, chẳng hạn như toàn âm hoặc toàn dương
Không còn ví dụ nào => giải thuật trả về mặc nhiên
Không còn thuộc tính nào => nghĩa là dữ liệu bị nhiễu, hi đó giải thuật phải
sử dụng một luật nào đó để xử lý, chẳng hạn như luật đa số (lớp nào có nhiều
ví dụ hơn sẽ được dùng để gán nhãn cho nút lá trả về)
Trang 39Từ các nhận xét này, ta thấy rằng để có một cây quyết định đơn giản, hay
một cây có chiều cao là thấp, ta nên chọn một thuộc tính sao cho tạo ra càng nhiều
các phân vùng chỉ chứa các ví dụ thuộc cùng một lớp càng tốt Một phân vùng chỉ
có ví dụ thuộc cùng một lớp, ta nói phân vùng đó có tính thuần nhất Vậy, để chọn
thuộc tính kiểm tra có thể giảm thiểu chiều sâu của cây quyết định, ta cần một phép
đo để đo tính thuần nhất của các phân vùng, và chọn thuộc tính kiểm tra tạo ra càng
nhiều phân vùng thuần nhất càng tốt ID3 sử dụng lý thuyết thông tin để thực hiện
điều này
Thuật toán phân lớp cây quyết định C4.5
Dữ liệu vào: Tập dữ liệu D, tập danh sách thuộc tính, tập nhãn lớp
Dữ liệu ra: Mô hình cây quyết định
Thuật toán: Tạocây (Tập dữ liệu E, tập danh sách thuộc tính F, tập nhãn lớp)
9 Đặt V = {v| v thoả điều kiện là phần phân chia xuất phát từ Nútgốc}
10 Lặp qua từng tập phân chia v
Gọi hàm Tạocây (E, tập danh sách thuộc tính của E, tập nhãn lớp)
Độ đo sử dụng để xác định điểm chia tốt nhất:
Entropy: Đại lƣợng đo tính đồng nhất hay tính thuần nhất của các mẫu
i c
p S
Trang 40Trong đó:
S là tập dữ liệu huấn luyện
Ci là một nhãn lớp bất kỳ trong tập dữ liệu S
Pi là xác suất của một bộ bất kỳ trên S thuộc về nhãn Ci
Giả sử phân chia các bộ trong S trên một thuộc tính A bất kỳ, để không mất tính tổng quát có thể xem như A có các giá trị phân biệt {a1, a2, …, av} Nếu thuộc tính A được sử dụng để chia thành v tập con, những tập con này sẽ tương ứng với các nhánh con của nút hiện tại, độ đo thông tin có được sau khi phân lớp theo v tập con trên sẽ được tính như sau:
S
S S
Entropy
1
)()
(Trong đó: S j là tổng số bộ dữ liệu được phân chia vào tập con thứ j
Information gain: độ đo xác định ảnh hưởng của một thuộc tính trong mẫu
đó trong việc phân lớp gọi là độ lợi thông tin
Độ lợi thông tin dựa trên phân nhánh bằng thuộc tính A:
)()
()
,(S A Entropy S Entropy S
SplitInformation: Thông tin tiềm ẩn được tạo ra bằng cách chia tập dữ liệu
trong một số tập con nào đó
S
S S S
1
2logTrong đó Si là tập con của S chứa các ví dụ có thuộc tính A mang giá trị Vi Để
ý rằng Splitinfomation thực sự chính là Entropy của S với sự liên quan trên những giá trị của thuộc tính A
GainRatio: Sự đánh giá thay đổi các giá trị của thuộc tính.
),(
A)Gain(S,A)
(S,GainRation
A S ation SplitInfom
Tất cả các thuộc tính sẽ được tính toán độ đo tỷ lệ Gain, thuộc tính nào có độ
đo tỷ lệ Gain lớn nhất sẽ được chọn làm thuộc tính phân chia