1.2 Các dạng nghiên cứu môi trường Bố trí thí nghiệm xử lý môi trường Phân tích diễn biến môi trường qua thời gian, dự báo mức độ ô nhiễm dựa trên phân tích chuỗi số liệu theo thờ
Trang 1TIN HỌC ỨNG DỤNG TRONG CNSHMT
Trang 2Mục tiêu
Giúp sinh viên độc lập trong nghiên cứu khoa học, có khả năng xử lý
số liệu thường gặp trong điều tra, nghiên cứu trong công nghệ sinh học môi trường
Trang bị cho sinh viên kỹ năng sử dụng phần mềm thống kê trong việc
giải quyết xử lý và trình bày số liệu
Trang 3Nội dung
Trang 4Tài liệu tham khảo
Nguyễn Ngọc Kiểng, Thống kê học trong nghiên cứu khoa học, NXB Giáo
dục, 1996.
Lê Đức Ngọc, Xử lý số liệu và kế hoạch hóa thực nghiệm, Khoa Hóa,
ĐHQGHN, 2001.
Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB Đại học Quốc gia, 2004
Phan Hiếu Hiền, Phương pháp bố trí nghiệm và xử lý số liệu, NXB Nông
nghiệp, 2001
Trang 51 Tin học ứng dụng trong CNSHMT
Khoa học môi trường
Các dạng nghiên cứu môi trường
Các bước trong nghiên cứu khoa học
Tin học ứng dụng trong công nghệ
Trang 61.1 Khoa học môi trường
Nghiên cứu các tác động qua lại của môi trường và con người
Thuật ngữ môi trường liên quan đến không khí, nước, đất cũng như
thực vật, động vật và vi sinh vật
Trang 7Khoa học môi trường giải quyết vấn đề:
Gia tăng dân số,
Cạn kiệt tài nguyên
Ô nhiễm môi trường
Trang 81.2 Các dạng nghiên cứu môi trường
Bố trí thí nghiệm xử lý (môi trường)
Phân tích diễn biến môi trường qua thời gian, dự báo mức độ ô nhiễm
dựa trên phân tích chuỗi số liệu theo thời gian
Điều tra các yếu tố vật lý, hóa học, sinh học của môi trường, phục vụ
đánh giá tác động của môi trường, đánh giá hiệu quả của biện pháp xử
lý
Trang 91.2 Các dạng nghiên cứu môi trường
Mối liên hệ và tác động qua lại giữa các yếu tố trong cùng quần thể,
dự đoán mối liên hệ giữa các yếu tố thông qua mối liên hệ tương quan
Trang 101.3 Các bước trong nghiên cứu khoa học
Xác định nhiệm vụ, đối tượng, dân số
Tính toán số lượng đơn vị cần thu thập theo qui định thống kê
Thu thập dữ kiện
Lưu trữ và xử lý số liệu
Phân tích kết quả và viết báo cáo
Trang 11Xác định nhiệm vụ, đối tượng, dân số
Trước khi tiến hành thu thập dữ kiện, phải hiểu mình muốn biết gì khi
điều tra nghiên cứu
xác định nhiệm vụ là việc hàng đầu trước khi thu thập dữ kiện
Trang 12Tính toán số lượng đơn vị cần thu thập theo qui định thống kê
Việc xác định dung lượng mẫu cần thiết cho cuộc điều tra có ảnh
hưởng đến kết quả đánh giá và suy diễn kết luận về quần thể thông
qua tập hợp mẫu
Thu thập không đủ số lượng đơn vị cho mẫu điều tra sẽ làm lệch sự suy
diễn, phi khoa học và dẫn đến sự ngộ nhận gây ra những hậu quả
không lường được
Trang 13Thu thập dữ kiện
Khi điều tra nghiên cứu môi trường, phải thực hiện việc thu thập dữ
kiện
Có những trường hợp dữ kiện phải được thu thập qua 2 bước Trong
khi thu thập dữ kiện phải thực hiện việc ghi chép thông qua các bảng ghi số liệu khảo sát
Trang 14Lưu trữ và xử lý số liệu
Hình thức và phương pháp lưu trữ dữ kiện thu thập ngoài hiện trường
hay kết quả phân tích trong phòng thí nghiệm rất đa dạng tùy theo mục đích điều tra nghiên cứu
Trang 15Lưu trữ và xử lý số liệu
Dưới dạng bảng tính
Dưới dạng cơ sở dữ liệu
Lưu trữ trực tiếp vào phần mềm xử lý thống kê
Trang 16Phân tích kết quả và viết báo cáo
2 loại dữ liệu:
Loại dữ liệu nguồn, các dữ liệu gốc đã thu thập hay phân tích từ phòng
thí nghiệm
Các kết quả xử lý: phải làm nổi bật các kết luận, đánh giá hiện trạng,
phân tích trong báo cáo điều tra nghiên cứu
Trang 17Phân tích kết quả và viết báo cáo
Một bảng thống kê kết quả chủ yếu gồm các thành phần sau:
Tựa đề của bảng
Các đầu đề dữ kiện
Nguồn gốc dữ kiện
Trang 181.4 Tin học ứng dụng trong công nghệ
Trong mọi ngành khoa học thực nghiệm:
thực tế
thí nghiệm
kết quả bằng số
Trang 19Kết quả bằng số:
là giá trị của một biến ngẫu nhiên
phụ thuộc vào nhiều yếu tố
ước lượng được qui luật phụ thuộc (nghiên cứu trên một tập hợp mẫu
với độ tin cậy nào đó)
Trang 20Xử lý số liệu
dữ liệu thô - tính toán, sắp xếp - dữ liệu tinh
làm cơ sở cho việc diễn giải, phân tích thống kê
Trang 212 Khái niệm cơ bản trong thống kê kết quả nghiên cứu
Phân tích thống kê
Mô tả dữ kiện
Công cụ của thống kê
Biến số
Phương pháp xử lý số liệu ban đầu
Đại lượng trung bình
Trang 222.1 Phân tích thống kê
Các con số tóm lược thông tin định lượng
Phương pháp tính toán để giúp chúng ta tóm lược hoặc khái quát hoá
thông tin
Kỹ thuật giúp quyết định vấn đề như phân tích phương sai, tương quan
hồi qui, trắc nghiệm, …
Trang 23Hạn chế của thống kê
Sử dụng thống kê phải biết rành về lĩnh vực chuyên môn của người
nghiên cứu
Thống kê chỉ là phương tiện, công cụ
Thống kê trình bày những số liệu hoặc hiện tượng rời rạc một cách hệ
thống hơn, chứ không nói được bản chất của sự việc
Thống kê không thay thế được cho suy nghĩ và kết luận của người
nghiên cứu
Trang 24Thống kê mô tả
Là một trong những bước đầu tiên để phân tích vấn đề và thực hiện
một quyết định
Gồm các tính toán cơ bản mang tính chất mô tả như trung bình,
phương sai, độ lệch chuẩn, … nhằm tổng kết về kết quả của thí nghiệm
Trang 25Thống kê mô tả
Phương pháp tóm lược thông tin để làm cho chúng trở nên dễ hiểu tức
giảm một số lớn các số liệu phức tạp thành một số nhỏ hơn gồm các giá trị tóm tắt
Mô tả mối quan hệ giữa các biến số
Trang 26Thống kê suy diễn
Khái quát hoá thông tin của một mẫu cho toàn dân số của mẫu tức là
chỉ đo đếm trên một tiểu tập hợp rồi suy luận cho toàn bộ với một độ tin cậy nào đó
Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thông tin này
để suy rộng ra các đặc tính của toàn bộ dân số
Trang 28Mô tả dữ kiện
Phân phối dân số
Phân phối mẫu
Phân phối chuẩn
Trang 29Phân phối dân số
là phân phối của những điểm số trong một dân số
Trang 30Phân phối mẫu
là phân phối của những điểm số trong một mẫu có kích cỡ nhất định
là phân phối của một thống kê nào đó của tất cả các mẫu có cùng một
kích cỡ trong dân số
Trang 31Phân phối chuẩn
Khi vẽ biểu đồ tương quan giữa tần số và kết quả thu nhận, hình dạng
đường cong thông thường có dạng hình chuông gọi là phân phối chuẩn
Trang 32Phân phối chuẩn
Là một phân phối đối xứng có dạng hình chuông, biểu diễn bằng phương
trình:
π δ
δ µ
2
2
2 / 2 )
−
= e x
Y
Trang 33 Hai phân phối chuẩn với độ lệch chuẩn khác nhau:
độ lệch chuẩn nhỏ cho phép khái quát hoá những kết quả của mẫu cho toàn dân số với độ tin cậy cao
Trang 34Phân phối chuẩn
Trang 35Phân phối chuẩn
Trong một phân phối chuẩn, khoảng:
68% số liệu trong khoảng X ±SD
95% số liệu trong khoảng X ±2SD
99% số liệu trong khoảng X ±3SD
Trang 36Phân phối chuẩn
Trong một phân phối chuẩn:
Có 95% số trường hợp nằm trong độ lệch chuẩn ±1,96 so với giá trị
trung bình
Có 99% số trường hợp nằm trong độ lệch chuẩn ±2,58 so với giá trị
trung bình
Trang 37Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Các giá trị của một biến số có sự phân phối là phân tán hay tập trung
Giá trị đồng nhất (các giá trị của một biến số có xu hướng quần tụ)
Giá trị không đồng nhất (các giá trị của một biến số có xu hướng phân
tán)
Trang 38Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Trung bình mẫu ước lượng giá trị trung tâm của phân bố
Độ lệch chuẩn của mẫu liên quan đến sự phân tán của số liệu
Trang 39Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Trung bình mẫu và Độ lệch chuẩn chỉ có giá trị đại diện cho mẫu khi
mẫu có phân phối chuẩn
Độ lệch (skewness) và độ nhọn (kurtosis) dùng để kiểm tra mẫu có phân
bố chuẩn hay không
Trang 41Độ nhọn (kurtosis)
Là tiêu chuẩn để xác định hình dạng của phân bố đối xứng.
Độ nhọn = 0 (phân bố chuẩn)
Độ nhọn > 0 (phân bố có đồ thị nhọn hơn phân bố chuẩn)
Độ nhọn < 0 (phân bố có đồ thị bẹt hơn phân bố chuẩn)
Trang 422.3 Công cụ của thống kê
Biểu bảng,
Biểu đồ,
Các giá trị mô tả (trung bình, độ lệch chuẩn, phương sai, …)
Trang 43Bảng phân phối tần số
Sắp xếp, trình bày dữ liệu một cách có hệ thống
Phân chia dữ liệu thành từng nhóm khác nhau
Căn cứ để hình thành biểu đồ phân phối tần số
Trang 44Sơ đồ tổng quát của bảng phân phối tần số
Trang 45Sơ đồ tổng quát của bảng phân phối tần số
Trang 46Sơ đồ tổng quát của bảng phân phối tần số
Năng
đối (%)
Tần số tích lũy
Tần số tương đối tích lũy
Trang 47Trị số của biến quan sát
Số cụ thể
Khoảng giá trị (khoảng cách có thể bằng nhau hoặc không, có giới hạn
trên/dưới hoặc chỉ một giới hạn)
Trang 48Biểu đồ trong thống kê
Biểu diễn toàn bộ số liệu
Thể hiện nét đặc trưng của tập hợp số liệu
Biểu diễn mối quan hệ giữa tính trạng nghiên cứu và chỉ tiêu theo dõi
Trang 49Biểu đồ phân phối tần số
Biểu đồ cột
Trình bày số quan sát lớn
Có thể trình bày tần số tương đối, tần số tích lũy, tần số tương đối tích
lũy
Trang 50Biểu đồ phân phối tần số
Trang 51Biểu đồ phân phối tần số
Trang 52Biểu đồ tần số tích lũy
Trang 53Biểu đồ tần số tương đối tích lũy
Trang 54Biểu đồ hộp
Khảo sát sơ lược dữ liệu
Tổng quát về phân phối của mẫu/ tổng thể
thể hiện ví trí tập trung, phân tán, bất thường
Trang 55Biểu đồ hộp
Trang 56Biểu đồ hộp
Khối hộp ‘box’ kéo dài từ giá trị phân vị ¼ đến giá trị phân vị ¾ ,
khoảng 50% giá trị nẳm trong ‘box’
Đường thẳng đứng ở vị trí trung bị mẫu, chia dãy số liệu thành 2 phần
bằng nhau, nếu mẫu phân bố đối xứng thì đường này nằm gần trung tâm của khối hộp
Trang 57Biểu đồ hộp
Dấu + ở vị trí trung bình của mẫu
Sự khác biệt đáng kể giữa trung bình và trung vị cho thấy có một vài số
liệu có khả năng gây ra sai số làm phân bố của mẫu bị lệch
Đoạn thẳng hai đầu gọi là ‘whisker’ nối từ giá trị cực tiểu đến điểm
phân vị ¼ và từ điểm phân vị ¾ đến giá trị cực đại
Trang 58Biểu đồ điểm
Trang 59Mẫu và dân số
Dữ liệu của dân số là những dữ liệu liên quan đến mọi trường hợp
Dữ liệu của mẫu đại diện có thể khái quát cho toàn bộ dân số
Trang 60Mẫu (sample)
Được chọn ngẫu nhiên từ dân số
Mẫu là một phần và là đại diện của dân số.
Phân tích mẫu có thể suy ra các đặc tính của dân số với một mức độ tin
cậy xác định nào đó
Trang 61Mẫu ngẫu nhiên
Mẫu lấy từ dân số mà các đơn vị đều có cơ hội đồng đều nhau, nó mang
tính khách quan trong thu thập dữ kiện
Trang 62Ví dụ: Muốn xác định mức độ ô nhiễm của một khu công nghiệp:
Dân số là tất cả các nhà máy, xí nghiệp trong khu công nghiệp đó.
Mẫu gồm một vài xí nghiệp hoặc nhà máy nào đó trong khu công nghiệp
để đánh giá mức độ ô nhiễm
Trang 63Dân số (population)
Là tập hợp những thông tin về người, sự vật hoặc sự việc riêng biệt kết
hợp với nhau trên cơ sở một đặc điểm chung nào đó mà người nghiên cứu đang quan tâm
Là tập hợp toàn bộ các đối tượng nghiên cứu, điều tra, khảo sát Có
những đặc điểm chung vào mục tiêu của điều tra nghiên cứu môi trường
Trang 64Dân số
Thường rất lớn và không thể kiểm tra hết
Muốn biết thông tin về dân số chỉ có thể đo đếm trên một tiểu tập hợp
gọi là mẫu
Trang 652.4 Biến số
Là một đặc trưng mà giá trị của nó khác nhau tùy theo trường hợp
Tùy nhu cầu nghiên cứu mà có thể tạo ra các biến số mới
đặc trưng quan sát mà cuộc nghiên cứu quan tâm đến,
có 02 loại biến số (liên tục, rời rạc)
Trang 66Biến số liên tục
Là các số nguyên dương và thập phân
Các số đo về chiều dài, trọng lượng, thể tích,
Trang 67Biến số rời rạc
Là các số nguyên dương
Các biến biểu thị tính chất hay số đếm như tỷ lệ cây trồng sống sót, số
cây không bị nhiễm rầy
Trang 68Đơn vị
đối tượng cụ thể để đo đếm và thu nhập dữ kiện
Một mẫu thăm dò sẽ có nhiều đơn vị
Đơn vị thống kê là một phần tử của một tập hợp mẫu thống kê điều tra
khảo sát
Cần phân biệt giữa đơn vị thống kê và hình thức thu thập mẫu trong trường hợp đối tượng nghiên cứu là nước, không khí
Trang 69Đếm số đơn vị
số cây con/m2,
số sâu trên một cá thể,
số chồi cây trên một gốc,
Trang 70Đặc tính quan sát - chỉ tiêu nghiên cứu
một đơn vị thống kê trong lĩnh vực môi trường có thể có rất nhiều chỉ
tiêu nghiên cứu
Đặc tính quan sát của đơn vị điều tra khảo sát được phân thành hai
nhóm: đặc tính giống nhau và đặc tính biến thiên
Trang 71đặc tính giống nhau
đặc tính không thay đổi từ đơn vị thống kê này đến đơn vị khác.
Các đặc tính giống nhau được chia làm 3 nhóm:
Đặc tính không gian
Đặc tính thời gian
Đặc tính cụ thể
Trang 72đặc tính biến thiên
Là các đặc tính quan sát mà các đơn vị có thể có giá trị khác nhau
Là các chỉ tiêu của đơn vị biến thiên từ đơn vị này đến đơn vị khác
Các đặc tính biến thiên có thể chia thành hai nhóm: định tính và định
lượng
Trang 73đặc tính biến thiên
có thể có tính chất cụ thể, tính chất thời gian hoặc không gian
xác định các thông tin cần thu thập trong khi điều tra khảo sát
Trang 742.5 Phương pháp xử lý số liệu ban đầu
Gọi a là trị thực của đại lượng đo, X là kết quả đo
Sai số tuyệt đối (X-a) có thể gồm 3 thành phần là sai số hệ thống, sai
số thô, sai số ngẫu nhiên
Trang 76Sai số thô
Sai số thô là sai số do bất cẩn, trục trặc kỹ thuật, thay đổi điều kiện đột
ngột, …Đặc điểm đơn lẻ, có trị số tuyệt đối lớn hoặc nhỏ một cách bất thường
Cần loại bỏ các số đo chứa sai số thô để khỏi ảnh hưởng không trung
thực đến kết quả chung
Trang 77Sai số ngẫu nhiên
Sai số ngẫu nhiên là sai số không thể tiên đoán được cụ thể, do rất
nhiều nhân tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng
Sai số ngẫu nhiên là sai số mà người làm thí nghiệm không thể loại bỏ
được, phải chấp nhận
Trang 782.6 Đại lượng trung bình
Trang 79Mode: (Mo)
Là giá trị xuất hiện nhiều nhất trong một biến số
Ví dụ: Phân phối xác suất: 5, 6, 7, 7, 8, 8, 8, 9, 10 có mode là 8
Dùng để đo độ tập trung
Không phụ thuộc vào giá trị ở 2 đầu của dãy số
Trang 80Mode: (Mo)
Biến số đơn thức là biến số khi gần như mọi trường hợp đều tập trung về
một giá trị
Biến số nhị thức là biến số khi gần như có hai hay nhiều trường hợp nhất
và gần như tương đương nhau
Trang 81Số trung vị: (Me)
số nằm ở chính giữa khi dãy số xếp từ nhỏ - lớn
Là giá trị chia đôi tổng số các giá trị của biến số thành 2 phần bằng nhau
cho kết quả nhanh về ước lượng trung bình.
Trang 82Trung bình cộng
Cộng các giá trị của các trường hợp và chia cho tổng trường hợp
Trường hợp dị biệt có thể làm trung bình mất đi tính đại diện
Tổng các độ lệch giữa các giá trị với trung bình luôn bằng 0
Tổng các độ lệch bình phương có giá trị nhỏ nhất
X
Trang 83Trung bình cộng
Đại diện cho cả một tập hợp lớn số liệu
Nêu lên đặc điểm chung nhất của hiện tượng
Dùng để so sánh các hiện tượng không có cùng qui mô
X
Trang 84Trung bình cộng số học
n
X X
n i
i
∑
=
= 1
Trang 85i i
f
f
X X
1 1
Trang 86Trung bình của dữ liệu phân nhóm có khoảng cách
i i
f
f
m X
1 1
Trang 87Trung bình nhân (trung bình hình học)
GM
Căn bậc n cho n giá trị
Thay cho trung bình cộng trong trường hợp dãy số liệu có phân phối
lệch (giá trị đột biến)
n
n
X X
X
GM = 1 2
Trang 88Phần tư vị (quartile)
Xếp dữ kiện từ nhỏ đến lớn, chia dãy n dữ kiện làm 4 phần
Phần tư vị dưới (low quartile): lấy giá trị của đơn vị ở vị trí ¼ (25%) dãy
dữ kiện
Phần tư vị trên (upper quartile): lấy giá trị của đơn vị ở vị trí ¾ (75%)
dãy dữ kiện
Trang 893 Các đại lượng biến thiên
Đại lượng đo lường độ biến thiên
Phân tích phương sai
Trang 903.1 Đại lượng đo lường độ biến thiên
Mô tả biến thiên
Điểm số chuẩn hoá
Sai biệt chuẩn
Khoảng tin cậy
Trang 91Đại lượng đo lường độ biến thiên
Phương pháp đo lường độ biến thiên của các phân phối giúp hiểu rõ
phân phối
Phương sai và độ lệch chuẩn là những đại lượng đo lường giúp tính toán
được biến thiên của một phân phối
Trang 92Phương sai
Phương sai (variance) chính là trung bình của các độ lệch bình phương
giữa các giá trị so với giá trị trung bình