1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Tài liệu TIN HỌC ỨNG DỤNG TRONG CNSHMT docx

306 6,7K 17
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tài liệu TIN HỌC ỨNG DỤNG TRONG CNSHMT
Trường học Đại Học Quốc Gia Hà Nội
Chuyên ngành Kỹ Thuật và Công Nghệ Thông Tin trong Công Nghệ Sinh Học Môi Trường
Thể loại Tài liệu hướng dẫn
Năm xuất bản Không rõ
Thành phố Hà Nội
Định dạng
Số trang 306
Dung lượng 1,25 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

1.2 Các dạng nghiên cứu môi trường Bố trí thí nghiệm xử lý môi trường  Phân tích diễn biến môi trường qua thời gian, dự báo mức độ ô nhiễm dựa trên phân tích chuỗi số liệu theo thờ

Trang 1

TIN HỌC ỨNG DỤNG TRONG CNSHMT

Trang 2

Mục tiêu

 Giúp sinh viên độc lập trong nghiên cứu khoa học, có khả năng xử lý

số liệu thường gặp trong điều tra, nghiên cứu trong công nghệ sinh học môi trường

 Trang bị cho sinh viên kỹ năng sử dụng phần mềm thống kê trong việc

giải quyết xử lý và trình bày số liệu

Trang 3

Nội dung

Trang 4

Tài liệu tham khảo

Nguyễn Ngọc Kiểng, Thống kê học trong nghiên cứu khoa học, NXB Giáo

dục, 1996.

Lê Đức Ngọc, Xử lý số liệu và kế hoạch hóa thực nghiệm, Khoa Hóa,

ĐHQGHN, 2001.

Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB Đại học Quốc gia, 2004

Phan Hiếu Hiền, Phương pháp bố trí nghiệm và xử lý số liệu, NXB Nông

nghiệp, 2001

Trang 5

1 Tin học ứng dụng trong CNSHMT

 Khoa học môi trường

 Các dạng nghiên cứu môi trường

 Các bước trong nghiên cứu khoa học

 Tin học ứng dụng trong công nghệ

Trang 6

1.1 Khoa học môi trường

 Nghiên cứu các tác động qua lại của môi trường và con người

 Thuật ngữ môi trường liên quan đến không khí, nước, đất cũng như

thực vật, động vật và vi sinh vật

Trang 7

Khoa học môi trường giải quyết vấn đề:

 Gia tăng dân số,

 Cạn kiệt tài nguyên

 Ô nhiễm môi trường

Trang 8

1.2 Các dạng nghiên cứu môi trường

 Bố trí thí nghiệm xử lý (môi trường)

 Phân tích diễn biến môi trường qua thời gian, dự báo mức độ ô nhiễm

dựa trên phân tích chuỗi số liệu theo thời gian

 Điều tra các yếu tố vật lý, hóa học, sinh học của môi trường, phục vụ

đánh giá tác động của môi trường, đánh giá hiệu quả của biện pháp xử

Trang 9

1.2 Các dạng nghiên cứu môi trường

 Mối liên hệ và tác động qua lại giữa các yếu tố trong cùng quần thể,

dự đoán mối liên hệ giữa các yếu tố thông qua mối liên hệ tương quan

Trang 10

1.3 Các bước trong nghiên cứu khoa học

 Xác định nhiệm vụ, đối tượng, dân số

 Tính toán số lượng đơn vị cần thu thập theo qui định thống kê

 Thu thập dữ kiện

 Lưu trữ và xử lý số liệu

 Phân tích kết quả và viết báo cáo

Trang 11

Xác định nhiệm vụ, đối tượng, dân số

 Trước khi tiến hành thu thập dữ kiện, phải hiểu mình muốn biết gì khi

điều tra nghiên cứu

 xác định nhiệm vụ là việc hàng đầu trước khi thu thập dữ kiện

Trang 12

Tính toán số lượng đơn vị cần thu thập theo qui định thống kê

 Việc xác định dung lượng mẫu cần thiết cho cuộc điều tra có ảnh

hưởng đến kết quả đánh giá và suy diễn kết luận về quần thể thông

qua tập hợp mẫu

 Thu thập không đủ số lượng đơn vị cho mẫu điều tra sẽ làm lệch sự suy

diễn, phi khoa học và dẫn đến sự ngộ nhận gây ra những hậu quả

không lường được

Trang 13

Thu thập dữ kiện

 Khi điều tra nghiên cứu môi trường, phải thực hiện việc thu thập dữ

kiện

 Có những trường hợp dữ kiện phải được thu thập qua 2 bước Trong

khi thu thập dữ kiện phải thực hiện việc ghi chép thông qua các bảng ghi số liệu khảo sát

Trang 14

Lưu trữ và xử lý số liệu

 Hình thức và phương pháp lưu trữ dữ kiện thu thập ngoài hiện trường

hay kết quả phân tích trong phòng thí nghiệm rất đa dạng tùy theo mục đích điều tra nghiên cứu

Trang 15

Lưu trữ và xử lý số liệu

 Dưới dạng bảng tính

 Dưới dạng cơ sở dữ liệu

 Lưu trữ trực tiếp vào phần mềm xử lý thống kê

Trang 16

Phân tích kết quả và viết báo cáo

2 loại dữ liệu:

 Loại dữ liệu nguồn, các dữ liệu gốc đã thu thập hay phân tích từ phòng

thí nghiệm

 Các kết quả xử lý: phải làm nổi bật các kết luận, đánh giá hiện trạng,

phân tích trong báo cáo điều tra nghiên cứu

Trang 17

Phân tích kết quả và viết báo cáo

Một bảng thống kê kết quả chủ yếu gồm các thành phần sau:

 Tựa đề của bảng

 Các đầu đề dữ kiện

 Nguồn gốc dữ kiện

Trang 18

1.4 Tin học ứng dụng trong công nghệ

Trong mọi ngành khoa học thực nghiệm:

 thực tế

 thí nghiệm

kết quả bằng số

Trang 19

Kết quả bằng số:

 là giá trị của một biến ngẫu nhiên

 phụ thuộc vào nhiều yếu tố

 ước lượng được qui luật phụ thuộc (nghiên cứu trên một tập hợp mẫu

với độ tin cậy nào đó)

Trang 20

Xử lý số liệu

 dữ liệu thô - tính toán, sắp xếp - dữ liệu tinh

 làm cơ sở cho việc diễn giải, phân tích thống kê

Trang 21

2 Khái niệm cơ bản trong thống kê kết quả nghiên cứu

 Phân tích thống kê

 Mô tả dữ kiện

 Công cụ của thống kê

 Biến số

 Phương pháp xử lý số liệu ban đầu

 Đại lượng trung bình

Trang 22

2.1 Phân tích thống kê

 Các con số tóm lược thông tin định lượng

 Phương pháp tính toán để giúp chúng ta tóm lược hoặc khái quát hoá

thông tin

 Kỹ thuật giúp quyết định vấn đề như phân tích phương sai, tương quan

hồi qui, trắc nghiệm, …

Trang 23

Hạn chế của thống kê

 Sử dụng thống kê phải biết rành về lĩnh vực chuyên môn của người

nghiên cứu

 Thống kê chỉ là phương tiện, công cụ

 Thống kê trình bày những số liệu hoặc hiện tượng rời rạc một cách hệ

thống hơn, chứ không nói được bản chất của sự việc

 Thống kê không thay thế được cho suy nghĩ và kết luận của người

nghiên cứu

Trang 24

Thống kê mô tả

 Là một trong những bước đầu tiên để phân tích vấn đề và thực hiện

một quyết định

 Gồm các tính toán cơ bản mang tính chất mô tả như trung bình,

phương sai, độ lệch chuẩn, … nhằm tổng kết về kết quả của thí nghiệm

Trang 25

Thống kê mô tả

 Phương pháp tóm lược thông tin để làm cho chúng trở nên dễ hiểu tức

giảm một số lớn các số liệu phức tạp thành một số nhỏ hơn gồm các giá trị tóm tắt

 Mô tả mối quan hệ giữa các biến số

Trang 26

Thống kê suy diễn

 Khái quát hoá thông tin của một mẫu cho toàn dân số của mẫu tức là

chỉ đo đếm trên một tiểu tập hợp rồi suy luận cho toàn bộ với một độ tin cậy nào đó

 Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thông tin này

để suy rộng ra các đặc tính của toàn bộ dân số

Trang 28

Mô tả dữ kiện

 Phân phối dân số

 Phân phối mẫu

 Phân phối chuẩn

Trang 29

Phân phối dân số

 là phân phối của những điểm số trong một dân số

Trang 30

Phân phối mẫu

 là phân phối của những điểm số trong một mẫu có kích cỡ nhất định

 là phân phối của một thống kê nào đó của tất cả các mẫu có cùng một

kích cỡ trong dân số

Trang 31

Phân phối chuẩn

 Khi vẽ biểu đồ tương quan giữa tần số và kết quả thu nhận, hình dạng

đường cong thông thường có dạng hình chuông gọi là phân phối chuẩn

Trang 32

Phân phối chuẩn

 Là một phân phối đối xứng có dạng hình chuông, biểu diễn bằng phương

trình:

π δ

δ µ

2

2

2 / 2 )

= e x

Y

Trang 33

 Hai phân phối chuẩn với độ lệch chuẩn khác nhau:

độ lệch chuẩn nhỏ cho phép khái quát hoá những kết quả của mẫu cho toàn dân số với độ tin cậy cao

Trang 34

Phân phối chuẩn

Trang 35

Phân phối chuẩn

Trong một phân phối chuẩn, khoảng:

 68% số liệu trong khoảng X ±SD

 95% số liệu trong khoảng X ±2SD

 99% số liệu trong khoảng X ±3SD

Trang 36

Phân phối chuẩn

Trong một phân phối chuẩn:

 Có 95% số trường hợp nằm trong độ lệch chuẩn ±1,96 so với giá trị

trung bình

 Có 99% số trường hợp nằm trong độ lệch chuẩn ±2,58 so với giá trị

trung bình

Trang 37

Các đặc trưng thống kê thường dùng trong mô tả dữ kiện

Các giá trị của một biến số có sự phân phối là phân tán hay tập trung

 Giá trị đồng nhất (các giá trị của một biến số có xu hướng quần tụ)

 Giá trị không đồng nhất (các giá trị của một biến số có xu hướng phân

tán)

Trang 38

Các đặc trưng thống kê thường dùng trong mô tả dữ kiện

 Trung bình mẫu ước lượng giá trị trung tâm của phân bố

 Độ lệch chuẩn của mẫu liên quan đến sự phân tán của số liệu

Trang 39

Các đặc trưng thống kê thường dùng trong mô tả dữ kiện

 Trung bình mẫu và Độ lệch chuẩn chỉ có giá trị đại diện cho mẫu khi

mẫu có phân phối chuẩn

 Độ lệch (skewness) và độ nhọn (kurtosis) dùng để kiểm tra mẫu có phân

bố chuẩn hay không

Trang 41

Độ nhọn (kurtosis)

 Là tiêu chuẩn để xác định hình dạng của phân bố đối xứng.

 Độ nhọn = 0 (phân bố chuẩn)

 Độ nhọn > 0 (phân bố có đồ thị nhọn hơn phân bố chuẩn)

 Độ nhọn < 0 (phân bố có đồ thị bẹt hơn phân bố chuẩn)

Trang 42

2.3 Công cụ của thống kê

 Biểu bảng,

 Biểu đồ,

 Các giá trị mô tả (trung bình, độ lệch chuẩn, phương sai, …)

Trang 43

Bảng phân phối tần số

 Sắp xếp, trình bày dữ liệu một cách có hệ thống

 Phân chia dữ liệu thành từng nhóm khác nhau

 Căn cứ để hình thành biểu đồ phân phối tần số

Trang 44

Sơ đồ tổng quát của bảng phân phối tần số

Trang 45

Sơ đồ tổng quát của bảng phân phối tần số

Trang 46

Sơ đồ tổng quát của bảng phân phối tần số

Năng

đối (%)

Tần số tích lũy

Tần số tương đối tích lũy

Trang 47

Trị số của biến quan sát

 Số cụ thể

 Khoảng giá trị (khoảng cách có thể bằng nhau hoặc không, có giới hạn

trên/dưới hoặc chỉ một giới hạn)

Trang 48

Biểu đồ trong thống kê

 Biểu diễn toàn bộ số liệu

 Thể hiện nét đặc trưng của tập hợp số liệu

 Biểu diễn mối quan hệ giữa tính trạng nghiên cứu và chỉ tiêu theo dõi

Trang 49

Biểu đồ phân phối tần số

 Biểu đồ cột

 Trình bày số quan sát lớn

 Có thể trình bày tần số tương đối, tần số tích lũy, tần số tương đối tích

lũy

Trang 50

Biểu đồ phân phối tần số

Trang 51

Biểu đồ phân phối tần số

Trang 52

Biểu đồ tần số tích lũy

Trang 53

Biểu đồ tần số tương đối tích lũy

Trang 54

Biểu đồ hộp

 Khảo sát sơ lược dữ liệu

 Tổng quát về phân phối của mẫu/ tổng thể

 thể hiện ví trí tập trung, phân tán, bất thường

Trang 55

Biểu đồ hộp

Trang 56

Biểu đồ hộp

 Khối hộp ‘box’ kéo dài từ giá trị phân vị ¼ đến giá trị phân vị ¾ ,

khoảng 50% giá trị nẳm trong ‘box’

 Đường thẳng đứng ở vị trí trung bị mẫu, chia dãy số liệu thành 2 phần

bằng nhau, nếu mẫu phân bố đối xứng thì đường này nằm gần trung tâm của khối hộp

Trang 57

Biểu đồ hộp

 Dấu + ở vị trí trung bình của mẫu

 Sự khác biệt đáng kể giữa trung bình và trung vị cho thấy có một vài số

liệu có khả năng gây ra sai số làm phân bố của mẫu bị lệch

 Đoạn thẳng hai đầu gọi là ‘whisker’ nối từ giá trị cực tiểu đến điểm

phân vị ¼ và từ điểm phân vị ¾ đến giá trị cực đại

Trang 58

Biểu đồ điểm

Trang 59

Mẫu và dân số

 Dữ liệu của dân số là những dữ liệu liên quan đến mọi trường hợp

 Dữ liệu của mẫu đại diện có thể khái quát cho toàn bộ dân số

Trang 60

Mẫu (sample)

 Được chọn ngẫu nhiên từ dân số

 Mẫu là một phần và là đại diện của dân số.

 Phân tích mẫu có thể suy ra các đặc tính của dân số với một mức độ tin

cậy xác định nào đó

Trang 61

Mẫu ngẫu nhiên

 Mẫu lấy từ dân số mà các đơn vị đều có cơ hội đồng đều nhau, nó mang

tính khách quan trong thu thập dữ kiện

Trang 62

Ví dụ: Muốn xác định mức độ ô nhiễm của một khu công nghiệp:

 Dân số là tất cả các nhà máy, xí nghiệp trong khu công nghiệp đó.

 Mẫu gồm một vài xí nghiệp hoặc nhà máy nào đó trong khu công nghiệp

để đánh giá mức độ ô nhiễm

Trang 63

Dân số (population)

 Là tập hợp những thông tin về người, sự vật hoặc sự việc riêng biệt kết

hợp với nhau trên cơ sở một đặc điểm chung nào đó mà người nghiên cứu đang quan tâm

 Là tập hợp toàn bộ các đối tượng nghiên cứu, điều tra, khảo sát Có

những đặc điểm chung vào mục tiêu của điều tra nghiên cứu môi trường

Trang 64

Dân số

 Thường rất lớn và không thể kiểm tra hết

 Muốn biết thông tin về dân số chỉ có thể đo đếm trên một tiểu tập hợp

gọi là mẫu

Trang 65

2.4 Biến số

 Là một đặc trưng mà giá trị của nó khác nhau tùy theo trường hợp

 Tùy nhu cầu nghiên cứu mà có thể tạo ra các biến số mới

 đặc trưng quan sát mà cuộc nghiên cứu quan tâm đến,

 có 02 loại biến số (liên tục, rời rạc)

Trang 66

Biến số liên tục

 Là các số nguyên dương và thập phân

 Các số đo về chiều dài, trọng lượng, thể tích,

Trang 67

Biến số rời rạc

 Là các số nguyên dương

 Các biến biểu thị tính chất hay số đếm như tỷ lệ cây trồng sống sót, số

cây không bị nhiễm rầy

Trang 68

Đơn vị

 đối tượng cụ thể để đo đếm và thu nhập dữ kiện

 Một mẫu thăm dò sẽ có nhiều đơn vị

 Đơn vị thống kê là một phần tử của một tập hợp mẫu thống kê điều tra

khảo sát

 Cần phân biệt giữa đơn vị thống kê và hình thức thu thập mẫu trong trường hợp đối tượng nghiên cứu là nước, không khí

Trang 69

Đếm số đơn vị

 số cây con/m2,

 số sâu trên một cá thể,

 số chồi cây trên một gốc,

Trang 70

Đặc tính quan sát - chỉ tiêu nghiên cứu

 một đơn vị thống kê trong lĩnh vực môi trường có thể có rất nhiều chỉ

tiêu nghiên cứu

 Đặc tính quan sát của đơn vị điều tra khảo sát được phân thành hai

nhóm: đặc tính giống nhau và đặc tính biến thiên

Trang 71

đặc tính giống nhau

 đặc tính không thay đổi từ đơn vị thống kê này đến đơn vị khác.

 Các đặc tính giống nhau được chia làm 3 nhóm:

Đặc tính không gian

Đặc tính thời gian

Đặc tính cụ thể

Trang 72

đặc tính biến thiên

 Là các đặc tính quan sát mà các đơn vị có thể có giá trị khác nhau

 Là các chỉ tiêu của đơn vị biến thiên từ đơn vị này đến đơn vị khác

 Các đặc tính biến thiên có thể chia thành hai nhóm: định tính và định

lượng

Trang 73

đặc tính biến thiên

 có thể có tính chất cụ thể, tính chất thời gian hoặc không gian

 xác định các thông tin cần thu thập trong khi điều tra khảo sát

Trang 74

2.5 Phương pháp xử lý số liệu ban đầu

 Gọi a là trị thực của đại lượng đo, X là kết quả đo

 Sai số tuyệt đối (X-a) có thể gồm 3 thành phần là sai số hệ thống, sai

số thô, sai số ngẫu nhiên

Trang 76

Sai số thô

 Sai số thô là sai số do bất cẩn, trục trặc kỹ thuật, thay đổi điều kiện đột

ngột, …Đặc điểm đơn lẻ, có trị số tuyệt đối lớn hoặc nhỏ một cách bất thường

 Cần loại bỏ các số đo chứa sai số thô để khỏi ảnh hưởng không trung

thực đến kết quả chung

Trang 77

Sai số ngẫu nhiên

 Sai số ngẫu nhiên là sai số không thể tiên đoán được cụ thể, do rất

nhiều nhân tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng

 Sai số ngẫu nhiên là sai số mà người làm thí nghiệm không thể loại bỏ

được, phải chấp nhận

Trang 78

2.6 Đại lượng trung bình

Trang 79

Mode: (Mo)

 Là giá trị xuất hiện nhiều nhất trong một biến số

Ví dụ: Phân phối xác suất: 5, 6, 7, 7, 8, 8, 8, 9, 10 có mode là 8

 Dùng để đo độ tập trung

 Không phụ thuộc vào giá trị ở 2 đầu của dãy số

Trang 80

Mode: (Mo)

 Biến số đơn thức là biến số khi gần như mọi trường hợp đều tập trung về

một giá trị

 Biến số nhị thức là biến số khi gần như có hai hay nhiều trường hợp nhất

và gần như tương đương nhau

Trang 81

Số trung vị: (Me)

 số nằm ở chính giữa khi dãy số xếp từ nhỏ - lớn

 Là giá trị chia đôi tổng số các giá trị của biến số thành 2 phần bằng nhau

 cho kết quả nhanh về ước lượng trung bình.

Trang 82

Trung bình cộng

 Cộng các giá trị của các trường hợp và chia cho tổng trường hợp

 Trường hợp dị biệt có thể làm trung bình mất đi tính đại diện

 Tổng các độ lệch giữa các giá trị với trung bình luôn bằng 0

 Tổng các độ lệch bình phương có giá trị nhỏ nhất

X

Trang 83

Trung bình cộng

 Đại diện cho cả một tập hợp lớn số liệu

 Nêu lên đặc điểm chung nhất của hiện tượng

 Dùng để so sánh các hiện tượng không có cùng qui mô

X

Trang 84

Trung bình cộng số học

n

X X

n i

i

=

= 1

Trang 85

i i

f

f

X X

1 1

Trang 86

Trung bình của dữ liệu phân nhóm có khoảng cách

i i

f

f

m X

1 1

Trang 87

Trung bình nhân (trung bình hình học)

GM

 Căn bậc n cho n giá trị

 Thay cho trung bình cộng trong trường hợp dãy số liệu có phân phối

lệch (giá trị đột biến)

n

n

X X

X

GM = 1 2

Trang 88

Phần tư vị (quartile)

 Xếp dữ kiện từ nhỏ đến lớn, chia dãy n dữ kiện làm 4 phần

 Phần tư vị dưới (low quartile): lấy giá trị của đơn vị ở vị trí ¼ (25%) dãy

dữ kiện

 Phần tư vị trên (upper quartile): lấy giá trị của đơn vị ở vị trí ¾ (75%)

dãy dữ kiện

Trang 89

3 Các đại lượng biến thiên

 Đại lượng đo lường độ biến thiên

 Phân tích phương sai

Trang 90

3.1 Đại lượng đo lường độ biến thiên

 Mô tả biến thiên

 Điểm số chuẩn hoá

 Sai biệt chuẩn

 Khoảng tin cậy

Trang 91

Đại lượng đo lường độ biến thiên

 Phương pháp đo lường độ biến thiên của các phân phối giúp hiểu rõ

phân phối

 Phương sai và độ lệch chuẩn là những đại lượng đo lường giúp tính toán

được biến thiên của một phân phối

Trang 92

Phương sai

 Phương sai (variance) chính là trung bình của các độ lệch bình phương

giữa các giá trị so với giá trị trung bình

Ngày đăng: 19/02/2014, 15:20

HÌNH ẢNH LIÊN QUAN

Sơ đồ tổng quát của bảng phân phối  tần số - Tài liệu TIN HỌC ỨNG DỤNG TRONG CNSHMT docx
Sơ đồ t ổng quát của bảng phân phối tần số (Trang 44)
Sơ đồ tổng quát của bảng phân phối  tần số - Tài liệu TIN HỌC ỨNG DỤNG TRONG CNSHMT docx
Sơ đồ t ổng quát của bảng phân phối tần số (Trang 46)
Đồ thị phân tán - Tài liệu TIN HỌC ỨNG DỤNG TRONG CNSHMT docx
th ị phân tán (Trang 224)
Đồ thị phân tán - Tài liệu TIN HỌC ỨNG DỤNG TRONG CNSHMT docx
th ị phân tán (Trang 225)
Đồ thị hàm hồi quy để phân tích hồi quy đa biến - Tài liệu TIN HỌC ỨNG DỤNG TRONG CNSHMT docx
th ị hàm hồi quy để phân tích hồi quy đa biến (Trang 291)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w