chương4 CNQLMT Sử dụng phần mềm R để phân tích dữ liệu môi trường Bảng dữ liệu gồm có: 1. Method (phương pháp xử lý rác thải sinh hoạt): 1. Xử lý bằng vật; 2. Xử lý bằng chôn lấp hợp vệ sinh; 3. Xử lý bằng phương pháp phân hủy tự nhiên. 2. Condition (điều kiện xử lý): 1. Xử lý trong điều kiện tự nhiên (ngoài trờ); 2. Xử lý trong phòng thí nghiệm (một yếu tố được tối ưu hóa). 3. Suitability (mức độ thích hợp): 1. Small scale (phạm vi nhỏ); 2. Large scale (phạm vi lớn); 3. Testing scale (thử nghiệm phòng thí nghiệm). 4. Score (cho điểm mức độ ưa thích)
Trang 1Công nghệ quản lý môi trường
Bộ môn: Kỹ thuật Môi trường
Họ và tên sinh viên:
Mã số sinh viên: MẦU TIẾN LONG Lớp học: CN QLMT LO4
Giảng viên: TS Nguyễn Hải Hòa
===========================================
Sử dụng phần mềm R để phân tích dữ liệu môi trường
(BT số 04) Bảng dữ liệu gồm có:
1 Method (phương pháp xử lý rác thải sinh hoạt): 1 Xử lý bằng vật; 2 Xử lý
bằng chôn lấp hợp vệ sinh; 3 Xử lý bằng phương pháp phân hủy tự nhiên
2 Condition (điều kiện xử lý): 1 Xử lý trong điều kiện tự nhiên (ngoài trờ); 2 Xử
lý trong phòng thí nghiệm (một yếu tố được tối ưu hóa)
3 Suitability (mức độ thích hợp): 1 Small scale (phạm vi nhỏ); 2 Large scale
(phạm vi lớn); 3 Testing scale (thử nghiệm phòng thí nghiệm)
4 Score (cho điểm mức độ ưa thích)
Yêu cầu:
- Sinh viên tính toán và phân tích phương sai môi trường một nhân tố và hai nhân tố/nhiều nhân tố với nhau (Check file kèm)
1 Nhận xét và phân tích bảng Analysis of Variance Table
2 Đánh giá phân tích kết quả nghiên cứu:
Summary (oneway): Score với Method, Score với Condition, Score với Suitability Summary (twoway): Score với Method + Condition + Suitability
Chú ý: So sánh và phân tích các biến số với nhau
3 Phân tích tương quan: Đánh giá và nhận xét
4 Tính giá trị của mô hình tiên đoán + nhận xét:
fitted(tên_mô_hinh): tham khảo Rstudio phần tương quan
Trang 25 Tính giá trị sai số của mô hình (giá trị quan sát và mô hình tiên đoán) + nhận xét: BÀI LÀM
EMGT2 <- read.table("D:/CNQLMT/BT_CHAPTER_4/BT_CHAPTER_4/THONGKEMOI TRUONG.csv", header=TRUE,sep=",", row.names="TT")
EMGT2
# CHUNG TA CO THE TAO RA MOT DAY SO BANG CACH SU DUNG HAM GL - gen erating levels #
condition <- gl(2, 9, 18)
condition
method <- gl(3, 3, 18)
method
suitability <- gl(3, 3, 18)
suitability
# TAO NEN 18 MA SO TU 1 DEN 18 #
ID <- 1:18
ID
# SAU CUNG LA SO LIEU CHO SCORE #
score <- c(4.1,3.9,4.3, 3.1,2.8,3.3, 3.5,3.2,3.6, 2.7,3.1,2.6, 1.9,2.2,2.3, 2.7,2.3,2.5)
score
# CHO TAT CA VAO MOT DATAFRAME, DAT TEN LA chapter_IV #
chapter_IVa <- data.frame(condition, method, suitability, ID, score)
attach <- (chapter_IVa)
# phan tich phuong si moi truong mot nhan to score ~ method -chúng ta dung lenh ham lm # oneway1 <- lm(score ~ method)
oneway1
anova(oneway1)
#TOM LUOC CAC UOC SO PHAN TICH1 #
summary(oneway1)
# phan tich phuong si moi truong mot nhan to score ~ condition -chung ta dung lenh ham lm
#
oneway2 <- lm(score ~ condition)
oneway2
anova(oneway2)
#TOM LUOC CAC UOC SO PHAN TICH2 #
summary(oneway2)
# phan tich phuong si moi truong mot nhan to score ~ suitability -chung ta dung lenh ham lm
#
oneway3 <- lm(score ~ suitability)
oneway3
anova(oneway3)
#TOM LUOC CAC UOC SO PHAN TICH3 #
summary(oneway3)
Trang 3Kết quả
EMGT2 <- read.table("D:/CNQLMT/BT_CHAPTER_4/BT_CHAPTER_4/THONGKEMOI TRUONG.csv", header=TRUE,sep=",", row.names="TT")
> EMGT2
Condition Method Suitability Score
1 1 1 1 4.1
2 1 1 1 3.9
3 1 1 1 4.3
4 1 2 2 3.1
5 1 2 2 2.8
6 1 2 2 3.3
7 1 3 3 3.5
8 1 3 3 3.2
9 1 3 3 3.6
10 2 1 1 2.7
11 2 1 1 3.1
12 2 1 1 2.6
13 2 2 2 1.9
14 2 2 2 2.2
15 2 2 2 2.3
16 2 3 3 2.7
17 2 3 3 2.3
18 2 3 3 2.5
> # CHUNG TA CO THE TAO RA MOT DAY SO BANG CACH SU DUNG HAM GL - g enerating levels #
> condition <- gl(2, 9, 18)
> condition
[1] 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
Levels: 1 2
> method <- gl(3, 3, 18)
> method
[1] 1 1 1 2 2 2 3 3 3 1 1 1 2 2 2 3 3 3
Levels: 1 2 3
> suitability <- gl(3, 3, 18)
> suitability
[1] 1 1 1 2 2 2 3 3 3 1 1 1 2 2 2 3 3 3
Levels: 1 2 3
> # TAO NEN 18 MA SO TU 1 DEN 18 #
> ID <- 1:18
> ID
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
> # SAU CUNG LA SO LIEU CHO SCORE #
> score <- c(score<-c(4.1,3.9,4.3, 3.1,2.8,3.3, 3.5,3.2,3.6, 2.7,3.1,2.6, 1.9,2.2,2.3, 2.7,2.3,2.5)
> score
> # CHO TAT CA VAO MOT DATAFRAME, DAT TEN LA chapter_IV #
> chapter_IVa <- data.frame(condition, method, suitability, ID, score)
> # SAU CUNG LA SO LIEU CHO SCORE #
> score <- c(4.1,3.9,4.3, 3.1,2.8,3.3, 3.5,3.2,3.6, 2.7,3.1,2.6, 1.9,2.2,2.3, 2.7,2.3,2.5)
> score
[1] 4.1 3.9 4.3 3.1 2.8 3.3 3.5 3.2 3.6 2.7 3.1 2.6 1.9 2.2 2.3 2.7 2.3 2.5
Trang 4> # CHO TAT CA VAO MOT DATAFRAME, DAT TEN LA chapter_IV #
> chapter_IVa <- data.frame(condition, method, suitability, ID, score)
> attach <- (chapter_IVa)
> # phan tich phuong si moi truong mot nhan to score ~ method -chúng ta dung lenh ham lm
#
> oneway1 <- lm(score ~ method)
> oneway1
Call:
lm(formula = score ~ method)
Coefficients:
(Intercept) method2 method3
3.4500 -0.8500 -0.4833
> anova(oneway1)
Analysis of Variance Table
Response: score
Df Sum Sq Mean Sq F value Pr(>F)
method 2 2.1811 1.09056 2.8458 0.08959
Residuals 15 5.7483 0.38322
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
Nhận xét Bang Analysis of Variance Table
Phân tích phương sai: Mục đích để so sánh giá trị trung bình của nhiều nhóm dựa trên số trung
bình của các mẫu quan sát từ nhóm này và thông qua kiểm đinh giả thuyết để kết luận về sự bằng
nhau của các số trung bình
Phương pháp với bậc tự do là 2, số dư tự do 15
Giá trị F value càng lớn thì càng tốt trong phương pháp này giá trị F velua = 2.8458
Giá trị Pr(>F) bằng 0.08959
> #TOM LUOC CAC UOC SO PHAN TICH1 #
> summary(oneway1)
Call:
lm(formula = score ~ method)
Residuals:
Min 1Q Median 3Q Max
-0.85000 -0.45000 -0.03333 0.52500 0.85000
Coefficients:
Estimate Std Error t value Pr(>|t|)
Trang 5(Intercept) 3.4500 0.2527 13.651 7.28e-10 ***
method2 -0.8500 0.3574 -2.378 0.0311 *
method3 -0.4833 0.3574 -1.352 0.1963
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
Residual standard error: 0.619 on 15 degrees of freedom
Multiple R-squared: 0.2751, Adjusted R-squared: 0.1784
F-statistic: 2.846 on 2 and 15 DF, p-value: 0.08959
Nhận xét :
So sánh phương pháp 2, phương pháp 3 với phương pháp 1
Nếu Phương pháp 2 và 3 > phương pháp 1 thì phương pháp 1 được ưa thích nhất
Nếu Phương pháp 2 và 3 < phương pháp 1 (mang dấu -) thì phương pháp không được ưa thích
nhất
Phương pháp 2 không được ưa thích vì co giá trị thấp hơn cả phương pháp 3
> # phan tich phuong si moi truong mot nhan to score ~ condition -chung ta dung lenh ham l
m #
> oneway2 <- lm(score ~ condition)
> oneway2
Call:
lm(formula = score ~ condition)
Coefficients:
(Intercept) condition2
3.533 -1.056
> anova(oneway2)
Analysis of Variance Table
Response: score
Df Sum Sq Mean Sq F value Pr(>F)
condition 1 5.0139 5.0139 27.515 8.004e-05 ***
Residuals 16 2.9156 0.1822
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
> #TOM LUOC CAC UOC SO PHAN TICH2 #
> summary(oneway2)
Call:
lm(formula = score ~ condition)
Residuals:
Trang 6Min 1Q Median 3Q Max
-0.73333 -0.26667 -0.00556 0.22222 0.76667
Nhận xét :
Các giá trị trong bảng Residuals có giá trị dao động 0.73333 ÷ 0.76667 giá trị Median = -0,00556 có giá trị sát tới 0 Các giá trị góc phần tư thứ nhất và góc phần tư thứ ba phân bố tương đối cân bằng so với giá trị Median
Coefficients:
Estimate Std Error t value Pr(>|t|)
(Intercept) 3.5333 0.1423 24.832 3.33e-14 ***
condition2 -1.0556 0.2012 -5.245 8.00e-05 ***
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
Residual standard error: 0.4269 on 16 degrees of freedom
Multiple R-squared: 0.6323, Adjusted R-squared: 0.6093
F-statistic: 27.52 on 1 and 16 DF, p-value: 8.004e-05
> # phan tich phuong si moi truong mot nhan to score ~ suitability -chung ta dung lenh ham l
m #
> oneway3 <- lm(score ~ suitability)
> anova(oneway3)
Analysis of Variance Table
Response: score
Df Sum Sq Mean Sq F value Pr(>F)
suitability 2 2.1811 1.09056 2.8458 0.08959
Residuals 15 5.7483 0.38322
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
> oneway3
Call:
lm(formula = score ~ suitability)
Coefficients:
(Intercept) suitability2 suitability3
3.4500 -0.8500 -0.4833
> #TOM LUOC CAC UOC SO PHAN TICH3 #
> summary(oneway3)
Call:
lm(formula = score ~ suitability)
Residuals:
Min 1Q Median 3Q Max
-0.85000 -0.45000 -0.03333 0.52500 0.85000
Trang 7Coefficients:
Estimate Std Error t value Pr(>|t|)
(Intercept) 3.4500 0.2527 13.651 7.28e-10 ***
suitability2 -0.8500 0.3574 -2.378 0.0311 *
suitability3 -0.4833 0.3574 -1.352 0.1963
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
Nhận xét bảng giá trị Coefficients:
Thấy phương pháp thứ 2 có sự phù hợp hơn so với phương pháp thứ 3 ( vì có giá trị Pr nhỏ hơn) Nhưng các giá trị trương quan R thì tương đối thấp Multiple R-squared: 0.2751,
Adjusted R-squared: 0.1784
Residual standard error: 0.619 on 15 degrees of freedom
Multiple R-squared: 0.2751, Adjusted R-squared: 0.1784
F-statistic: 2.846 on 2 and 15 DF, p-value: 0.08959
Phương pháp phân tích phương sai môi trường 2 nhân tố
EMGT1<read.table("D:/CNQLMT/BT_CHAPTER_4/BT_CHAPTER_4/THONGKEMOITR UONG.csv", header=TRUE,sep=",", row.names="TT")
EMGT1
# CHUNG TA CO THE TAO RA MOT DAY SO BANG CACH SU DUNG HAM GL - generating levels #
condition <- gl(2, 9, 18)
condition
method <- gl(3, 3, 18)
method
suitability <- gl(3, 3, 18)
suitability
# TAO NEN 18 MA SO TU 1 DEN 18 #
ID <- 1:18
ID
# SAU CUNG LA SO LIEU CHO SCORE #
score <- c(4.1,3.9,4.3, 3.1,2.8,3.3, 3.5,3.2,3.6,2.7,3.1,2.6, 1.9,2.2,2.3, 2.7,2.3,2.5)
Trang 8score
# CHO TAT CA VAO MOT DATAFRAME, DAT TEN LA chapter_IV #
chapter_IV <- data.frame(condition, method, ID, score)
attach <- (chapter_IVa)
# DE PHAN TICH PHUONG SAI HAI CHIEU - CHUNG TA VAN DUNG LENH HAM lm
#
twoway <- lm(score ~ method +condition + suitability)
twoway
anova(twoway)
#TOM LUOC CAC UOC SO PHAN TICH #
summary(twoway)
Kết quả phân tích 2 nhân tố
> EMGT1 <- read.table("D:/CNQLMT/BT_CHAPTER_4/BT_CHAPTER_4/THONGKEM OITRUONG.csv", header=TRUE,sep=",", row.names="TT")
> EMGT1
Condition Method Suitability Score
1 1 1 1 4.1
2 1 1 1 3.9
3 1 1 1 4.3
4 1 2 2 3.1
5 1 2 2 2.8
6 1 2 2 3.3
7 1 3 3 3.5
8 1 3 3 3.2
9 1 3 3 3.6
10 2 1 1 2.7
11 2 1 1 3.1
12 2 1 1 2.6
13 2 2 2 1.9
14 2 2 2 2.2
15 2 2 2 2.3
16 2 3 3 2.7
17 2 3 3 2.3
18 2 3 3 2.5
> # CHUNG TA CO THE TAO RA MOT DAY SO BANG CACH SU DUNG HAM GL - g enerating levels #
> condition <- gl(2, 9, 18)
> condition
[1] 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
Levels: 1 2
Trang 9> method <- gl(3, 3, 18)
> method
[1] 1 1 1 2 2 2 3 3 3 1 1 1 2 2 2 3 3 3
Levels: 1 2 3
> suitability <- gl(3, 3, 18)
> suitability
[1] 1 1 1 2 2 2 3 3 3 1 1 1 2 2 2 3 3 3
Levels: 1 2 3
> # TAO NEN 18 MA SO TU 1 DEN 18 #
> ID <- 1:18
> ID
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
> # SAU CUNG LA SO LIEU CHO SCORE #
> score <- c(4.1,3.9,4.3, 3.1,2.8,3.3, 3.5,3.2,3.6,2.7,3.1,2.6, 1.9,2.2,2.3, 2.7,2.3,2.5)
> score
[1] 4.1 3.9 4.3 3.1 2.8 3.3 3.5 3.2 3.6 2.7 3.1 2.6 1.9 2.2 2.3 2.7 2.3 2.5
> # CHO TAT CA VAO MOT DATAFRAME, DAT TEN LA chapter_IV #
> chapter_IV <- data.frame(condition, method, ID, score)
> attach <- (chapter_IVa)
> # DE PHAN TICH PHUONG SAI HAI CHIEU - CHUNG TA VAN DUNG LENH HAM
lm #
> twoway <- lm(score ~ method +condition + suitability)
> twoway
Call:
lm(formula = score ~ method + condition + suitability)
Coefficients:
(Intercept) method2 method3 condition2 suitability2 suitability3
3.9778 -0.8500 -0.4833 -1.0556 NA NA
> anova(twoway)
Analysis of Variance Table
Response: score
Df Sum Sq Mean Sq F value Pr(>F)
method 2 2.1811 1.0906 20.788 6.437e-05 ***
condition 1 5.0139 5.0139 95.575 1.235e-07 ***
Residuals 14 0.7344 0.0525
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
Nhận xét :
Ba nguồn dao động (variation) của score được phân tích:
- Trung bình bình phương (mean square): ảnh hưởng của điều kiện có vẻ quan trọng hơn là ảnh hưởng của phương pháp thí nghiệm
- Tuy nhiên, cả hai ảnh hưởng đều có ý nghĩa thống kê, vì trị số p rất thấp cho hai yếu tố
- Yêu cầu R tóm lược các ước số phân tích bằng lệnh summary (twoway):
Trang 10> #TOM LUOC CAC UOC SO PHAN TICH #
> summary(twoway)
Call:
lm(formula = score ~ method + condition + suitability)
Residuals:
Min 1Q Median 3Q Max
-0.32778 -0.16389 0.03333 0.16111 0.32222
Coefficients: (2 not defined because of singularities)
Estimate Std Error t value Pr(>|t|)
(Intercept) 3.9778 0.1080 36.841 2.43e-15 ***
method2 -0.8500 0.1322 -6.428 1.58e-05 ***
method3 -0.4833 0.1322 -3.655 0.0026 **
condition2 -1.0556 0.1080 -9.776 1.24e-07 ***
suitability2 NA NA NA NA
suitability3 NA NA NA NA
-
Signif codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1
Residual standard error: 0.229 on 14 degrees of freedom
Multiple R-squared: 0.9074, Adjusted R-squared: 0.8875
F-statistic: 45.72 on 3 and 14 DF, p-value: 1.761e-07
Nhận xét
So với điều kiện 1, điều kiện 2 có score thấp hơn khoảng 1.055 & sai số chuẩn là 0.229, trị số
p = 1.761e-07, có ý nghĩa thống kê
So với phương pháp 1, score cho phương pháp 2 & 3 thấp hơn đáng kể, độ thấp nhất ghi nhận
ở phương pháp 2, ảnh hưởng của phương pháp thí nghiệm cũng có ý nghĩa thống kê
3 Phân tích tương quan: Đánh giá và nhận xét
> TUONGQUAN2015 <-
read.table("D:/CNQLMT/BT_CHAPTER_4/BT_CHAPTER_4/THONGKEMOITRUONG.c sv", header=TRUE,sep=",", row.names="TT")
> TUONGQUAN2015