Xử lý và phân tích dữ liệu về ảnh hưởng của các thông số dán tới độ bền của liênkết dán dựng Yêu cầu 1: Mô tả được từng biến với các đặc trưng thống kê của biến: số trung bình, trung v
Trang 1Xử lý và phân tích dữ liệu về ảnh hưởng của các thông số dán tới độ bền của liên
kết dán dựng
Yêu cầu 1: Mô tả được từng biến với các đặc trưng thống kê của biến: số trung bình, trung vị, độ lệch chuẩn, phương sai, độ biến thiên, khoảng tin cậy 95%
- Đọc dữ liệu dandung.csv và gọi object là dandung
> dandung=read.csv("D:/dan dung.csv",header=T)
> attach(dandung)
> names(dandung)
[1] "nhietdodan" "aplucdan" "thoigiandan"
[4] "dobenxelienketdan" "dogian"
Mô tả đặc trưng thống kê của biến: "nhietdodan"
> summary(nhietdodan)
>sd=sd(nhietdodan)
>var=var(nhietdodan)
>cv=sd(nhietdodan)*100/mean(nhietdodan)
>c(sd,var,cv)
>mean(nhietdodan)-sd(nhietdodan)
>mean(nhietdodan)+sd(nhietdodan)
Trang 23 Độ lệch chuẩn (Sd) 14.433757
Mô tả đặc trưng thống kê của biến: "aplucdan"
> summary(aplucdan)
>sd=sd(aplucdan)
>var=var(aplucdan)
>cv=sd(aplucdan)*100/mean(aplucdan)
>c(sd,var,cv)
>mean(aplucdan)-sd(aplucdan)
>mean(aplucdan)+sd(aplucdan)
Ta được bảng các đặc trưng thống kê của biến: : "aplucdan"
ST
T
Mô tả đặc trưng thống kê của biến: " thoigiandan"
>summary(thoigiandan)
>sd=sd(thoigiandan)
Trang 3>var=var(thoigiandan)
>cv=sd(thoigiandan)*100/mean(thoigiandan)
>c(sd,var,cv)
>mean(thoigiandan)-sd(thoigiandan)
>mean(thoigiandan)+sd(thoigiandan)
Ta được bảng các đặc trưng thống kê của biến: : " thoigiandan "
ST T
Mô tả đặc trưng thống kê của biến: " dobenxelienketdan"
>summary(dobenxelienketdan)
>sd=sd(dobenxelienketdan)
>var=var(dobenxelienketdan)
>cv=sd(dobenxelienketdan)*100/mean(dobenxelienketdan)
>c(sd,var,cv)
>mean(dobenxelienketdan)-sd(dobenxelienketdan)
>mean(dobenxelienketdan)+sd(dobenxelienketdan)
Trang 4Ta được bảng các đặc trưng thống kê của biến: : " dobenxelienketdan "
ST T
Mô tả đặc trưng thống kê của biến: " dogian"
>summary(dogian)
>sd=sd(dogian)
>var=var(dogian)
>cv=sd(dogian)*100/mean(dogian)
>c(sd,var,cv)
>mean(dogian)-sd(dogian)
>mean(dogian)+sd(dogian)
Ta được bảng các đặc trưng thống kê của biến: : " dogian "
Trang 5 Yêu cầu 2: Vẽ biểu đồ phân bố của từng biến
- Ta sử dụng lệnh hist trên R để vẽ biểu đồ phân bố từng biến cố, để dễ
dàng so sánh từng biến một cách khách quan nhất, ta vẽ đồ thị cho tất cả
5 biến bằng cách chia màn ảnh thành 6 cửa sổ với 2 dòng và 3 cột:
>op=par(mfrow=c(2,3))
- biểu đồ phân phối của biến : "nhietdodan"
>hist(nhietdodan, prob=T)
>lines(density(nhietdodan))
- biểu đồ phân phối của biến : "aplucdan"
>hist(aplucdan, prob=T)
>lines(density(aplucdan))
- biểu đồ phân phối của biến : " thoigiandan "
>hist(thoigiandan, prob=T)
>lines(density(thoigiandan))
- biểu đồ phân phối của biến : " dobenxelienketdan "
>hist(dobenxelienketdan, prob=T)
>lines(density(dobenxelienketdan))
- biểu đồ phân phối của biến : " dogian "
>hist(dogian, prob=T)
>lines(density(dogian))
Trang 6Histogram of nhietdodan
nhietdodan
140 150 160 170 180
Histogram of aplucdan
aplucdan
1.5 2.0 2.5 3.0 3.5
Histogram of thoigiandan
thoigiandan
10 12 14 16 18 20 22
Histogram of dobenxelienketdan
dobenxelienketdan
65 70 75 80 85 90 95
Histogram of dogian
dogian
Trang 7 Yêu cầu 3: Vẽ biểu đồ tương quan từng đôi một giữa các biến liên tục
- Vẽ biểu đồ tương quan từng đôi một giữa các biến: "nhietdodan,
"aplucdan", "thoigiandan" , "dobenxelienketdan","dogian"
>dat=cbind(nhietdodan,aplucdan,thoigiandan,dobenxelienketdan,dogia n)
>pairs.panels(dat)
Ta được biểu đồ:
Nhận xét :
Đường màu đỏ thể hiện xu hướng biến đổi giữa các cặp biến Đường dóng ngang thể hiện hệ số tương quan giữa hai biến
Đồ thị biểu thị mối liên quan giữa các cặp biến từng đôi một
Yêu cầu 4: Xác định được mô hình tuyến tính đa biến tối ưu thể hiện ảnh hưởng của các các thông số dán dựng tới độ bền mối liên kết dán
Trang 8Mô hình tuyến tính đa biến tối ưu nhất thể hiện ảnh hưởng của các thông
số dán dựng tới độ bền mối liên kết dán là mô hình ít tham số nhưng có thể giải thích được nhiều dữ liệu
Ta có phương trình hồi quy:
> m1=lm(dobenxelienketdan~nhietdodan)
>m2=lm(dobenxelienketdan~aplucdan)
>m3=lm(dobenxelienketdan ~thoigiandan)
>m4=lm(dobenxelienketdan~ dogian)
>m5=lm(dobenxelienketdan~nhietdodan+aplucdan+thoigiandan+dogi an)
>summary(m1)
p-value>2.2 e-16 , mô hình này không có ý nghĩa thống kê dobenxelienketdan=100,56-0.12x nhietdodan
khi nhiệt độ tăng lên 1 độ C thị độ bền liên kết dán giảm 0,12 N
>summary(m2)
Trang 9p-value>2.2 e-16 , mô hình này không có ý nghĩa thống kê phương trình: dobenxelienketdan=108,16-10.72xaplucdan khi áp lực dán tăng lên 1N thì độ bền liên kết giảm đi 10,72N
>summary(m3)
p-value>2.2 e-16 , mô hình này không có ý nghĩa thống kê phương trình: dobenxelienketdan=109,94-1,78xthoigiandan khi thời gian dán tăng 1s thì độ bền liên kết dán giảm 1,78 N
Trang 10p-value<2.2 e-16 , mô hình này có ý nghĩa thống kê
mô hình này giải thích 99,44 % độ dao động của độ bền mối liên kết dán phương trình: dobenxelienketdan=58,43+1,85dogian
khi độ giãn tăng lên 1cm thì độ bền liên kết dán tăng 1,85N
>summary(m5)
Trang 11Mô hình Sai số chuẩn R 2
nhietdodan aplucdan thoigianda
n
dogian
Phương trình hồi quy tuyến tính đa biến:
Dobenxelienketdan=86.770000-0.049600xnhietdodan-4.428000xaplucdan+ 1.100000xdogian
p-value<2.2 e-16 , mô hình này có ý nghĩa thống kê
mô hình này giải thích 99,85 % độ dao động của độ bền mối liên kết dán phương trình:
dobenxelienketdan=86,77-0,05xnhietdogian-4,42aplucdan+1,1dogian
Mô hình giải thích 99,85 dao động của độ bền liên kết mối dán Mỗi 1N tăng độ bền liên kết mối dán có liên quan tới nhiệt độ dán là giảm 0.0649 độ C , giảm áp lực dán là -4.42 N và tăng 1,1 cm độ giãn
Sử dụng phương pháp phép tính BMA để tìm mô hình tối ưu: thực hiện trên R
>install.packages("BMA")
>install.packages("ggplot2")
Trang 12> library(BMA)
> library(ggplot2)
> newdata =data.frame(nhietdodan,aplucdan,thoigiandan,dogian, dobenxelienketdan)
> newdata=na.omit(newdata)
> yvar = newdata[,1]
> xvars = newdata[,-1]
> reg = lm(dobenxelienketdan ~ , data=newdata)
Trang 13> step(reg, direction="both")
> bma= bicreg(xvars, yvar, strict=FALSE, OR=20)
> summary(bma)
Trang 14BMA trình bày kết quả 2 mô hình được đánh giá tối ưu nhất Cột thứ nhất liệt kê các biến số độc lập
Cột thứ hai trình bày xác suất biến độc lập có ảnh hưởng đến độ bền liên kết mối dán Ta có "dogian" và “dobenxelienketdan “có xác xuất ảnh hưởng đến độ bền mối liên kết dán là 100% còn hai biến "aplucdan" và
"thoigiandan" là 50%.Như vậy mô hình với biến "dogian",
“dobenxelienketdan “ là mô hình tối ưu nhất Cột 3 EV và cột 4 SD trình bày trị số trung bình và độ lệch chuẩn của hệ
số cho mỗi biến độc lập.
Cột 5 là ước tính hệ số ảnh hưởng của mô hình 1 Mô hình này có xác suất xuất hiện là 50%
Cột 6 là ước tính hệ số ảnh hưởng của mô hình 2 Mô hình này có xác suất xuất hiện là 50%
Thể hiện kết quả dạng biểu đồ
Trang 15> imageplot.bma(bma)
Models selected by BMA
Model #
dobenxelienketdan
dogian thoigiandan aplucdan
Như vậy mô hình biến "dogian" và “dobenxelienketdan “ là mô hình tối
ưu nhất thể hiện ảnh hưởng của các các thông số dán dựng tới độ bền mối liên kết dán