TIỂU LUẬN HỌC PHẦN : PP PHÂN TÍCH DỮ LIỆU NGÀNH DỆT MAY Xử lý và phân tích dữ liệu về ảnh hưởng của các thông số dán tới độ bền của liên kết dán dựng Yêu cầu 1: Mô tả được từng biến với
Trang 1TIỂU LUẬN HỌC PHẦN : PP PHÂN TÍCH DỮ LIỆU NGÀNH DỆT MAY
Xử lý và phân tích dữ liệu về ảnh hưởng của các thông số dán tới độ bền của
liên kết dán dựng
Yêu cầu 1: Mô tả được từng biến với các đặc trưng thống kê của biến: số trung bình, trung vị, độ lệch chuẩn, phương sai, độ biến thiên, khoảng tin cậy 95%
- Đọc dữ liệu dandung.csv và gọi object là dandung
> dandung=read.csv("D:/dan dung.csv",header=T)
[1] "nhietdodan" "aplucdan" "thoigiandan"
[4] "dobenxelienketdan" "dogian"
Mô tả đặc trưng thống kê của biến: "nhietdodan"
>sd=sd(nhietdodan)
>var=var(nhietdodan)
>cv=sd(nhietdodan)*100/mean(nhietdodan)
>c(sd,var,cv) >mean(nhietdodan)-sd(nhietdodan) >mean(nhietdodan) +sd(nhietdodan)
Ta được bảng các đặc trưng thống kê của biến: "nhietdodan"
Trang 2ST Số thống kê Giá trị T
Mô tả đặc trưng thống kê của biến: "aplucdan"
>sd=sd(aplucdan)
>var=var(aplucdan)
>cv=sd(aplucdan)*100/mean(aplucdan)
>c(sd,var,cv) >mean(aplucdan)-sd(aplucdan) >mean(aplucdan) +sd(aplucdan)
Ta được bảng các đặc trưng thống kê của biến: : "aplucdan"
T
Mô tả đặc trưng thống kê của biến: " thoigiandan"
>summary(thoigiandan)
>sd=sd(thoigiandan)
Trang 3>cv=sd(thoigiandan)*100/mean(thoigiandan)
>c(sd,var,cv)
>mean(thoigiandan)-sd(thoigiandan)
>mean(thoigiandan)+sd(thoigiandan)
Ta được bảng các đặc trưng thống kê của biến: : " thoigiandan "
T
Mô tả đặc trưng thống kê của biến: " dobenxelienketdan"
>summary(dobenxelienketdan) >sd=sd(dobenxelienketdan)
>var=var(dobenxelienketdan)
>cv=sd(dobenxelienketdan)*100/mean(dobenxelienketdan) >c(sd,var,cv)
>mean(dobenxelienketdan)-sd(dobenxelienketdan)
>mean(dobenxelienketdan)+sd(dobenxelienketdan)
Trang 4Ta được bảng các đặc trưng thống kê của biến: : " dobenxelienketdan "
T
Mô tả đặc trưng thống kê của biến: " dogian"
>summary(dogian)
>sd=sd(dogian)
>var=var(dogian)
>cv=sd(dogian)*100/mean(dogian)
>c(sd,var,cv)
>mean(dogian)-sd(dogian)
>mean(dogian)+sd(dogian)
Ta được bảng các đặc trưng thống kê của biến: : " dogian "
Trang 5Yêu cầu 2: Vẽ biểu đồ phân bố của từng biến
- Ta sử dụng lệnh hist trên R để vẽ biểu đồ phân bố từng biến cố, để dễ dàng
so sánh từng biến một cách khách quan nhất, ta vẽ đồ thị cho tất cả
5 biến bằng cách chia màn ảnh thành 6 cửa sổ với 2 dòng và 3 cột:
>op=par(mfrow=c(2,3))
- biểu đồ phân phối của biến : "nhietdodan"
>hist(nhietdodan, prob=T)
>lines(density(nhietdodan))
- biểu đồ phân phối của biến : "aplucdan" >hist(aplucdan, prob=T)
>lines(density(aplucdan))
- biểu đồ phân phối của biến : " thoigiandan " >hist(thoigiandan,
prob=T) >lines(density(thoigiandan))
- biểu đồ phân phối của biến : " dobenxelienketdan "
>hist(dobenxelienketdan, prob=T)
>lines(density(dobenxelienketdan))
- biểu đồ phân phối của biến : " dogian " >hist(dogian, prob=T)
>lines(density(dogian))
Trang 6Histogram of nhietdodan Histogram of aplucdan Histogram of thoigiandan
nhietdodan
aplucdan
thoigiandan
Histogram of dobenxelienketdan Histogram of dogian
Trang 7Yêu cầu 3: Vẽ biểu đồ tương quan từng đôi một giữa các biến liên tục
- Vẽ biểu đồ tương quan từng đôi một giữa các biến: "nhietdodan, "aplucdan",
"thoigiandan" , "dobenxelienketdan","dogian"
>dat=cbind(nhietdodan,aplucdan,thoigiandan,dobenxelienketdan,dogia n)
>pairs.panels(dat)
Ta được biểu đồ:
Nhận xét :
Đường màu đỏ thể hiện xu hướng biến đổi giữa các cặp biến Đường dóng ngang thể hiện hệ số tương quan giữa hai biến
Đồ thị biểu thị mối liên quan giữa các cặp biến từng đôi một Yêu cầu 4: Xác định được mô hình tuyến tính đa biến tối ưu thể hiện ảnh hưởng của các các thông số dán dựng tới độ bền mối liên kết dán
Trang 8Mô hình tuyến tính đa biến tối ưu nhất thể hiện ảnh hưởng của các thông
số dán dựng tới độ bền mối liên kết dán là mô hình ít tham số nhưng có thể giải thích được nhiều dữ liệu
Ta có phương trình hồi quy:
> m1=lm(dobenxelienketdan~nhietdodan)
>m2=lm(dobenxelienketdan~aplucdan) >m3=lm(dobenxelienketdan
~thoigiandan) >m4=lm(dobenxelienketdan~ dogian)
>m5=lm(dobenxelienketdan~nhietdodan+aplucdan+thoigiandan+dogi an)
>summary(m1)
p-value>2.2 e-16 , mô hình này không có ý nghĩa thống
kê dobenxelienketdan=100,56-0.12x nhietdodan khi nhiệt độ tăng lên 1 độ C thị độ bền liên kết dán giảm 0,12 N
>summary(m2)
Trang 9p-value>2.2 e-16 , mô hình này không có ý nghĩa thống kê phương trình: dobenxelienketdan=108,16-10.72xaplucdan khi
áp lực dán tăng lên 1N thì độ bền liên kết giảm đi 10,72N
>summary(m3)
p-value>2.2 e-16 , mô hình này không có ý nghĩa thống kê phương trình: dobenxelienketdan=109,94-1,78xthoigiandan khi thời gian dán tăng 1s thì độ bền liên kết dán giảm 1,78 N
Trang 10p-value<2.2 e-16 , mô hình này có ý nghĩa thống kê
mô hình này giải thích 99,44 % độ dao động của độ bền mối liên kết dán phương trình: dobenxelienketdan=58,43+1,85dogian
khi độ giãn tăng lên 1cm thì độ bền liên kết dán tăng 1,85N
>summary(m5)
Trang 11Mô hình Sai số chuẩn R2
n
Phương trình hồi quy tuyến tính đa biến:
Dobenxelienketdan=86.770000-0.049600xnhietdodan-4.428000xaplucdan+ 1.100000xdogian p-value<2.2 e-16
, mô hình này có ý nghĩa thống kê
mô hình này giải thích 99,85 % độ dao động của độ bền mối liên kết dán
phương trình:
dobenxelienketdan=86,77-0,05xnhietdogian-4,42aplucdan+1,1dogian
Mô hình giải thích 99,85 dao động của độ bền liên kết mối dán
Mỗi 1N tăng độ bền liên kết mối dán có liên quan tới nhiệt độ dán là
giảm 0.0649 độ C , giảm áp lực dán là -4.42 N và tăng 1,1 cm độ giãn
Sử dụng phương pháp phép tính BMA để tìm mô hình tối ưu: thực hiện trên R
>install.packages("BMA")
>install.packages("ggplot2")
Trang 12> library(BMA)
> library(ggplot2)
> newdata =data.frame(nhietdodan,aplucdan,thoigiandan,dogian, dobenxelienketdan)
> reg = lm(dobenxelienketdan ~ , data=newdata)
Trang 13> step(reg, direction="both")
Trang 14BMA trình bày kết quả 2 mô hình được đánh giá tối ưu nhất Cột thứ nhất liệt kê các biến số độc lập
Cột thứ hai trình bày xác suất biến độc lập có ảnh hưởng đến độ bền liên kết mối dán Ta có "dogian" và “dobenxelienketdan “có xác xuất ảnh hưởng đến độ bền mối liên kết dán là 100% còn hai biến "aplucdan"
và "thoigiandan" là 50%.Như vậy mô hình với biến "dogian",
“dobenxelienketdan “ là mô hình tối ưu nhất
Cột 3 EV và cột 4 SD trình bày trị số trung bình và độ lệch chuẩn của
hệ số cho mỗi biến độc lập
Cột 5 là ước tính hệ số ảnh hưởng của mô hình 1 Mô hình này có xác suất xuất hiện là 50%
Cột 6 là ước tính hệ số ảnh hưởng của mô hình 2 Mô hình này có xác suất xuất hiện là 50%
Thể hiện kết quả dạng biểu đồ
Trang 15> imageplot.bma(bma)
Models selected by BMA
aplucdan
thoigiandan
dogian
nxelienketdan
Model #
Như vậy mô hình biến "dogian" và “dobenxelienketdan “ là mô hình tối
ưu nhất thể hiện ảnh hưởng của các các thông số dán dựng tới độ bền mối liên kết dán