Một số biểu đồ chính trong khoa học... Biểu đồ phân bố... Biểu đồ thanh bar plot... Biểu đồ tương quan đơn giản... Biểu đồ tương quan đa biến... Biểu đồ hộp box plot... Tóm lược biểu đồ
Trang 1Garvan Ins)tute of Medical Research, Australia University of Technology Sydney (UTS) and UNSW Australia
Ton Duc Thang University, Vietnam
TDTU Machine Learning Workshop 3/1/2017 – 12/1/2017 © Tuan V Nguyen
Trang 2Một số biểu đồ chính trong khoa học
Trang 3Biểu đồ phân bố
Trang 4Phân bố dữ liệu: histogram
Trang 6tên trục tung và trục hoành
Trang 9Biểu đồ thanh (bar plot)
Trang 12> colors = c("red", "yellow", "green", "violet", "orange", "blue",
Trang 14Biểu đồ tương quan đơn giản
Trang 16> plot(fnbmd ~ age, pch=16, col="blue")
> abline(lm(fnbmd ~ age), col="red")
Trang 17Biểu đồ "tán xạ" (scatter plot)
• Package "car"
• Mối liên quan giữa x và y
• sca]erplot trong package "car"
scatterplot(y ~ x | group, )
Trang 18Biểu đồ đơn giản dùng package "car"
Trang 20"Tô điểm" cho biểu đồ
# thêm tiêu đề, giá trị trục tung và hoành
scatterplot(fnbmd ~ age | gender, pch=c(1,16), col=c("red","black"), xlim=c(55,95),
ylim=c(0.2, 1.4), xlab="Age", ylab="FNBND")
Trang 24"Tô điểm" cho biểu đồ
# bỏ đường biểu diễn smooth
scatterplot(fnbmd ~ age | gender,
pch=c(1,16), col=c("red","black"), xlim=c(55,95), ylim=c(0.2, 1.4),
xlab="Age", ylab="FNBND",
smooth=F)
Trang 25Biểu đồ tương quan đa biến
Trang 27Hàm pairs.panels(data) trong psych
• Package "psych"
Trang 30
Biểu đồ hộp (box plot)
Trang 325 yếu tố trong biểu đồ hộp
25% (Q1)
interquartile range = Q3 – Q1
Trang 38boxplot(wt, main="Weight (kg)", xlab="Weight", ylab="Kg", col="Red", notch=TRUE)
Trang 39Box plot theo nhóm (giới tính)
boxplot(wt~ sex , main="Weight by gender", xlab="Weight", ylab="Kg", notch=T, col=c("red","blue"))
Trang 40Box plot theo nhóm (giới tính)
boxplot(wt~sex, main="Weight by gender", xlab="Weight", ylab="Kg", notch=T, col=c("red","blue"),
Trang 42Tóm lược biểu đồ hộp
• Biểu đồ hộp (John Tukey)
• Biểu đồ hộp là một phương )ện rất tốt cho mô tả biến liên tục
• Càng ngày càng phổ biến trong bài báo khoa học
Trang 43
Biểu đồ sai số chuẩn
(error bar plot)
Trang 44Biểu đồ "error bar"
Trang 51error.bars.by trong psych
error.bars.by(fnbmd, gender, bars=T,
ylim=c(0,1.3),
labels=c("Women","Men"),
col=c("Blue","Blue") )
Trang 52Tóm lược biểu đồ sai số chuẩn
• Hai giá trị trung bình có thể thể hiện bằng bar plot
• Nhưng phải có sai số chuẩn („nh khoa học!)
• Package "sciplot" à rất có ích!
Trang 53
Tóm lược
• Bốn dạng biểu đồ phổ biến
– Biểu đồ phân bố: hist()
– Biểu đồ tương quan: plot(), sca]erplot() – Biểu đồ hộp: boxplot()
– Biểu đồ thanh: barplot()