Garvan Instute of Medical Research, Australia University of Technology Sydney UTS and UNSW Australia Ton Duc Thang University, Vietnam TDTU Machine Learning Workshop 3/1/2017 – 12/1/20
Trang 1Garvan Ins)tute of Medical Research, Australia University of Technology Sydney (UTS) and UNSW Australia
Ton Duc Thang University, Vietnam
TDTU Machine Learning Workshop 3/1/2017 – 12/1/2017 © Tuan V Nguyen
Trang 3Tạo biến mới
Trang 7Tạo biến mới
• Dataframe có tên: tuan
• Nếu dataframe có 2 cột (biến) x1 và x2
x1 = c(1, 3, 4, 7)
x2 = c(4, 6, 8,3)
tuan = data.frame(x1,x2)
Trang 8Tạo biến mới
Trang 9Giới thiệu dấu $
Trang 10Tạo biến mới qua mã hoá
Trang 11Tạo biến mới qua coding
Trang 12Tạo biến mới qua coding
Trang 13Tạo biến mới qua coding
Trang 14Tạo biến mới qua coding
Trang 15Hoán chuyển
Trang 16Hoán chuyển dữ liệu
Trang 17Dataframe như là một matrix
Trang 18Data frame = matrix
dat = data.frame(id, name, x)
Trang 19subset làm việc với một phần dữ liệu
Trang 20subet
Chúng ta muốn làm việc trong
nhóm ID <=5
dat2 = subset(dat, id<=5)
dat3 = subset(dat, id<=8 & x<30)
Trang 21order Thứ tự hóa dữ liệu
Trang 24Sắp xếp thứ tự: ví dụ
# sắp xếp thứ tự theo biến x, cao xuống thấp
new.dat = dat[ - order(dat$x), ]
Trang 25merge Hợp nhất dữ liệu
Trang 26dat = merge(dat1, dat2, by="id") dat = merge(dat1, dat2, by="id”, all.x=T, all.y=T)
Trang 27melt(reshape) chuyển từ cột sang dòng
Trang 30melt trong gói reshape hay reshape2
"day3"))
dat1 = melt(dat, id=1:3, measure.vars = c("day1", "day2", "day3"))
Trang 31melt trong gói reshape hay reshape2
Trang 32cast(reshape)chuyển từ dòng sang cột