Các mô hình tiên lượng tử vong Hà Tấn Đức Bệnh viện đa khoa trung ương Cần Thơ Đại học Tôn Đức Thắng Thực hành R Ngày 3 1 Câu hỏi 10 File ‘test excel file 1 xls’, đặt tên data Vẽ histogram cho x1 Dùng.
Trang 1Hà Tấn Đức Bệnh viện đa khoa trung ương Cần Thơ
Đại học Tôn Đức Thắng
Thực hành R
Ngày 3
1
Trang 2Câu hỏi 10
File ‘test excel file 1.xls’, đặt tên data.
Vẽ histogram cho x1
Dùng hàm hist() Package: ‘graphics’ Các argument trong hàm bao gồm:
− x: tên biến liên tục.
− breaks: số cột yêu cầu.
− xlab: nhãn trục hoành
− ylab: nhãn trục tung.
2
Trang 3Câu hỏi 10
Vẽ boxplot cho x1 và disease, gender
Hàm boxplot, packages: ‘graphics’ Các argument của hàm:
Trang 4− gr[gender=='Female' & disease==0]= 'Nu lanh'
− gr[gender=='Female' & disease==1]= 'Nu benh'
− gr[gender=='Male' & disease==0]= 'Nam lanh'
− gr[gender=='Male' & disease==1]= 'Nam benh'
− boxplot(x1~gr)
4
Trang 6Soạn biểu đồ barplot số người bị obesity, overweight, và normal cho từng giới tính.
Hàm barplot Packages: graphics Các argument cần thiết:
− height: hoặc vector hoặc matrix
− beside: xếp nhiều bar hoặc một bar.
− legend.text: đặt tên legend
− col: pha màu cho các bar.
6
Trang 8Soạn biểu đồ barplot số người bị obesity, overweight, và normal cho từng giới tính.
barplot(table(w.group,gender),beside=T,col=c('red','blue','green'))
legend('topright', legend=c('Normal','Overweight','Obesity'), fill=c('red','blue','green'),bty='n')
8
Trang 10Vẽ barplot về giá trị trung bình của x1 cho 3 nhóm cân nặng
Hàm tapply Packages: base Các argument của hàm:
− X: biến liên tục.
− INDEX: biến phân nhóm.
− FUN: tính mean, var, sd
− na.rm: loại bỏ những giá trị NA.
Hàm barplot.
10
Trang 11Câu hỏi 10
Vẽ barplot về giá trị trung bình của x1 cho 3 nhóm cân nặng
meanx=tapply(x1, w.group, mean,na.rm=T)
barplot (meanx, ylim=c(0, 6))
11
Trang 12Câu hỏi 10
Vẽ biểu đồ tương quan giữa weight, x1 và đường biểu diễn tuyến tính.
Hàm plot Package: graphics Các argument của hàm:
− x: vector x.
− y: vector y
− type: loại plot được vẽ.
Hàm lm Package: stat Các argument của hàm:
− formula: y ~ x
− data: dataset.
12
Trang 13Câu hỏi 10
Vẽ biểu đồ tương quan giữa weight, x1 và đường biểu diễn tuyến tính.
Hàm abline Package: graphics Các argument của hàm:
− reg: đối tượng hồi quy.
− a, b: intercept và slope (hệ số góc)
− h: giá trị y của đường ngang.
− v: giá trị x của đường thẳng đứng.
13Phân tích mô tả bằng biểu đồ
Trang 15Câu hỏi 10
Vẽ biểu đồ tương quan giữa weight và x1, và đường biểu diễn tuyến tính cho từng giới tính.
Các hàm sử dụng: plot, abline, par.
Hàm par Packages: graphics Dùng cho rất nhiều chức năng.
− par (new=T): print đè lên biểu đồ trước đó.
15
Trang 16Vẽ biểu đồ tương quan giữa weight và x1, và đường biểu diễn tuyến tính cho từng giới tính.
plot(weight[gender=='Female'] ~ x1[gender=='Female'], xlim=c(0,15),ylim=c(0,130),xlab='X1',ylab='Weight')
Trang 17Câu hỏi 10
Vẽ biểu đồ tương quan đa biến giữa x1, x2, x3, weight, height, và độ tuổi.
Các hàm sử dụng: pairs.panels (package: ‘psych’)
− x: data.frame hoặc matrix.
− method: pearson, spearman, kendall.
17
Trang 18Vẽ biểu đồ tương quan đa biến giữa x1, x2, x3, weight, height, và độ tuổi.
dat$age= (as.numeric(as.Date(visitdate,'%Y/%m/%d')) - as.numeric(as.Date(dob, '%Y/%m/%d')))/365
Trang 19Câu hỏi 11
File ‘Presidents achievement.csv’
Đọc dữ liệu, đặt tên dữ liệu us
Tính trung bình chiều cao cho mỗi loại thành tựu
Hàm describeBy Package: psych Các argument:
− x: data.frame hoặc matrix hoặc biến liên tục.
− group: biến không liên tục.
library(psych)
describeBy (us$height, us$achievement)
19Phân tích mô tả bằng biểu đồ
Trang 20Câu hỏi 11
File ‘Presidents achievement.csv’
Thể hiện kết quả về chiều cao và thành tựu bằng một biểu đồ thích hợp.
Hàm boxplot, mtext Các argument của mtext:
− text: Điền vào đoạn text dự kiến.
− side: 1=bottom, 2=left, 3=top, 4=right.
− line: vị trí hàng điền vào.
− at: vị trí cột điền vào.
boxplot(height~achievement)
mtext('Not yet',side=1,line=1,at=1)
20
Trang 21Câu hỏi 12
File genetic effect.csv Báo cáo ảnh hưởng của hút thuốc lá đến sự thay đổi biểu hiện của gene.
Đọc dữ liệu vào R và gọi đối tượng là “gen”.
Dùng R để vẽ biểu đồ về effect (trục hoành) và log10(pvalue) (trục tung), điều kiện abs(effect)>70 và pvalue<10^(-10).
Hàm plot, data.frame, subset Các argument của subset:
− x: đối tượng tạo tập con, thường là dataset.
− subset: điều kiện tạo tập con.
21Phân tích mô tả bằng biểu đồ
Trang 23Bieu do tuong quan x1,x2,x3 bai 10
23