Phân tích và xử lý dữ liệu với RPhần 2 Nhập liệu với R... 1.1 Giao diện RTrình thực hiện qua tương tác... 1.2 R như là một canculator Các hàm phổ biến: sqrt, log, lũy thừa Thực hiện qua
Trang 1Phân tích và xử lý dữ liệu với R
Phần 2
Nhập liệu với R
Trang 2Nhập liệu với R
Trang 31 Giao diện và tương tác với R
1.1 Giao diện R
1.2 R như là một calculator
1.3 Đối tượng (object)
1.4 Vector và Dataset
Trang 41.1 Giao diện R
Trình thực hiện qua tương tác
Trang 51.2 R như là một canculator
Các hàm phổ biến: sqrt, log, lũy thừa
Thực hiện qua tương tác
Trang 61.3 Object
Mỗi đối tượng phải có một tên
Tên có thể được viết bằng chữ thường, con số
và các ký hiệu
Tên của các đối tượng phân biệt chữ hoa chữ thường
Tương tác
Trang 71.4 Vector và Dataset
Vector là tập hợp nhiều số liệu
Vector có thể coi là cột dữ liệu hay biến số
(variable)
Khai báo 1 vector
Tên đối tượng = c(danh sách số liệu)
VD: x = c(1,5, 80,90,91)
Tương tác
Trang 9Tính toán thống kê
Những hàm phổ biến
mean, median, var, sd, leghth,
min, max, rangeme
Biểu đồ cơ bản
hist,plot
Trang 10Nhập liệu với R
Trang 112 Nhập liệu dữ liệu từ Excel vào R
dưới dạng file “.csv”
Data = read.csv (đường dẫn file, header = TRUE)
Để lưu dữ liệu vào đối tượng data
attach(Data)
Trang 123 Nhập liệu dữ liệu từ 1 file sav (SPSS)
Data = read.spss(
đường dẫn file, to.data.frame = TRUE)
Để lưu dữ liệu vào đối tượng data
tích
attach(Data)
Trang 13Nhập liệu với R
Trang 15^ hoặc ** Exponentiation – lũy thữa
X%%Y chia x cho y lấy phần dư( a = 5%%2 a =1)
X%/%Y Chia lấy phần nguyên ( a = 5%/%2 a=2)
Trang 18Tạo biến mới
DataFrame có tên: Data
Nếu DataFrame có 2 cột (biến) x1 và x2
// Khởi tạo biến x1,x2
x1 = c(1,3,4,7)
x2 = c(4,6,8,3)
// Gán dữ liệu vào biến Data
Data = data.frame(x1,x2)
Trang 19Tạo biến mới
Trang 20Giới thiệu dấu $
Dùng dấu $ để tạo biến mới và kết nối với một dataframe
Data$sum = Data$x1+Data$x2
// Kiểm tra giá trị của Data
Data
Bây giờ dataframe Data có 3 biến x1,x2 và sum
Trang 21Tạo biến mới qua coding (mã hóa)
Trang 22Tạo biến mới qua coding
Trang 23Tạo biến mới qua coding
id = c(1,2,3,4,5)
gender = c(“male”,”female”,”male”,”male”,”male”)
Mục tiêu:
Tạo ra biến mới là group
nếu id = 1,2,3 thì group = “A”
nếu id = 4,5 thì group =“B”
Trang 24Tạo biến mới qua coding
> dat$group[id>=1 & id<=3]="A"
> dat$group[id>=4 & id<=5]="B"
Trang 25Hoán chuyển dữ liệu
Chuyển từ numeric sang text/character
As.numeric(), as.character()
Ví dụ id1 = as.character(id)