tidyverse 译 “洁净的宇宙” => “极乐净土”
以 iris 鸢尾花数据集为例
** 查看数据集**

** 查看维度dimention**
dim(iris)

 iris 数据集有150个对象(observation),5列 ( Sepal.Length , Sepal.Width , Petal.Length , Petal.Width , Species )
 数据太多,只想看一部分可以用 head 和 tail ,默认展示 6 个 observations
head(iris)
tail(iris)


想展示12行,设定展示的行数为12即可
head(iris,12)
tail(iris,12)

 
** 取 行 数据**
iris[1,]  # 取第一行
iris[1:3,] # 取前三行

取 列 数据
iris[,1]  # 取第一列全部150个数据
iris$Sepal.Length # 可以直接读取Sepal.Length列

 
这这里引入管道 pipe(%>%) ( 快捷键:Ctrl + Shift + M ) (个人感觉用 |> 表示更方便)
** 添加 id 列**

删除列
iris[,-6]  # 删除掉第 6 列,即刚刚创建的 id 列

条件查询 行
#方法1
 iris1 = iris |> 
  + subset(Sepal.Length > 6.9 & Sepal.Width > 3.2)
# 查看iris1
 iris1
#方法2
 iris2 = iris |> 
  + filter(Sepal.Length > 6.9 & Sepal.Width > 3.2)
# 查看iris2
 iris2

 subset 显示的是原来的 id, filter 显示的是筛选之后新的 id
 subset 和 filter 的并集都用 |
 
条件查询 列
iris3 = iris |> 
+ select(Sepal.Length , Sepal.Width)
# 查看
iris3

 select 也可以删除某列
 
重命名 rename

pipe 的好处: 可以一次性处理多个任务,不用累赘的嵌套 iris1 , iris2…
iris_final = iris |> 
+ rename(S.L = Sepal.Length , S.W = Sepal.Width) |> 
+ mutate(id = row_number()) |> 
+ filter(S.L > 6 & S.W >3) |> 
+ select(S.L, S.W, Species)
 iris_final



















