数据分析常用操作的笔记,R语言版本。
数据操作:使用dplyr包(plyr包)、data.table包
数据整合:使用reshape2包、tidyr包
以下为原生R语言的数据处理(不涉及第三方R包)。
读取数据
|
|
数据探索
|
|
数据清洗
类型转换
判断 | 转化 |
---|---|
is.numeric(df%A) | as.numeric() |
is.charachter() | as.charachter() |
is.vector() | as.vector() |
is.matrix() | as.matrix() |
is.data.frame() | as.data.frame() |
is.factor() | as.factor() |
is.logical() | as.logical() |
缺失值
注意:R中NA为缺失值,与NAN是不同的,而Inf和-Inf是正负无穷
|
|
日期格式
修改表结构
|
|
数据切片
|
|
表格整合
|
|
数据聚合&分组运算
使用reshape2包
|
|
数据透视表
|
|
数据导出
R数据处理函数
- 数学函数
- 统计函数
- 概率函数
- 字符串处理函数
- 其他