R语言学习
文章目录
- R语言学习
- 1.数据的R语言表示
- 2.多元数据的R语言调用
- 3.多元数据的简单R语言分析
- 总结
1.数据的R语言表示
数据框(data frame)
R语言中用函数data.frame()
生成数据框,其句法是:
data.frame(data1,data2,…),例如:
> X=data.frame(x1,x2)
> X
x1 x2
1 171 57
2 175 64
3 159 41
4 155 38
5 152 35
6 158 44
7 154 41
8 164 51
9 168 57
10 166 49
11 159 47
12 164 46
数据框的列名默认为变量名,也可以对列名进行重新命名,例如:
> (X=data.frame('身高'=x1,'体重'=x2) )
身高 体重
1 171 57
2 175 64
3 159 41
4 155 38
5 152 35
6 158 44
7 154 41
8 164 51
9 168 57
10 166 49
11 159 47
12 164 46
2.多元数据的R语言调用
1.从剪切板读取
2.从文本文件读取
3.从Excel文件读取
>X=read.table("data.csv")
注意:若要读取Excel工作簿数据,需安装和调用RODBC包:
>library(RODBC)
>Rcode<-odbcConnectExcel("Rcode.xls")
3.多元数据的简单R语言分析
1.定量变量的分析
(1)展现定量数据
直方图
hist()
函数
hist(x,freq=NULL,…)
> hist(x1) #身高的直方图
(2).定量变量间的关系
散点图plot()函数
plot(x,y,…)
> plot(x1,x2)
2.定性变量的分析
列联表函数
table()
(1)单因素分析
> data=read.table("clipboard",header=T) #剪切板数据读入data
> head(data) #前6组数据
年龄 性别 风险意识 专兼职情况 职业状况 教育程度 投资结果
1 20-29 男 有 兼职 金融 高中 赚钱
2 50-59 女 有 兼职 科教 中学 持平
3 40-49 女 无 专职 科教 中学 赔钱
4 30-39 男 有 兼职 工人 中专 赚钱
5 50-59 女 有 专职 农民 大专 赚钱
6 40-49 女 有 兼职 管理 小学 赚钱
> attach(data) #解析变量
> table(年龄) #一维列联表
年龄
* 0-19 20-29 30-39 40-49 50-59 60-
20 3 92 167 157 51 24
> barplot(table(年龄),col=1:7)
> pie(table(投资结果))
(2)两因素分析
> table(年龄,性别)
性别
年龄 男 女
* 9 11
0-19 2 1
20-29 69 23
30-39 101 66
40-49 89 68
50-59 24 27
60- 15 9
> barplot(table(年龄,性别),beside=T,col=1:7)
> barplot(table(性别,年龄),beside=T,col=1:2)
(3)三因素分析
> ftable(年龄,性别,投资结果) #三维列联表
投资结果 持平 赔钱 赚钱
年龄 性别
* 男 4 3 2
女 3 7 1
0-19 男 0 0 2
女 1 0 0
20-29 男 21 17 31
女 10 7 6
30-39 男 31 30 40
女 30 20 16
40-49 男 31 30 28
女 25 30 13
50-59 男 5 11 8
女 8 10 9
60- 男 7 5 3
女 2 5 2
> (ft=ftable(性别,投资结果,年龄))
年龄 * 0-19 20-29 30-39 40-49 50-59 60-
性别 投资结果
男 持平 4 0 21 31 31 5 7
赔钱 3 0 17 30 30 11 5
赚钱 2 2 31 40 28 8 3
女 持平 3 1 10 30 25 8 2
赔钱 7 0 7 20 30 10 5
赚钱 1 0 6 16 13 9 2
> rowSums(ft)
[1] 99 96 114 79 79 47
> colSums(ft)
[1] 20 3 92 167 157 51 24
> sum(ft)
[1] 514
整理后的频数表:
总结
本小节主要学的是一些关于R语言的数据及图像表达的操作,数据案例表已绑定,继续加油!