1、R的基础包
基础包是R语言的核心组成部分,构建了R语言的基本功能框架。是R语言默认的安装包,不需要额外安装,使用时无需加载。
2、常用函数及其功能
(1)数据处理函数:unique()、sort()、subset()
# 获取向量中的唯一值
numbers<-c(1,2,3,2,4,3,5,1)
unique_numbers<-unique(numbers)
print(unique_numbers)
# 对向量进行升序排序
sorted_numbers1<-sort(numbers)
print(sorted_numbers1)
# 对向量进行降序排序
sorted_numbers2<-sort(numbers,decreasing=TRUE)
print(sorted_numbers2)
# 筛选数据框中产量大于等于3000的行
df<-data.frame(crop=c("maize","wheat","rice"),
yield=c(4500,2710,3200))
subset_df<-subset(df,yield>=3000)
print(subset_df)
(2)数据模式和结构转换:as.numeric()、as.data.frame()、as.Date()
# 将字符型向量转换为数值型向量
character_numbers<-c("1","2","3","4","5")
numeric_numbers<-as.numeric(character_numbers)
print(numeric_numbers)
# 将矩阵转换为数据框
matrix_data<-matrix(1:9,nrow=3,ncol=3)
print(matrix_data)
df<-as.data.frame(matrix_data)
print(df)
# 将字符型向量转换为日期型
dates<-c('2023-07-01',"2023-07-15","2023-07-31")
date_data<-as.Date(dates)
print(date_data)
(3)统计分析函数:mean()、median()、dnorm()、t.test()
# 计算向量的平均值和中位数
numbers<-c(10,20,30,40,60)
average<-mean(numbers)
print(average)
median_value<-median(numbers)
print(median_value)
# 计算正态分布的概率密度函数值
x<-seq(-5,5,length.out=100)
density<-dnorm(x,mean=0,sd=1)
print(density)
# 执行单样本t检验
data<-c(23,27,24,22,28)
t_test_result<-t.test(data,mu=25)
print(t_test_result)
(4)图形绘制函数:plot()、hist()、pie()
# 绘制散点图
x<-c(1,2,3,4,5)
y<-c(2,4,1,3,5)
plot(x,y)
# 绘制直方图
data<-c(22,28,34,36,30,25,40,32,27,28)
hist(data,main="Histogram")
# 绘制饼图
data<-c(40,20,30,10)
labels<-c("A","B","C","D")
pie(data,labels=labels)