微生物群落在生态系统中发挥则重要功能,我们在对微生物群落进行分析时,会将不同分类水平(从门到属)的微生物类群的相对丰度与测定的某一生态功能进行相关性分析。但由于微生物类群数较多,又有不同的分类水平,将其包揽在一个图中,并显示不同的微生物类群的名字,会显得十分杂乱,因此我们尝试使用交互式的可视化来进行探索性分析。下面我们将结合R语言和javascript,来实现这一任务。考虑到微生物生态学方面的同学对JavaScript可能比较陌生,我们也提供了网络工具,为网友在线探索分析微生物各类群与生态功能的关系提供便利。
实现的效果:可点击该连接查看实现的效果,TreeCorrelation,鼠标停留在每一个节点可以显示每个节点的微生物类群名称。
例如,当鼠标停留在图中的蓝色节点时会显示其对应的名称,鼠标移开后名称消失,保持图形的整洁。
看完了实现效果,下面具体介绍实现该交互式网页的方法
Step1:数据准备
我们需要使用到两大类的数据:各水平相对丰度表
和测定的生态功能表
。
- 门水平相对丰度表
- 纲水平相对丰度表
- 目水平相对丰度表
- 科水平相对丰度表
- 属水平相对丰度表
- 生态功能表(测定的生态功能,或者对应的理化性质等)
我们需要使用到个分类水平的相对丰度表,这个在进行完序列分析后都可以获得,其数据格式如下,这里以门水平的相对丰度表为例,纲、目、科、属水平的相对丰度表也类似。
准备好生态功能的数据表
Step2:利用R语言生成JSON文件
2.1 加载必要的包
library(jsonlite)
library(stringr)
library(psych)
2.2 读取文件
L2 <- read.delim("./icicle data/taxa_nifH_16s_L2.txt", row.names=1, check.names = FALSE)
L3 <- read.delim("./icicle data/taxa_nifH_16s_L3.txt", row.names=1, check.names = FALSE)
L4 <- read.delim("./icicle data/taxa_nifH_16s_L4.txt", row.names=1, check.names = FALSE)
L5 <- read.delim("./icicle data/taxa_nifH_16s_L5.txt", row.names=1, check.names = FALSE)
f <- read.delim("./icicle data/FUN.txt", row.names=1)
2.3 生态功能与各微生物类群的相关性分析
taxaList <- list(L2=L2,L3=L3,L4=L4,L5=L5)
corList <- list()
for(i in 1:length(taxaList)){
cor <- corr.test(taxaList[[i]],f$s1)
corr <- cor$r
corr[cor$p>0.05] <- 0
corList[[i]] <- corr
}
2.4 生成可视化需要的JSON文件
taxa_df <- list()
split_string <- strsplit(colnames(taxaList[[length(taxaList)]]), ";")
for(i in 1:length(taxaList)){
if(i == length(taxaList)){
taxa_df[[i]] <- colnames(taxaList[[i]])
}
else{
taxa_df[[i]] <- sapply(split_string,function(x){paste(x[1:(length(x) - length(taxaList)+i)], collapse = ";")})
}
}
df <- data.frame(taxa_df)
listn <- list()
n <- length(df)
for(m in 1:n){
list4 <- list()
if(m==1){
for (i in 1:nrow(df)){
list4[[i]] <- list(name=df[i,n],value=replace_na(corList[[n-m+1]][i],0))
}
listn[[m]] <- list4
}
else{
j=1
df0 <- df[!duplicated(df[,n-m+2]),(n-m+1):(n-m+2)]
for (i in 1:nrow(df0)){
if (!duplicated(df0[,1])[i]){
list0 <- list(name=df0[i,1],value=replace_na(corList[[n-m+1]][j],0),
children=listn[[m-1]][df0[,1] %in% df0[i,1]])
list4[[j]] <- list0
j=j+1
}
}
listn[[m]] <- list4
}
}
list1 <- list(list(name="Bacteria",children=listn[[n]]))
2.5 导出JSON文件
json_string <- toJSON(list1, pretty = TRUE)
cat(json_string)
write(json_string,"./taxonomy.json")
Step3:将生成的JSON文件上传网页
打开网页:buildTreeCorrelation,选择并读取生成的JSON文件即可。