IF= 13.4| 当eDNA遇上机器学习法

图片

近日,凌恩生物客户重庆医科大学在《Water Research》(IF= 13.4)发表研究论文“Supervised machine learning improves general applicability of eDNA metabarcoding for reservoir health monitoring”。该研究主要介绍了一种基于eDNA的机器学习方法,具有广泛的适用性,可用于生物监测,评估水库的健康状况。

图片

传统的生物监测方法存在许多局限性,如:采样和鉴定困难、难以监测微小生物、难以监测季节变化。建立有效和标准化的监测方法对于水库的成功恢复和管理至关重要。环境DNA(eDNA)宏条码测序为生物监测提供了一种很有前途的选择,并可以克服传统形态学生物评估的许多局限性。本文提出了一种基于eDNA的机器学习方法,该方法通过综合评估水库的物理化学和生物指标,开发了一种新的生物完整性指数(Me-IBI),该指数整合了多种营养相互作用和环境信息,可以克服许多传统生物监测方法的局限性。本文详细介绍了该方法的实施过程,包括样本采集、数据分析和模型建立等步骤,为大规模、标准化的生物监测应用奠定了坚实的基础。

图片

图1 研究采样点

图片

本文研究了三峡水库的水质评估和生态系统健康监测。作者采用了多种方法,包括单因素污染指数和水质指标测定法、eDNA测序法、生物信息学分析、以及机器学习方法。开发了一种基于eDNA的指标(Me-IBI),用于评估水库生态系统的健康状况。结果表明,Me-IBI比物理化学评估更能区分三峡水库的实际健康状况,比较了不同机器学习方法在预测Me-IBI时的性能,即使只有少量的特征,不同的SML算法也可以建立稳定的模型,并获得优异的预测性能。同时探讨了人类活动和营养状况对Me-IBI的影响。最后,提出了一种基于eDNA和机器学习的标准化健康监测方法,可用于监测河流-水库生态系统的健康状况。

图片

图2 三峡水库健康状况综合评价

(a)根据《中国地表水环境质量标准》(GB3838-2002),采用单因素污染指标法(SFPI)对水质进行评价。(b)两个季节TGR 14个采样点(平均±标准差值)计算WQI的变异和健康分类。两个季节TGR 14个采样点(平均±标准差值)计算的Me-IBI的(c)变异和健康分类。(d)根据SFPI、WQI和Me-IBI对两季水质健康评估结果的比较。

图片

图片

图3 Me-IBI对大坝(a)、WQI (b)、营养状况(PC1表示,c)和人类分布(PC1表示,d)的响应。非线性多项式回归包括95%CI(阴影区域)的WQI(二次)和营养(立方)。线性回归包括人类分布中的95%CI(阴影区域)。

图片

图片

图4 使用随机森林进行特征筛选

(a)确定预测两个季节水库健康状况的所有特征。(b)通过5次重复10次交叉验证确定重要特征的数量。(c)核心特征的确定交叉出现在重要特征下100个重复。

图片

图片

图5 随机森林(RF)和支持向量机(SVM,具有四个核技巧)模型在预测TGR中的Me-IBI时使用三个特征数的预测性能。实际和预测的Me-IBI值之间的线性值r2值,测量实际和预测的Me-IBI值之间的差异,以及测量实际和预测的Me-IBI衍生健康状态之间的一致性的kappa值在箱线图上表示。

图片

图片

图6 使用不同的算法获得的最好的预测模型与三个特征数。获得的参考Me-IBI值绘制在横轴上,而通过无分类法数据获得的预测值绘制在纵轴上。彩色的矩形代表离散的质量分级,从蓝色的“优秀”到红色的“差”。灰色点表示来自训练数据集的预测,而红点表示来自测试数据集的预测。

图片

图片

参考文献

Supervised machine learning improves general applicability of eDNA metabarcoding for reservoir health monitoring. Water Research, 2023.

原文链接

Doi.org/10.1016/j.watres.2023.120686

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/500941.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

mysql的主从配置

MySQL主从复制是一种常见的数据库复制技术,用于实现数据在一个主数据库服务器和一个或多个从数据库服务器之间的同步。在主从配置中,主服务器负责接收和处理写操作,然后将这些变更通过binlog日志传播到从服务器,从服务器根据主服务…

【MySQL】7.MHA高可用配置及故障切换

什么是MHA MHA(MasterHigh Availability)是一套优秀的MySQL高可用环境下故障切换和主从复制的软件 mha用于解决mysql的单点故障问题; 出现故障时,mha能在0~30秒内自动完成故障切换; 并且能在故障切换过程中&#xff0…

《让你的时间多一倍》逃离时间陷阱,你没有自己想的那么懒 - 三余书屋 3ysw.net

让你的时间多一倍 今天我们来阅读法比安奥利卡尔的作品《让你的时间多一倍》。或许你会心生疑虑,这本书是否又是一本沉闷的时间管理指南?但我要告诉你的是,尽管时间管理这个话题已经为大众所熟知,这本书却为我们揭示了一个全新的…

【Roadmap to learn LLM】Large Language Models in Five Formulas

by Alexander Rush Our hope: reasoning about LLMs Our Issue 文章目录 Perpexity(Generation)Attention(Memory)GEMM(Efficiency)用矩阵乘法说明GPU的工作原理 Chinchilla(Scaling)RASP(Reasoning)结论参考资料 the five formulas perpexity —— generationattention —— m…

PyCharm中配置PyQt5并添加外部工具

Qt Designer、PyUIC和PyRcc是Qt框架下的三个重要工具,总的来说,这三个工具各司其职,相辅相成,能显著提升Qt开发的速度与效率。 Qt Designer:是一个用于创建图形用户界面的工具,可轻松构建复杂的用户界面。…

matlab及其在数字信号处理中的应用001:软件下载及安装

目录 一,matlab的概述 matlab是什么 matlab适用于的问题 matlab的易扩展性 二,matlab的安装 1,解压所有压缩文件 2,解压镜像压缩文件 3,运行setup.exe 4,开始安装 5,不要运行软件…

EasyBoss ERP上线实时数据大屏,Shopee本土店铺数据实时监测

近日,灵隐寺PPT汇报用上数据大屏疯狂刷屏,有做东南亚本土电商的老板发现这种数据大屏的模式可以很好地展现店铺运营状况。 所以就有老板来问:EasyBoss能不能也上线实时数据大屏的功能?没问题!立马安排! 要有…

BasicVSR++模型转JIT并用c++libtorch推理

BasicVSR模型转JIT并用clibtorch推理 文章目录 BasicVSR模型转JIT并用clibtorch推理安装BasicVSR 环境1.下载源码2. 新建一个conda环境3. 安装pytorch4. 安装 mim 和 mmcv-full5. 安装 mmedit6. 下载模型文件7. 测试一下能否正常运行 转换为JIT模型用c libtorch推理效果 安装Ba…

只出现一次的数字 II

题目链接 只出现一次的数字 II 题目描述 注意点 nums中,除某个元素仅出现一次外,其余每个元素都恰出现三次设计并实现线性时间复杂度的算法且使用常数级空间来解决此问题 解答思路 本题与只出现一次的数字的数字类似,区别是重复的数字会…

深度学习InputStreamReader类

咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java SE相关知识点了,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好…

SpringMVC注解及使用规则

文章目录 前言一、SpringMVC注解是什么?二、使用步骤1.注解使用2创建JSP3 SpringMVC视图1. 逻辑视图(Logical View)2. 物理视图(Physical View)区别和关系 4 SpringMVC注解总结 总结 前言 提示:这里可以添…

Java运算符-三元运算符,这你必须得会!

哈喽,各位小伙伴们,你们好呀,我是喵手。 今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互相学习,一个人虽可以走的更快,但一群人可以走的更远。 我是一名后…

08-研发流程设计(上):如何设计Go项目的开发流程?

在Go 项目开发中,我们不仅要完成产品功能的开发,还要确保整个过程是高效的,代码是高质量的。 所以,Go 项目开发一定要设计一个合理的研发流程,来提高开发效率、减少软件维护成本。研发流程会因为项目、团队和开发模式…

基于SSM的百货中心供应链管理系统设计与实现(论文+源码)_kaic

摘 要 社会发展日新月异,用计算机应用实现数据管理功能已经算是很完善的了,但是随着移动互联网的到来,处理信息不再受制于地理位置的限制,处理信息及时高效,备受人们的喜爱。本次开发一套百货中心供应链管理系统有管理…

政安晨:【Keras机器学习实践要点】(九)—— 保存、序列化和导出模型

政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: TensorFlow与Keras机器学习实战 希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正! 这篇文章是保存、序列化和导出模型的完整指南。 …

python实战之进阶篇(一)

定义类 1. 构造方法 2. 实例方法 3. 类方法 类似于Java中的静态方法, 使用方式: 类名.类方法 4. 私有变量 5. 私有方法 6. 使用属性set和get

vue3+threejs新手从零开发卡牌游戏(二十一):添加战斗与生命值关联逻辑

首先将双方玩家的HP存入store中,stores/common.ts代码如下: import { ref, computed } from vue import { defineStore } from piniaexport const useCommonStore defineStore(common, () > {const _font ref() // 字体const p1HP ref(4000) // 己…

4、Cocos Creator 动画系统

目录 1、Clip 参数 2、动画编辑器 3、基本操作 更改时间轴缩放比例 移动显示区域 更改当前选中的时间轴节点 播放 / 暂停动画 修改 clip 属性 快捷键 4、模拟实验 5、动画事件 6、注意事项 参考 Animation 组件是节点上的一个组件。Clip 动画剪辑就是一份动画的声…

【edge浏览器无法登录某些网站,以及迅雷插件无法生效的解决办法】

edge浏览器无法登录某些网站,以及迅雷插件无法生效的解决办法 edge浏览器无法登录某些网站,但chrome浏览器可以登录浏览器插件无法使用,比如迅雷如果重装插件重装浏览器重装迅雷后仍然出现问题 edge浏览器无法登录某些网站,但chro…

InfoNCE loss

InfoNCE loss是一种用于自监督学习的损失函数,通常用于训练对比学习模型,如自编码器或神经网络。全称是"InfoNCE: Contrastive Estimation of Neural Entropy",基于对比学习的思想,旨在最大化正样本的相似性&#xff0c…