9.windows ubuntu 子系统,centrifuge:微生物物种分类。

上次我们用了karken2和bracken进行了物种分类,这次我们使用centrifuge.

Centrifuge 是一种用于快速和准确进行微生物分类和物种鉴定的软件。其主要功能包括:

  1. 快速分类和物种鉴定: Centrifuge 可以对高通量测序数据(如 metagenomic 或 RNA-Seq 数据)进行快速的微生物分类和物种鉴定。通过比对序列数据与已知的参考数据库,Centrifuge可以快速而准确地确定每个序列的来源微生物学分类。

  2. 精确性: Centrifuge 使用了一种快速的压缩算法来加速分类过程,同时不牺牲准确性。它能够在短时间内处理大规模的测序数据,并提供高质量的分类结果。

  3. 多样性分析: 除了物种鉴定外,Centrifuge 还可以提供关于微生物群落多样性和组成的相关信息。这对于研究微生物群落结构、功能和生态学角度的应用非常有用。

  4. 支持不同类型的测序数据: Centrifuge 不仅适用于 metagenomic 数据,也可以用于其他类型的测序数据,例如 RNA-Seq 数据,从而帮助研究人员更全面地理解微生物组成和功能。

  5. centrifuge是一种非常快速且省内存的软件,用于对微生物样本中的DNA序列进行分类,具有比其他领先系统更好的灵敏度和可比的准确性。该系统使用了一种基于Burrows-Wheeler变换(BWT)和Ferragina Manzini(FM)索引的新索引方案,专门针对宏基因组分类问题进行了优化。centrifuge需要相对较小的索引(例如,约4100个细菌基因组需要4.3GB),但分类速度非常快,可以在一小时内处理典型的DNA测序。

#安装centrifuge,有两种安装方法

第一种,conda 安装

conda create -n centrifuge python=3.6

conda activate centrifuge

# 下载软件

mamba install -y centrifuge

第二种方法登录 Centrifuge (jhu.edu) 官网,选择满足自己需求的版本,解压缩,添加环境目录到~/.bashrc,再source ~/.bashrc,激活一下。

我选择的是centrifuge-1.0.3-beta-Linux_x86_64版本。

接下来就是下载数据库,还是刚才的官网。

1.h+v+c:人类基因组和病毒基因组,包括106个SARS-CoV-2完整基因组(下载链接)

2.h+p+v+c:人类基因组、原核基因组和病毒基因组,包括106个SARS-CoV-2完整基因组(下载链接)

3.其他索引,包括nt索引,也可在Genexa获得(注:索引包括一个参考SARS-CoV-2基因组)。

我下载了HPVC,解压缩之后,

#(centrifuge) guozihan@PC:/mnt/h/db/centrifuge$ ls
hpvc.1.cf  hpvc.2.cf  hpvc.3.cf  hpvc.4.cf  hpvc.tar.gz

#跑流程,下面是centrifuge的基础用法。双端数据。

centrifuge -x <index> -1 <reads1.fastq> -2 <reads2.fastq> -S <output_file>

以下是基因组Centrifuge软件中常见的参数及其作用:

  1. -x, --index:指定要使用的索引文件,该索引文件包含了对应基因组序列的信息,用于比对和分类DNA测序数据。

  2. -U, --reads:指定输入的DNA测序数据文件,用于进行分类和注释分析。

  3. -S, --report-file:指定结果输出文件,将分类和注释结果输出到指定文件中,以便后续分析和查看。

  4. -p, --threads:指定使用的线程数,加快计算速度,特别是对于大规模DNA测序数据的处理更为重要。

  5. -k, --keep-tmpfiles:保留临时文件,有助于调试和分析过程中可能出现的问题。

  6. -m, --min-hitlen:设置最小命中长度,用于过滤较短的比对结果,提高分析的准确性。

  7. -t, --taxid-map:提供一个taxid映射文件,用于将分类结果映射到相应的分类单元(如物种、门、纲等)。

除此之外,还有很多可选参数,大家可以看技术文档。

每个软件都有自己的特长和短板,很多时候要比对结果,选择合适的软件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/495591.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JAVA------基础篇

java基础 1.JDK JDK :java development kit JRE&#xff1a;java runtime environment JDK包含JRE java跨平台&#xff1a;因为java程序运行依赖虚拟机&#xff0c;虚拟机需要有对应操作系统的版本&#xff0c;而jre中有虚拟机。 当你想要在Linux系统下运行&#xff0c;则需要…

JavaScript 权威指南第七版(GPT 重译)(四)

第九章&#xff1a;类 JavaScript 对象在第六章中有所涉及。该章将每个对象视为一组独特的属性&#xff0c;与其他对象不同。然而&#xff0c;通常有必要定义一种共享某些属性的对象类。类的成员或实例具有自己的属性来保存或定义它们的状态&#xff0c;但它们还具有定义其行为…

vue3+vite - 报错 import.meta.glob() can only accept string literals.(详细解决方案)

报错说明 在vue3+vite项目中,解决报错: [plugin:vite:import-analysis] import.meta.glob() can only accept string literals. 如果我们报错差不多,就可以完美搞定这个错误。 解决教程 这个错误,是因为

3GPP 协议资料学习和文档下载

一、登录3GPP官网 3GPP – The Mobile Broadband Standard 二、选择Specifications Per TSG Round 三、选择ftp下载路径 四、选择不同阶段的3GPP协议 包含了从1999年到R18,甚至更新到当前最新的协议。 五、查看对应版本的LTE或者5G NR协议 其中LTE射频相关章节为36.521系列&…

进销存记账软件有哪些?中小商户的进销存记账管理软件选购指南

进销存记账软件已经成为众多实体店不可或缺的管理工具。利用这类软件&#xff0c;实体店能够解决手工记账效率低下、对账繁琐且容易出错等问题。 然而&#xff0c;许多实体店都是小本经营&#xff0c;对于进销存记账软件的选择缺乏经验&#xff0c;导致随意选购的结果往往令人…

C++开发基础理解std::string 对象的生命周期,避免悬空指针或内存访问错误

一、字符串的两种类型互换 在C开发中&#xff0c;const char * 和 std::string 是用于表示字符串的两种不同类型。它们之间可以相互转换。但是需要注意const char * 和 std::string 的互换场景错误。 const char * 到 std::string 的转换&#xff1a; 可以使用 std::string 的…

保研线性代数机器学习基础复习1

1.什么是代数&#xff08;algebra&#xff09;? 为了形式化一个概念&#xff0c;构建出有关这个概念的符号以及操作符号的公式。 2.什么是线性代数&#xff08;linear algebra&#xff09;&#xff1f; 一项关于向量以及操作向量的公式的研究。 3.举一些向量的例子&#x…

使用 Clip 反推提示词报<error>解决方案

本文收录于《AI绘画从入门到精通》专栏&#xff0c;专栏总目录&#xff1a;点这里&#xff0c;订阅后可阅读专栏内所有文章。 大家好&#xff0c;我是水滴~~ 本文主要介绍在使用 Stable Diffusion WebUI 中使用图生图中的“使用 Clip 反推提示词”时报了<error>异常的解决…

JSes6语法和Json快速入门

对象操作 对象的crud 创建对象&#xff1a;let obj{} 新增属性&#xff1a;ojb.a1 修改属性&#xff1a;ojb.a2 查询属性&#xff1a;obj.a 删除属性&#xff1a;delete obj.a 其他操作 obj[a]1 Object.assign() //深拷贝&#xff1f;浅拷贝 let{ name} user &#x…

巨控GRM110系列:短距离内的无线通讯模块

标签: #巨控GRM110 #无线通讯 #ROLA技术 #工业自动化 #远程数据采集 在工业自动化和智能制造的领域中&#xff0c;数据的准确传输是实现高效生产的关键。随着技术的不断进步&#xff0c;无线通讯技术已成为破解远距离数据传输难题的利器。今天&#xff0c;我们将聚焦于一款革命…

JAVA的sort用法详解(二维数组排序,List<>排序,lambada表达式,自定义类型排序)

目录 前言&#xff1a; 一维数组降序&#xff1a; 方法1.Comparator接口&#xff1a; 代码实现&#xff1a; 方法2.Collections.reverseOrder()&#xff1a; 代码实现&#xff1a; 二维数组排序&#xff1a; 代码如下&#xff1a; List<>排序&#xff1a; 代码…

遥感卫星影像质量评价指标汇总

1. 主观评价方法 以人为图像的评价者&#xff0c;根据自己的评价尺度和经验对图像质量进行评价。 2. 客观评价方法 1)均方差 2)信噪比 主要用来评价影像经压缩、传输、增强等处理前后的质量变化情况&#xff0c;其本质与均方差类似。 3)方差 反映了图像各个像元灰度相对…

基于js css的瀑布流demo

要实现照片按照瀑布流展示&#xff0c;写个小demo&#xff0c;记录下。 瀑布流实现思路如下&#xff1a; CSS 弹性布局对 3 列按横向排列&#xff0c;对每一列内部按纵向排列 html代码&#xff1a; <div class"content"></div> css代码&#xff1a; …

【学习】企业申请DCMM原来有这么多的好处

DCMM&#xff0c;即数据管理能力成熟度评估模型&#xff08;Data management Capability Maturity Model&#xff09;&#xff0c;是我国在数据管理领域首个正式发布的国家标准。DCMM的核心目的是帮助企业利用先进的数据管理理念和方法&#xff0c;建立和评价自身的数据管理能力…

基于springboot实现蜗牛兼职网平台系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现蜗牛兼职网平台系统演示 摘要 随着科学技术的飞速发展&#xff0c;社会的方方面面、各行各业都在努力与现代的先进技术接轨&#xff0c;通过科技手段来提高自身的优势&#xff0c;蜗牛兼职网当然也不能排除在外。蜗牛兼职网是以实际运用为开发背景&#xff…

基于单片机超声波停车位自动检测系统设计

**单片机设计介绍&#xff0c;基于单片机超声波停车位自动检测系统设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机超声波停车位自动检测系统设计概要主要涵盖了利用超声波传感器和单片机技术实现停车位自动检测与…

三翼鸟:创牌仅3年,2023场景交易额超51亿

文 | 智能相对论 作者 | 沈浪 3月27日晚间&#xff0c;海尔智家发布了2023年报。财报显示&#xff0c;2023年海尔智家实现营收2614.28亿元&#xff0c;同比增长7.33%&#xff1b;经营利润169.21亿元&#xff0c;同比增长15.8%&#xff1b;归母净利润165.97亿元&#xff0c;同…

科学高效备考2024年汉字小达人:历年真题详细解析-古诗文专题10

距离2024年第11届汉字小达人比赛还有七个多月的时间&#xff0c;如何利用这段时间有条不紊地备考呢&#xff1f;我的建议是两手准备&#xff1a;①把小学1-5年级的语文课本上的知识点熟悉&#xff0c;重点是字、词、成语、古诗。阅读理解不需要。②把历年真题刷刷熟&#xff0c…

c++的学习之路:5、类和对象(1)

一、面向对象和面向过程 在说这个定义时&#xff0c;我就拿c语言举例&#xff0c;在c语言写程序的时候&#xff0c;基本上就是缺什么函数&#xff0c;就去手搓一个函数&#xff0c;写的程序也只是调用函数的&#xff0c;而c就是基于面向对象的开发&#xff0c;他关注的不再是单…

<QT基础(3)>QLineEdit使用笔记

LineEdit 这次要用的是两个功能&#xff1a;初始化展示参数值&#xff0c;修改参数值。 初始化 将l_num的默认值显示 ui.lineEdit->setText(QString::number(l_num));信号 textChanged() 文本发生改变textEdited() 文本编辑信号cursorPositionChanged(&#xff09;光标发…