16s功能注释--PICRUST2的安装及使用

文章目录

  • 安装
    • 本地安装
    • conda安装
  • 使用
  • 一些报错

安装

本地安装

在github网址下载压缩包:https://github.com/picrust/picrust2/releases/tag/v2.5.2
解压后将bin目录设置到环境变量

conda安装

利用bioconda安装

conda create -n picrust2 -c bioconda -c conda-forge picrust2=2.5.2

安装成功:在这里插入图片描述

使用

picrust2_pipeline.py -s asv-sequences.fasta -i asv_table.txt -o picrust2_result -p 10

得到的结果:
在这里插入图片描述
结果注释:
详见:
https://blog.csdn.net/woodcorpse/article/details/118618094?spm=1001.2014.3001.5506

一些报错

全部ASV和ASV前10000注释时都报错,暂未找到解决方法
但使用ASV前1000则能运行成功
在这里插入图片描述
在这里插入图片描述
运行命令:

(picrust2) yangzy@DESKTOP-1J86A3B:/mnt/d/WSL/799F/yunyan87$ picrust2_pipeline.py -s asv-sequences.fasta -i step2.even.14615.asv_table.rename.txt -o picrust2_result -p 10

报错信息:

Error running this command:
place_seqs.py --study_fasta asv-sequences.fasta --ref_dir /home/yangzy/anaconda3/envs/picrust2/lib/python3.8/site-packages/picrust2/default_files/prokaryotic/pro_ref --out_tree picrust2_result/out.tre --processes 10 --intermediate picrust2_result/intermediate/place_seqs --min_align 0.8 --chunk_size 5000 --placement_tool epa-ng

Standard error of the above failed command:
Warning - 70 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequences). These input sequences will not be placed and will be excluded from downstream steps.

This is the set of poorly aligned input sequences to be excluded: ASV62839, ASV93483, ASV26791, ASV102682, ASV97176, ASV59758, ASV85125, ASV38932, ASV90242, ASV32757, ASV91755, ASV80919, ASV79359, ASV99099, ASV48371, ASV92728, ASV56198, ASV94807, ASV38419, ASV32421, ASV65544, ASV43259, ASV74887, ASV71270, ASV94630, ASV59930, ASV110098, ASV68072, ASV107416, ASV56326, ASV109445, ASV98991, ASV72629, ASV90196, ASV84467, ASV101288, ASV100585, ASV99664, ASV70821, ASV62940, ASV85563, ASV84512, ASV110740, ASV55046, ASV102543, ASV44147, ASV72670, ASV63978, ASV38842, ASV55069, ASV103868, ASV97565, ASV111824, ASV87304, ASV52082, ASV97688, ASV95257, ASV111042, ASV99079, ASV91731, ASV57867, ASV72833, ASV111128, ASV112709, ASV43327, ASV85200, ASV73620, ASV97864, ASV106479, ASV102761


Error running this command:
epa-ng --tree /home/yangzy/anaconda3/envs/picrust2/lib/python3.8/site-packages/picrust2/default_files/prokaryotic/pro_ref/pro_ref.tre --ref-msa picrust2_result/intermediate/place_seqs/ref_seqs_hmmalign.fasta --query picrust2_result/intermediate/place_seqs/study_seqs_hmmalign.fasta --chunk-size 5000 -T 10 -m /home/yangzy/anaconda3/envs/picrust2/lib/python3.8/site-packages/picrust2/default_files/prokaryotic/pro_ref/pro_ref.model -w picrust2_result/intermediate/place_seqs/epa_out --filter-acc-lwr 0.99 --filter-max 100

Standard output of the above failed command:
INFO Selected: Output dir: picrust2_result/intermediate/place_seqs/epa_out/
INFO Selected: Query file: picrust2_result/intermediate/place_seqs/study_seqs_hmmalign.fasta
INFO Selected: Tree file: /home/yangzy/anaconda3/envs/picrust2/lib/python3.8/site-packages/picrust2/default_files/prokaryotic/pro_ref/pro_ref.tre
INFO Selected: Reference MSA: picrust2_result/intermediate/place_seqs/ref_seqs_hmmalign.fasta
INFO Selected: Filtering by accumulated threshold: 0.99
INFO Selected: Maximum number of placements per query: 100
INFO Selected: Automatic switching of use of per rate scalers
INFO Selected: Preserving the root of the input tree
INFO Selected: Specified model file: /home/yangzy/anaconda3/envs/picrust2/lib/python3.8/site-packages/picrust2/default_files/prokaryotic/pro_ref/pro_ref.model
INFO Selected: Reading queries in chunks of: 5000
INFO Selected: Using threads: 10
INFO     ______ ____   ___           _   __ ______
        / ____// __ \ /   |         / | / // ____/
       / __/  / /_/ // /| | ______ /  |/ // / __
      / /___ / ____// ___ |/_____// /|  // /_/ /
     /_____//_/    /_/  |_|      /_/ |_/ \____/ (v0.3.8)
INFO Using model parameters:
INFO    Rate heterogeneity: GAMMA (4 cats, mean),  alpha: 0.453141 (user),  weights&rates: (0.25,0.0250674) (0.25,0.220229) (0.25,0.782933) (0.25,2.97177)
        Base frequencies (user): 0.229585 0.22008 0.298596 0.251739
        Substitution rates (user): 1.00319 2.79077 1.5301 0.87441 3.83966 1
INFO Output file: picrust2_result/intermediate/place_seqs/epa_out/epa_result.jplace
INFO 5000 Sequences done!
INFO 10000 Sequences done!
INFO 15000 Sequences done!
INFO 20000 Sequences done!
INFO 25000 Sequences done!
INFO 30000 Sequences done!
INFO 35000 Sequences done!
INFO 40000 Sequences done!
INFO 45000 Sequences done!
INFO 50000 Sequences done!

参考:
[1]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/729089.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Matlab基础语法:变量和数据类型,基本运算,矩阵和向量,常用函数,脚本文件

目录 一、变量和数据类型 二、基本运算 三、矩阵和向量 四、常用函数 五、脚本文件 六、总结 一、变量和数据类型 Matlab 支持多种数据类型,包括数值类型、字符类型和逻辑类型。掌握这些基本的变量和数据类型,是我们进行数学建模和计算的基础。 数…

网络安全复习笔记

概述 要素 CIA:可用性;完整性;保密性。 可控性;不可否认性;可审查性。 攻击 被动:窃听 - 保密性;监听 - 保密性主动:假冒 - 完整性;重放 - 完整性;改写 -…

数学建模系列(4/4):Matlab建模实战

目录 引言 1. Matlab简介与安装 1.1 Matlab简介 1.2 Matlab的安装 2. Matlab基础操作 2.1 Matlab基础语法和常用命令 2.2 Matlab中的数据类型和数据结构 3. 用Matlab进行建模 3.1 矩阵运算与线性代数 矩阵运算 3.2 Matlab中的绘图功能 绘制2D图形 绘制3D图形 3.3…

中服云产品远程运维系统

中服云产品远程运维系统主要针对设备售后市场服务的管理,利用工业物联网技术,一方面面向设备生产厂商,将分散的经销商、客户、销售出去的设备统一管理;另一方面面向设备使用厂家,实现设备实时运行监控;系统…

【手机号性别查询、姓名查询、年龄查询、要素核验接口】支持高并发查询。

** 最近更新时间:2024-06-21 用户手机号注册实名认证接口,精度高,简化注册用户的认证流程,输入手机号码就可以获得认证结果,适合金融、社交、教育、电商、商户入驻等业务场景,用于简化实名认证流程&#…

AI网络爬虫:用deepseek提取百度文心一言的智能体数据

真实网址:https://agents.baidu.com/lingjing/experhub/search/list?pageSize36&pageNo1&tagId-99 返回的json数据:{ "errno": 0, "msg": "success", "data": { "total": 36, "p…

Ollma本地大模型沉浸式翻译【403报错解决】

最终效果 通过Chrome的 沉浸式翻译 插件,用OpenAI通用接口调用本地的Ollma上的模型,实现本地的大模型翻译文献。 官方文档指导的Ollama的配置:一定要配置环境变量,否则会出现【403报错】

H6901B 2.7-24V36V60V72V80V100V 高效率高精度升压型大功率LED恒流驱动芯片

H6901B是一款高效率高精度升压型大功率LED恒流驱动芯片,它具备多种特性和优势,应用于多种LED照明产品中。 首先,H6901B具有宽范围的输入电压,从2.7V到100V,这使其能够适应不同电压源的应用场景。同时,其高效…

【解决方案】智慧园区解决方案(配套源码)

智慧园区整体解决方案-综合运营管理系统 1. 园区现状与发展机遇 2. 智慧园区愿景 3. 智慧解决方案架构 4. 智慧园区各子系统介绍 5. 智慧园区建设意义 楼宇管理,物业管理,消防管理,巡检管理,门禁管理,停车管理等综合实…

如何手机录屏?2个方法轻松搞定!

随着智能手机的普及和移动互联网的飞速发展,手机录屏已经成为人们在日常生活中经常需要使用的功能。无论是录制游戏精彩瞬间、分享App操作教程,还是保留重要聊天信息,手机录屏都发挥着重要作用。可是你知道如何手机录屏吗?本文将介…

若电路板上的二极管损坏后怎么确定型号呢?

若电路板上的二极管损坏后,还可以看清原来管子的型号,换用一个同型号的二极管即可。若看不清型号或管子未标注型号,一般可以根据该二极管在电路中的作用来代换。电路板上的二极管坏了,如何确定它的型号?。 一般来说看…

Linux 软链接

# 语法 ln -s <文件夹or文件的真实路径> <自定义路径别名> # 例子 ln -s /etc/sysconfig/network-scripts/ifcfg-ens33 ~/ens33

【启明智显产品介绍】Model3C工业级HMI芯片详解专题(一)芯片性能

【启明智显产品介绍】工业级HMI芯片Model3C详解&#xff08;一&#xff09;芯片性能 Model3C 是一款基于 RISC-V 的高性能、国产自主、工业级高清显示与智能控制 MCU&#xff0c;配置平头哥E907&#xff0c;主频400MHz&#xff0c;强大的 2D 图形加速处理器、PNG/JPEG 解码引擎…

AI写作如何助力大学生完成毕业论文?

近年来&#xff0c;随着科技的快速发展&#xff0c;AI已经逐渐渗透到了生活中的方方面面&#xff0c;其中也包含着学术领域。 作为学生党&#xff0c;你是否还在为期末论文&#xff0c;大学生实践报告而发愁&#xff1f; 有了这些AI写作神器&#xff0c;大学生们再也不用在期…

Numpy: np.memmap详细用法

文章目录 0. 引言1. 基本用法2. 参数说明3. 例子3.1 读取内存映射文件3.2 修改内存映射文件 4. 使用场景5. 注意事项 0. 引言 np.memmap 是 NumPy 提供的一种用于内存映射大文件的类&#xff0c;允许大文件不完全加载到内存中&#xff0c;而是通过内存映射的方式部分加载。这在…

还原试卷的软件叫什么?这3款一键还原

还原试卷的软件叫什么&#xff1f;在数字化学习日益普及的今天&#xff0c;学生们在处理试卷时经常面临一个问题&#xff1a;如何高效地将已作答的试卷还原成空白状态以便重复练习&#xff1f;为了解决这一问题&#xff0c;市场上涌现出了多款还原试卷的软件。下面&#xff0c;…

职工管理系统

需求分析 系统需要能够实现对职工信息的插入、删除、查找、修改和排序功能。职工信息包括职工编号、姓名、性别、出生年月、参加工作年月、学历、职务、住址、电话等信息。界面友好&#xff0c;通过菜单实现以上功能&#xff0c;操作简单&#xff0c;能够方便快捷地进行信息管理…

RAG实操教程langchain+Milvus向量数据库创建你的本地知识库 二

Miluvs 向量数据库 关于 Milvui 可以参考我的前两篇文章 • 一篇文章带你学会向量数据库Milvus&#xff08;一&#xff09;[1]• 一篇文章带你学会向量数据库Milvus&#xff08;二&#xff09;[2] 下面我们安装 pymilvus 库 pip install --upgrade --quiet pymilvus如果你…

【自撰写】【国际象棋入门】第7课 常见战术分析(二)牵制、驱赶和腾挪

第7课 常见战术分析&#xff08;二&#xff09;牵制、驱赶和腾挪 在《第6课&#xff1a;常见战术分析&#xff08;一&#xff09;吃双和抽将》中&#xff0c;我们通过一系列实际棋局的例子&#xff0c;简单介绍了“吃双”和“抽将”这两种十分常见的战术。本次课中&#xff0c…

Apache DolphinScheduler 亚马逊云科技联合Meetup: 基于云上的最佳实践

引言 随着大数据和云计算技术的快速发展&#xff0c;企业在数据管理和任务调度上面临着前所未有的挑战&#xff0c;包括复杂的配置过程、性能优化和成本管理等问题。同时&#xff0c;确保数据在传输和存储过程中的安全性&#xff0c;并满足合规性要求&#xff0c;也是一个重要…