尊嘟假嘟,只需HiFi测序即可获得T2T基因组?

图片

探秘动植物物种进化及遗传多样性的第一步往往是进行基因组测序,基因组从头组装(Genome De novo assembly) 是指从测序数据中重建生物基因组序列的过程。组装一直是生物信息学中的核心问题。

然而,到2019年底完成图这个概念仍然只在细胞器基因组、细菌、病毒基因组中流行。由于真核生物常见的二倍体或多倍体基因组结构的特殊性,以及一些组装工具的限制,导致真核生物基因组通常只能获得scaffold水平精细图或染色体水平的基因组。

图片

细菌基因组完成图

2019年以PacBio HiFi测序为代表的高精度长读长测序的出现彻底改变了基因组序列组装领域。长读长测序技术(Long-Read Sequencing,LRS)可以产生长度≥10kb的连续序列。利用三代测序,科学家们首次完成了一个人类基因组从端粒到端粒(T2T)水平的组装。预计在未来几年内,越来越多的物种将得到T2T基因组。所以不少科学家都提出,基因组组装已经进入了T2T时代。

2023年5月,Dana-Farber癌症研究所李恒老师,发表了题为《Genome assembly in the telomere-to-telomere era》的综述文章。详细介绍了目前T2T基因组数据和组装软件等的进展,也为组装T2T基因组提供了自己的见解和指导。

图片

1.影响T2T组装的主要因素和相关测序技术

影响基因组组装难易程度的主要因素其实不是基因组的大小,而是重复序列。理论上重复序列可以通过长读长和加大测序深度来解决。

在二倍体物种中,两个同源的单倍型也可以视为彼此的重复。正确分离这两个拷贝(或多倍体的多个拷贝)被称为“分型”。单倍型的分型和组装重复序列二者是相关的。能够解决相似重复序列的组装工具自然具有高度分离同源单倍型的能力。

T2T组装通常需要多种测序技术相结合。目前采用的主要测序手段是二代测序+HiFi测序+Hi-C,HiFi测序数据是高质量组装和T2T组装的核心数据类型,Hi-C测序技术可以提供染色体的空间构象信息。此外,亲本序列数据(Trio),也可以被视为一种长距离数据,对于全基因组分型非常有帮助,

图片

2.T2T的组装和相关算法

目前对二倍体样品的T2T组装策略依然集中在HiFi数据结合ONT超长、Trio和Hi-C数据。作者提出Trio数据可以对基因组进行准确的分型,但没有亲本样品时也可以利用Hi-C测序技术。

对于纯合基因组,端粒到端粒组装的最可靠解决方案使用PacBio-HiFi数据和ONT超长数据,目前,单独使用HiFi数据就可以实现纯合基因组的良好组装。Verkko、hifiasm、HiCanu和LJA等都可以实现良好的组装。VGP和DToL都可以整合Hi-C数据。

目前,ONT超长数据的获取相对昂贵,并且需要大量的起始DNA。许多测序项目不会生成ONT超长数据,而是选择单独使用HiFi数据。将HiFi与远距离数据(如trio、Hi-C或Strand-seq)相结合,也可以产生一对高质量的单倍型分型的组装。对于杂合基因组,verkko和hifiasm都可以整合PacBio-HiFi、ONT超长和Hi-C数据,并可以解析人类染色体单倍型。它们还可以单独处理HiFi数据,也可以得到高质量的组装结果。HiCanu可以单独使用HiFi数据生成高质量的组装结果。

此外文章还提到了组装T2T目前的核心算法,包括overlap-graph和de Bruijn graph的主要原理以及使用这些算法的主流软件等。

图片

纯合与杂合二倍体的组装流程

3.T2T基因组的评估

要使一个基因组组装成为真正T2T基因组,它必须覆盖每个染色体的整个部分,并且不包含大规模的组装错误。在得出端粒对端粒的结论之前,严格评估组装的质量至关重要。这里通常用到N50和BUSCO进行评估,BUSCO仍然是评估基因组完整性的黄金标准。minimap2中的“asmgene”工具是BUSCO的替代品,可以解决高质量参考基因组偶尔低完整性的问题。同时kmer评估和基因组的QV值也是很重要的评估指标。

图片

文章中最常见的基因组评估表格(以茶树为例)

4.挑战与展望

尽管T2T组装取得了部分进展,但在实际应用中仍面临不小的挑战,组装算法的局限性、ONT对DNA质量的严苛要求、Hi-C技术对性染色体识别的效果不佳、多倍体基因组的倍性问题,都是目前基因组组装过程中急需解决的问题。除大型动植物基因组外,宏样本中常常要面临完整的MAGs组装的挑战,要实现完整的宏基因组组装,还有很长的路要走。

一个完整的基因组组装往往只是下游研究的开始,尽管基因组组装进展迅速,但基因组比对和注释工具却远远落后。作者希望在未来看到这些工具的不断发展,以实现完整基因组组装的全部功能。

参考文献:

Genome assembly in the telomere-to-telomere era. 2023, arXiv

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/465716.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

香港公司变更注册地址所需材料及流程全解析

香港公司变更注册地址:所需材料及流程全解析 各位老板好,我是经典世纪胡云帅,随着业务的拓展和发展,香港公司可能需要变更其注册地址。变更注册地址不仅关系到公司的日常运营,还与公司的法律地位和品牌形象息息相关。本…

Grok-1 开源:马斯克旗下xAI公司发布革命性AI模型,开启开源大模型新篇章|3140亿参数

自从埃隆马斯克(Elon Musk)上周(3月11日)在 X 平台上宣布 Grok 将于本周开源的消息后,无数目光便聚焦于此,期待之情溢于言表。继 Meta 旗下的 Llama 2 模型开源之后,开源大模型界便充满了对新技…

Linux查看硬件型号详细信息

1.查看CPU (1)使用cat /proc/cpuinfo或lscpu (2)使用dmidecode -i processor Dmidecode 这款软件允许你在 Linux 系统下获取有关硬件方面的信息。Dmidecode 遵循 SMBIOS/DMI 标准,其输出的信息包括 BIOS、系统、主板、…

【Unity】获取游戏对象或组件的常用方法

前言 在Unity开发过程中,我们经常需要获取组件,那么在Unity里如何获取组件呢? 一、获取游戏对象 1.GameObject.Find GameObject.Find 是通过物体的名称获取对象的 所以会遍历当前整个场景,效率较低 而且只能获取激活状态的物体…

Sentinel篇:线程隔离和熔断降级

书接上回:微服务:Sentinel篇 3. 隔离和降级 限流是一种预防措施,虽然限流可以尽量避免因高并发而引起的服务故障,但服务还会因为其它原因而故障。 而要将这些故障控制在一定范围,避免雪崩,就要靠线程隔离…

作品展示ETL

1、ETL 作业定义、作业导入、控件拖拽、执行、监控、稽核、告警、报告导出、定时设定 欧洲某国电信系统数据割接作业定义中文页面(作业顶层,可切英文,按F1弹当前页面帮助) 涉及文件拆分、文件到mysql、库到库、数据清洗、数据转…

青海200MW光伏项目 35kV开关站图像监控及安全警示系统

一、背景 随着我国新能源产业的快速发展,光伏发电作为清洁能源的重要组成部分,得到了国家政策的大力扶持。青海作为我国光伏资源丰富地区,吸引了众多光伏项目的投资建设。在此背景下,为提高光伏发电项目的运行效率和安全性能&…

数据安全与个人隐私:美国人的焦虑与变化

PrimiHub一款由密码学专家团队打造的开源隐私计算平台,专注于分享数据安全、密码学、联邦学习、同态加密等隐私计算领域的技术和内容。 在这个每一次点击、轻敲或按键都留下数字踪迹的时代,美国人对个人数据安全的焦虑与日俱增。他们感觉对数据的使用几乎…

R语言:microeco:一个用于微生物群落生态学数据挖掘的R包,第四:trans_beta class

trans_beta class:利用trans_beta类可以变换和绘制beta分集的距离矩阵。该类中涉及到beta多样性的分析主要包括排序、群距、聚类和方差分析。我们首先使用PCoA显示排序。 > dataset$cal_betadiv() The result is stored in object$beta_diversity ... > t1 &…

unittest初级了解

unitttest初级了解 单元测试框架测试流程 编写测试用例创建测试类测试用例测试用例执行 单元测试框架 unittest(python自带的),pytest(第三方库) 测试流程 编写测试用例—收集测试用例—执行用例—生成测试结果 编写测试用例 创建测试类 类名称建议以Test开头&…

html系列:按钮被样式图片挡着了,无法点击怎么办

​ 背景 在开发中会遇到一些奇奇怪怪的需求,比如在按钮上要显示一个样式图片,同时还要能不影响按钮的点击使用;这时候,设置好了样式,按钮无法点击怎么办? 在查阅资料的时候找到了解决方案。 解决方案 …

WPF图表库LiveCharts的使用

这个LiveCharts非常考究版本,它有非常多个版本,.net6对应的是LiveChart2 我这里的wpf项目是.net6,所以安装的是这三个,搜索的时候要将按钮“包括愈发行版”打勾 git:https://github.com/beto-rodriguez/LiveCharts2?…

数学建模——蒙特卡洛法

目录 1.介绍2.可以做的题型3.实战3.1求pi的值3.2求定积分x^2 的值 参加了大大小小很多场比赛了,但是都是混子,但还是打算记录一下吧,系统认真过一遍。后续功力深厚,会拓展写的文章,目前是干货,一些背景啥的…

2024 年(第 12 届)“泰迪杯”数据挖掘挑战赛—— C 题:竞赛论文的辅助自动评阅完整思路与源代码分享

一、问题背景 近年来我国各领域各层次学科竞赛百花齐放,层出不穷,学生参与度也越来越高。随着参赛队伍的增 加,评阅论文的工作量急剧增加,这对评阅论文的人力要求也越来越大。因此引入机器辅助评阅成为竞赛主办方的现实需求。 在…

System Verilog的接口、程序块与断言解析

接口、程序块与断言 1 接口 1.1 使用接口简化连接 // 接口 interface arb_if(input bit clk);logic [1:0] grant,request;logic rst; endinterface// 使用了简单接口的仲裁器 module arb (arb_if arbif);...always(posedge arbif.clk or posedge arbif.rst)beginif(arbif.rs…

计算方法实验1:圆形镜面成像问题

Algorithm Description 设 T ( c o s θ , s i n θ ) T(cos\theta,sin\theta) T(cosθ,sinθ),则有 P T Q T ( P x − c o s θ ) 2 s i n 2 θ ( Q x − c o s θ ) 2 ( Q y − s i n θ ) 2 PTQT\sqrt{(P_x-cos\theta)^2sin^2\theta}\sqrt{(Q_x-cos\theta)^2(Q_y-sin…

苹果Apple Watch将有更多新手势,智能穿戴将被赋予Find My功能

根据美国商标和专利局(USPTO)公示的清单,苹果公司获得了一项 Apple Watch 相关技术专利,表明苹果公司正在探索更多的交互手势。 苹果在 watchOS 10.1 更新中,为 Apple Watch 引入了全新的“双指互点两下”手势&#…

智慧公厕对于智慧城市管理的意义

近年来,智慧城市的概念不断被提及,而智慧公厕作为智慧城市管理的重要组成部分,其在监测、管理和养护方面发挥着重要的作用。智慧公厕不仅是城市市容提升的重要保障,还能提升城市环境卫生管理的质量,并有效助力创造清洁…

unity学习(61)——hierarchy和scene的全新认识+模型+皮肤+动画controller

刚刚开始,但又结束的感觉? 1.对hierarchy和scene中的内容有了全新的认识 一定要清楚自己写过几个scene;每个scene之间如何跳转;build setting是add当前的scene。 2.此时的相机需要与模型同级,不能在把模型放在相机下…

服务器开机不输入密码自动进系统, 与设置开机启动项

打开运行[win R ] 输入: control Userpasswords2设置开机启动项 运行 输入 shell:startup在这里插入图片描述