首页 > 技巧
点击下载文章原文
海洋占地球体积的71%,拥有丰富的生物资源。 海洋生物多糖和蛋白质含量较高,部分海洋生物容易死亡和腐败,导致DNA降解,提供高纯度和完整的基因组DNA。 收购带来很大困难。 海洋生物通常比陆地动植物更复杂,并且更难以组装和拼接。 本研究利用测序技术突破了这些瓶颈,完成了超高质量的海洋鱼类基因组组装!
研究中利用104X测序数据进行基因组组装,并通过Canu、WTDBG等多种软件分别进行组装。 选择最优的组装结果(主要从基因组大小、N50、组装完整性、组装准确性等方面进行评估)用于后续研究。 优化。 研究人员最终利用WTDBG软件组的基因组版本结合Hi-C技术的进一步优化,组装出474.31 Mb的基因组,并将该基因组的99.44%安装在20条染色体上,增加到22.46 Mb,最长的达到了32.32 MB!
图1 基因组组装流程
众所周知,N50是衡量基因组组装质量的重要指标。 在一定程度上,价值越高,装配的质量就越好。 与现有的河豚基因组相比,绿鳍河豚的基因组组装超过同样采用三代测序组装的黄鳍河豚的5倍,是翻车鱼(Mola mola)的1000倍!
表1 瞳孔目基因组比较
与近年来的一些鱼类基因组相比,绿鳍河豚基因组组装的连续性也很突出。 从表2中不难发现,近年来鱼类基因组水平基本徘徊在Kb和Mb之间,但此次组装的绿鳍河豚直接提升了一个数量级,完成了高质量的基因组具有很强的连续性。
表2 近年发表的鱼类基因组
优秀的基因组不能仅仅建立在连续性的基础上,完整性也同样重要。 研究人员利用Racon和Pilon分别对WTDBG组装好的基因组进行了两轮和三轮纠错,从多个方面评估了纠错前后基因组的完整性。
01.二代reads对比分析
使用bwa软件将二代数据与参考基因组进行比较。 结果显示,第二代reads的双端比对效率为97.41%,表明第三代组装的基因组完整性较好。
02. 核心基因完整性评估
CEGMA v2.5数据库包含458个真核生物保守核心基因。 CEGMA v2.5 用于评估最终基因组组装的完整性。 在最终版本的基因组中,通过序列相似性(>70%)比对,总共找到了458个核心基因中的442个(96.51%)。 CEGMA v2.5包含的248个更保守的序列中,91.13%可以在组装的基因组中找到。
03. BUSCO评价
BUSCO v2 中的数据库包含 4584 个真核生物保守的核心基因。 我们使用 BUSCO v2.0 软件来评估基因组组装的完整性。 在我们组装的基因中海洋鱼类,总共找到了4,324个完整的BUSCO基因,其中单拷贝4,213个,多拷贝111个; 62个不完整的BUSCO基因; 198 未找到。 BUSCO评估基因组完整度为94.33%(/Total)。
评估结果均显示完整性在94%以上,表明基因组整体组装质量非常优异,这将极其有利于后续下游分析,具有无限的发展潜力。
总结
本案海洋经济鱼类绿鳍河豚通过平台进行超长读长基因组测序,使得海洋生物组装指数(N50)超过22 Mb! 成为迄今为止我们所知的海洋鱼类N50最高的基因组! 同时,评估结果也表明,装配的精度和完整性也非常高。
ONT平台超连续基因组研究演示(部分)
结合前几期展示的组装数据和上表,不难看出,在一定的组装深度下,技术可以带来高水平的基因组甚至新的惊喜! 无论是动物、植物还是微生物,无论是基因组、转录组还是元基因,无论是更新旧数据还是破译困难物种,它都能表现出色~
截至目前,平台已完成近400个物种的DNA文库构建和测序工作,拥有丰富的项目经验! 无论是技术还是项目经验,我们都很强! 期待越来越多可喜的成果交到老师们的手中~
官方认证
本文来自《百麦克生物》,原文链接:
- 上一篇: 海洋探秘带你一起探索蓝色之旅
- 下一篇: 宿州论坛 关于埇桥区主城区分类实施社区防控的通告(第34号)
猜你喜欢
- 2024-02-17 世界海洋鱼类种类最丰富的国家之一营养丰富吗
- 2024-01-15 海鱼的种类图片,请问下哪里有关于海洋鱼类色彩的资料
- 2024-01-12 海洋鱼类 营口大白鲸世界海岸城封顶明年底具备运营条件
- 2024-01-11 海洋鱼类大全图册,海洋当中又好多种鱼类
- 2024-01-10 海鱼的品种大全及名字,海洋鱼类名称?
- 2024-01-06 世界上最大的海洋鱼类,你吃过几种?
- 2024-01-05 鲭鱼是什么鱼?海洋鱼类是怎么吃的?!
- 2023-12-23 气候变化导致全球海洋鱼类种群的生产力同步趋势变得越来越显著