当前位置:网站首页>NC|王军/宋默识结合三代测序解析肠道菌群结构变异和功能
NC|王军/宋默识结合三代测序解析肠道菌群结构变异和功能
2022-06-10 13:38:00 【刘永鑫Adam】

期刊:Nature Communications
链接:https://doi.org/10.1038/s41467-022-30857-9
- 研究背景 -
测序技术的不断进步是生命科学发展的重要原动力,微生物组领域的兴起更是依赖于二代测序技术的广泛应用。尤其是肠道微生物组,在人类健康和疾病中的作用日益受到关注,在近十年以来已经成为生命科学研究领域的热点。
目前对人体肠道微生物组的组成和功能的研究已经积累了大量的数据,但是目前大部分研究都集中在使用二代测序技术进行物种和功能的解析,宏基因组的拼接质量不高并且很难实现菌株水平的功能差异分析。肠道细菌基因组是开放的基因组,它们可以通过结合、转化和转导等方式获得外源基因进行基因重组以及大的结构变异(Structural variations,SV),导致细菌功能的变化,从而影响人体的健康和疾病状态。
已经有系列研究利用二代测序方法进行了肠道菌群中以缺失(deletion)为主的SV进行了系统的功能表征,并且提示这些SV对菌株水平上的功能有重要的影响;但由于二代测序技术本身读长限制,这类方法依赖于已经建立的细菌参考基因组,检测插入(insertion)或者倒位(inversion)的能力有限,并且在验证上存在一定困难。
三代测序技术例如ONT和Pacbio等新一代测序技术具有读长更长(可以获得10kb-1Mb片段)的优势,可以帮助更好的拼接各种复杂的基因组以及宏基因组,并且在多种生物的基因组优化中发挥了重要的作用,例如人类基因组的T2T(telemere to telemere)等。
- 研究进展 -
针对肠道宏基因组研究,中科院微生物研究所王军课题组和中科院动物研究所宋默识课题组合作,建立了ONT三代测序和Illumina二代测序数据混合组装和后续分析流程。
① 混合组装提高组装质量与SVs检测能力
在mock community上的验证表明,三代和二代测序数据的混合组装从完整度、准确程度以及编码密度方面均比单纯二代或者三代测序组装更有优势。研究人员进行了100个人的横断面、10个人10个连续时间点样品的测序分析,整体contig的N50相较于二代测序提高了3倍;通过分箱在其中获得了N50为117kb的9,612个MAGs(宏基因组组装基因组),涵盖692个物种,其中包括现在之前尚未组装的69个细菌基因组。在丰度较高、有代表性的MAGs中通过比对,一共发现317,558个插入突变,34,129个缺失突变和1,373个基因倒位(图1d);并且这种SV的分布具有分类学的差异,Firmicutes门的SV最多,而Desulfobacteroita门最少。随机挑选的SV进一步通过三代测序的匹配验证,发现97%的SV可以直接利用长序列证实真实存在。

图1 (a) 本研究的技术路线:利用三代测序进行SV的深度解析,以及横断面/时间序列中SV的组成、动态分析,最终进行SV对代谢功能的影响判定。(b, c) 混合组装能够有效提高N50,并组装出大量的基因组。(d) 其中发现更多的insertion、deletion和inversion。
② SVs“指纹”可区分不同宿主
针对横断面和时间序列的分析也表明,SV可以作为区分不同人的同种细菌的标志,这与最近的报道相一致。横断面研究中,不同个体间每Mb基因组中平均有16.7的SVs,而同一个体不同时间点每Mb基因组种SVs的中位值为0,证实了SV在时间上的稳定性。
③ SVs造成菌株水平基因功能变化
对包含SVs相关的基因进行功能富集分析,在top30通路中发现有19个通路与多糖降解、鞘脂代谢等代谢功能有关,而与细胞生长、复制相关通路非常少。研究组同时对横断面队列的粪便、血清和尿液样本进行了代谢组学分析,并且通过关联分析发现了SVs导致菌株水平上代功能可能的改变。例如,Fusicatenibacter saccharivorans与粪便样本中Neotrehalose浓度具有显著关联(图3d);但在一些基因有SV例如插入或者缺失情况下,该部分菌株失去了与代谢产物的显著关联。且F.saccharivorans与空腹血糖也显著负相关,但在具有SVs亚组中,关联变得不显著(图3h)。同样,SVs的存在也使得A.rectalis与glucose的关联在整体菌种水平上显著的情况下,在菌株水平消失(图3i)。

图3 肠道微生物中与SVs相关的功能研究结果。(a, b, c) SV影响基因富集结果; (d-i) SV影响单菌种内不同菌株与代谢产物以及血糖的关联。
④ 群落prophage与CRISPR结构高度相关
最后,针对可能产生SV的prophage以及CRISPR spacer系统进行进一步分分析,发现了2,247个原噬菌体(图3a)以及1,077个原噬菌体-宿主的对应关系(图4b);其中只有72个包括在在现有的MVP数据库中;对所有MAGs的分析发现了150,058个CRISPR spacers,平均每个样本中1,665 ± 560个spacers,并且只有11.73%已经在在CRISPROpenDB数据库汇总。更有意思的是,Prophage/CRISPR spacers的β多样性显著关联,且在多样性上横截面队列中不同个体间原噬菌体和病毒组成呈现显著负相关(图4c)。

图4 肠道菌群汇中与病毒和CRISPR相关的研究结果
- 研究总结 -
综上所述,本文基于三代ONT序列提高了宏基因组装的质量、SV的发现能力,发现了大量包括插入突变和基因倒位在内的结构变异对于菌株水平上基因功能的影响,以及噬菌体、CRISPR-spacer等系统的的深度挖掘。这项研究是课题组利用三代Nanopore测序技术解析肠道病毒组(Cao et al., Medicine in Microecology, 2020, 4:100012; Cao et al. Gut Microbes, 2021, 13),近期发表的真菌组分析方法(Lu et al, Molecular Ecology, doi:10.1111/mec.16534),和靶向RNA检测病原微生物(Zhao et al., Advanced Science, 2021, 8, 2102593)之后,在利用三代Nanopore测序技术探索肠道微生物研究领域的新进展。
- 通讯作者 -

中科院微生物所
王 军
理学博士,博士生导师
王军,中国科学院微生物研究所,免疫与病原微生物重点实验室研究员,德国马普学会合作伙伴小组-生物信息学与计算生物学研究组长,海外高层次人才支持计划青年项目入选者。
长期从事微生物组为核心的生物信息学和计算生物学研究,近年来在重要感染和慢性疾病中基于共生微生物的检测和治疗手段研发中取得一系列重要进展,主要包括:
结合新测序方法和新的人工智能分析技术,辅助病原检测和感染治疗。
针对重大感染疾病和免疫病,深入分析肠道微生物组学特征和关联。
利用GWAS研究明确关键的与微生物互作、维持肠道菌群稳态的宿主基因。
以通讯作者或者第一作者在Nature Biotechnology、Science、Nature Genetics(2篇)、Cell Host & Microbe、Advanced Science、Nature Communications(2篇)、Microbiome(2篇)、Protein & Cell(3篇)、Arthritis & Rheumatology、Gut Microbes等期刊发表文章共60余篇(包括发表于Science、Nature Genetics在内的6篇封面文章),总影响因子>1000,引用8400余次(Google Scholar数据);申请国内专利5项(授权1项),PCT专利1项。承担并完成国家自然科学基金基金委重大研究计划培育项目、基金委新型冠状病毒应急攻关专项,担任国家重点研发计划课题负责人,中国科学院重点部署项目课题负责人;2020年3-4月代表微生物研究所在武汉参加抗疫攻关。
猜你喜欢
iMeta简介 高引文章 高颜值绘图imageGP 网络分析iNAP
iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla
iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature
一文读懂:宏基因组 寄生虫益处 进化树 必备技能:提问 搜索 Endnote
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
点击阅读原文,跳转最新文章目录阅读
边栏推荐
- How to deal with the interview for the fresh senior graduates who want to self-study software testing?
- Recommend an efficient IO component - okio
- [Netease Yunxin] in depth analysis of the design of "circle group" message system | series of articles on "circle group" technology
- 启牛能开户吗,在APP上可以直接开通券商安全吗
- Neuron Newsletter 2022-05|新增 2 個南向驅動和 1 個北向應用、Modbus TCP 實現定制擴展
- Win10 virtual machine download and installation process
- 格力手机叫板苹果手机?除了嘴硬之外,恐怕再无其他
- 《软件体系结构原理、方法与实践》第二版期末考试复习总结
- Idea custom configuration link Nacos
- Qualcomm has finally begun to develop its own core architecture after learning from the difficulties of assembling chips to maintain its competitive advantage
猜你喜欢

超详细的FFmpeg安装及简单使用教程

The shortcomings of the "big model" and the strengths of the "knowledge map"

大厂必备的40个方法论

Student status management system

多云管理平台cmp是什么意思?谁能清楚解释一下

3. web page development tool vs Code
10 competitive airpods Pro products worth your choice

《软件体系结构原理、方法与实践》第二版期末考试复习总结

What does the multi cloud management platform CMP mean? Who can explain it clearly

解决VMWareStation安装 tools 时 D:\setup.exe 找不到的问题
随机推荐
Google Earth Engine(GEE)——基于s2影像的实时全球10米土地利用/土地覆盖(LULC)数据集
If I write the for loop again, I will hammer myself
How to write code that is not easy to overflow memory
The shortcomings of the "big model" and the strengths of the "knowledge map"
解决win10虚拟机和主机不能互相粘贴复制的问题
3. web page development tool vs Code
Pycharm安装详细教程
No spitting
[raise bar C #] how to call the base of the interface
buuctf [Discuz]wooyun-2010-080723
[FAQ] résumé des problèmes courants et des solutions lors de l'utilisation de l'interface API rest du Service de santé sportive
【抬杠C#】如何实现接口的base调用
buuctf [GlassFish]任意文件读取
解决VMWareStation安装 tools 时 D:\setup.exe 找不到的问题
P3379 【模板】最近公共祖先(LCA)
Leetcode-56-merge interval
Win10 virtual machine download and installation process
buuctf [PHP]inclusion
《软件体系结构原理、方法与实践》第二版期末考试复习总结
「大模型」之所短,「知识图谱」之所长