冬虫夏草菌的真菌致病性及其高海拔生态适应性研究获进展,更大的数据集揭示了深层根源

真菌是地球上最大、丰富度最高的生物之一,估计有150万到500万个物种,目前UNITE
数据库中有ITS序列的真菌物种为 73,929 个。

冬虫夏草菌 (Ophiocordyceps sinensis)
是一种常年生活在青藏高原高海拔环境下的子囊真菌,隶属于子囊菌门
(Ascomycota)、粪壳菌纲 (Sordariomycetes)、肉座菌目
(Hypocreales)、线虫草科 (Ophiocordycipitaceae)之线虫草属
(Ophiocordyceps)。它侵染青藏高原高山草甸土中的蝠蛾昆虫幼虫而形成的菌虫复合体常被称为冬虫夏草,在我国是一种传统的名贵中药材,与人参和鹿茸并称为“中药三宝”,具有较高的药用和科研价值。然而,其人工栽培至今尚未完全取得成功,究其原因是由于人们对冬虫夏草菌在侵染宿主过程中的真菌致病性、高海拔生态环境适应性及其背后的遗传基础认识不足。

比较基因组内容分析提供了对动物早期进化的深入了解。一种允许在这些研究中使用更大数据集的新方法产生的结果与动物系统发育的经典观点一致。

图片 1

中国科学院昆明植物研究所研究员高立志带领的植物种质资源、基因组学与生物信息学研究团队,联合华南农业大学基因组学与生物信息学研究中心、中科院西双版纳热带植物园、广东省农业科学研究院、中科院北京基因组研究所和华盛顿大学等单位的相关研究团队,整合罗氏454和Illumina
Hiseq2000两大测序平台的优势,采用杂合组装的策略,获得了约116.42
Mb的冬虫夏草菌高质量的参考基因组图谱,注释得到了7,939个蛋白编码基因。比较之前发表的冬虫夏草菌基因组草图,该研究所获得的基因组图谱,不管是从组装完整性还是准确度上均得到了较大的提升,为从基因组水平上解析冬虫夏草菌的真菌致病性、高海拔生态适应及其群体遗传学等研究夯实了基础。

图片 2

该团队研究发现,伴随着青藏高原的抬升,冬虫夏草菌基因组中的重复序列(尤其是长末端重复序列反转录转座子家族)大量扩增,使得冬虫夏草菌基因组相比于其它低海拔近缘物种变得异常之庞大;有趣的是,与其基因组变大形成鲜明反差的是,冬虫夏草菌的蛋白编码基因却发生快速的丢失,致使其蛋白编码基因的编码区在进化过程中被剧烈地压缩。冬虫夏草菌在基因组结构和基因编码区上所表现出来的这种特性,可能是对青藏高原高海拔环境变化的重要响应,也是造成其具有极高宿主专一性的原因或结果。

重建动物的系统发育揭示了进化生物学中尚未解决的问题,包括组织和器官系统的起源和发展。然而,追踪动物的深层系统发育关系仍然是一项具有挑战性的任务。如今,这种努力主要基于蛋白质氨基酸序列的比较分析。这种方法现在可以应用于“系统发育学”数据集,其实际上包含动物基因组的完整蛋白质序列。然而,尽管取得了这些进展,我们仍然没有一种普遍接受的动物系统发育树。所有动物的根源尤其如此,其早期的进化历史仍然备受争议。

目前具有全基因组数据的物种大约有400个,它们的基因组大小从2M-180M不等。目前真菌界的物种进化关系主要是基因树建立的,人们通常会选几个蛋白质编码基因或者DNA片段进行多序列比对,然后进行系统发育树的构建。例如2006年美国密歇根大学Tim教授用了6个基因(18S,
28S, 5.8S, EF1a 以及 RPB1 和
RPB2)对真菌高阶分类单元进行了重建。这也是目前真菌界比较稳定的系统发育树,如下图。

比较基因组学的研究结果表明,相比于低海拔的近缘物种,在进化过程中大量与真菌致病性相关的基因或基因家族(例如,过氧化物酶活性基因、丝氨酸水解酶编码基因、重金属蛋白酶基因和细胞色素P450
基因等)在冬虫夏草菌中发生了特异性的显著扩增。有趣的是,该团队的研究结果还发现,与抗低温密切相关的功能基因在冬虫夏草菌中大量扩增,这可能有助于冬虫夏草菌增强自身的抗寒性以便在青藏高原极端复杂的环境下得以生存。进一步的研究表明,达尔文选择强烈地作用于冬虫夏草菌真菌致病性相关的蛋白编码基因,可能与其特殊的宿主侵染机制和生态适应相关。

该研究结果发表在“分子生物学与进化”杂志上。

图片 3

真菌的有性生殖类型,主要由其交配型基因的类型决定。真菌的交配型基因在控制其交配亲和性和有性生殖产生子实体上发挥着重要作用,因而与真菌的有性繁殖方式关系密切。高质量的冬虫夏草菌参考基因组的获得与解析以及对来自冬虫夏草菌几乎所有生态地理分布区域的31个群体的重测序数据的分析强烈地支持和证实了冬虫夏草菌是一种同宗交配型真菌。与禾谷镰刀菌类似,冬虫夏草菌交配型基因处于连锁状态,其周边富含有大量的长末端逆转录转座子序列。通过物种进化树的构建进一步发现,在冬虫夏草菌的进化过程中,交配系统曾经历过多次由同宗-异宗-同宗的转换,并最终固定为同宗。众所周知,比起青藏高原之辽阔,生物种类显得十分稀少,冬虫夏草菌的这种同宗交配方式,可能有助于其在青藏高原高海拔环境中快速、低成本地进行有性生殖和繁衍后代,这可能也是造成其有效群体大小变小的原因。

为了解开早期进化动物群体之间的关系,进化生物学家比较了来自一系列物种的“同源”基因序列。同源基因具有相似的氨基酸序列和编码蛋白质的编码,这些蛋白质通常在不同的感兴趣物种中发挥相同的功能,因此被认为是源自共同的祖先。通常,这些分析专门关注“直向同源物”,它是两个同源基因的公认亚组之一。直系同源物被认为是从单个祖先序列直接衍生的基因。“但基因以不同的速度发展,旁系同源基因是预先存在的基因的复制产物,其随后可以彼此独立地进化。“当所有同源基因家族,而不是单独的直系同源基因被纳入基因内容的比较系统发育分析时,我们可以更深入地利用信息,”新研究的第一作者沃克佩特解释道。

然而在物种进化过程中,由于其编码的每个基因收到的进化选择压力不同,比如有的非常重要的功能基因突变会导致物种死亡等,所以这类基因相对非常保守,进化速度慢,而有部分基因不编码重要的生理功能受的进化选择压力较小,从而进化速度较快。所以物种树是不能用基因树完全替代的,在以前基因组测序贵,可用数据较少的情况下用多基因树进行系统发育重建是一个很好的方向。随着真菌全基因组数据越来越多,研究者们开始尝试用不用的方法构建全基因组系统发育树如composition
vector 等。

冬虫夏草菌在中国主要分布于云南、四川、西藏、青海和甘肃等地。近年来,随着冬虫夏草的药用价值不断被发掘和产业化利用,国内和国际市场对其需求量剧增致使其价格也随之急剧攀升。在商业利益的驱动下,过度甚至毁灭性的采挖已经使得冬虫夏草这一珍贵的野生种质资源呈现逐年下降并濒临灭绝。我国已将冬虫夏草菌列为国家二级保护物种。该研究团队选择了代表冬虫夏草菌几乎所有生态地理分布区域的天然群体的31个基因组开展重测序研究,基于业已获得的高质量参考基因组,获得了冬虫夏草菌的基因组变异水平、式样与群体遗传结构的清晰认识。系统进化树、主成分分析和结构分析强烈地支持按纬度梯度将青藏高原冬虫夏草菌群体划分为低、中、高三个很明显的亚群体。进一步的研究显示,低纬度的群体具有较高的群体内基因组多样性和较低的群体间分化水平,低纬度的西藏林芝地区可能是冬虫夏草菌的遗传多样性中心,该物种发生了由低纬度向高纬度进行扩散并发生群体的分化。

为了测试该方法的分辨率,Pett及其同事使用完整的可识别同源基因家族或直系同源子集研究了动物生命树中最早分支谱系的系统发育。这些动物门中特别感兴趣的是海绵和梳状果冻,因为尚不清楚这些组中的哪一组代表所有其他动物的姐妹组。“无论我们是否包括旁系同源物,我们的结果都与动物系统发育的经典观点一致,因为海绵是所有其他现存动物谱系的姐妹群,”Wörheide说。直系同源基因含量的分析将梳状果冻作为原生动物的姐妹群,刺胞动物和Bilateria。然而,包括同源基因家族内容数据,将栉水母识别为刺胞动物的姐妹群。这一结果与从形态学研究中提出的建议

本文中,作者把两个不同的物种比喻成两本不同的书,基因树就像是用书中的一些相似的段落来判断这两本书是不是一样,而作者开发的全基因组建树的方法就是考虑从整本书的角度来全面比较两本书之间的关系,并给出更为合理的进化关系。作者开发了一种叫Feature
Frequency Profile 的方法进行全基因组树的构建。作者目标主要是a.
重新审视由基因树主导的物种进化分支关系;b.让大家争论目前用基因树进行进化模型分析的利弊并与全基因组树进行比较。

该成果获得了高质量的冬虫夏草菌参考基因组,对其深入的解析和群体基因组学研究结果,不仅阐明了冬虫夏草菌在侵染宿主昆虫过程中真菌致病性的基因组学基础,也为诠释冬虫夏草菌的高海拔生态适应性、交配系统进化、群体的变异与进化等重要问题提供了理论依据,无疑对促进冬虫夏草珍贵野生资源的遗传保护、加快其人工栽培具有非常重要的意义。

  • 科朗特拉塔假说 – 同样可以追溯到19世纪中期,这一观点近年来已经失宠。

作者分别用已发表的全基因组数据;转录组数据以及蛋白质组数据分别建树进行比较,发现用蛋白质组数据建的树数,拓扑结构最稳定,作者用蛋白质组数据建的树分别与基因树进行了一系列比较。接下来作者给出了一些非常颠覆性的结论:

该成果得到中组部“万人计划”领军人才项目、云南省创新团队、中科院“百人计划”海外杰出人才择优支持、云南省高端科技人才引进计划、云南省百名海外高层次人才引进计划等项目的支持。

“我们从我们的研究结果中得出结论,一些高度发散的谱系的异常放置,例如梳状果冻,反映了传统的基于序列的方法的能力的基本限制

  1. 以前我们通常认为真菌界有4-8个主要的门,包括(Glomeromycota,
    Zygomycota, Basidiomycota, Ascomycota, Chytridiomycota,
    Neocallimatigomycota, Blastocladiomycota, and
    Microsporidia)。而作者通过蛋白质组树将真菌界减少到3个类群,第一类是终生不产生双核的单核真菌:Cryptomycota,
    Chytridomycota, and
    Zygomycota。第二类是有性生殖产生担孢子的担子菌门包括:
    Puccinomycotina, Ustilaginomycotina, and
    Agaricomycotina。第三类是有性生殖产生子囊孢子的子囊菌门,包括:Taphrinomycotina,
    Saccharomycotina, and
    Pezizomycotina。作者认为这三个门是所有真菌的共同祖先

  2. 图片 4

上述成果标志着国家大科学装置中国西南野生生物种质资源库基因组学、种质资源与生物信息学研究团队与平台建设又取得了重要进展,将对我国丰富的野生生物种质资源的研究、保护与发掘利用产生重要影响。该成果于5月11日以The
caterpillar fungus, Ophiocordyceps sinensis, genome provides insights
into highland adaptation of fungal pathogenicity

为题在线发表于《科学报告》(Scientific
Reports
)。该研究团队博士生夏恩华、江建军,中科院版纳植物园研究员杨大荣为并列第一作者,高立志为通讯作者。

  • 这种方法仅依赖于直向同源物的数据 – 来解决分枝问题。
    Wörheide说:“非常古老的血统。”“因此,我们认为,我们在此引入的基因内容分析应该用于检测基于直向同源物的比较序列分析的假设。如同其他领域,如犯罪学,如果对两个不同数据集的分析产生同样的结果,那么人们可以对这一结果更有信心,而不是单个结果。“

文章链接

  1. 在基因树中位于所有真菌基部位置的Microsporidia,在蛋白树中被分到了非真菌的单细胞真核生物中。蛋白树显示Microsporidia的蛋白组数据与原生动物更为相似,而不是真菌。

  2. 另一个重要的调整是把Neocallimastigomycota成真菌界换到了原生动物界,而且本文还调整了Wallemia等菌的分类位置。

图片 5

图片 6

图1 冬虫夏草菌和蛹虫草菌基因组大小变异

本文在真菌高阶分类单元重建了现有的分类系统,虽然本文才刚刚发表还未有人引用,但可以预见本文在真菌分类进化领域的引领性作用,随着测序越来越便宜,以及生物信息学技术的发展,未来用组学数据进行进化及系统发育分析将取代基于单个或者多个基因进行系统演化方法,让大家从管中窥豹时代进入纵览全局时代。

图片 7

图2 冬虫夏草菌基因和基因家族的进化

Choi J J, Kim S H. A genome Tree of Life for theFungi kingdom[J].
Proceedings of the National Academy of Sciences, 2017, 114:9391-9396.

图片 8

James T Y, Kauff F, Schoch C L, et al.Reconstructing the early evolution
of Fungi using a six-gene phylogeny[J].Nature, 2006, 443: 818.

图3 冬虫夏草菌过氧化物酶类编码基因及正选择作用

图片 9

图4 冬虫夏草菌的群体遗传结构

相关文章