茶承载了人类千百年的文化传承,是一个连接人与土地、传统与现代的纽带。茶的经济和文化双重价值一直在为社会的可持续发展提供动力。在每一片茶叶背后,都隐藏着一部生命的史诗,撰写它们的主角就是一个个神秘的茶树基因组。2023年11月27日中国农业科学院深圳基因组所张兴坦团队发表了题为“Gene mining and genomics-assisted breeding empowered by the pangenome of tea plant Camellia Sinensis”的研究成果,该文章揭示了茶树的泛基因组,为我们打开了通往茶叶背后故事的大门。这不仅是一篇科学的文章,更是对我们所钟爱的茶文化的致敬。让我们一同追溯源头,感受科学研究与传统饮料的完美交融,共赴茶树基因组的奇妙之旅!
发表期刊:Nature Plants(IF=18)
BOB半岛·综合体育提供三代PacBio测序服务和二代Illumina测序服务
01 研究背景
非模式植物物种对于自然环境的优化和人类社会的进步有着不可代替的作用,但由于存在改良周期、复杂的基因组、模糊的家系背景以及低效的基因转化系统等阻碍,非模式植物物种的改良一直进展缓慢。泛基因组研究手段的普及,为非模式物种带来了新的方向,该方法不受限于单一参考基因组,能以单碱基分辨率捕捉物种内的全部遗传变异。这种方法已经用于挖掘模式作物(如水稻、番茄和黄瓜)以及非模式作物(如小麦、高粱和马铃薯)中与复杂性状相关的关键基因。
茶在全球拥有庞大的种植面积和产量,茶叶产业的经济价值达到了约170亿美元,在可持续发展、减少贫困和茶叶出口及发展中国家食品安全方面发挥关键作用。尽管已有部分研究揭示了染色体水平的茶树基因组,为茶的功能基因组学和遗传研究提供了宝贵资源。然而,一两个参考基因组不能充分代表该物种的全面遗传信息,茶泛基因组研究能够整合多个茶基因组的复杂变异,减少参考偏差;发现基因型结构变异(SVs)的优势,有助于解决全基因组关联研究(GWAS)中的“缺失遗传性”的问题。因此,构建茶树核心种质资源的泛基因组,并将其应用于解读关键经济性状的遗传结构,对茶叶遗传学和育种研究具有重要意义。
02 研究结果
① 多个优质茶树品种基因组的从头组装和注释
研究人员从中国、印度、韩国等八个主要茶叶产国搜集了736个山茶品种,形成了3个群组。通过高质量的组装和评估,他们构建了一个包含22个品种的茶树泛基因组群,这代表了中华茶种的遗传多样性。研究者发现这些基因组具有92.8%的Busco平均值,碱基组装准确度可达Q30,以及98.93%的二代数据比对覆盖率。在重新注释基因组时,他们观察到重复序列中LTRs的占比达到50%以上,并注意到LTR在所有基因组中的快速扩张。通过鉴定高质量基因模型,研究者发现茶树基因组中的蛋白编码基因数量比猕猴桃增加了近20%,这主要源于小规模的基因复制,而非全基因组复制。这些发现为深入了解茶树基因和物种演化提供了重要信息。
22个不同品种的茶树泛基因组构建
② 茶基因组的结构变异(SV)与转座子(TE)的深度剖析
通过21个基因组与参考基因组(TGY)的比较分析,研究人员鉴定到分布在15条染色体上的887,986个SV,包含435,505个缺失,421,642个插入,6,595个重复和24,244个倒位;其中,79.8%的SV与各自区域中的转座子TE重合,二者之间具有显著的相关性,这些结果暗示,转座子在驱动结构变异方面发挥着重要作用。茶树泛基因组等位基因分析表明,茶树泛基因组拥有29.8%的core基因,43.9%的Shell基因,以及26.3%的private基因。此外研究发现超过30%的结构变异对蛋白质编码基因产生了显著影响,受SV影响的高表达基因的比例要高于不受SV影响的基因,这表明,部分SVs可能有助于激活茶树中的转录过程,促进基因表达。
茶基因组的结构变异(SV)分析
③ 结构变异对茶树不同叶片颜色的影响
研究人员结合转录组和代谢组研究,进一步探究了结构变异SV对茶树叶片颜色的影响。研究发现,茶树不同品种之间的叶片颜色差异可能归因于与叶绿素和玉米黄质等途径相关的基因发生的结构变异(SVs)。通过对相关基因进行序列比对,发现在关键酶中存在多个SVs,可能影响叶绿素和其他代谢物的合成。其中,‘AJBC’和‘HJY’品种的GluRS基因显示了反密码子识别结构的缺失,可能导致谷氨酰-tRNA合成酶功能受损,从而影响叶绿素合成。此外,CYP97A3基因在不同叶片颜色的样本中显示出各种突变,这可能影响底物结合能力,进而影响玉米黄质的积累。在对紫叶样本的研究中还发现了与类花青素生物合成途径相关的基因表达上升和转录因子基因的插入突变,这可能是紫色叶片产生的原因。这些研究结果揭示了结构变异在茶树叶片颜色调控中的潜在作用。
结构变异影响茶树的叶片颜色
④ 茶树泛基因组GWAS挖掘
该研究利用茶树泛基因组进行早芽萌发阶段(EBF)的GWAS研究。在155个重测序个体中,研究人员发现了35个与EBF特性显著相关的SNP,其中,有三个SNP与之前定义的38.45 Mb的性状位点(qSPI4)重叠,SNP关联进一步细化了该区域,同时还鉴定了额外的25个潜在蛋白编码基因。此外,通过基于SV分子标记的泛GWAS分析,研究人员在特定基因座内发现一个结构变异(SV)与DREB2A-like基因相关,这可能在控制EBF特性中发挥作用。与传统SNP-GWAS相比,SV-based GWAS能够发现新的与EBF特性相关的基因组区域。总之,这种泛GWAS揭示了与EBF相关的多个SV,其中一些SV会影响与休眠相关的基因,这些发现强调了基于SV的泛GWAS研究在探究茶树遗传并定位功能基因的有效性。
茶树泛基因组GWAS挖掘
总结
本文通过对22个典型茶树品种的基因组测序和泛基因组组装及构建,揭示了茶树基因组的庞大复杂性,强调了泛基因组在揭示关键基因方面的优势。研究发现茶树基因组中蛋白编码基因数量之多超过预期,主要源于小规模的基因重复,并强调了结构变异在叶片颜色调控和早芽萌发等复杂性状中发挥的关键作用。总之,这一研究推动了对茶树进化和遗传学的深入理解,为茶树产业的可持续发展和改良提供了科学依据,也为其他非模式植物的基因组研究提供了启示。