2024年4月23日,西南大学家蚕基因国家重点实验室赵爱春团队于Horticulture Research在线发表了题为”Haplotype-resolved Chromosomal-Level Genome Assembly Reveals Regulatory Variations in Mulberry Fruit Anthocyanin Content“的文章,BOB半岛·综合体育为该研究提供三代PacBio HiFi建库测序服务。文章通过基因组、转录组、代谢组、GWAS等多组学联合分析的手段,对桑果花青素含量调控的关键基因和基因变化规律进行深度解析,为桑果遗传规律的探索和新品种选育提供了重要理论指导。
作为桑科的一员,桑树(Morus)在全球范围广泛分布,常见于北半球的热带和亚热带地区。桑果因其美味的口感、醒目的颜色、丰富的营养和较低的热量成为亚洲广泛种植的水果之一。除作为食用水果外,桑树还承载着主食和传统草药的历史传承。从桑果中提取的关键生物活性成分,如花青素和多糖等,已被证实具有各种生物活性,其中,花青素因其益于健康和抵抗衰老的特性受到广大研究工作者的深度关注。
研究人员选择了两个具有代表性的桑树品种ZS5801和ZZB,这两个品种在桑果外观和花青素含量上具有较大的差异。基于高深度的HiFi(98X和73X)和Hi-C(118X和79X)以及大量的Illumina二代数据,构建了2个桑树品种的单倍型基因组,基因组大小分别为293.6-301.3Mb和309-314.9Mb,Contig N50为2.6Mb-8.9Mb。基因组评估表明两个基因组分别具有97%和97.3%的BUSCO,二代数据的Mapping率和覆盖度可达99% 以上。通过注释,研究人员发现,单体型基因组的重复序列分别为151-159Mb和167-172Mb,占基因组大小约50%,基于多种工具和手段,单倍型基因组注释到23,950-24,283个高可信度的蛋白编码基因。综上,研究人员结合二代测序和三代测序获得了具有高精度、完整性和连续性的桑树基因组并完成了注释。
图 两个桑果品种高质量单体型基因组的构建
研究人员选择了拟南芥、榕树、已发表的若干桑树基因组,桑树品种ZS5801和ZZB,基于3,584个单拷贝基因组家族进行比较基因组学分析。研究发现,ZS5801和ZZB的物种分歧大概发生在距今1.84百万年前,其中ZS5801有70个基因家族发生了扩张,183个发生了收缩,这些基因功能主要集中在蛋白泛素化,ATP依赖的酶和防御反应等;对于ZZB有76个基因家族发生了扩张,142个发生了收缩,这些基因与花粉识别、盐胁迫相关。此外,研究人员发现,这两个桑树品种的基因组都未发生全基因组复制事件,但含有较多的TE和LTR类型的重复序列,且表现出种间差异的插入事件。
图 桑树的比较基因组学分析
通过基于GEMMA的线性混合模型(LMM)对112个桑树个体的基因型和表型数据来进行GWAS,研究人员想要阐明桑树果实颜色演化的分子基础。研究人员在5号染色体上定位到1个突出的关联信号,命名为MaVHAG3,MaVHAG3属于VHA亚基G基因家族,在桑树果实成熟期间,其表达显著上调。对MaVHAG3深度剖析,发现一个位于MaVHAG3最后一个外显子的显著SNP变异,与果实颜色变异高度相关。此外,还发现了一个位于MaVHAG3上游启动子区域的5bp Indel,对基因的表达模式产生了影响。RNA-seq和qRT-PCR分析验证了MaVHAG3在桑树果实中花青素积累中的重要作用。综上,MaVHAG3在桑树果实颜色调控中发挥着重要作用,其自然变异是支持这一特征的重要原因,而地理和环境因素可能也对其变异和选择起到了影响作用。
图 果实颜色演化的GWAS分析
通过重构代谢途径,研究人员成功识别了参与果实颜色形成的酶基因。同时比较ZS5801和ZZB的花青素合成途径,预测花青素和黄酮类物质的生物合成酶。为了更深入了解果实颜色调控,研究人员进行了跨越多个发育阶段的多组学调查。通过转录组和代谢组分析,发现ZS5801和ZZB在果实发育过程中呈现出明显的颜色变化,其中ZS5801积累了花青素,而ZZB逐渐降解叶绿素;高花青素产量和低花青素产量样本之间存在显著代谢物差异,特别是在黄酮类物质含量方面;非靶向代谢分析发现了543种代谢物,包括碳水化合物、有机酸和氨基酸等,这些成分对果味产生了贡献。通过分析来自五个果实发育阶段的RNA测序数据,发现18,025个基因在五个组织和两个品种间呈现差异表达。最后,利用确定的花青素途径酶和转录因子,研究人员构建了两个桑树品种的时间序列基因共表达网络,揭示了调控两个品种果实颜色转变的基因调控机制。总之,这些转录和代谢分析的结果为进一步探索花青素的调控机制奠定了深厚的基础。
图 桑果的转录和代谢研究