近期,西北农林科技大学姜雨团队在Genome Research发表了题为“A sheep pangenome reveals the spectrum of structural variations and their effects on tail phenotypes”的论文,该研究基于PacBio HiFi 测序技术,对15个不同基因群体的绵羊基因组进行注释,建立了绵羊泛基因组,发现了大量的绵羊新基因和结构变异,并揭示了羊尾形特征的变异机制。这一成果揭示了绵羊泛基因组的丰富性和多样性,为绵羊基因编辑,哺乳动物表型变异研究和品种选育提供了重要理论参考。
BOB半岛·综合体育提供三代PacBio HiFi建库测序服务。
研究背景
结构变异(SVs)指基因组上大于50bp的大尺度核苷酸序列变化或位置变化。与单核苷酸多态性(SNP)相比,它们可能在基因区域和调控区域引起更大规模的变化,进而影响基因表达和生物表型。
绵羊是被驯化的家畜之一,对经济发展和文化研究具有重要意义。尽管部分绵羊表型特征(如羊毛颜色、羊毛变化等)与结构变异(SV)的相关关系已经被报道,但绵羊SV谱系中仍然存在大量的未知。
研究材料
欧洲、东亚、中东和非洲等地区的649只绵羊中的15个不同绵羊品种
研究结果
研究人员从649只绵羊中选择了来自欧洲、东亚、中东和非洲等地区的15个不同的绵羊品种,它们涵盖了约87.1%的常见SNP。基于PacBio HiFi测序技术,结合hifiasm生信分析工具和BUSCO评估,研究人员组装了这15个绵羊品种的高质量基因组,其中Gap数少于100的基因组占比高达80%,每个基因组平均含有1513个Contig,平均Contig N50长度为68.8Mb,这些基因组补充了原有参考基因组中约82.1%的缺口。
15个绵羊基因组的从头组装
结构变异(SV)是决定家畜表型变化的重要遗传变异类型。研究人员基于三代PacBio HiFi测序技术和图结构泛基因组方法对这15个绵羊基因组的SV进行解析。研究人员检测到149,158个双等位基因插入/缺失和丰富的复杂变异,包括6531个不同等位基因和14,707个多等位基因的变异,这些SV总共贡献了130.3 Mb的非参考序列,其中包含72.5%的TE重复序列,SV的总体验证率为94%;通过这些SV,该团队首次揭示了一个包含骨髓相关分化标记(MYADM)的不同基因座的完整序列;此外,研究人员还发现,SV的数量随着自身长度的增加而减少,且由于负选择作用,SV在非翻译区 (UTR)、编码序列 (CDS) 和调控元件(H3K4me3、H3K27ac)中的占比较低。
绵羊中的结构变异
绵羊的尾巴对于物种驯化、环境适应和实际生产应用具有重要的意义,但其深层的突变机制仍未明确。因此,基于泛基因组SV分析和全基因组关联分析(GWAS)技术,研究人员对绵羊尾巴的长短和粗细的变异机制进行深度剖析。对649只家养绵羊中长尾品种和短尾品种的SV进行种群分支统计(PBS),结合Hu sheep × East Friesian的杂交种的GWAS数据,专家发现168bp插入片段的周围区域与尾长高度相关,且在反刍动物中较为保守。对8个肥尾品种和10个细尾品种绵羊进行PBS分析,鉴定到与尾肥性状相关的基因区域中包含6个高度高度分化的dSV(PDGFD基因和IBH区域),且这两个区域中的这些SV可能是决定尾肥性状的关键候选突变位点。
绵羊尾巴变异机制
研究总结
该研究通过三代PacBio HiFi测序技术和图结构方法构建一个包含15个不同的绵羊品种的高质量泛基因组图谱,并通过结构变异(SV)分析揭示了绵羊基因组的复杂性和多样性。基于PBS分析和GWAS技术,研究人员进一步剖析了绵羊尾巴长短和粗细的变异机制,发现了与这些性状相关的基因区域中的关键候选突变位点。这些发现有助于进一步理解绵羊基因组的演化和驯化过程,为绵羊育种和改良提供了基础数据和新的方向。此外,该研究的技术和方法对于研究其他动物的基因组和复杂性状也具有一定的参考意义。
参考文献
Li, Ran & Gong, Mian & Zhang, Xinmiao & Wang, Chunna & Yang, Peng & Jiang, Yu, et al. (2023). A sheep pangenome reveals the spectrum of structural variations and their effects on tail phenotypes[J]. Genome Research. 33. 10.1101/gr.277372.122.