中国农科院基因组所发布首个茶树泛基因组图谱

茶,作为世界上最古老的饮料之一,不仅有着令人愉悦的香味,更是承载着千年文化的象征。茶树的种植面积和产量在全球范围内十分庞大,经济价值相当可观,是茶叶出口国和多个发展中国家消除贫困和粮食安全的重要保障。茶树的育种工作也一直备受关注,然而传统茶树一直依赖于对自然变异和有价值的基因型重组的长期选择。如何更加精确、高效地育种一直是茶树育种家关注的焦点。

为此,科学家们提出了利用泛基因组(Pan-genome)辅助育种技术,有望实现更快速地植物性状改良。泛基因组包含更加全面的遗传信息,可以有效降低参考基因组偏差对遗传变异检测的影响。通过该技术,人们能够更全面地了解植物的遗传特性。泛基因组育种方法已经在水稻、番茄等一些常见模式作物上取得了成功,并且正逐渐被应用于小麦、高粱、土豆等非模式作物的遗传改良。

图1|茶的多样性

为了更好地理解茶树的遗传特性和表型多样性,基因组所张兴坦课题组主导,联合国内多家单位成功构建茶树首个泛基因组图谱,完成了22个茶树品种的测序并成功构建茶树泛基因组,并在此基础上揭示了茶树基因组中近期基因大规模扩张的遗传基础,并鉴定了多个参与茶树叶色差异,芽期,香气等多个重要农艺性状相关的遗传变异,为茶树重要基因挖掘和分子设计育种提供了重要参考。研究成果于2023年11月28日以“Gene mining and genomics-assisted breeding empowered by the pangenome of tea plant Camellia sinensis”为题发表在国际期刊《自然植物(Nature Plants)》上。

研究选取了22个能最大化代表茶树遗传多样性和表型多样性的茶树品种,包括大叶茶(C.sinensis var.assamica,CSA),小叶茶(C.sinensis var.sinensis,CSS)和白毛茶(C.sinensis var.pubilimba(CSP))进行测序组装。分析发现,茶树基因组中有高达5万至6万个蛋白编码基因,相较于已发表的版本(1–6),编码基因数目增加了近20%。茶树基因组包含大量的重复序列,其中长末端重复转座子(LTRs)占据了基因组序列的50%以上。茶树基因组一次近期的LTR爆发事件(LTRburst,约30-50万年前)导致蛋白编码基因的迅速扩张(图2)。

图2.22个泛基因组测序的代表性茶树品种。a.736份茶树重测序主成分分析(PCA),揭示其遗传多样性。彩色点图是用于泛基组分析的茶树品种。b.22个代表性茶树品种单拷贝基因(single-copygenes)的系统发育分析。C.sinensis var.assamica(CSA)样品为红色背景,C.sinensis var.pubilimba(CSP)样品为黄色背景,C.sinensis var.sinensis(CSS)样品为浅蓝色背景。右图显示了CSA和CSS的形态学差异。

通过茶树基因组的结构变异分析,发现茶树基因组中的结构变异序列(SVs)大多源自于转座元件(TEs),TE的高度活跃性产生了基因组中大量SV。此外,本研究揭示了SV如何影响茶叶的品质特征,如叶色的多样性。通过对茶树的转录组和代谢数据的分析,发现不同品种之间的叶色差异主要与叶绿素、类黄酮、花青素等相关代谢物的含量有关。通过基因的SV分析,发现了结构变异可能影响相应代谢物的生物合成,从而造成了叶色的差异。比如,MYB114是调控花青素合成的一个重要转录因子,其启动子区域的一段LTR插入是形成茶树紫叶的关键因素(图3)。

图3.影响茶树叶色相关的功能性结构变异。f.CsMYB114的示意图。蓝色矩形表示基因外显子,红色三角形指启动子的一段LTR插入。g.不同叶色品种CsMYB114启动子区域LTR插入的Read深度图。紫叶品种(‘ZJ’,‘JMZ’,‘JGY’)的代表品种以及绿叶茶品种(‘FDDB’,‘BHZ’,‘GH3H’)。

芽期是(TBF)影响茶树的一个关键经济性状,培育早生优质茶树品种是一个重要的育种目标。本研究通过图形泛基因组关联分析(pan-GWAS)深入挖掘了与茶树芽期相关的遗传变异,鉴定出了与早芽萌发相关的QTL(qSPI4)(7)。同时,新发现一个潜在参与早芽性状(EBF)基因CYP72A9(图4)。该研究揭示了pan-GWAS在识别茶叶性状相关遗产变异的有效性。

图4.基于图形泛基因组的GWAS在挖掘茶树TBF性状相关关键基因中的应用。a.曼哈顿图显示了TBF性状的GWAS结果,包括SNP-GWAS和SV-GWAS。b.不同品种间DREB2A-like等位基因的序列比对。具有LBF性状的个体表现为C基因型,而具有EBF性状的样本表现出A基因型。c.遗传变异与染色体4上的EBF性状之间的关联分析。蓝色矩形表示在染色体4上显著标记-性状关联的候选基因区域(227.490–227.520Mb)。d.EBF和LBF品种的DREB2A-like等位基因的系统发育分析。e.一个61kb的结构变异(SV_2_83963),位于CsCYP72A9(TGY012913)的上游。f.群体分析支持CsCYP72A9上游的SV_2_83963与TBF性状相关。

此外,结合图形泛基因组、群体基因组学以及代谢组数据的综合分析,本研究还鉴定到多个影响茶叶风味性状的等位变异,包括儿茶素合成,茶香气合成的核心基因的等位变异,为茶树分子育种改良提供了重要靶标。

茶树泛基因组图谱的构建更新了大众对茶树基因组的认识,包括蛋白编码基因数以及遗传变异对茶树表型的影响。该研究不仅为茶树基因组和重要性状的演化提供新见解,而且为茶树重要基因挖掘和遗传育种提供了重要平台资源和信息,为加速茶树育种进入全基因组设计时代奠定了重要基础。同时也为木本植物的生物学研究提供重要参考。

基因组所博士研究生陈帅、西北农林科技大学王鹏杰教授、基因组所孔维龙副研究员以及客座硕士研究生柴琨为论文共同第一作者,基因组所张兴坦研究员、福建农林大学叶乃兴教授和广东省农业科学院茶叶研究所吴华玲教授为论文共同通讯作者。此外,博士研究生张晟铖、王毅斌、余嘉鑫、高莹莹、蒋梦薇、雷文龙、王文玲、陈晓、屈伸洋、王芳、王英豪、谷梦雅,以及基因组所博士后张清、广东省农业科学院茶叶研究所方开星博士、中国农科院茶叶研究所马春雷副研究员、福建农林大学孙威江教授也参与了此项工作。该研究得到了广东省重点领域研发计划子项目、深圳市优秀青年科学基金、国家优秀青年科学基金的资助。

来源:中国农科院基因组所,信息贵在分享,如涉及版权问题请联系删除

暂无评论