2019年10月16日,由中国农业科学院作物科学研究所、中国科学院遗传与发育生物学研究所、国际玉米小麦改良中心等单位多名科学家在Plant Communications 发表了题为Enhancing genetic gain through genomic selection: from livestock to plants(通过基因组选择提升遗传增益:从畜牧到植物)的综述论文。文章系统地阐述了将率先在畜牧中大规模应用的基因组选择扩展到植物育种所面临的机遇和挑战。作者评述了基因组选择的相关策略,包括田间和环境管理、最优模型构建、降低成本、平台和网络建设、开源育种和跨学科途径等。
植物育种的进程一般用单位时间内遗传改良的速度,即遗传增益来评价。为满足日益增长的人口对植物产品的需求,育种家需要在未来进一步加快植物遗传改良的速度。然而,动植物的许多重要经济性状都是由多基因控制的数量性状。控制性状的基因数目较多,但每个基因的效应较小,且基因之间、基因与环境之间存在复杂的互作关系。因此,适合主效基因的常规遗传改良策略,包括基因克隆和转移,很难直接用于微效多基因所控制的性状。可供选择的途径之一就是利用覆盖全基因组的分子标记去捕获分布在基因组不同区域的微效多基因座位及其所包含的遗传单倍型,从而通过标记辅助的选择将有利的等位基因及其单倍型聚合在一个目标个体中,实现复杂性状的遗传改良。聚合有利基因及其单倍型的分子育种策略之一就是基因组选择(genomic selection)[1]。
基因组选择就是利用基因组上均匀的分子标记,通过对训练群体的基因型鉴定和表现型鉴定,根据基因型和表现型之间的关系,估计每个标记的效应,建立通过标记的基因型来预测表现型的遗传模型。所建立的遗传模型(包括标记效应)然后用于育种群体的表现型预测, 即根据育种群体的基因型,结合训练群体的标记及其单倍型效应,对育种群体的每个个体进行表现型预测,获得所有标记和单倍型效应的综合值——基因组育种值(GEBV)[2-3]。与传统的分子标记辅助育种不同,基因组选择利用所有测试的标记(而不仅仅是统计学上对表现型有显著效应的标记)进行预测,因而可以捕获全基因组范围的相关遗传变异,从而提高选择效率。
基因组选择的大规模应用,取决于高效低成本的分子标记检测系统和信息分析处理、决策支撑平台。大型家畜,由于单个个体的经济价值比较高、基因组选择可以大大缩短选择周期,因而率先在动植物育种中采用基因组选择,并获得了巨大的比较优势[4]。少数大型跨国种业公司,由于其巨大的规模优势,可以建立起高通量的分子检测、信息处理和决策支撑系统,近年来在植物育种中也采用了基因组选择。但是,在发展中国家和中小种业公司,植物基因组选择的应用还存在很多瓶颈和制约因素。近年来,基因组学、分子检测技术、模拟和预测、实验设计、环境控制和管理、人工智能、信息和网络技术、共享育种平台等的发展,为基因组选择在植物育种中的广泛应用提供了现实可能性。
在本文引言部分,作者首先讨论了进一步提升遗传增益的速度对于满足人类在2050年多生产70% 的植物产品的重要性。随后,回顾了动植物育种中预测方法在分子标记技术的推动下,从最佳线性无偏估计(BLUP)向基因组育种值(GEBV)估计的发展以及基因组选择概念的提出(图1显示了自交植物和杂种优势利用植物基因组选择的基本流程)。最后通过对遗传增益组成部分的剖分,提出通过增加选择强度、拓展遗传变异、改进预测和选择准确性(遗传率)、缩短育种周期等来提高遗传增益。
图1 自交植物和杂种优势利用植物基因组选择基本流程
作者在论文的第二部分系统地比较了畜牧和植物基因组选择在基本特征、平台、训练和育种群体、遗传增益影响因子、育种策略上的差异,分析了植物基因组选择的瓶颈和限制因素。畜牧, 特别是大型畜牧,因为单个个体的价值很高、基因组选择可以大大缩短世代间隔, 因此率先进行了许多重要性状的基因组选择。与传统的表型性状相比,基因组选择极大地提高了遗传增益。然而在植物中, 特别是在公共育种单位和中小育种公司,降低成本成为基因组选择最为重要的先决条件。在植物中,不断更替的大量群体、复杂多变的外界环境、普遍存在的基因型和环境互作,增加了植物基因组选择的复杂性, 并因此受到很多限制因素的制约。
针对以上制约因素,作者在文章的第三部分,重点讨论了改进基因组预测准确性的问题[5],内容涉及五个方面。一是利用高密度分子标记改进预测准确性, 特别是在复杂和遗传变异较大的群体中, 标记密度成为一个基本的限制因素。二是增加训练和育种群体的规模,同时平衡两者之间的关系。随着大量群体信息的累积,训练群体可以得到优化和重组。三是在预测模型中引入标记效应,特别是主效基因相关的标记(包括功能标记),以及全基因组关联分析所揭示的性状-标记关联信息。四是在预测模型中包含基因型和环境互作效应以及非加性遗传效应(显性和上位性等),这涉及到基因-表型模型、与全基因组预测有关的作物生长模型。五是利用其他组学(代谢组学、转录组学等)信息来优化预测模型。在此过程中,通常需要与构建全新或改进的模型相结合。
基因组选择必须与各种现代育种技术相结合才能发挥其最大的潜力[5]。文章的第四部分讨论了如何将基因组选择与现代育种技术相结合的问题(图2)。首先,要利用各种分子技术(包括基因编辑、转基因、前育种技术)为基因组选择释放和创造遗传变异。其次,要通过优化田间管理来改进遗传率的估值,也就是通过控制环境和试验误差以及精准表现型鉴定等,以减少环境变异和方差。其三,增加育种规模和缩短育种周期。DH育种、快速育种、常规的分子标记辅助选择等,均可以用于增加育种规模,包括扩大训练和育种群体。缩短育种周期则有助于提高单位时间内所获得的遗传增益。
图2 植物基因组选择与现代育种技术的整合
基因组选择的大规模应用关键在于发展中国家。文章的最后一部分讨论如何在发展中国家和中小公司通过开源育种网络开展基因组选择的问题。应用规模小、平台建设的投入产出比低下、分析成本高成为发展中国家和中小公司分子育种以及基因组选择的关键制约因子。建立平台、资源和信息共享的开源育种网络可以更加经济有效地开展基因组选择育种。基因型鉴定作为至关重要的决定因子,随着高效、精确、低成本靶向测序基因型检测(GBTS ) 技术的开发[6],可以使基因型信息在不同时间、地点、群体间实现友好交流和共享。国际农业研究机构及其合作伙伴倡导和建立的共享植物育种和基因组信息平台,随着公共数据的日益增加[7],为全世界植物开源育种和基因组选择的提供了范例。
图3 开源育种与基因组选择网络
最后,我们可以期待未来的基因组选择,植物可以与畜牧并驾齐驱。用于基因组选择的信息,将不再局限于单一标记,而是会扩展到单倍型、有利的基因及其网络的区块。不久的将来,相关成本也将不再成为基因组选择的限制因素。
十三年前, 论文的第一作者徐云碧博士加盟国际玉米小麦研究中心, 担任玉米分子育种的高级科学家。他所承担的第一项任务,就是探索在发展中国家和中小种业公司开展分子标记辅助育种存在的瓶颈和制约因素并寻求解决之道。经过近两年的调研和考察,完成了Marker-assisted selection in plant breeding: from publications to practiced 的综合评论,发表在Crop Science上[8]。十多年过去了,该文所讨论的问题以及提出的解决方案,一部分已经成为过去,一部分依然是尚待解决的制约因素, 那就是共享平台和基因型检测的成本。这也是为什么该文这么多年来一直备受关注,期间曾让Crop Science的影响因子在历史上跨过了2的门栏。近几年的年引用频次都在50次以上,迄今已被引用了700多次(图4)。基因组选择,作为分子标记选择育种技术的一种高级形式,目前依然未能达到应有的广泛应用。因此,我们期待这篇论文也会引起国内外同行的广泛关注,并推动基因组选择在植物育种中得到日益广泛的实践。
图4 “分子标记辅助育种:从论文到实践” 一文的引用和影响