从“黑匣子”到“导航图”:西瓜基因组“三级跳”的创新闭环。 回顾过去3个7年,并未感到漫长,反而感觉时间过得太快。5月5日,北京市农林科学院研究员许勇团队联合美国康奈尔大学教授费章君团队在《自然—遗传》发表了西瓜泛基因组研究成果。3个7年,3篇发表于《自然—遗传学》的论文,他们完成了三级跳。
从2012年率先绘制西瓜全基因组参考图谱,到2019年构建西瓜变异组图谱,再到2026年最新发表的群体水平超级泛基因组研究成果,他们用三篇高水平论文,系统揭示了西瓜进化的基因组奥秘,为西瓜分子育种和精准设计提供了系统性解决方案,为分子育种奠定了坚实的理论基础。
利用瓤色功能基因标记高效创制多彩瓤色京彩系列西瓜新品种。受访者供图
论文通讯作者许勇告诉《中国科学报》,这项研究的最大价值,不是发了顶刊,也不是拿了专利,更不是推广了多少亩面积——而是系统地通过可验证的科学发现,创造出可转化的技术工具,最终兑现为产业进步和民生改善的完整创新闭环。
从零起步的蓝图:跨越二十年的科学接力
1994年,许勇在北京市农林科学院蔬菜研究中心开始独立组建西瓜遗传育种团队。彼时,国内西瓜育种主要依靠传统经验,分子育种技术几为空白。基因组是一个物种的遗传密码,破译了它,就意味着打开了这一物种生命活动的‘黑匣子’!许勇回忆道。然而,在21世纪初,完成西瓜全基因组测序,对当时技术和经费都匮乏的国内团队而言,几乎是天方夜谭。
转机出现在国际合作与技术进步中。2002年,许勇赴美访学,结识了国际同行,并开始为基因组研究做技术储备。2005年,他作为中国代表参与了国际葫芦科基因组计划的筹划。但真正着手西瓜全基因组测序研究,是2008年在同行的鼓舞下,许勇团队在没有国家级项目支持、缺乏经费和生物信息分析人才的三无困境下,毅然启动了西瓜基因组测序工作。
最初筹措来的几百万元启动经费,来自先正达、瑞克斯旺等国际种业巨头,这既是产业界对基因组信息的渴求,也是对团队潜力的认可。研究后期,他们又凭借实力得到了十二五科技部基因组专项支持。
最大的挑战,是缺乏生信技术分析人才。许勇坦言。测序过程一波三折,曾遭遇样品污染被迫重测的困境。关键时刻,费章君团队的加盟,弥补了生信分析的短板。通过与费章君团队合作,他们培养了一批生信技术分析人才,为后续开展功能基因组、分子辅助育种以及基因编辑技术研究奠定了良好人才与数据基础。
最终,2012年,全球首个西瓜基因组参考图谱成功绘制并登上《自然—遗传学》,这第一跳解决了西瓜基因组是什么的根本问题,首次完成了最具代表性的20个西瓜材料的重测序,也确立了中国在该领域的领先地位。
但这仅仅是开始。许勇说,这是一个有规划有目标推进的过程。在第二个7年中,中国农科院启动了西瓜与甜瓜重测序项目,两个研究团队商量决定合作整合数据。2019年西瓜与甜瓜基因组重测序的2篇研究论文在《自然—遗传》同期发表,期刊还同时发表了《甜蜜测序》的评述文章。
第二跳完成了对全球414份栽培和野生西瓜种质进行重测序,构建了变异组图谱,旨在回答不同西瓜之间基因组位点有何差异的问题,为挖掘关键性状基因奠定基础。
彼时,测序技术不断完善,端粒到端粒(T2T)全基因组装解析西瓜结构变异显得十分重要,期间有多家实验室也发表了西瓜T2T基因组。当时我们下一个目标,就是更加全面地将西瓜属全部种以及有广泛代表性栽培西瓜品种的结构变异一网打尽。许勇说,今年发表的论文构建了西瓜超级泛基因组,就是期望挖掘西瓜全基因组所有遗传变异,以提高分子育种的高效精准度。
研究重心的转变,清晰勾勒出从基础认知到应用赋能的路径。然而,从解析一个基因组到分析成百上千个基因组的差异,困难接踵而至。最大的挑战来自于田间。想要准确判断近千份自然群体材料的农艺性状,特别是西瓜的多个品质性状,会由于西瓜材料的遗传背景差异大、采收时间的早晚而直接影响鉴定准确度。论文第一作者、北京市农林科学院研究员张洁解释道。为此,团队历时三年,在北京海淀、延庆和海南三亚三地同步开展表型精准鉴定,为后续基因定位提供了坚实的数据基石。
破解密码与意外收获
我们穷尽了西瓜属全球已有的全部野生种的40份基因型。费章君说,西瓜属目前共有7个种,包括6个野生近缘种与1个栽培种,栽培种中又包括2个亚种。
团队对西瓜属全部7个种的135份代表性种质进行了高质量基因组组装,并结合已发表数据,构建了包含138个基因组和914份重测序数据的超级泛基因组,首次近乎完整地绘制了西瓜属的遗传变异全景图。
这项庞大工程的首要成果,是破解了困扰学界多年的西瓜起源之谜。此前,关于栽培西瓜的野生直接祖先存在多种假说。
费章君介绍,2021年德国著名植物分类学家Susanne S. Renner教授提出Kordofan是西瓜直接祖先。2024年发表的西瓜泛基因组研究中测序了1个Kordofan西瓜,发现其不能覆盖栽培西瓜的所有变异,于是人们又提出多祖先假说。
这次我们扩大Kordofan西瓜样本后发现,其变种完全覆盖了栽培西瓜的基因组变异,并不来自其他物种,不支持‘多祖先’假设。论文共同第一作者、康奈尔大学博士生孙宏贺说,Kordofan西瓜与栽培西瓜在大约4900年前分化,与考古驯化时间完全吻合;而另一个西瓜的候选直接祖先早在12万年前就已分化,时间对不上,进一步验证排除了其作为直接祖先的假说。
费章君说,这一研究明确了西瓜驯化单一起源于苏丹西部的科尔多凡(Kordofan)地区及达尔富尔(Darfur)一带。进一步在该地区收集、评价西瓜最直接祖先的资源材料,将有可能挖掘出一批有价值优良基因育种资源。他说。
除了厘清历史,超级泛基因组更像一座基因金矿,让许多过去遗失在野生种中的宝贵基因重见天日。他们在野生种中鉴定出34个新的抗病基因,为西瓜抗病育种提供了全新的抗性武器库。
更让团队兴奋的,是一个关于西瓜瓤色深浅的美丽意外。
红黄两类西瓜品种中,瓤色由浅到深排列的代表性品种。受访者供图
西瓜瓤色,从淡红到大红,深浅不一,其调控机制曾是谜团。在阐明西瓜肉质不同颜色的分子机制以后,我们发现育种中,要想用肉眼分辨同一颜色的深浅非常困难,且深受环境影响。消费者青睐鲜艳颜色,产业也有需求。张洁说。在尚未完成泛基因组测序之前,他们就专门设立了研究瓤色深浅的课题。
意想不到的是,通过泛基因组研究,他们发现不同瓤色深浅的品种中存在西瓜瓤色深浅控制基因的1~4个拷贝的串联重复。随着拷贝数的增加,基因表达量提高,瓤色也随之加深。孙宏贺说。这个发现完美解释了瓤色深浅的连续变异。
没有超级泛基因组信息,是不可能获得如此完整的拷贝数变异图谱的。许勇强调。更引人深思的是群体遗传分析结果:多拷贝等位基因在驯化过程中频率显著增加,在现代品种中占比过半,且3拷贝比2拷贝更普遍。这清晰反映了人类在育种过程中对深瓤色的持续选择和偏好。许勇说。
这个发现不仅有趣,而且立刻转化为可转化的技术工具。团队已利用此变异开发分子标记,并成功培育出一批瓤色深红且稳定的新品种,解决了早春低温导致瓤色浅的产业痛点。
闭环创新:当科学发现照亮田间地头
什么是完整的创新闭环?许勇说,发好论文是提高人类对自然的认知能力,获得专利与登记保护品种将这种认知变成可以应用的技术,再通过技术创制出可以帮助瓜农增收与满足人民对美好生活向往的西瓜品种,这才最终体现基础研究的价值。
但很多基础研究的价值,再刚开始研究时往往并不清楚其真正的实用价值,需要时间不断沉淀与技术不断更新。能完成从基础研究——技术创新——品种创制全链条,其本身就代表未来农业高新技术创新的新范式——科技创新与产业创新融合发展。许勇团队3个7年的坚持,动力正来自于这个不断运转的闭环。
团队从一开始就将产业需求作为创新使命。在2012年第一篇基因组论文尚未发表时,他们就已开始搜寻与品质、抗病相关的关键基因位点,并敏锐地意识到,将理论转化为技术的关键卡点在于高通量基因分型平台。于是,他们率先引进了先进的基因分型设备,并派人赴海外学习,快速建成了高效运行的分子育种实验室,确保了基础研究的成果能无缝对接到育种实践。
张洁对此深有体会:我们瞄准西瓜冬春季在东南亚大面积种植,急需优质、抗病、耐贮运品种的产业难题,通过前景与背景选择技术结合,仅用3年就快速选育出高糖、脆硬、抗病的材料,培育出‘京美10K’系列品种。该品种已成为简约化生产的标杆和东南亚冬季生产的主栽品种。
从发现一个基因,到开发一个标记,再到培育一个品种,这条路径在团队中已高效运转。例如,通过解析瓤色基因,他们利用标记辅助选择育成了富含β-胡萝卜素的京彩系列西瓜,引领高端消费市场。借鉴西瓜成功经验,他们又将分子育种体系拓展到甜瓜,培育出适应华南冬季生产的都蜜5号哈密瓜,成为东移南进技术的典范品种。
据统计,基于这一系列基因组研究成果开发的分子育种技术,显著提高了育种效率,选择准确率超过95%,育种周期由9代缩短至6代。团队培育的京欣、京美、都蜜系列品种累计推广超过3233万亩,科技支撑我国西甜瓜品种国产率超过98%。
谈及如何平衡前沿探索与产业应用,费章君表示:合作始于共同的目标。我们康奈尔团队擅长计算生物学和基因组学分析,许勇团队对西瓜生物学和产业需求有深刻理解。这种互补让我们能从最前沿的技术出发,解决最实际的问题。
现在年轻一代正处于生物技术、信息技术与人工智能大爆炸的新时代,以前不敢想象的应用场景都将有可能实现!许勇说。(来源:中国科学报 李晨)
相关论文信息:https://doi.org/10.1038/s41588-026-02598-8
作者:许勇等 来源:《自然—遗传》