中国科学报他们凭什么二刷这个难题并让自然再次发表
中国作物科学研究所研究员张学勇研究了一辈子的小麦。临近退休,他却为中国小麦基因组研究的现状担忧起来。
2020年,加拿大学者领衔多国科学家在《自然》上发表了国际小麦泛基因组计划(10+),其涵盖的品种均为欧洲、CIMMYT和北美品种,远远不能代表世界第一小麦生产国——中国的小麦品种多样性。
在张学勇心中,关于小麦还有很多未解之谜。他决定带领自己的团队内外学者做一份更高质量的小麦泛基因组参考图谱。
北京时间2024年11月28日,《自然》再次发表小麦泛基因组图谱,这项研究来自张学勇和他的合作者。他们从头组装了中国17个代表性小麦品种染色体水平的高质量基因组,并揭示了小麦品种与人文、环境协同进化的基因组基础。
被全球小麦界奉为金标准的中国地方品种
关于小麦,吃着面食长大的甘肃人张学勇有讲不完的故事。他在课堂上、组会上,总是能从这些故事讲到小麦遗传学的科学问题上去。
“‘中国春’是一个非常古老而重要的小麦地方品种,被广泛应用于小麦遗传学研究。”张学勇说,大约在上世纪初,“中国春”传到了英国,当时被称为“中国白小麦”,后来传到美国和加拿大,并被称作现在的名字——“中国春”。由于“中国春”很容易与黑麦杂交,育种家获得了抗病性很好的小麦—黑麦。后来又获得了单体、三体和缺-四体材料,成为广泛用作小麦遗传学研究的核心,即“中国春”非整倍体系列,也使“中国春”成了众所周知的小麦遗传学和外源基因转移等研究的工具和桥梁材料。
科学家研究认为,“中国春”是四川成都平原的著名地方品种“成都光头”的一个选系。
“由于它的重要性,‘中国春’被选为小麦参考基因组。”张学勇说,小麦是异源六倍体,含有三个功能相似、染色体间可发生互换的亚基因组(A,B,D),基因组极其复杂,其大小约为人类染色体的5倍。在国际小麦基因组测序联盟(IWGSC)的牵头下,20余个国家、70多家机构、200多位科学家,花费15年时间才破解“中国春”基因组。
2018年,由澳大利亚莫道克大学教授R. Appels领衔的“中国春”小麦参考基因组发布,中国科学家完成了其中半条染色体的测序工作。
“参考基因组的完成让科学家对小麦的认识跨上了一个新台阶。”张学勇拿着已故中国科学院院士庄巧生主编的《中国小麦品种及其系谱》说,这本书非常全面准确的记录了中国小麦品系的演变和亲本关系,是我国老一辈科学家留下的一份财富。然而,还很少有研究从基因组学的角度来客观阐述小麦育种规律。
正如庄巧生所说,目前的育种有技术加经验,也有一些目前看来尚属于心领神会、难以言传身教的艺术成分。
如今,基于规模化品种的重测序成为系统解析优异种质资源和重大品种形成和演变的重要技术和方法,为从新的角度分析和认识育种中的规律提供了可能。张学勇当即开始对照“中国春”基因组,对145个中国小麦品种进行重测序。
小麦种质资源表型鉴定。张学勇供图
冲锋:高质量的小麦泛基因组
焦成智就是在诺禾致源公司承担该测序项目时认识了张学勇老师。
短短两年时间,他对张学勇信手拈来的各种小麦典故着了迷。“我觉得研究小麦既有趣,又有挑战性。它的基因组很复杂,是几大粮食作物里基因组学研究进展最缓慢的一个。”
张学勇一直对焦成智的工作赞许有加,这让焦成智倍感信任,“张老师不给我压力,我反而不由自主地想把项目进度往前赶”。
通过对145份不同时期小麦代表性品种进行重测序,他们构建了高密度的基因组变异图谱,揭示了过去70年我国小麦育成品种基因组重塑和优化的过程。
然而,在重测序数据中,总有一些片段无法比对到“中国春”参考基因组上。这个问题不但让张学勇感到意外,也让焦成智非常好奇。
2019年夏天,论文完成并投稿到《分子植物》(Molecular Plant)。焦成智下定决心今后要选择小麦作为一辈子的研究对象。一天傍晚,他给张学勇打了电话,表达了想在张学勇团队读博的愿望。
“张老师在电话里非常激动,他很高兴我愿意加入,可能是因为他的团队一直缺少生物信息学的专业成员。”焦成智说,当时的他并不知道,快要退休的张学勇在已经没有招生名额。
打了一圈电话后,张学勇高兴地告诉焦成智,南京农业大学王秀娥教授忍痛割爱,同意提供一个联合培养的博士生名额。就这样,焦成智在2020年辞去工作,成为了张学勇和王秀娥老师的博士生,开始探索他好奇的问题。
“一个品种并不完全拥有小麦的所有基因组信息,需要对一批具有代表性的品种或资源基因组进行从头组装,才有可能获得一个物种基因组变异的全部信息,即泛基因组。”张学勇说,当他们决定从145份小麦品种中挑选出最具代表性的一些品种来完成高质量的小麦泛基因组时,意想不到的事情发生了——《自然》杂志发表了加拿大等国科学家联合完成的国际小麦泛基因组计划(10+),但中国科学家只是以国外科研单位或大学工作人员身份参与其中。认真读完这篇论文后,张学勇不慌了。
首先,泛基因组计划(10+)中有10个品种组装比较完整,比较粗旷,但显示了小麦中大量结构变异的存在。其次,10+项目所涵盖的品种大多为欧洲和北美品种,其中的“中国春”并不能代表中国的育成品种。张学勇在前期研究中已经发现,中国小麦育成品种的多样性高于全球其他发达国家品种的多样性。
“这是由于我国小麦商业化育种发展相对较慢,一定程度上保留了品种的遗传多样性,维持了小麦品种较高的韧性。”张学勇说。
中国作为世界第一小麦生产、消费大国,也是小麦育种大国,过去70年中小麦品种的产量水平提高了6~8倍,育成国审品种约3500个。这是巨大的种质资源宝库。“研究中国小麦品种育种过程中基因组的变化,无疑将提供一个很好的基因组与育种相结合的样板。”张学勇说。
张学勇的导师是我国作物种质资源学科的主要奠基人、中国工程院院士董玉琛,一位用半生收集作物种质资源的女性。张学勇把导师的大照片挂在办公桌对面的墙上,只要一抬头就能看到她含笑的眼睛,就好像导师还在默默勉励着他。
张学勇团队在国家作物种质资源库前。张学勇供图
带领合作者和团队集智攻关
考虑到品种的历史性、区域性、对当前育种的可参考性,张学勇团队从145个品种中选出了17个有代表性的品种,进行三代测序组装,包括2000年以后的川麦42、周麦16、周麦22、济麦22,上世纪十年代的宁春4号、小偃6号、扬麦158,还有上世纪五六十年代的著名品种北京8号、西农6028等。张学勇能如数家珍般地说出这17个品种是谁在哪里育成的,有什么特征,为何有代表性……
焦成智负责组装工作,材料提供给测序合作者后,进入了长达一年多的等待期。“这段时间我们没有闲着,通过分析以前得到的一些数据,对以往课题组创造的材料及相应的表型和芯片扫描数据联合分析,总结提出了一种能兼顾育种和基因组研究、基因定位克隆的群体构建方案。”焦成智说。
张学勇在国际动植物基因组学年会上认识了澳大利亚莫道克大学教授Rajeev K. Varshney。他是植物、特别是豆类作物基因组研究的领军人物。张学勇给他发了一份邮件,提出请他修改润色那篇准备投稿到《植物通讯》(plant communications )的论文。
Varshney对论文中提出的育种策略表示充分肯定,主动提出与张学勇合作研究。
然而,17个高质量染色体级别的基因组数据量何其庞大,后续要开展的分析工作头绪很多。
小麦从中东的新月沃土地区的野草,逐渐变身为全球最成功的作物,到底经历了什么?它是如何适应人文和自然环境的变化的?小麦品种分化的核心区域在哪里?到底是先有冬小麦还是先有春小麦?为什么我国小麦籽粒呈现北“硬”南“软”的特征?这些问题是张学勇一直想要回答的,也是国际上小麦基因组研究的热点。
如果只靠一个团队的力量去解决这些问题,在庞大的数据面前仿佛“大海捞针”,进展非常缓慢。
“我感觉进入一个瓶颈期了,有一段时间组会上听不到太多新的进展。”张学勇觉得是时候引入新的力量推进这个项目了。
他对焦成智说,中国农业大学农学院教授郭伟龙在北京邮电大学和清华大学学习的是计算机和信息学,现在从事小麦基因组解析与种质资源演化研究。他不仅专业对口,而且为人谦和,应该能一起干事情。
焦成智特别支持导师的动议,“只要是愿意一起分享成果和技术的,我们都愿意合作”。
在张学勇给郭伟龙打电话前,二人只有一面之缘。但是电话里,不到两分钟的时间,郭伟龙就爽快的答应和他们一起做小麦泛基因组的解析工作。放下电话,他就将这项工作交待给了自己的博士生谢小明。
“郭老师团队加入后,我们的进度立马加快了。”张学勇说。有一次,他让谢小明分析小麦春化基因VRN-A1拷贝数变异情况。不到一周,谢小明就交出一张漂亮的图,上面显示了17个品种中春化基因的拷贝数以及对应品种是春性还是冬性。
结果发现,小麦的祖先种如野生四倍体、栽培四倍体完全是“春性”类型,基本只携带一个拷贝;而普通小麦中出现“冬性”突变,拥有2到3个突变后的VRN-A1拷贝。
现代品种的拷贝数明显比老地方品种要少,这解释了地方品种和现代育成品种对环境变化的高度适应性及遗传基础,也为小麦为何能在全球分布如此广泛提供了新的见解。
团队成员在中麦66繁殖田中。张学勇供图
激动人心:在国际小麦大会上收到论文接受通知
张学勇团队的成员90%以上是北方人,他们对小麦制作的面食有一种天然的喜爱。
年轻时的张学勇,走南闯北地做实验,一大爱好就是业余时间走街串巷挖掘地方美食,去到哪里都要找一碗当地最好吃的面条尝尝。“北方人喜欢吃锅盔、咀嚼感很强的面条,而东南居民喜欢松软的面食。”张学勇总结了一句话:北硬南软,西烤东蒸,一碗面条横扫天下。
西北面食锅盔和切开后的孔隙结构。张学勇供图
“切开西北的面食‘锅盔’,可以看到里面的结构致密多孔,和西方的面包差不多。”张学勇认为,小麦从西方传来中国后,加工成面粉并烤制食用的习惯渐渐在北方流行起来。而喜欢把小麦籽粒当“饭”吃的习俗随着战乱“迁往”了南方。
他们的研究发现,小麦籽粒硬度是影响面团结构的重要遗传因素,它受Ha基因座两个基因同时控制。当其中任何一个基因突变或丢失,品种籽粒就会变硬,更适合制作烘焙类食品;反之更适宜于加工比较松软的馒头、蛋糕等食品。
“西北有一个用了几十年的品种——宁春四号,就是典型的Ha基因缺失品种,用它磨出来的面粉叫做雪花粉,西北人就爱用它做面食。”张学勇说,我国西北、华北小麦品种含Ha基因突变的频率显著高于东南、西南地区小麦品种。“可见人们对面食的偏好很大程度上潜移默化地影响着本地区小麦育种对Ha基因型的选择,当然籽粒的软硬与气候也有很大关系”。
他们还发现,在染色体着丝粒附近区域结构变异的积累显著影响了基因组的重组,这一现象今年在人类基因组研究中也有发现和报道。
来自于黑麦的1RS染色体为小麦提供了重要的抗白粉病、条锈病基因,同时也增加了个体的根量,增强了水肥吸收能力,为小麦产量的提高做出了重要贡献。他们发现,这一外源染色体片段在小麦中不是一成不变的,而是快速调整和进化。
一个个分析结果陆续完成。“我们这个团队里有非常多优秀的年轻人。大家一起合作,让论文写作和投稿都比较顺利。”张学勇说,助理研究员谢玉心博士可以在组会讨论时用英文实时记录,会后一边照顾刚满月的千金,一边进行讨论记录和初稿的整理和起草;莫道克大学教授V. Garg英文水平很高,她把文章润色得非常得体;中国农业大学博士后王梓豪针对第一次评审意见,完成了长达30多页的答复初稿……
《自然》杂志编辑看到这篇论文后说,这项研究不仅解答了中国小麦育种科学发展的历程,也回答了欧洲科学家极为关注的问题——小麦是如何传播到全世界的。
就在论文投稿后几个月,英国科学家也向《自然》杂志投稿小麦泛基因组。但由于张学勇团队在先,他们转投《自然》子刊。“如果不是我们当初和郭老师团队合作,不可能在三年内完成这项工作,也就很可能被英国科学家抢了先机。”焦成智说。
2024年9月,第三届国际小麦大会在莫道克大学举办。张学勇、郭伟龙和焦成智一同参会,他们在大会上介绍了小麦泛基因组研究的进展。但作为东道主的Varshney提醒他,别在大会上说论文已经进入最后的审稿流程。
演讲结束后,张学勇接到组委会发来的邮件,邀请他参加第二天的闭门会议。“这个会议是邀请制,只有全世界小麦研究最前沿的科学家才能参与。以前我们很少参加过。”张学勇说,会上大家讨论了小麦研究今后的重点方向,张学勇的工作成为大家关注的焦点。
参加第三届国际小麦大会,从左至右依次为:郭伟龙、焦成智、张学勇、Varshney、Chitikineni、Garg。张学勇供图
当天晚上11点半,Varshney收到了《自然》编辑部接受论文的手机短信。他激动地打电话告诉张学勇、郭伟龙、焦成智和所有参与此项研究的年轻人。
“那天我们在群里抢‘红包’庆祝。”张学勇说,未来,他们将绘制全球小麦基因组结构变异图谱及关联的育种性状,并推动这项基础研究的相关成果走向育种应用。
论文发表之际,中国工程院院士、中国农业大学校长孙其信说,这项工作构建了迄今为止规模最大、质量最高的小麦泛基因组,是在2020年国际小麦10+基因组计划完成后的一项新的里程碑式的工作。这一工作成功解读了小麦广泛环境适应性和品质形成背后的“基因密码”,所揭示的丰富结构变异反映了小麦基因组高度的可塑性。该研究是近年来作物学研究与大数据交叉融合攻关的范例,再次证明我国在麦类基因组学领域处于国际领先地位。
中国工程院院士刘旭说,这项成果标志着我国小麦的前沿基础研究从跟踪、学习,逐步迈入世界领先水平。该文的发表必将推动我国作物种质资源的研究正式进入大数据时代,加速重要基因的挖掘与利用研究。
相关论文信息:
https://www.nature.com/articles/s41586-024-08277-0
(单位: 中国作物科学研究所)