百合(Lilium spp.)以其迷人、芳香的花朵和营养丰富的鳞茎而被誉为“球根花之王”,具有很高的观赏、食用和药用价值。然而,百合庞大的基因组给高质量的基因组组装带来了挑战。此前该属尚无参考基因组。
兰州百合 南京农大供图
近日,pg电子娱乐平台下载园艺学院教授滕年军团队、副教授薛佳宇团队,联合华中农业大学园艺林学学院教授宁国贵团队与福建农林大学教授明瑞光团队等国内10多家科研团队,公布了百合高质量染色体级别基因组,成为世界上首个正式报道的最大植物基因组。相关文章11月4日正式发表在《细胞》集团旗下的《创新》(The Innovation)上。
该研究创新性地解析了TE扩增和全基因组复制(WGD)对基因组膨胀的影响,发现了超长基因的独特表达模式,并通过多组学整合分析揭示了百合小鳞茎的碳水化合物代谢机制。
国际期刊《园艺学研究》主编、pg电子娱乐平台下载教授程宗明说,这些成果为理解巨型基因组的形成机制提供了新视角,并为百合及其他百合科药、食、观赏多用植物(如川贝母)的基因组研究和分子设计育种打开了大门,尤其是在超大和超复杂基因组组装、多倍化进化和代谢调控机制探索等方面提供了新方法、新思路、新洞见。非常高兴这一研究由中国科学家领衔,联合国际学者协同完成。
生物体复杂性与基因组大小是否相关?
基因组存储了一个物种的完整遗传信息,是理解其生物学特性和进化历程的关键。“自然界中,不同生物的基因组揭示了生命之树上基因组大小的巨大差异,其中一些植物拥有超大的基因组。然而,这些超大基因组的起源和形成机制却不尽相同。”论文通讯作者滕年军告诉《中国科学报》。
由于技术困难和高成本,迄今为止,仅有少数大型基因组被解析。“生物体基因组大小的显著多样性具有重要的生物学意义,但生物体复杂性与基因组大小之间的相关性仍然不明确。”滕年军说,大型复杂基因组的测序和组装因多倍体、高杂合度和高重复序列比例等问题而具有挑战性。
百合(Lilium spp.)是单子叶百合目百合科多年生植物,全世界约115种,其中中国有55个种和18个变种。中国百合的丰富多样性有助于其广泛利用,并为科学研究提供了宝贵的资源。
论文共同通讯作者薛佳宇说,由于基因组远大于其他真核生物,几乎所有的百合物种都可以作为研究生物体复杂性和基因组大小关系的理想模型。
兰州百合(L. davidiivar. unicolor)是唯一可食用的甜百合品种,已在中国兰州种植约150年,为当地农民提供了重要的收入来源。然而,经过长期栽培,兰州百合种性开始退化,降低了鳞茎产量与品质。
如何保存并发扬好我国这一优秀的种质资源,科学家试图从基因的角度找到答案。“我们选择兰州百合进行基因组测序,一是显示中国特色,二是希望获得其巨大基因组的宝贵数据,从而促进其遗传改良和育种工作,为我国百合产业高质量发展提供重要理论指导。”滕年军说。
超大型基因组因何形成?
论文共同第一作者、pg电子娱乐平台下载钟山青年研究员徐素娟介绍,利用流式细胞实验和K-mer分析,他们预估兰州百合基因组的大小分别为38.01 Gb左右,杂合率为2.18%。细胞核型分析显示其为二倍体,具有12对巨型染色体。
随后,结合Nanopore、Illumina和Hi-C数据,他们成功组装得到了36.68 Gb的超大型基因组,96.99%的序列被挂载到12条染色体上。他们注释87501个蛋白编码基因,其中功能注释比率为89.54%。评估结果显示,兰州百合的基因组的高完整性、准确性和连续性。
这个百合基因组是2000年破译的人类基因组的10倍以上,是迷你小巧的拟南芥基因组的293倍。
为什么百合会形成超大型基因组?薛佳宇说,基因组大小的主要影响因素包括重复序列的积累和基因组多倍化。在兰州百合基因组中,重复序列占比高达88.31%,其中长末端重复反转录转座子(LTR-RTs)占64.40%。
分析显示,兰州百合的长末端重复反转录转座子在近五百万年以来发生急剧扩张。约165万年前和约89万年前,分别爆发了两种扩张,其中的一些转座子甚至发生了特异性的快速扩张。这些扩张对异染色质区域有偏好,抑制重组,降低长末端重复反转录转座子去除率,从而造成短时间内长末端重复反转录转座子的海量插入且无法去除,形成了兰州百合超大的巨型基因组。
“全基因组复制也是基因组扩张的潜在原因。”论文共同通讯作者宁国贵说,百合经历了两轮全基因组复制事件,与金钱蒲、芦笋等植物的共线性分析支持了这一结论。基于核基因的系统发育分析,将百合置于天门冬目的姊妹群,两者分化于7200万年前。基于此系统框架,尽管近缘的洋葱和大蒜都额外多经历了两轮全基因组复制,它们的基因组却不到兰州百合的一半大,表明百合在进化过程中展现出与它们不同的模式。
特有的基因形成和表达规律
“兰州百合基因组中的长基因非常常见。”宁国贵说,其平均长度为57.61 Kb。而长度超过50 Kb的基因被定义为“超长基因”,占33.88%。
“然而兰州百合基因编码序列的平均长度仅为847.17 bp,提示我们其长内含子才是形成超长基因的主要原因。”宁国贵说,百合基因的平均内含子长度约为19.13 Kb,在所有已发表的植物基因组中仅次于攀枝花苏铁。
对基因表达模式的分析发现,百合基因长度与表达水平显著相关,但表现出变化的趋势:短于50 Kb的基因表达水平随基因长度变长而持续上升,而长于50 Kb的基因则表达持续下降。他们推测,50 Kb可能是限制基因转录或内含子剪接效率的转折点,这种表达变化尚未在其他物种中见到,可能为百合独有的特征。
此外,他们还重点关注了与百合鳞茎相关的基因。百合鳞茎是储存营养的器官,是东亚地区药品和食品工业的重要资源。为了研究百合小鳞茎发育过程中营养积累及其潜在机制,他们收集了五个发育阶段的小鳞茎样本,进行了全面的细胞学、转录组和代谢组分析。
研究发现,在小鳞茎发育的整个过程中,淀粉和蔗糖积累都在持续进行,而大量参与糖酵解代谢途径的基因在小鳞茎中呈现出高度表达,表现出明显的器官特异性表达模式。
此外,在五个发育阶段的小鳞茎中检测到总计870种代谢物,包括碳水化合物、脂类和酚酸等,展现出丰富的代谢多样性。代谢组与转录组的关联分析显示,碳水化合物代谢物与一个基因表达模块显著相关,该模块可能包含了编码碳水化合物和淀粉代谢途径酶的基因。
相关论文信息:https://doi.org/10.1016/j.xinn.2024.100726
【中国科学报】百合:最大植物基因组背后的秘密
原文链接: