成都生物所张勇、张韬团队完成澳洲野生稻T2T基因组组装并揭示稻属EE与DD基因组进化关系
来源:生物资源利用中心
时间:2026-06-08
中国科学院成都生物研究所张勇、张韬研究团队在稻属基因组进化研究领域取得重要突破性成果。团队成功完成稻属唯一EE基因组物种澳洲野生稻的端粒到端粒(T2T)无缺口完整基因组组装,深度解析其基因组结构演化规律,并为EE基因组与DD亚基因组的进化亲缘关系提供了全新的独立基因组学证据。
稻属是水稻种质创新与物种进化研究的核心资源,包含27个物种,具有AA、BB、CC、EE、FF、GG等11种不同的基因组类型。其中,O. australiensis是唯一的EE基因组二倍体物种,分布于澳大利亚北部热带地区,具有极强的环境适应能力,其基因组大小约为栽培稻(O. sativa)的两倍。该物种被认为是现存与DD基因组亲缘关系最近的物种,对于理解稻属多倍体起源和演化具有重要价值。
由于现存稻属不存在二倍体DD物种,学界长期依赖CCDD异源四倍体中的DD亚基因组作为稻属研究对象。EE基因组与DD亚基因组的分歧时间估计存在差异,早期研究估计为7.08百万年前(Mya),近期基于单拷贝基因的研究将其修正至约4.44-5.13 Mya。然而,多倍化后基因组的进化速率可能发生偏移,仅依赖蛋白编码序列分析可能存在局限,因此需要来自重复序列等中性进化标记的独立证据。尽管已有多个O. australiensis基因组草图发表,但均未达到T2T无缺口标准,着丝粒、端粒等复杂区域的序列信息仍不完整,限制了对其基因组结构和演化历史的深入分析。
利用ONT PromethION长读长、超长读长及Illumina短读长数据进行从头组装,经端粒修补、缺口填补和多轮迭代纠错,最终获得大小为901 Mb的基因组,包含12条完整的T2T染色体,scaffold N50为76.6 Mb。质量评估显示,BUSCO完整性达99.8%,LTR组装指数为23.79,共识质量值为41.76。在端粒区域,除经典的TTTAGGG重复外,研究还鉴定出CCCAGG和TTTAAAA等非经典端粒衍生序列,表明稻属物种的端粒序列存在比此前认知更高的多样性。
该研究提供了稻属野生稻首个T2T参考基因组,为后续功能基因组学和比较基因组学研究奠定了数据基础。在着丝粒演化方面,研究揭示了稻属着丝粒重定位的多种机制,特别是转座子在着丝粒重塑中的作用,为理解新着丝粒的形成和演化提供了新的视角。在基因组进化方面,研究通过转座子动态分析,为EE与DD基因组的亲缘关系提供了独立于蛋白编码序列的证据,有助于更全面地认识稻属物种的演化历史。
上述研究结果以"Telomere-to-telomere genome assembly of Oryza australiensis reveals transposon-driven centromere repositioning and shared EE–DD ancestry"为题发表在期刊Nature Communications上。中国科学院成都生物研究所张韬研究员、扬州大学程祝宽教授、裔传灯教授和南京农业大学张文利教授为该论文的通讯作者;鲍宇和游韩莉博士为论文的共同第一作者。本研究得到国家重点研发计划(2023YFD1200800)、国家自然科学基金(32270585、U25A20664)等资金资助。
原文链接:https://www.nature.com/articles/s41467-026-73769-8

图1. 澳洲野生稻基因组特征。

图2. 澳洲野生稻着丝粒定位和进化分析

图3.稻属种着丝粒定位的动态变化。

图4. 稻属中着丝粒的动态演化。

图5. EE基因组与DD基因组在转座子扩增方面具有相似的历史过程。

图6. Angela LTR修正了EE与DD亚基因组之间的分歧时间.