中国生物工程学会

会员登录 会员注册

基因中国

 

关注微信公众号

 

关注科普公众号

第七届中国科协优秀科技论文|SARS-CoV-2的起源与持续进化

发布时间:2022年10月21日 来源:中国生物工程学会

研究团队

北京大学陆剑团队长期致力于比较基因组学和演化生物学研究,将组学和演化生物相结合,系统解析真核生物基因表达调控因子的进化特征与驱动机理,并探索其在细胞演化及物种适应性进化中的作用,近年来在新冠病毒基因组的演化规律这一前沿领域取得一系列重要成果,在Molecular Biology and EvolutionNature CommunicationsNational Science ReviewScience Bulletin等主流学术期刊发表论文50多篇,推动了领域前沿。中国科学院上海巴斯德研究所崔杰团队长期致力于病原演化研究,推动了病毒进化生物学发展。

 

研究背景

新冠肺炎疫情自2019年底暴发以来,已造成超过六亿人感染,650多万例死亡,严重威胁着人类健康、经济发展和国家安全。新冠病毒的进化和流行动态,受到国内和国际社会广泛关注。依据世界各地陆续发布的新型冠状病毒基因组序列,开展分子进化分析,对疫情精准防控政策的制定、临床诊断及治疗以及输入型病例的分子溯源均具有重要意义,也能为国家提供重要的战略储备和科技支撑。北京大学陆剑团队与上海巴斯德研究所崔杰团队合作对疫情早期新冠病毒基因组展开分析,相关研究以“On the origin and continuing evolution of SARS-CoV-2”为题于2020年3月3日在《国家科学评论(National Science Review)发表,获《国家科学评论》2021年度优秀论文奖,近期被评为“第七届中国科协优秀科技论文”。

 

研究过程

团队在疫情暴发早期就密切关注疫情进展,通过对当时公共数据库中仅有的103条新冠病毒基因组进行分子进化分析,发现位于参考基因组8782(orf1ab:U8517C,同义突变)和28144(ORF8:C251U,S84L)的两个位点显示出显著的连锁。在103株SARS-CoV-2病毒株中:72株表现出“CU”单倍型(定义为“L”谱系,因为U28144位于编码亮氨酸的密码子中),29病毒株在这两个位点表现出“UC”单倍型(定义为“S”谱系,因为C28144位于编码丝氨酸的密码子中)。因此,根据这两个高度连锁的位点,将SARS-CoV-2病毒分为L和S两个主要谱系。使用这103株新冠病毒基因组中的所有变异位点重建单倍型网络,L谱系(蓝色)和S谱系(红色)可以清晰地分开(图1A)。为了确定L和S谱系的进化关系,本研究检查了SARS-CoV-2和其他相关冠状病毒的基因组比对。发现在蝙蝠及穿山甲冠状病毒中,8782和28144位点高度保守,并且与S谱系的是相同的(图1B)。因此,尽管在这103株SARS-CoV-2基因组中,L谱系(~70%)比S谱系(~30%)更流行,但S谱系在进化上与动物冠状病毒关系更近。因此推测S谱系更为古老,L谱系从S中演化而来。上述工作为本团队后续关于新冠病毒基因组分型演化研究的系列工作奠定了基础。

 

 

 

 

研究应用

研究结果发表后引起了广泛关注,被F1000推荐,该论文迄今被下载70万余次(编辑部提供数据)。S/L谱系划分也陆续被国内外其他独立研究印证,为新冠病毒基因组的谱系划分和演化分析提供了重要支撑。S/L划分系统被广泛应用于流行病学研究,被中国疾控中心等多家机构广泛用于疫情早期输入型病例的分子溯源,也被《中国—世界卫生组织新冠病毒溯源联合研究》中英文报告所采用。