国家基因组科学数据中心发布2019新型冠状病毒资源库
2020年1月22日,国家基因组科学数据中心正式发布。该库整合了世界卫生组织(who)、中国疾病预防控制中心(cdc)、美国国家生物技术信息中心(ncbi)、全球流感序列数据库(gisaid)等机构公开发布的冠状病毒基因组序列数据、元信息、学术文献、新闻动态、科普文章。同时,对不同冠状病毒株的基因组序列做了变异分析与展示。
2019新型冠状病毒基因组序列发布动态
2019新型冠状病毒资源库收录了来源于ncbi的genbank数据库和gisaid数据库发布的2019新型冠状病毒(2019-ncov)病毒株的株名、采样日期、采样地点、样本提供单位、数据递交单位等元信息。通过该资源库还可访问到国家基因组科学数据中心基因组数据库gwh从公共数据库收录的冠状病毒科基因组和蛋白序列,用户可基于accession号、种名、属名、采样日期、采样地点、宿主、分离源、发布日期等元信息筛选感兴趣的冠状病毒株,个性化选取序列进行下载以开展相关的科学研究。
2019新型冠状病毒资源库将持续更新元信息与基因组序列数据,实时监控ncbi的pubmed数据库中发表的2019新型冠状病毒和其他冠状病毒的学术文献、中新网与新华网发布的新闻,同步更新世界卫生组织与中国疾病预防控制中心发布的科普介绍,为用户开展学术研究、掌握科研进展、了解新闻动态与科学知识提供资源与窗口。
gwh数据库收录的冠状病毒科基因组序列信息
2019新型冠状病毒资源库基于不同参考基因组序列开展2019-ncov病毒株基因组变异分析,并对结果进行了统计与可视化展示。通过对全基因组序列相似性比较和变异位点分析,获取2019-ncov病毒株之间、2019-ncov病毒株与sars冠状病毒以及与类sars冠状病毒蝙蝠株之间的变异程度、变异区域、变异碱基的详细信息。经数据分析,2019-ncov与2003年爆发的sars病毒基因组序列相似度为80%,与2017年2月从国内的蝙蝠中采集到的bat sars-like coronavirus isolate bat-sl-covzc45基因组序列相似性最高,相似度为88%。对2019-ncov病毒株的基因组变异分析为追溯病毒来源、追踪病毒株变异路径、防控新型冠状病毒引发的疫情、治疗病毒性肺炎提供重要的数据基础与决策支持。
2019新型冠状病毒基因组变异分析:基因组变异分析的参考基因组为genbank发布的2019新型冠状病毒株基因组序列mn908947.3,sars-cov为sars 冠状病毒,bat-sl-covzc45为类sars冠状病毒蝙蝠株,其余基因组序列来源于gisaid发布的2019新型冠状病毒株。红色竖线表示变异位点。