第10版:北京劳动者之歌
3上一版  下一版4
 
在生物数据的海洋中乘风破浪
从无到有开办援蒙医院皮肤科门诊
 
版面导航
 
3上一期
下一篇4 2024年1月3日 放大 缩小 默认        

在生物数据的海洋中乘风破浪
——记国家基因组科学数据中心团队
 

国家基因组科学数据中心是国家科技资源共享服务平台之一,在北京基因组研究所生命与健康大数据中心基础上发展而成。该中心面向我国人口健康和社会可持续发展的重大战略需求,建立生命与健康大数据汇交存储、安全管理、开放共享与整合挖掘的研究体系,研发大数据前沿交叉与转化应用的新方法和新技术,支撑公益性科学研究和产业创新发展。

该中心拥有一支年轻化、有理想且富有战斗力的多学科背景交叉团队,在中心主任鲍一明的带领下积极践行“创新科技、服务国家、造福人民”科技价值观,团结奋斗,努力拼搏,取得了一系列具有国际影响力的重要科技创新成果,已连续6年被本领域国际权威期刊《核酸研究》称为与美国国家生物技术信息中心(NCBI)、欧洲生物信息学研究所(EBI)齐名的国际主要生物数据中心,获得国内外本领域同行的高度认可,国际影响力不断提升。

追赶国际步伐

建立生物数据中心

世界上被国际认可的生物信息中心有3个,分别是美国国家生物技术信息中心(NCBI)、欧洲生物信息研究所(EBI)和日本核酸数据库(DDBJ),三者共同掌握着国际上主要的生物数据资源。20世纪90年代,我国的老一辈院士开始呼吁建设国家级的生物数据中心。如今,这个愿望终于实现。

“提起生物数据,也许很多人会感到陌生,它看不见、摸不到。但其实,生物数据和石油一样,属于国家基础性战略资源,在生物学、医学甚至农学等学科中都起着非常重要的作用。传统的生物学是观察型学科,随着人类基因组计划的完成,生命科学和医学将过渡到数据科学,未来,生物医学领域的数据也会呈爆发式增长。”鲍一明说,“地球上有近80亿人,每个人的生理状况各不相同,使用生物大数据就能针对每个病人的具体情况给出最精准的治疗方案,或者在人们健康的时候,能提前预知身体可能出现的病变,为预防工作提供一个可靠的指导。”

鲍一明曾在美国国立科研机构工作多年,主要从事生物信息学、病毒基因组注释和病毒进化与分类等方面研究,具有很高的国际声誉。2017年,他放弃国外的优厚待遇和生活条件,怀揣“一定要为祖国建成自己的生物数据中心”的理想,回国加入中国科学院北京基因组研究所。

在他的带领下,国家基因组科学数据中心团队从最初的30人发展为如今的120人。团队聚焦海量生物数据孤岛和存管用问题,努力建成面向国家人类遗传资源和重要战略生物资源的多组学数据汇交、存储、共享体系,形成了组学“数据——信息——知识”一体化资源系统,并迅速成为被国际同行认可的全球主要生物数据中心之一。

实现“零”的突破

为国家项目提供重要支撑

鲍一明介绍:“中国是生物资源大国,每年产生超过20PB的生物数据,占比全球的20%,与美国并列为贡献生物数据量最大的国家之一。但由于缺乏被国际认可的公共数据平台,导致国内产生的数据必须存储到欧、美、日主导的国际数据库方可得到国际认可。”

为改变这种被动局面,国家基因组科学数据中心团队齐心协力,攻坚克难,于2016年完成大数据中心数据库框架建设,发布组学原始数据归档库(GSA),成为国内首个被国际期刊认可的组学数据共享平台,实现“零”的突破,并在国际权威期刊《核酸研究》数据库专刊发布中心数据资源,引起领域内科学家的重点关注。

此外,在“一带一路”国际科学组织联盟(ANSO)的支持下,中心牵头建立了以我国为主的国际生物多样性和健康大数据共享联盟(BHDB),当前已与12个国家的28个机构建立了数据共享和科研合作关系。

在团队全体成员的努力下,截至2023年8月,中心生物数据资源总量超过31PB,支持各类科技项目15000多个,提供一站式数据递交和中英文服务,发布的数据编号被全球各大主要学术出版集团认可,解决了长期以来我国生物组学数据汇交、共享严重依赖国际数据库的问题,为国家基因组科学数据的汇交、共享、安全管理和挖掘利用,以及国家重点研发计划、国家自然科学基金、中科院战略性先导科技专项等国家重大、重点研究计划及任务的科学数据安全管理和开放共享提供了重要支撑。

心怀国之大者

青春无悔致力科技抗疫

2020年1月,在新冠肺炎疫情发生的第一时间,国家基因组科学数据中心迅速行动,以高度的责任感、使命感全力投入抗击疫情的科技攻关。

“要战胜新冠疫情,首先需要了解新冠病毒的基因组序列信息。”鲍一明介绍说。当时,很多团队成员都不在北京,有的在老家过年,有的在旅途路上,但接到任务时,大家不约而同地拿出笔记本电脑,第一时间着手进行新冠病毒信息库的开发工作。

经过日夜奋战,该中心于2020年1月22日率先开发上线具有自主知识产权的新冠病毒信息库,整合并持续更新全球公开的新冠病毒基因组数据,实现新冠病毒数据汇交整合、审编质控和开放共享,技术创新达到国际领先水平。同时,鲍一明带领团队全力推进新冠病毒基因组序列研究、新冠病毒变异分析等工作,相关成果为新冠病毒的分类溯源、传播机制、致病机理研究以及新冠疫情的精准预防等提供了多方位支撑,为科技抗疫作出了突出贡献。

2020年6月,鲍一明团队通过对北京新发地市场的新冠样本分析,首次发现冷链货物污染可能是造成局部疫情发生的病毒源头,为优化疫情常态化防控策略提供了重要科学依据。该团队还全程参与了世界卫生组织与中国开展的新冠病毒溯源联合研究,前后方分工协作,为病毒溯源提供科学数据支撑。

截至2023年8月,该中心的新冠病毒信息库已收录全球1600多万条新冠病毒基因组序列信息,服务全球182个国家/地区350多万名访客,累计数据下载超179亿条,国外访客占比最高达60%,被20多家国际专业机构推荐使用,为推动我国和全球新冠病毒生物信息数据汇交与共享、服务科技抗疫发挥了重要作用。

对于未来,鲍一明表示,科研路漫漫,希望更多不同学科背景的人才可以积极投身到我国的生物信息学研究领域中来,为国家发展贡献青春力量。

□本报记者 孙艳

 
下一篇4  
   


主办:劳动午报社 运营管理:劳动午报社 版权所有©2013-2014 技术开发:正辰科技
地址:北京市丰台区东铁营横七条12号 邮编:100079
ICP备案:京ICP备20012564号-1 京公网安备11010602200849号

 

关闭