极地中心建设极地生命科学数据底座:我国首个“极地基因组学专题数据库”上线发布运行
发布日期:2026-03-03 09:38:21
近日,我国首个“极地基因组学专题数据库”由极地中心罗玮研究员团队联合国家极地科学数据中心团队共同合作建成,并正式上线发布(Polar Genomics Database,https://genbank.chinare.org.cn/node/home)。该平台作为安全合规的新一代多用途组学数据库,旨在系统汇聚、规范管理与高效共享极地生物组学数据,推动极地生命科学研究的数字化转型与数据共建共用。
核心功能介绍
“极地基因组学数据库”作为面向全球的极地科学数据基础设施,致力于打造一个系统化、专业化的极地环境多维度组学数据资源平台。平台采用“项目-样本-实验-批次-数据”五级联动架构,实现数据全流程的精准追溯;广泛整合国内外研究机构的极地组学数据资源,依托统一的元数据标准与严格的质量控制体系,对多源异构的组学数据进行标准化处理与治理;同时,通过私有、受限、公开三级权限管理机制,精准满足科研人员、合作机构及公众的差异化需求,在确保数据安全合规的前提下,积极推动极地科学研究的协同创新,充分释放数据价值,实现其最大化利用。
三大核心模块:构建多组学数据分层管理体系
极地生物项目库: 集中汇聚全球公开的极地科研项目信息,支持多维度的检索、浏览与统计页面查看。作为数据导航的“总图”,帮助用户快速掌握全球极地科学研究的宏观布局与具体项目背景。
极地生物样本库: 系统化整合极地生物样本及其标准化元数据,提供样本的检索、定位与统计页面查看,确保样本信息的标准化与可追溯性,衔接实体样本与下游组学数据。
极地组学数据归档库: 作为平台的核心数据资源池,提供从数据提交、质量控制、安全归档到授权共享的全流程管理。通过标准化处理与长期维护,保障数据完整性、可靠性与可用性,支撑下游科研分析与数据挖掘。
四大关键功能:赋能科研全流程
基于统一、高质量的数据基石,平台面向用户提供四项关键功能,将数据价值转化为科研生产力。
组学数据统计(决策支持): 提供数据规模、类型分布、地理来源及增长趋势的多维度交互式可视化看板,直观呈现数据全景,辅助科研战略决策。
组学数据下载(高效复用): 依托灵活的检索筛选与“私有、受限、公开”三级权限控制,支持用户安全、高效地获取标准化数据集,提升科研效率。
用户中心(个性空间): 为注册用户打造一站式科研工作台,集成个人数据汇交、项目追踪、下载历史等功能,实现个性化科研资产管理。
后台管理系统(运维保障): 提供集中化、精细化的管理工具,对平台用户、数据资源、权限及配置进行全方位运维,确保平台安全、稳定、有序运行。

图1:“极地基因组学数据库”系统截图
已上线发布的数据内容和类型简介
“极地基因组学数据库”把南、北极“从陆地到海洋、从雪冰界面到径流湖海”的关键生态空间相关的组学数据纳入同一检索框架,覆盖陆地冻土与土壤、湖泊等淡水生境,延伸至冰川与海冰等冰冻圈环境,以及海水水体与海底沉积物等海洋介质。既汇聚北极熊、帝企鹅等代表性宏生物样本信息与典型极地物种数据,也系统收录大气、海冰、土壤等环境介质中的大量基因组学资源。为全球极地科学研究提供极端环境生命科学系统性数据支持与知识发现基础。
全生境覆盖:
平台系统性整合了南、北极环境数据,支持对陆地冻土与土壤、湖泊淡水、冰川与海冰界面、海水水体及海底沉积物等关键生态空间的组学数据的统一检索。目前已收录超过10TB的大气宏基因组数据,来自海洋与土壤生境的组学数据分别为3.87TB和5.81TB,其中海洋宏转录组数据2.38TB,可以为极地不同生物群落功能活性与生态过程解析提供重要数据基础。
全物种收录:
动物界:重点包括帝企鹅(124.32 GB)、阿德利企鹅(691.22 GB)、帽带企鹅(25.19GB)、北极熊(128.94 MB)、独角鲸(1.43 TB数据)、格陵兰鲸 (646.14 GB)、南极磷虾(122.55 GB)等旗舰物种及生态基石物种的高质量基因组;
植物界: 涵盖苔原植物、高山草本等陆生耐寒植被,以及褐藻等典型极地“海洋森林”类群;
微生物界: 包括嗜冷菌(如科尔韦氏菌)、耐寒酵母及微型真核生物,并收录大量极地分离株全基因组数据。

图2:“极地基因组学数据库”数据分布图
极地科学作为高度国际化的研究领域,其特殊的地理位置与极端环境条件,犹如一道道严苛的“过滤器”,对生命过程和物种演化进行着层层筛选与考验。长期以来,国际上的极地数据平台多侧重于生物多样性监测或物理海洋学数据的收集与整理,而极地生命组学数据(涵盖基因组学 Genomics、转录组学 Transcriptomics 等多个维度)却相对分散,缺乏有效的整合与共享机制。本次上线的数据库,堪称一次具有里程碑意义的整合行动,它汇聚了来自全球46个国家和地区的极地研究数据,一举打破了以往“数据孤岛”的局面。

图3:各主要极地国家基因数据量共享及成果产出贡献
国家极地科学数据中心将持续优化数据动态更新与共享机制,致力于夯实数据底座,贯通数据体系,突破关键科学瓶颈。数据库将重点构建极地基因数据汇交标准体系,规范生物资源调查、采集及全流程数据生产,致力于打造一个标准统一、动态更新的权威极地生命数据资源平台。
来源:中国极地研究中心(中国极地研究所)


沪公网安备3101150201798号