中心主任:
王彦飞,博士,研究员,博士生导师。国家杰出青年科学基金获得者,国家重点研发计划项目首席科学家,国家自然科学基金重大研究计划重点项目负责人,中国青年科技奖获得者。主要从事综合地球物理、计算及勘探地球物理反演理论及算法研究。
办公室:地6楼443室
电 话:010-82998132
E-mail:yfwang@mail.iggcas.ac.cn
联系亿百体育:北京市朝阳区北土城西路19号,emc易倍,邮编100029
中心介绍:
党的十八届五中全会明确提出实施国家大数据战略,《国民经济和社会发展第十三个五年规划纲要》将实施国家大数据战略作为“十三五”时期坚持创新驱动发展、培育发展新动力、拓展发展新空间的重要抓手。我国正面临从“数据大国”向“数据强国”转变的历史新机遇。在此背景下,emc易倍适时提出建设“地球科学大数据与人工智能中心”(以下简称“大数据中心”)。
大数据中心的定位是:(1) 大数据基础理论研究;(2) 大数据与人工智能的有效结合:人工智能计算的实现需要深刻的反问题理论和运筹学理论。因而中心将大力加强大数据知识挖掘的人工智能技术研发;(3) 大数据中心将成为促进地球科学技术快速发展的引擎:数据驱动的知识发现是未来地球科学的研究热点;(4) 作为协同创新平台,为科研人员进行高端研发和成果转化提供有力支撑。
大数据中心的目标是:利用大数据平台的数据分析能力,针对地下中深层空间探测,形成更加高效的石油天然气、矿产资源勘察技术方法和装备能力;针对地下超深层空间,反演地球动力学机制的差异和圈层演化特征,为我们认识大陆地壳演化、水圈形成和演化、大气圈演进和生命演化提供重要线索;在该平台支撑下,形成对月球、火星等比较行星学数据的分析与应用;最终,建成以高弹性、高效率、高可靠、高度智能化为特征的国际一流的固体地球科学大数据与人工智能中心。
大数据人工智能云平台:GEO-Bigdata and AI in Earth Sciences(缩写为:GEOBAYES,以纪念著名的英国数学家Thomas Bayes 1702-1761,他创立的贝叶斯统计理论是指导机器学习的基础框架)是面向地球科学的数据管理、应用展示与算法开发三位一体化的平台,可以为广大地学科研人员提供以下服务:(1)海量数据的标准化查询、上传、下载和维护;(2)地学领域应用模块的在线计算与成果可视化展示;(3)以并行计算、深度学习等算法为基础的日常科研计算二次开发平台;(4)以正反演、最优化、概率统计理论为基础的特色大数据与计算智能服务。
特色服务:
1、IPIG 综合地球物理联合反演与解释:
本平台受国家重点研发计划(2018YFC0603500)资助。通过3000米以浅多种、多类型数据的联合反演解释技术以及多元信息评价与预测技术,发展大数据人工智能理论方法,提高大规模数据处理、解释的高性能计算能力,研发重磁、电磁、地震处理、解释可视化及一体化平台。
2、人工智能计算云服务:
本中心提供基于高速、低延迟网络和高性能GPU加速的人工智能计算云服务,以满足我所科研人员在地学领域的深度学习研究和计算需求,可为用户提供NVIDIA Tesla V100S GPU计算卡、高密度计算机节点和并行文件系统海量数据存储等计算资源。
集群内预搭建了多种编程语言环境、常用数学函数库、MPI并行开发环境,以及TensorFlow、PyTorch等常用的深度学习框架,能够满足各种科研场景下的算力需求。集群硬件配置见下表:
云服务集群硬件配置表
硬件名称 |
数量 |
单台硬件配置 |
高密度计算节点 |
24 |
CPU:Intel 6230R*2 |
内存:DDR4-2933 32GB*12 |
||
GPU计算节点 |
2 |
CPU:Intel 6258R*2 |
内存:DDR4-2933 32GB*12 |
||
GPU:NV V100S 32G*2 |
||
3 |
CPU:Intel 4210R*2 |
|
内存:DDR4-3200 16GB*4 |
||
GPU:NV RTX3090 24G*1 |
||
并行存储系统 |
1 |
Tstor 3000高速并行存储系统容量520TB |
网络连接 |
|
主干InfiniBand HDR高速低延迟网络 + 千兆以太管理网络 |
如需了解使用方式和收费情况,请联系技术人员:张心宇,zxyryan@mail.iggcas.ac.cn。