地球大数据缘起和进展

郭华东 中国科学院院士

(以下文章来源于《科学通报》)


进入信息时代以来, 数据总量呈爆炸式增长, 数据的类型、结构、维度也更加复杂多样, 远远超出了传统数据库的管理和处理能力, 逐渐向“大数据”方向转变. 大数据是用于描述超出常规处理能力的数据集术语, 其内涵不仅包含海量的数据本身, 也包含对这些数据集的存储、处理与分析方法. 当前, 大数据已经成为国家信息主权的体现, 并已在人类社会发展中发挥重要作用[1,2].

科学大数据主要由大型实验设施、监测设备、传感器和计算机模拟产生, 具有不可重复、多维和高度不确定等特性, 即对于一般自然与物理客观过程的观测很难重复; 由于观测对象和采样方法本身的时空属性以及观测传感器的多样化, 数据具有时空多维性; 由于采用的直接或间接观测方式、采样手段和记录技术, 导致系统观测误差及数据记录误差的存在. 地球大数据作为科学大数据的重要组成部分, 近年来呈现飞速发展的态势: 随着遥感、导航、通讯等技术的发展, 对地观测手段和仪器越来越多, 对地观测的空间越来越大, 光谱分辨率越来越高, 科学数据的传输速度和存储容量也相应增加[3,4]. 同时, 由社会公众收集的与地理相关的社会经济数据也成为地球大数据的重要组成部分[5,6].

数字地球利用数字技术和方法对地球数据进行组织、分析、管理、挖掘及可视化[7,8], 在地球科学研究中发挥重要作用. 早期, 数字地球强调“把地球装进计算机”, 以数字化技术推动地球科学发展. 近年来, 随着大数据概念的不断深入, 数字地球进入“地球大数据”时代[9]. 作为一种数据驱动范式, 地球大数据正在成为认识地球的“新钥匙”和加速地球科学研究发展的“新引擎”, 为联合国可持续发展目标(Sustainable Development Goals, SDGs) 的实现和全球发展倡议的实施提供科学支撑[10,11].

1

数字地球全球发展

1.1 数字地球概念

数字地球概念是在1998年首次由时任美国副总统戈尔提出. 他在题为“数字地球——21世纪认识我们这颗星球的方式”的演说中描绘了数字地球的清晰轮廓, 提出“用数字化的手段来处理整个地球多方面问题”的思想[12]. 这一概念引起广泛传播, 众多研究者从不同角度对数字地球的内涵进行了描述: (1) 数字地球是对真实地球的一种虚拟表达; (2) 按照地理坐标对海量数据进行多分辨率、三维和动态特征的融合; (3) 以空间数据为依托, 对真实地球及其相关现象进行数字化分析和认知[13~19].

进入21世纪, 空间技术、信息科技等的极大发展, 推动了数字地球的概念不断革新[20]. 如今, 第一代数字地球愿景已经实现, 在大数据等技术的兴起背景下, “面向2020数字地球发展理念”赋予了数字地球新的理解和诠释, 新一代数字地球的序幕开启. 新一代数字地球将表现为功能强大、可视化的科学平台, 以三维、四维甚至多维的形式发展[13~15].

1.2 数字地球平台

数字地球平台是采集、存储、检索、处理、传输、转换、分析、可视化地球空间数据并服务科学研究、决策支持的系统, 其基于多种遥感影像数据、统一的坐标系统及数据交换标准, 通过交互式可视化技术, 向人类提供观测、分析和研究地球的有力工具, 是对数字地球表现形式、海量数据管理及数据整合分析的集中体现[17,21]. 1999年以来, 许多国家、公司开发了各类数字地球软件及平台, 广泛应用于科学研究和商业领域. 数字地球平台的功能从以数据浏览、可视化分析为核心, 转向到地球大数据智能分析为中心[22].

典型的数字地球平台可以分为4种类型. (1) 综合数据平台, 应用于地球科学问题. 例如, 日本地球模拟器平台, 使用640个超级计算机并行连接搭建数据处理平台, 部分应用于地球科学. 这类平台速度快、效率高, 但由于其公用属性, 仅能处理部分地球科学数据[23]. (2) 针对特定问题的数字地球平台. 例如, 澳大利亚Bluelink平台, 对澳大利亚周围海洋进行观测模拟. 这类平台开发成本较低, 精度较高, 但仅能解决单一领域问题[24]. (3) 面向第一代数字地球的平台. 例如, 美国航空航天局的WorldWind平台等使用大量遥感影像, 可以准确对地球进行三维建模和数字化, 并允许用户进一步开发[25]. (4) 面向新一代数字地球的平台. 例如, 中国科学院数字地球科学平台, 具备了遥感影像接收、数据处理、图形编辑等功能, 被认为是“世界上功能最全的数字地球系统, 提供了地球科学数据综合分析功能, 在对地观测数据分析处理能力上尤其突出”[17].

近年来, 大量商业数字地球平台也不断涌现. 例如, 谷歌公司开发的谷歌地球和谷歌地球引擎[26]、微软公司开发的Virtual Earth[27]、ESRI公司开发的ArcGIS Explorer等, 提供了大量的商业化应用, 为数字地球技术带来了革命性变化[27].

1.3 数字地球发展

1999年, 第一届国际数字地球会议在北京召开, 其间通过了《数字地球北京宣言》, 自此数字地球正式开启了全球发展. 此后, 国际数字地球会议每奇数年举办一次, 至今共举办了12次. 2004年, 国际数字地球学会(International Society for Digital Earth, ISDE)在北京成立, 并决定在偶数年增办“数字地球高峰会议”. 2009年, 第六届国际数字地球会议在北京召开, 通过了《2009数字地球北京宣言》[28]. 这次会议是国际数字地球发展史上具有里程碑意义的会议. 时隔10年, 2019年在意大利佛罗伦萨召开的第十一届国际数字地球会议上通过的《2019数字地球佛罗伦萨宣言》, 成为继两次北京宣言后又一重要的里程碑文件[29].

我国是开展数字地球研究较早的国家. 由我国科学家发起且总部设在中国的国际数字地球学会已成为该研究领域在国际上最重要的学术组织; 我国科学家创刊的《国际数字地球学报》(International Journal of Digital Earth)和《地球大数据》(Big Earth Data)是国际上该领域首创的学术期刊. 由我国科学家发起并领衔、来自18个国家100余位科学家共同撰写的《数字地球手册》(Manual of Digital Earth)是全球数字地球领域的权威著作[16].

国际数字地球学会不断发展壮大, 于2009年成为地球观测组织(Group on Earth Observations, GEO)成员; 2017年被吸纳为国际科学理事会(International Science Council, ISC, 原国际科学理事会(International Council for Science, ICSU))成员, 这也是我国发起的国际科技组织中迄今唯一成为国际科学理事会的组织. 2019年国际数字地球学会加入联合国全球地理空间信息管理专家委员会地理空间学会联盟(United Nations Committee of Experts on Global Geospatial Information Management-Geospatial Societies, UN-GGIM GS).

2

地球大数据问世

2.1 大数据改变科学研究范式

20世纪90年代中后期, 大数据开始受到重视, 但其定义还主要着重于描述数据量大的特征——“超出存储和计算上限的数据量”[30,31]. 随着计算机领域海量数据传输、存储与处理能力的大幅提升, 大数据研究得以发展, 互联网数据中心大数据处理技术的突破被视为最成功的范例之一[32].

此后, 大数据的定义开始强调数据的种类和增长速度, 并向数据类型多样、数据规模庞大及处理速度迅速3个方面(合称3Vs)发展[33]. 随着从数据中挖掘信息的能力不断提升, 在3Vs基础上又提出大数据的新特征——数据价值密度低[34]. 随着各领域研究的深入, 准确性、可视性与合法性等大数据特征也相继被提出[35~37].

大数据时代的到来是科技与社会领域众多学科飞速发展的产物, 蕴含着自然科学、社会科学、人文科学和工程学发展的深刻变化[38]. 大数据计算确立了数据密集型科学研究方法, 推动模型驱动到数据驱动的转变. 大数据技术极大地促进了科学研究的发展. 第一, 大数据促进了学科的融合, 统一了不同学科间的研究对象及数据获取、分析、挖掘方式. 第二, 大数据提高了科学研究的可信度和普适性. 将大量数据作为研究对象可以获取客观、真实的结果, 避免主观因素对研究的影响. 较模型驱动不同, 数据驱动很大程度上避免了模型适用范围、精度、离群值等干扰. 第三, 大数据统一了“本地知识”与“云端知识”, 通过云端检索与数据挖掘, 极大提高了知识获取的效率[39~41].

2.2 科学大数据的提出

随着大数据研究的不断深入, 2013年9月, 笔者提出科学大数据概念, 并以“科学大数据与数字地球”为题发表于《科学通报》[3]. 作为与科学研究和工程实践的结合, 大数据融复杂性、综合性、全球性、信息与通信技术高度集成性等诸多特点于一身. 其研究范围也从单一学科向多学科、跨学科方向转变; 研究内容从自然科学向自然科学与社会科学的充分融合方向过渡; 研究群体从个人或者小型科研团体向国际科技组织方向发展. 作为少量依赖因果关系, 而主要依靠相关性发现新知识的研究新模式, 科学大数据已成为继经验、理论和计算模式之后的数据密集型科学范式的典型代表[2,3,39]. 2015年, 国务院发布《促进大数据发展行动纲要》(国发(2015)50号), 笔者建议的科学大数据明确列入其中, 文件中提出发展科学大数据, 构建科学大数据国家重大基础设施, 支持解决经济社会发展和国家安全重大问题.

科学大数据具有自身的属性与特征. 从数据内容上来看, 科学大数据一般表征自然客观对象和变化过程; 从数据体量、数据增长速率上来看, 其在不同学科中存在较大的差异; 从数据获取手段上来看, 其一般来自观测和实验的记录以及后续加工; 从数据分析方法上来看, 其知识发现一般需要借助科学原理模型, 单纯依赖数据分析、抛开科学原理模型的领域与方法并不多见. 科学大数据主要来源于对自然物理的客观观测, 过程中会引入系统观测误差及记录误差, 且其包括多时空、多种类、多结构数据, 内容、形式极其复杂, 因此不可重复、高度不确定、高维度、高度计算复杂性是科学大数据的主要特征. 因此可以说, 科学大数据具有不同于一般大数据的显著特征[1~3].

2.3 地球大数据概念

2014年, 在地球科学和大数据发展背景下, 笔者正式提出地球大数据概念——针对地球科学领域的、具有空间属性的科学大数据集合, 是新一代数字地球的表现形式[9]. 地球大数据主要产生于大型科学实验装置、探测设备、传感器、社会经济观测以及计算机模拟过程, 具有海量、多源、异构、多时相、多尺度、非平稳等大数据的一般性质, 同时也具有很强的时空关联和物理关联性, 以及数据生成方法和来源的可控性[6,40,42]. 地球大数据在使人类面临巨大挑战的同时, 也带来了巨大的机遇: 一方面, 现有的数据处理手段难以发挥地球大数据的优势, 需要开发出相应的整合机制和方法, 探索由大数据驱动的科学发现新范式; 另一方面, 地球大数据将为地球科学乃至其他领域的可持续发展带来巨大的变革.

如图1所示, 地球大数据以岩石圈、水圈、大气圈、生物圈、冰冻圈为科学研究目标, 利用人工智能、机器人学、物联网、边缘计算、云计算、数据立方体等数字化技术开展地球系统多圈层相互作用研究, 以多种对地观测手段采集多圈层自然数据, 并结合经济、社会、文化、政策、社会发展等人文科学数据, 从不同时空尺度开展“自然-社会”的耦合研究, 最终实现知识体系构建、科学发现、技术创新、决策支持和知识传播.

图1 地球大数据科学研究框架[42]

2020年, 笔者进一步提出地球大数据科学, 其是自然科学、社会科学以及工程学交叉融合的产物, 基于地球大数据分析来系统研究地球系统的关联和耦合, 即综合应用大数据、人工智能和云计算, 将地球当作一个整体进行观测和研究, 理解地球自然系统与人类社会系统间复杂的交互作用和发展演进过程, 可为联合国2030年可持续发展议程、全球发展倡议、共建“一带一路”等作出重要贡献[41,43,44].

地球大数据的主要任务是利用各种工具和算法, 从多源、海量、复杂的地球大数据中获取知识, 发展相关理论来解释社会-物理系统的运行及演变机制, 以确保建立一个对保护地球至关重要的可持续发展的人类社会. 因此, 地球大数据科学研究对解决重大社会问题来说至关重要[10,41,43]. 地球大数据科学的价值链框架包括以下5 方面内容[10,11,41,45].

(1) 数据泛在感知, 即充分利用全空间体系的数据感知与采集设施, 基于统一的数据资源体系框架, 实现泛在数据的高效感知与集成, 并为数据融合、关联分析、空间统计等提供即时可用的数据源[46].

(2) 数据可信共享, 即通过分布式账本, 精确记录地球空间数据在整个生命周期中经历的全部处理流程及其精度水平, 保证数据可溯源、决策可信、隐私数据可保护性使用[47].

(3) 多元数据融合, 是指为了充分挖掘多元数据的关联关系及其价值, 通过多层次、多角度、多尺度的数据关联、转换、过滤、集成等, 实现价值提升, 进而为决策指定提供知识[48].

(4) 数据孪生及复杂模拟, 是指采用非线性、高维度的复杂系统模拟地理、人文、社会、经济等多要素约束下的地球系统演变、发展规律, 并根据多重反馈源数据进行自我学习, 近乎实时地在数字世界里呈现物理实体的真实状况[49,50].

(5) 空间地球智能认知, 是在要素提取、识别、分类等机器视觉基本功能完成的基础上, 辅以人工智能、机器学习和软件分析, 使得模拟系统能够像人一样认知、理解地球系统的复杂现象和过程[4,51].

3

地球大数据科学工程

2018年, 中国科学院设立A类战略性先导科技专项“地球大数据科学工程”(Big Earth Data Science Engineering Program, CASEarth), 旨在利用地球大数据驱动跨学科、跨尺度宏观科学发现, 以系统性和整体性的理念去研究一系列重大科学问题, 在对地球系统科学认知上有重大突破, 同时在决策支持上实现新的跨越, 持续地产出在科学发现、宏观决策、技术创新和知识传播等方面的重大成果[5,44,52].

CASEarth整合中国科学院资源、环境、生物和生态领域社会统计数据、航空监测数据、遥感卫星数据、导航定位数据和地面调查数据, 以大数据技术为支撑和纽带, 建立大数据云服务平台, 重点开展数字一带一路、全景美丽中国、生物多样性与生态安全、三维信息海洋、时空三极环境等多个项目的基础与应用研究(图2). 通过系统集成相关资源, 形成综合分析与决策支持、主题分析与展示、分布式网络化服务3种应用模式, 为资源、环境、生物和生态领域提供高精度、高效能和高可视化的信息服务, 全面提升这些领域在国家技术创新、科学发现、宏观决策和社会公众知识传播服务等方面重大成果的产出水平.

图2 地球大数据科学工程专项框架[5]

3.1 地球大数据云平台系统

经过5年的发展, CASEarth建设了地球大数据云平台系统, 突破了以数据为核心的超融合计算系统架构技术, 发展了多算力平台融合按需计算的地球大数据云原生编程分析技术, 创建了数据、计算、服务一体化的地球大数据应用新模式, 实现了200 PF计算、300 PB存储聚合, SDGs数据产品全分辨率在线预览、交互式在线计算与可视化分析、在线应用及按需发布, 已服务于全球174个国家和地区、超54万用户. 该平台系统已入选联合国SDGs技术促进机制在线平台, 是首批24个全球合作方之一[53,54].

地球大数据云平台系统由云服务基础平台、分布式计算平台、地球大数据数据银行(DataBank)、地球大数据智能分析引擎(EarthDataMiner)、数据共享、可视化分析等系统共同组成.

云服务基础平台和分布式计算平台是地球大数据云平台系统的硬件基础设施. 实现了300 PB存储、200 PF高性能计算及10000 CPU核心云计算资源的聚合, 支持PB级地球大数据格网化组织与按需剖分访问、百亿级元数据秒级并发查询、在线函数式编程分析、工具在线开发发布等功能, 可面向应用多样化、数据密集型计算需求提供一体化基础设施及一站式在线协同计算云服务.

基于DataBank的研发与建设, 地球大数据云平台系统突破了传统学科分类的资源汇聚体系, 构建了地球大数据的格网剖分规范、资源分类与多维标签管理分类体系, 建立了统一的数据资源汇聚原则、标准与数据编码规则. 该系统构建了PB级地球大数据在线全生命周期管理与共享服务系统, 形成创新的地球大数据“云治理”模式, 实现全生命周期的数据管理与共享, 提供面向计算的公共数据访问服务.

EarthDataMiner为地球大数据领域科学家提供多领域交叉融合的挖掘分析工具系统, 引入前沿机器学习算法, 利用高质高效的模型与算法共享机制, 提升多领域综合分析模型的创新设计质量和效率[55].

由数字地球基础平台、数字地球应用系统、空间信息产品生产系统、数字地球后端服务4个层次、六大分系统共同构成的数字地球服务环境, 为地球大数据云平台系统提供了强大的地球大数据汇聚与可视化能力, 支持丰富多样的数据挖掘与时空可视化形式, 支持跨终端、多模式的数字地球可视化应用系统研制与集成.

数据共享服务系统为CASEarth数据资源提供发布及共享服务[56]. 平台提供了多种数据发现模式及在线下载、应用程序编程接口(Application Programming Interface, API)访问等多种数据获取模式; 支持可定制的多格式数据在线查看、预览和查询; 支持面向个性化需求统计、收藏、推荐、下载、评价服务, 为数据有序化关联及全生命周期管理提供保障.

地球大数据云平台系统基于国内首创的基础设施平台混合架构, 以及自主研发的地球大数据系统软件栈, 实现了从数据到信息到挖掘的全过程功能, 解决了地球大数据多源数据集成、大规模实时按需计算、云化服务、可视化分析等问题, 面向联合国2030年可持续发展议程提供了时空数据管理与分析服务的中国方案[41,44]. 为支持宏观决策、促进交叉科学研究和重大科学发现提供了高效的、重要的支撑[57,58].

3.2 可持续发展科学卫星

当前, SDGs的实现面临着数据缺失和指标体系不足的问题. 为了更好地满足日益增长的数据需求, 提高SDGs监测与评估的空间观测全球数据覆盖率, 完善可持续发展指标体系, CASEarth提出并组织研制可持续发展科学卫星1号(Sustainable Development Goals Science Satellite 1, SDGSAT-1), 于2021年11月5日发射升空[59]. SDGSAT-1是全球首颗专门服务于联合国2030年可持续发展议程的科学卫星, 旨在对社会经济活动剧烈区域利用不同类型多载荷昼夜协同探测, 实现“人类活动痕迹”的精细刻画, 揭示与人类活动和自然环境相关可持续发展指标间关联和耦合的规律以及人类活动引起的环境变化和演变规律.

SDGSAT-1携带10 m全色微光+40 m彩色微光载荷、最高幅宽分辨率比(300000:30)热红外成像仪、深蓝+红边波段的多谱段成像仪3个传感器, 采用昼夜连续观测模式. 3个传感器的幅宽均为300 km, 可以确保更有效的全球数据收集. 3个传感器24 h协同工作, 其中多谱段成像仪在白天收集数据, 微光成像仪在夜间工作, 热红外成像仪则可以昼夜运行, 这种新模式可以利用不同传感器同时观察同一地物, 提高了分析的一致性[60]. 目前, SDGSAT-1已获取超过20万景影像数据, 服务的国家/地区已达72个.

3.3 地球大数据应用研究

CASEarth推动了大数据驱动科学发现的新方法、新范式, 通过再现陆地、海洋、大气、人类社会要素各参数的空间分布和时间动态, 揭示了全球和区域尺度不同要素间复杂耦合的相互作用, 形成了SDGs地球大数据的评估方法体系, 开展了全球、区域、国家及地区多尺度SDGs科学评估的应用.

数字“一带一路”项目聚焦“一带一路”倡议, 以地球大数据信息挖掘为主线, 依托空间对地观测技术, 开展“一带一路”自然资源、生态环境、气候变化与灾害、社会经济多学科研究, 建立数字丝路国际卓越中心网络, 构建了一套面向联合国2030年可持续发展议程的地球大数据评估指标体系, 实现了SDGs关键指标的科学监测与量化评估; 建成了“一带一路”地球大数据分析与决策支持系统, 提供粮食安全决策、生态环境保护及风险评估、气候变化和灾害应对、自然-文化遗产保护与发展等决策分析, 为共建“一带一路”提供宏观战略决策支持服务.

全景美丽中国项目以地球系统科学和人-地关系理论为指导, 全面展示了“美丽中国”的本底特征、空气、生态文明建设和城市发展等专题情景, 创建了“三生”空间(生产空间、生活空间、生态空间)统筹优化决策支持系统; 揭示了人类社会与资源环境间相互作用的历史轨迹和现状, 评估了全球变化背景下的资源、环境、生态安全及其演变趋势; 对全国及典型区SDGs实现现状及未来空气、生态文明建设和城市发展等情景进行评估与预测, 为SDGs评价研究和“美丽中国”建设提供政策建议.

生物多样性与生态安全项目通过全面整合生物、生态信息资源, 加工产出中国古脊椎动物数据、中国古人类数据、古DNA数据和三维数字形态数据、CASEarth生命百科、生物物种名录、在线中国生物地图、生物遗传资源数据、原始组学数据、重要生物DNA条形码数据等系列数据产品; 绘制完成新一代中国植被图, 为我国农林牧业发展和生态建设提供重要依据; 以大数据技术为支撑和纽带, 在地质历史中生命的演化进程与机制等方面发表国际高影响力文章, 提升对生命演化与生物多样性形成机制的科学认知, 建成了具有国际影响力的生物多样性与生态安全BioONE大数据平台, 为国家《生物多样性保护公约》履约、重大传染病监测防控、濒危野生动植物保护、国家生态承载力评估和生态安全格局决策平台构建等提供决策支撑.

三维信息海洋项目通过整合海洋科学数据资源, 构建综合集成、实时更新、开放共享的多学科海洋科学数据库; 研发具有普适性、综合性和示范性的海洋科学数据产品; 构建了海洋系统实时展示、动态模拟和情景分析可视化系统, 包括全球海洋环境基础数据库与过程交互系统、近海与海岸带信息集成与决策支持系统、南海岛礁与周边资源环境信息系统、深海特殊生态系统信息集成服务与展示系统、印度洋及其重点港口区海洋灾害信息系统等, 为国家海洋权益维护、综合管理、资源开发、防灾减灾提供智能决策支持平台.

时空三极环境项目以服务极地科学和极地治理为目标, 集成地球三极(南极、北极、青藏高原)地面、遥感和模型多源数据, 建成了数据、产品、共享、模拟、挖掘、同化、展示一体化的三极地球大数据平台. 基于该平台开展大数据范式支持的三极冰冻圈、气候、水文、生态、可持续发展综合研究, 提升了对三极地球系统的深度科学认知. 在三极全球变化遥相关特征、三极气候系统多圈层相互作用、三极千年古环境重建、极地冰冻圈和生态水文变化等领域发表多篇国际高影响力文章. 该项目定期发布《三极生态与环境评估科学报告》, 服务国家高层战略决策与部署; 研建了北极东北航道智能规划系统和北极海冰预报系统, 为我国极地活动能力和治理能力提供全面的科技支撑.

4

地球大数据驱动可持续发展

随着全球范围内数字化进程的加快, 数据的国际可比性和可用性有所改善, 但SDGs数据的地理覆盖面与及时性在各个领域仍然存在差距, 亟须创新方法来填补数据和方法论的空白[60~62]. 集地球科学、信息科学和空间科技等交叉融合的地球大数据技术, 具有宏观、动态监测能力, 能大大提高数据获取能力, 为SDGs的实现提供重要支撑. 利用地球大数据支撑SDGs监测与评估具有独特优势: 一是数据来源多样, 相互验证, 使SDGs监测结果更透明、可重复; 二是赋予可持续发展指标空间差异信息、动态变化信息, 进而有利于决策者通过空间信息发现发展不平衡和薄弱环节、补齐短板, 并通过时间动态变化明确变化趋势和政策效果[63~65].

CASEarth利用地球大数据, 面向零饥饿(SDG 2)、清洁饮水和卫生设施(SDG 6)、经济适用的清洁能源(SDG 7)、可持续城市和社区(SDG 11)、气候行动(SDG 13)、水下生物(SDG 14)和陆地生物(SDG 15)等与地表环境和人类活动密切相关的SDGs, 汇聚了卫星遥感影像、地理空间数据、媒体网络数据、统计信息等地球大数据, 研发了大数据处理与分析关键技术及方法, 并在云计算环境下实现了全球公共数据产品的研制和多尺度可持续发展指标的监测与评估, 以及多指标权衡-协同效应分析等创新工作, 获得了诸多亮点成果, 为SDGs进展评估、SDGs多学科研究以及多层级SDGs决策提供了数据支持、方法借鉴和科学参考(图3)[66].

图3 地球大数据支撑SDGs路线图[64]

2019~2022年, 《地球大数据支撑可持续发展目标报告》连续4年在联合国大会召开期间发布, 累计贡献106个监测评估与示范研究案例, 包括84套数据产品、54种方法模型和74个决策支持, 展示了中国利用地球大数据技术支持全球和区域可持续发展议程的探索与实践[58,64,66~69].

5

可持续发展大数据国际研究中心的诞生

基于CASEarth在可持续发展指标研究和监测评估工作中取得的一系列成果, 2020年9月22日, 我国政府在第75届联合国大会提出设立可持续发展大数据国际研究中心(International Research Center of Big Data for Sustainable Development Goals, CBAS). 该中心于2021年9月6日正式成立, 这是全球首个以大数据服务联合国2030年可持续发展议程的国际科研机构.

CBAS通过研建可持续发展大数据平台系统、发射并运行可持续发展科学卫星、开展地球大数据服务SDGs的技术方法研究, 面向全球提供可持续发展指标监测和评估的数据、信息和服务, 为联合国2030年议程的实施作出积极贡献[44,52,64,69,70].

目前, CBAS已建成全球首个可持续发展大数据平台系统, 面向全球提供稳定的数据共享、在线分析、按需生产服务; SDGSAT-1数据面向全球开放共享, 已服务于70多个国家及地区; 研发了10余套全球尺度可持续发展数据产品, 由中国政府赠送给联合国.

6

展望

2020年, 联合国发布《数字合作路线图》, 专门就数字技术对人类社会的治理、经济、安全、权力与合作进行了分析和发展规划[71]. 数字技术和可持续发展问题的协同研究, 以及利用数字技术服务可持续发展支撑国家和世界宏观战略发展目标这一系列重要问题亟待探索和解决[63,71~73]. 地球大数据在推动SDGs实现中还需加强理论、方法、技术的深入研究[74]. 面向未来, 应深入开展以下研究.

(1) 建立面向人地系统的大数据感知理论和方法. 厘清自然-社会-经济系统可持续发展的关键观测指标因子, 研究地球环境和人类社会两大系统的多时空观测方法, 发展海量异构可持续发展指标数据的汇聚与泛数字化技术, 构建地球大数据感知人与环境系统交互演化的科学理论和方法体系.

(2) 发展可持续发展大数据智能建模与处理技术. 开展自然-社会-经济一体化的可持续发展大数据多维建模和标准化技术研究, 结合深度学习、人工智能等前沿技术, 建立不同时空尺度的标准化监测体系, 实现可持续发展指标的精准监测.

(3) 研究可持续发展数字治理方法. 开展大数据驱动的自然-社会-经济耦合的可持续性情景模拟研究, 尤其对不同指标内在联系、地理相关性、动态变化规律等方面深入研究, 并建立可持续发展指标预测模型, 实现对各种情景下可持续发展状况的动态分析及仿真.

(4) 搭建全球性的数字地球科学平台. 建立全球可持续发展数据的“数算一体”超融合系统架构, 研究集数据、计算、服务于一体的可持续发展大数据共享及云服务新模式, 建立新一代数字地球平台, 为实现数据、知识、决策三位一体的可持续发展多维度决策提供信息支撑.

(5) 推广地球大数据促进SDGs成果. 面向SDGs监测的本土化问题, 尤其是发展中国家, 努力将我国的应用示范成果推动成为普适性的SDGs官方应用示范典型案例, 建设面向服务于SDGs评估和实现的开放型高端智库, 为我国和国际SDGs的实现提供科学支持.

【参考文献】

1 郭华东. 大数据 大科学 大发现——大数据与科学发现国际研讨会综述. 中国科学院院刊, 2014, 29: 500–506

2 郭华东. 科学大数据——国家大数据战略的基石. 中国科学院院刊, 2018, 33: 768–773

3 Guo H, Wang L, Chen F, et al. Scientific big data and Digital Earth. Chin Sci Bull, 2014, 59: 5066–5073.

4 Guo H, Wang L, Liang D. Big Earth Data from space: a new engine for Earth science. Sci Bull, 2016, 61: 505–513

5 郭华东. 地球大数据科学工程. 中国科学院院刊, 2018, 33: 818–824

6 Guo H. Big Earth data: A new frontier in Earth and information sciences. Big Earth Data, 2017, 1: 4–20

7 Guo H. Digital Earth: a new challenge and new vision. International Journal of Digital Earth, 2012, 5: 1–3.

8 Guo H D, Liu Z, Zhu L W. Digital Earth: Decadal experiences and some thoughts. Int J Digital Earth, 2010, 3: 31–46

9 Guo H D. Digital Earth: Big Earth Data. Int J Digital Earth, 2014, 7: 1–2

10 Guo H. Big Earth data facilitates sustainable development goals. Big Earth Data, 2020, 4: 1–2

11 Guo H, Chen F, Sun Z, et al. Big Earth Data: A practice of sustainability science to achieve the Sustainable Development Goals. Sci Bull, 2021, 66: 1050–1053

12 Gore A. The Digital Earth. Australian Surveyor, 1998, 43: 89–91

13 Goodchild M F, Guo H, Annoni A, et al. Next-generation Digital Earth. Proc Natl Acad Sci USA, 2012, 109: 11088–11094

14 Craglia M, de Bie K, Jackson D, et al. Digital Earth 2020: Towards the vision for the next decade. Int J Digital Earth, 2012, 5: 4–21

15 Annoni A, Nativi S, Çöltekin A, et al. Digital earth: yesterday, today, and tomorrow. Int J Digital Earth, 2023, 16: 1022–1072

16 Guo H, Goodchild M F, Annoni A. Manual of Digital Earth. Singapore: Springer, 2020

17 Guo H, Fan X, Wang C. A digital earth prototype system: DEPS/CAS. International J Digital Earth, 2009, 2: 3–15

18 Goodchild M F. The future of Digital Earth. Annals GIS, 2012, 18: 93–98

19 Xue Y, Guo H, Wan W, et al. Overview and preliminary idea for building Digital Earth with Grid computing technology. International Journal of Digital Earth, 2008, 1: 240–245

20 郭华东, 王长林. 数字地球:十五年发展与前瞻. 中国科学院院刊, 2013, 28: 59–66

21 Fukui H, Man D C, Phan A. Digital Earth: A platform for the SDGs and green transformation at the global and local level, employing essential SDGs variables. Big Earth Data, 2021, 5: 476–496

22 Baumann P, Mazzetti P, Ungar J, et al. Big Data Analytics for Earth Sciences: the EarthServer approach. Int J Digital Earth, 2016, 9: 3–29

23 Okuda H, Nakajima K, Iizuka M, et al. Parallel Finite Element Analysis Platform for the Earth Simulator: GeoFEM. In: Sloot P M A, Abramson D, Bogdanov A V, et al., eds. Computational Science—ICCS 2003. Berlin, Heidelberg: Springer Berlin Heidelberg, 2003. 773–780

24 Oke P R, Brassington G B, Griffin D A, et al. The Bluelink ocean data assimilation system (BODAS). Ocean Modelling, 2008, 21: 46–70

25 Bell D G, Kuehnel F, Maxwell C, et al. NASA World Wind: Opensource GIS for Mission Operations. In: 2007 IEEE Aerospace Conference, 2007. 1–9

26 Gorelick N, Hancher M, Dixon M, et al. Google Earth Engine: Planetary-scale geospatial analysis for everyone. Big Remotely Sensed Data: tools, applications and experiences, 2017, 202: 18–27

27 Jones W D. Microsoft and Google vie for virtual world domination. IEEE Spectrum, 2006, 43: 16–18

28 ISDE6. 2009 Beijing Declaration on Digital Earth. Int J Digital Earth, 2009, 2: 397–399

29 The 11th International Symposium on Digital Earth, Florence DECLARATION by the International Society for Digital Earth. Int J Digital Earth, 2019, 12: 1465–1466

30 McCune J C. DATA, DATA everywhere. Management Review, 1998, 87: 10-12

31 Guo H, Liu Z, Jiang H, et al. Big Earth Data: a new challenge and opportunity for Digital Earth’s development. Int J Digital Earth, 2017, 10: 1–12

32 John Walker S. Big Data: A revolution that will transform how we live, work, and think. Int J Advertising, 2014, 33: 181–183

33 Dautov R, Distefano S. Quantifying volume, velocity, and variety to support (Big) data-intensive application development. In: 2017 IEEE International Conference on Big Data (Big Data), 2017. 2843–2852

34 Marx V. The big challenges of big data. Nature, 2013, 498: 255–260

35 Khan M A, Uddin M F, Gupta N. Seven V’s of Big Data understanding Big Data to extract value. In: Proceedings of the 2014 Zone 1 Conference of the American Society for Engineering Education, 2014. 1–5

36 Sun Z, Strang K, Li R. Big Data with Ten Big Characteristics. In:Proceedings of the 2nd International Conference on Big Data Research. New York, NY,: Association for Computing Machinery, 2018. 56–61

37 Hilbert M. Big Data for development: A review of promises and challenges. Development Policy Review, 2016, 34: 135–174

38 李学龙, 龚海刚. 大数据系统综述. 中国科学: 信息科学, 2015, 45: 1–44

39 郭华东, 陈润生, 徐志伟, 等. 自然科学与人文科学大数据——第六届中德前沿探索圆桌会议综述. 中国科学院院刊, 2016, 31: 707–716

40 Guo H. Big data drives the development of Earth science. Big Earth Data, 2017, 1: 1–3

41 Guo H, Nativi S, Liang D, et al. Big Earth Data science: An information framework for a sustainable planet. Int J Digital Earth, 2020, 13: 743–767

42 Guo H, Liang D, Sun Z, et al. Measuring and evaluating SDG indicators with Big Earth Data. Sci Bull, 2022, 67: 1792–1801

43 Guo H. Steps to the digital Silk Road. Nature, 2018, 554: 25–27

44 Guo H, Liang D, Chen F, et al. Innovative approaches to the Sustainable Development Goals using Big Earth Data. Big Earth Data, 2021, 5: 263–276

45 Sudmanns M, Tiede D, Lang S, et al. Big Earth data: disruptive changes in Earth observation data management and analysis? Int J Digital Earth, 2020, 13: 832–850

46 Ostermann F O, Granell C. Advancing science with VGI: Reproducibility and replicability of recent studies using VGI. Transactions GIS, 2017, 21: 224–237

47 El Ioini N, Pahl C. A review of distributed ledger technologies. In: Panetto H, Debruyne C, Proper H A, et al., eds. On the Move to Meaningful Internet Systems. OTM 2018 Conferences. Cham: Springer International Publishing, 2018. 277–288

48 Castanedo F. A review of data fusion techniques. Sci World J, 2013, 2013: 704504

49 Jones D, Snider C, Nassehi A, et al. Characterising the Digital Twin: A systematic literature review. CIRP J Manuf Sci Technol, 2020, 29: 36–52

50 Li X, Feng M, Ran Y, et al. Big Data in Earth system science and progress towards a digital twin. Nat Rev Earth Environ, 2023, 4: 319–332

51 Eliot J. About Spatial Intelligence: I. Percept Mot Skills, 2002, 94: 479–486

52 郭华东, 梁栋, 陈方, 等. 地球大数据促进联合国可持续发展目标实现. 中国科学院院刊, 2021, 36: 874–884

53 IATT. Emerging Science, Frontier Technologies, and the SDGs—Perspectives from the UN System and Science and Technology Communities. New York: United Nations, 2021

54 郭华东. 地球大数据科学工程数据共享蓝皮书(2019). 北京: 科学出版社, 2020

55] Liu J, Wang W, Zhong H. EarthDataMiner: A Cloud-Based Big Earth Data Intelligence Analysis Platform. In: IOP Conference Series: Earth and Environmental Science, 2020, 509: 012032

56 Ji L, He G, Yan D. Data Sharing in CASEarth Project. Biodivers Inform Sci and Stand, 2019, 3: e37280

57 Li X, Che T, Li X, et al. CASEarth Poles: Big Data for the Three Poles. Bull Am Meteorol Soc, 2020, 101: E1475–E1491

58 Guo H. Big Earth Data in Support of the Sustainable Development Goals (2019). Beijing: Science Press and EDP Sciences, 2019

59 Guo H, Chen H, Chen L, et al. Progress on CASEarth Satellite Development. Chin J Space Sci, 2020, 40: 707–717

60 Guo H, Dou C, Chen H, et al. SDGSAT-1: the world’s first scientific satellite for sustainable development goals. Sci Bull, 2023, 68: 34–38

61 United Nations. Transforming Our World: The 2030 Agenda for Sustainable Development. New York: United Nations, 2015

62 United Nations. The Sustainable Development Goals Report 2021. New York: United Nations, 2021

63 UN Secretary-General’s High-Level Panel on Digital Cooperation. The Age of Digital Interdependence. New York: United Nations, 2019

64 郭华东. 地球大数据支撑可持续发展目标报告(2021):中国篇. 北京: 科学出版社, 2022

65 Nilsson M, Griggs D, Visbeck M. Policy: Map the interactions between Sustainable Development Goals. Nature, 2016, 534: 320–322

66 中国科学院, 可持续发展大数据国际研究中心. 地球大数据支撑可持续发展目标报告(2022). 北京: 中国科学院, 2022

67 郭华东. 地球大数据支撑可持续发展目标报告(2019). 北京: 科学出版社, 2019

68 郭华东. 地球大数据支撑可持续发展目标报告(2020):中国篇. 北京: 科学出版社, 2020

69 郭华东. 地球大数据支撑可持续发展目标报告(2020):一带一路篇. 北京: 科学出版社, 2020

70 郭华东. 地球大数据支撑可持续发展目标报告(2021):一带一路篇. 北京: 科学出版社, 2022

71 Guo H D, Hackmann H, Gong K. Big data in support of the Sustainable Development Goals: A celebration of the establishment of the International Research Center of Big Data for Sustainable Development Goals (CBAS). Big Earth Data, 2021, 5: 259–262

72 United Nations. Our Common Agenda—Report of the Secretary-General. New York: United Nations, 2021

73 Li X. Big Earth Data boost UN SDGs. Science Bulletin, 2023, 68: 773–774

74 中国科学技术协会. 直面人类未来:2021年度人类社会发展十大科学问题解读. 北京: 科学出版社, 2022