-
基于 AI 的遥感图像分类与识别
演讲人:毕海霞
遥感图像分类与识别是遥感对地观测的关键任务。近年来, 世界各国 成功发射了大量对地观测遥感卫星,获取了海量遥感图像,遥感大数据时 代已然来临。但是,目前遥感技术应用的瓶颈在于其图像处理技术远远滞 后于其图像获取技术。因此,如何对遥感图像进行快速准确地解译,具有 非常重要的理论和实际应用价值。近年来,蓬勃发展的人工智能技术将遥 感图像分类与识别推向自动化、智能化。 然而,基于人工智能的遥感图像分类识别任务面临两个巨大挑战,即 (1)小样本:尽管存在海量数据,但数据标记成本高,标记数据难以获 取;(2)数据质量差:遥感图像中存在噪声大及数据缺失等问题。为解决 小样本问题,如何基于物理规律充分利用无标记数据;低标注场景下如何 学习强判别性特征;如何提升标记效率为亟需解决的科学问题;为解决数 据质量差的问题,对噪声建模及在机器学习模型中融入领域先验为有效的 解决思路。本报告将围绕以上研究课题介绍遥感图像分类识别中的代表性 工作;同时对遥感图像分类识别的未来发展趋势进行展望。
-
地学机理模型与机器学习模型的耦合范式
演讲人:沈焕锋
构建物理驱动的机理模型一直是地学研究的核心科学范式,但仍然存 在机理认知局限、欠定系统、计算负担等瓶颈问题;发展数据驱动的机器 学习模型是地学研究范式转换的重要途径,但泛化性、迁移性、可解释性 不足是其主要问题。耦合机理模型与学习模型则可以实现“理性主义”与“经 验主义”的结合,是当前最受关注的研究热点之一。然而,将显式的机理模 型与隐式的学习模型进行耦合存在诸多挑战,尽管当前已经取得了一些研 究进展,但仍然缺乏标准、统一的范式框架。 本报告针对遥感反演与动力学数值模拟,分析机理模型与学习模型的 内在瓶颈及其互补性,阐述以机理级联学习、学习嵌入机理、机理融进学 习为核心的耦合范式框架。机理级联学习是将两种模型进行前后串联,一 种模型的输出作为另一种模型的输入;学习嵌入机理,是以机理模型为主、 学习模型为辅,将学习模型嵌入到机理模型之中,对原有的不确定过程进 行替代或优化;机理融进学习,就是以学习模型为主框架,将物理知识融 入其中,从而实现对学习过程的约束引导。
-
地学知识约束的机器学习与大数据同化
演讲人:李新
科学大数据推动了科学研究向数据密集型科学范式的转换。针对地球 系统科学研究中涉及的几种前沿大数据分析方法,如深度学习、物理约束 的机器学习、因果推理和深度强化学习等,探讨这些方法的基本原理及其 在地球系统研究中的应用前景和面临的挑战。其中,深度学习通过多层神 经网络从数据中挖掘更深、更抽象的特征,极大地增强了模型的学习能力, 在地球系统科学分类、回归、预测和预报等相关领域取得了巨大成功。物 理约束的机器学习通过融合机理模型和地学知识,提升了机器学习模型的 可解释性和移植能力,极大地增强了机器学习在地学知识发现和决策的有 效性。因果推理侧重于从地球大数据中寻找地球系统变量间的因果关联, 识别因果路径,量化因果效应,能够在地球系统的过程理解和反事实预测 方面发挥重要作用。深度强化学习将深度学习的感知能力和强化学习的决 策能力相结合,能够在高维环境中进行更强大的特征表达和非线性建模, 在应对地球系统科学的决策问题中发挥重要作用。
-
大数据背景下的人类起源模型
演讲人:倪喜军
狭义的人类起源是指人猿分异之后人类支系的演化,人类支系的演化 方向,表现为获得直立行走的能力、脑容量增大、大规模制作和使用工具、 发展复杂社会、形成文化传承,直至发展成为现代人类。广义的人类起源 包括灵长类的起源、类人猿的演化、大猿的分化和人猿分异。自灵长类起 源以来的演化过程,形成了人类灵活的手脚、彩色视觉、脑容量增大、社 群结构复杂等人类的生物学特征。涉及人类起源的数据包括现生与化石灵 长类和人类的解剖学特征、行为学特征、地质年代和地理分布、现生灵长 类和人类的基因组、蛋白组以及少数化石种类的不完整的遗传信息片段。 这些数据的特征在于化石记录不完整、保存信息有限、演化时间长、地质 年代误差范围大、数据来源差异巨大、待检验模型的数量是天文数字等方 面。目前用于模型选择的标准包括遗传距离、简约性、最大似然和贝叶斯 推断。人类起源研究中目前面临的具体挑战包括化石准确定年、形态特征 矩阵建立工作量巨大、异质性数据整合困难。在形态数据获得方面,尽管 各种成像手段已经可以获得海量数据,但是提取解剖特征主要还是依赖于 研究者的主观经验。
-
“数据-数学-超算”三位一体驱动现代地球科学创新
演讲人:成秋明
大数据、互联网、云环境和人工智能等革命性数字技术的快速发展和 应用,使地球科学家能够研究地球如何随时间演化,重大地质事件如何发 生和改变地球,以及与人类生活和社会发展密切相关的资源、能源和地质 灾害分布情况。使用各种现代天-空-地-海技术获取的地球大数据代表了人 类时间尺度上的当前地球,但从记录地球地质历史的岩石样本中分析的“长 尾”数据往往以无格式文本、表格或地图的形式分散在文献中。机器阅读、 机器学习和知识图谱技术可以在提取和整合这些类型的长尾数据以形成 表征地球随时间变化的深时序列方面发挥重要作用。然而,这些类型数据 的质量会受到多种因素的影响,包括但不限于岩石样品的不完善以及地质 构造运动可能造成的岩石损失,因此对深时数据的分析需要使用适当的数 学模型和方法及其软件进行特殊处理。本文要介绍的这些方法之一是局部 奇异性分析 (LSA),它是最近开发的基于分形密度新概念的方法。 LSA 可 用作高通滤波技术,通过去除深时数据的趋势来有效提取弱异常。