报告简介:
数学作为科学进步的重要基石,长期支撑着物理学、工程学、计算机科学乃至经济学等众多学科的发展与突破。其严密的逻辑体系与抽象的推理能力,不仅是人类智慧的集中体现,更是现代科技发展的理论根基。近年来,随着人工智能(AI)技术,特别是大规模语言模型与深度学习的迅猛发展,科学研究范式正在经历一场深刻变革。AI 不仅在数据驱动的领域大放异彩,也开始深入到以逻辑和证明为核心的数学研究之中,为这一传统学科注入全新活力。
当 AI 遇见数学,二者之间的“化学反应”正日益显现:一方面,数学为 AI 提供了理论支撑与算法基础,是推动大模型推理能力提升的关键要素;另一方面,AI 正快速逼近甚至在某些方面超越人类在数学解题方面的能力,例如 2025 年高考数学中大模型得分高达 145 分,部分前沿模型在 AIME 竞赛和 FrontierMath 基准测试中已展现出专家级水平。然而,数学研究远不止于解题——它需要长线思考、过程高度严谨、且答案存在性未知,这些特性构成了 AI 介入数学研究的核心挑战。为应对这些挑战,团队研发了面向数学研究的多智能体系统 AIM。该系统包含 Explorer、Verifier 与 Refiner 三个协同智能体及一个引理记忆模块,通过迭代探索与记忆机制实现长线思考、通过悲观检验机制部分实现证明正确性的自动验证、通过引理图降本增效。在四个研究级数学问题上的实验结果显示 AIM具备了一定的独立解决数学问题能力;进一步的,通过人机协同实现了对一个真实开放数学理论问题的证明,显示 AI 在解决研究级数学问题方面具有巨大潜力。展望未来,AI 有望不仅辅助定理证明,还可能参与提出高价值数学问题,推动学科交叉融合。
报告人简介:

