2023-07-09_陶哲轩预言成真！ChatGPT可用来证明数学定理，数学家要失业啦？-行业资讯-网站开发软件制作-北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司--北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司-

陶哲轩预言成真！ChatGPT可用来证明数学定理，数学家要失业啦？来源：新智元大语言模型，可以用来证明数学定理了！「数学天才」陶哲轩曾在一篇博客中称，2026年，AI将与搜索和符号数学工具相结合，成为数学研究中值得信赖的合著者。这个预言，如今已经成真！加州理工、英伟达、MIT等机构的学者，构建了一个基于开源LLM的定理证明器。而这篇论文，或许将改变数学的未来。项目地址：https://leandojo.org/ 在此，研究人员提出一个开源平台LeanDojo，提供工具包、基准和模型，为LLM创造了一种定理证明的交互式环境。数学：首个见证AI重大突破的领域论文一作杨凯峪表示，公式证明是计算机程序，其正确性可以被验证。最重要的是，这项研究为解决LLM，在事实性和幻觉方面的缺陷开辟了一条新途径。因为，定理证明是一种具有严格评价的代码生成形式，根本没有让模型产生幻觉的空间。英伟达首席科学家Jim Fan激动转发称：见证人工智能实现重大突破的第一个学科，很可能就是数学！他说：每个人都该读一读数学家陶哲轩的博客。在此博客中，陶预测在2026年，AI将与搜索和符号数学工具相结合，成为数学研究中值得信赖的合著者。为什么AI的第一个重大突破会在数学？理由如下—— - 数学可以方便地表示为编码问题 - 可以通过Lean这样的定理证明器进行严格的验证，而不是依赖经验结果 - 不需要像生物学和医学这样的物理实验，机器人技术的发展还有待进步 GPT擅长编码，Lean是公式数学的编码语言，还不会出现幻觉。人工智能数学co-pilots来了。发现新定理的全自动人工智能数学家就是下一个！有网友称，所以陶哲轩可以被解雇，很容易被取代，不是吗？ LeanDojo究竟有多强？ LeanDojo：定理证明交互式环境机器学习，特别是大型语言模型，在使用证明助手Lean证明公式定理方面显示出广阔的前景。 LeanDojo其主要特点包括： - 提供了用于数据提取和与Lean交互的工具- 证明中的前提（现有定理）的细粒度标注：使用和定义这些前提的位置- LeanDojo Benchmark：97000个人工编写的定理/证明，用于开发定理证明的机器学习模型- ReProver（检索增强证明器）：第一个基于LLM的证明器，专门增强了前提选择（Premise Selection）的检索 Lean是一个在数学家中非常受欢迎的证明助手工具。研究团队针对Lean进行了加工和改进，开发出了LeanDojo。它可以从Lean中提炼出人类撰写的证明过程，形成一个数据集。从而可以通过与Lean的证明环境互动，使得这个训练出来的模型可以用来证明定理。 LeanDojo的工作流程和原理大致如下图所示：顶部右边：LeanDojo从Lean中提取证明到数据库中，用来训练机器学习模型。这个流程也可以通过和Lean的证明环境进行交互后让训练好的模型来证明定理。顶部左边：这是Lean定理的证明树。在这里gcd是最大公约数的意思。在证明定理时，我们从原始定理作为初始状态（根）开始，并重复应用策略（边）将状态分解为更简单的子状态，直到所有状态都得到解决（叶节点处）。策略可能依赖于大型数学库中定义的诸如 mod_self 和 gcd_zero_left 之类的前提。例如，mod_self 是证明中用于简化目标的现有定理：底部：只要给定一个状态，Reprover模型就能从数学库中检索前提，这些前提与状态连接起来，输入到一个作为编码器和解码器的Transformer中以生成下一个策略。 Benchmarks 基准测试 - LeanDojo Benchmark：从mathlib中提取的96,962个定理/证明、212,787个策略和128,163个前提。- LeanDojo Benchmark 4：从mathlib4中提取的91,766个定理/证明和177,349个策略。前提信息将很快提供。LeanDojo可以从Lean中的任何GitHub存储库中提取数据（支持Lean 3和Lean 4）。这些数据包含原始Lean代码中不直接可见的丰富信息，包括文件依赖项、抽象语法树 (AST)、证明状态、策略和前提。主要特征 1：前提信息LeanDojo Benchmark包含前提的细粒度标注（在证明中使用它们以及在库中定义它们），为前提选择（定理证明中的关键瓶颈）提供有价值的数据。主要特征 2：具有挑战性的数据分割将定理随机分割到训练/测试中会导致高估模型性能。大语言模型可以通过在训练期间记住类似定理的证明，就可以证明看似困难的定理。研究人员通过设计具有挑战性的数据分割来缓解这个问题，要求模型基于从未在训练中使用的创新性前提来泛化到定理。与Lean产生交互如上图所示，LeanDojo将Lean变成了一个类似体育馆的环境，数学家可以在其中观察证明状态，运行策略来改变状态，并接收有关错误或证明完成的反馈。这样的一个环境对于评估/部署证明器或通过强化学习进行训练是必不可少的。实验评估研究人员使用LeanDojo Benchmark来训练和评估ReProver。下图展示了10分钟内证明的定理的百分比。每一列代表不同的数据分割。ReProver的性能优于Lean内置的证明自动化策略（tidy），提供了一个无需检索即可直接生成策略的测试基准。研究人员采用的另一个基准是使用GPT-4以零样本方式生成策略。发现新证明&发现公式错误研究人员采用在miniF2F和FroofNet中的定理来评估ReProver。他们发现miniF2F中有33个证明，ProffNet中有39个证明在Lean中是不存在的。与此同时，最新研究还发现了ProofNet定理陈述公式中的多个错误。详见：https://github.com/zhangir-azerbayev/ProofNet/pull/14ChatGPT插件研究人员还构建了一个LeanDojo的ChatGPT插件，使ChatGPT能够通过与Lean交互来证明定理。他们具体在三种数学公式上进行了尝试，包括a+b+c=a+c+b，斯特林公式（Stirling's formula），以及高斯求和公式（Gauss' summation formula）。结果发现，专业的定力证明LLM（ReProver）相比，ChatGPT可以将非正式数学与正式证明步骤交叉在一起，类似人类与证明助手的交互方式。它甚至可以解释Lean的错误信息，并且比专业证明器更容易控制（通过提示工程）。然而，由于搜索和规划方面的弱点，它在多数情况下很难找到正确的证明。具体演示如下：a+b+c=a+c+b 斯特林公式（Stirling’s formula）高斯求和公式（Gauss' summation formula） GitHub上，开发者给出使用演示方法示例：插件安装成功后，你可以让ChatGPT证明定理，只需告诉它定理的名称和定义。比如：I want you to prove a theorem in Lean. The theorem's name is `hello_world`, and it is defined in the file `src/example.lean` in `https://github.com/yangky11/lean-example`. Please explain the theorem to me, lay out a high-level proof plan, and then try various tactics to prove the theorem. 初始化证明搜索可能需要一些时间。你可以用提示来控制ChatGPT的行为。例如，在尝试任何测术之前，你可以要求它「产生一个高级证明计划」。网友评论这个发现是AI在数学领域的最佳应用，找到了一个非常现实的角度让AI能为数学研究做出了贡献。我们离正式证明所有数学公式的伟大目标又进了一步！数学证明真的是为大语言模型量身定制地任务，因为结果的有效性是可以完全确保的。网友们除了狂赞这个项目对于数学研究的加速，纷纷脑洞大开，幻想了很多未来的可能性。Cue了马老板，数学的飞速发展将使得人类进入一个科幻小说中才存在的世界。因为数学是科学之母，数学的飞速发展将导致所有的自然科学不断加速。数学将成为第一个看到人工智能实现重大突破的科学学科，这确实是有道理的。作者介绍 Kaiyu Yang（杨凯峪）杨凯峪是加州理工学院计算+数学科学（CMS）系的博士后研究员，导师是Anima Anandkumar。他曾在普林斯顿大学获得了博士学位，导师是Jia Deng，还与Olga Russakovsky和陈丹琦一起工作。他的研究重点是神经符号人工智能，旨在使机器学习能够进行符号推理。杨凯峪是两个角度实现目标：（1）将机器学习应用于符号推理任务，如形式逻辑或自然语言中的数学推理和定理证明；（2）将符号组件引入机器学习模型，使其更具可解释性、可验证性和数据高效。目前，他正在研究能够理解和推理数学的人工智能。数学推理是人类智能的一个重要里程碑，它有可能改变科学和工程中的许多重要问题，比如解决偏微分方程和公式验证。Alex Gu Alex Gu是麻省理工学院的博士生，导师是Armando Solar-Lezama。在Armando和Jacob Andreas的指导下，他还在麻省理工学院获得了学士和硕士学位。Alex Gu曾在Meta AI Research、Jane Street和pony.ai实习。Peiyang Song PeiYang Song是加州大学圣巴巴拉分校（UCSB）创意研究学院（CCS）荣誉计算机科学学士候选人。研究兴趣包括机器学习及其在自然语言处理、计算机视觉中的应用，以及它与计算机架构、编程语言等的交叉。他最近的研究工作主要在两个方向：1）结合大语言模型（LLM）和交互式定理证明器（ITP）的神经定理证明和自动推理；2）节能机器学习推理的时序逻辑。参考资料：https://leandojo.org/https://twitter.com/KaiyuYang4/status/1673882824158613504 https://twitter.com/DrJimFan/status/1674083328478318594 推荐阅读西电IEEE Fellow团队出品！最新《Transformer视觉表征学习全面综述》润了！大龄码农从北京到荷兰的躺平生活（文末有福利哟！）如何做好科研？这份《科研阅读、写作与报告》PPT，手把手教你做科研奖金675万！3位科学家，斩获“中国诺贝尔奖”！又一名视觉大牛从大厂离开！阿里达摩院 XR 实验室负责人谭平离职最新 2022「深度学习视觉注意力」研究概述，包括50种注意力机制和方法！【重磅】斯坦福李飞飞《注意力与Transformer》总结，84页ppt开放下载！2021李宏毅老师最新40节机器学习课程！附课件+视频资料欢迎大家加入DLer-计算机视觉技术交流群！大家好，群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享，主要方向有：图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。进群请备注：研究方向+学校/公司+昵称（如图像分类+上交+小明） ??长按识别，邀请您进群!

上一篇：2025-08-14_在预算收紧和节奏加快的时代，索尼PXW-Z380为什么刚刚好？

下一篇：2020-08-25_七夕了，这里有几万字的情诗送给你、你、你！

TAG标签：

网站开发网络凭借多年的网站建设经验，坚持以“帮助中小企业实现网络营销化”为宗旨，累计为4000多家客户提供品质建站服务，得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线：13245491521 13245491521 ，我们会详细为你一一解答你心中的疑难。项目经理在线

13245491521

与我们取得联系