漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-07 talkingdev

Lean 4.22预览版发布:首次实现可验证命令式程序

即将发布的Lean 4.22版本带来了一项激动人心的新功能——针对命令式程序属性的验证基础设施预览。这一突破性进展允许开发者通过形式化方法证明命令式程序的正确性,标志着定理证明工具向实用化迈出重要一步。作者Marku...

Read More
2025-04-30 talkingdev

[开源]DeepSeek-Prover-V2:AI自动定理证明框架升级版发布

DeepSeek团队近日在GitHub开源了其第二代自动定理证明框架DeepSeek-Prover-V2,该项目迅速获得326个Hacker News点赞和63条技术讨论,显示出学术界和工业界对AI形式化验证工具的高度关注。作为当前最前沿的AI推理系统...

Read More
2025-04-25 talkingdev

[开源] 使用Lean定理证明器重写《数学原理》:罗素经典著作的现代化尝试

近日,开发者ndrwnaguib在GitHub上发布了一个引人注目的开源项目,旨在使用Lean4定理证明器对伯特兰·罗素教授的经典著作《数学原理》第一卷进行形式化验证。该项目严格遵循罗素原著中的证明过程,仅在必要时添加形式...

Read More
2025-04-22 talkingdev

[论文推荐]AlphaGeometry 2:DeepMind新一代几何模型,正确率提升至84%

DeepMind近日发布了其几何模型AlphaGeometry的重大升级版本AlphaGeometry 2,该模型在解决几何问题上的正确率从先前方法的54%大幅提升至84%。这一突破性进展主要得益于Gemini语言模型的整合以及更高效的搜索算法。Al...

Read More
2024-10-14 talkingdev

论文:DeepSeek通过大规模合成数据推动LLM中的定理证明进展

DeepSeek项目致力于通过大规模合成数据提升LLM在定理证明领域的能力。传统的定理证明通常依赖于有限的标注数据,这限制了模型的学习和推理能力。DeepSeek通过生成多样化的合成数据集,训练模型识别和解决复杂的数学...

Read More
2023-10-27 talkingdev

ToRA:集成Agent工具解决数学推理难题

ToRA是一系列工具集成的推理代理人,旨在通过与工具交互来解决具有挑战性的数学推理问题。通过与定理证明器、计算机代数系统等工具进行交互,ToRA能够发现新的证明策略,并在证明过程中自动应用这些策略。目前,ToRA...

Read More