漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-26 talkingdev

每道只花几百美元!谷歌DeepMind AlphaProof 攻克数十年未解数学难题

谷歌DeepMind团队推出新系统AlphaProof Nexus,在未依赖公开发表或训练集中可见的标准解法的情况下,自主解决了353个公开埃尔德什(Erdős)问题中的9道,其中有两道难题甚至困扰了数学界56年之久。值得一提的是,每...

Read More
2026-05-08 talkingdev

AlphaEvolve:谷歌Gemini驱动的AI编码代理,正在多领域引发颠覆性突破

谷歌DeepMind团队近日发布了其最新成果AlphaEvolve,这是一个由Gemini大模型驱动的自主编码代理。与普通的代码助手不同,AlphaEvolve的核心能力在于设计并生成高级算法,而不仅仅是补全或改写现有代码。它已经能够在...

Read More
2026-03-13 talkingdev

Axiom以16亿美元估值融资2亿美元,用“形式化验证”打造可信AI编程助手

硅谷初创公司Axiom在成立仅一年、团队约20人规模之际,成功完成了由Menlo Ventures领投的2亿美元A轮融资,估值高达16亿美元。该公司致力于开发名为“Verified AI”的系统,其核心创新在于利用形式化验证技术,确保AI生...

Read More
2026-02-23 talkingdev

OpenAI公布First Proof挑战赛提交结果:AI模型尝试攻克十大专家级数学证明难题

OpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战,旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...

Read More
2026-02-14 talkingdev

AI再突破:GPT-5.2独立推导出理论物理学新成果,获学界验证

近日,一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示,其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果:它独立地提出了一个关于胶子散射振幅的新公...

Read More
2026-01-10 talkingdev

AI自主攻克数学难题:陶哲轩证实埃尔德什问题#728首次由人工智能基本独立解决

近日,数学界迎来一项里程碑式进展:著名数学家陶哲轩在其社交账户上宣布,埃尔德什问题#728在人工智能工具的辅助下首次被基本自主地解决。这一突破性成果并非简单复现已有文献,而是在埃尔德什问题网站社区重构问题...

Read More
2025-10-05 talkingdev

开源|ProofOfThought:基于Z3定理证明的LLM神经符号推理框架

NeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法,通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制,实现了兼具鲁棒性与可解释性的自动推理...

Read More
2025-08-18 talkingdev

超越布尔逻辑:TypeScript与Lean语言在逻辑表达上的本质差异

在编程语言的世界中,逻辑表达通常以布尔类型(boolean)为基础,即真(true)或假(false)。然而,TypeScript和Lean语言在逻辑表达的处理上展现出截然不同的哲学。TypeScript沿袭传统,将逻辑表达式视为布尔类型,...

Read More
  1. Next Page