数学推理的相关内容 - 漫话开发者

2025-05-22 talkingdev

谷歌推出Gemini Diffusion：首个采用扩散模型替代Transformer的大语言模型

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破，这是该公司首次采用扩散模型（Diffusion Model）完全替代传统的Transformer架构。技术文档显示，该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

2025-05-02 talkingdev

微软近日发布了Phi-4-reasoning系列变体，这一创新标志着小型语言模型（SLMs）在效率与复杂推理能力上的重大进展。Phi-4-reasoning通过算法优化和架构改进，在保持参数规模精简的同时，实现了接近大型语言模型（LLMs...

2025-05-01 talkingdev

最新研究表明，通过在大语言模型（LLM）的残差流中实施简单的表征控制向量干预，可显著调节其推理性能。这项发表于arXiv的突破性研究揭示了神经网络内部表征与逻辑推理能力的直接关联，为可解释AI领域提供了新工具。...

2025-04-28 talkingdev

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2，这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露，R2模型将采用创新的混合架构设计，整合了稀疏专家模型(MoE)与密...

2025-04-22 talkingdev

DeepMind近日发布了其几何模型AlphaGeometry的重大升级版本AlphaGeometry 2，该模型在解决几何问题上的正确率从先前方法的54%大幅提升至84%。这一突破性进展主要得益于Gemini语言模型的整合以及更高效的搜索算法。Al...

2025-04-17 talkingdev

GitHub最新开源的DeepMath数据集为人工智能领域带来突破性资源——该数据集包含10.3万道经过严格过滤和去污染的数学问题，专门用于提升大语言模型的逻辑推理能力。这一资源解决了当前数学推理训练数据质量参差不齐的核...

2025-03-04 talkingdev

近日，一项关于LLM（大语言模型）自我奖励推理的研究引起了广泛关注。该研究提出了一种创新的两阶段训练框架，使模型能够独立生成推理步骤、自我评估正确性，并在无需外部反馈的情况下迭代优化输出。这一框架结合了...

2025-01-25 talkingdev

近日，DeepSeek团队发布了其最新研究成果DeepSeek-R1，旨在通过强化学习（RL）技术提升大型语言模型（LLM）的推理能力。DeepSeek-R1的核心目标是通过激励机制优化模型的推理过程，使其在处理复杂问题时表现出更高的...