大语言模型的相关内容 - 漫话开发者

2026-07-13 talkingdev

论文推荐| 稀疏训练技术取得突破：大幅降低大语言模型计算成本，小型机构也能担纲

一项新研究探索了利用稀疏技术高效训练大语言模型的方法，旨在显著减少算力开销的同时保持模型性能。该方案通过引入结构化稀疏与动态剪枝策略，在训练前期识别并冻结低重要性参数，使有效参数量呈指数级下降，从而降...

2026-07-12 talkingdev

在大语言模型后训练中，强化学习正变得愈发关键，但面向长周期智能体任务时，传统同步、批次交替的RL流程效率低下。异步强化学习通过随到随更新的方式提升了效率，然而现有系统多偏重吞吐量，训练稳定性和任务有效性...

2026-07-12 talkingdev

OpenAI正式推出GPT-5.6系列模型，包含Sol、Terra和Luna三个版本，其中Sol在编码、网络安全和科学研究等任务中展现出领先的智能与效率。该系列模型通过更少的令牌消耗实现更强的性能，单位算力成本显著下降。Sol在多...

2026-07-12 talkingdev

SpaceXAI 正式推出其最新一代大语言模型 Grok 4.5，该模型被定义为迄今最先进版本，专为三大核心领域深度优化：编码生成与推理、自主代理（Agentic）任务执行以及高复杂度知识工作。与前代产品相比，Grok 4.5 在工具...

2026-07-12 talkingdev

在AI辅助软件开发快速演进的当下，本地运行的大语言模型正成为开发者关注的焦点。Martin Fowler官网近日发布了一篇来自ThoughtWorks同事的实践总结，详细记录了在编程智能体场景中使用本地模型的最新体验。该报告指...

2026-07-12 talkingdev

OpenAI 近期对当前广泛使用的 AI 编程能力评估基准 SWE-Bench Pro 进行了一次系统性审计，结果发现约 30% 的任务存在严重瑕疵，令该基准的可靠性与准确性备受质疑。此次审计由 Anthropic 团队执行，结合了自动化筛查...

2026-07-12 talkingdev

埃隆·马斯克旗下的人工智能公司SpaceXAI正式推出了新一代大语言模型Grok 4.5，将其定位为公司在编码、智能代理任务和知识工作领域的最强模型。官方披露，该模型在训练过程中与流行AI编程工具Cursor进行了深度协同优...

2026-06-30 talkingdev

Meta（原 Facebook）近日在 GitHub 上开源了其内部打磨长达八年的设计系统——Astryx。该系统不仅支撑了 Meta 内部超过 13,000 款应用程序的界面开发，更凭借其 150 多个高可访问性组件和丰富主题体系，展示了在极端规...