大型语言模型的相关内容 - 漫话开发者

2026-07-16 talkingdev

开源|Boop Agent：将iMessage打造成你的个人AI智能体，支持Claude与Codex双引擎

近期在GitHub上开源的Boop Agent项目，为iMessage用户提供了一种全新的个人人工智能交互范式。该项目并非简单的聊天机器人，而是一个深度集成在苹果iMessage中的个人智能体应用。其技术核心在于提供了双运行时选择：...

2026-07-14 talkingdev

在大型语言模型（LLM）驱动的AI智能体日益普及的今天，如何可靠地评估其在长时间、多步骤任务中的实际生产力，仍是行业面临的核心挑战。GitHub上最新发布的开源项目LHTB（Long-Horizon Terminal Benchmark）正试图填...

2026-07-12 talkingdev

Traycer 作为一款新兴的开源 AI 编排应用，正在重新定义智能体编码的工作流。它并非另一个需要单独付费的 AI 模型，而是一个强大的“神经中枢”，允许开发者连接现有的各种智能体订阅服务。其核心技术突破在于通过共享...

2026-06-30 talkingdev

DeepSeek近日正式开源了一款名为DSpark的创新框架，旨在显著加速大型语言模型（LLM）的推理过程，据称最高能将解码速度提升85%。这一突破性进展直接针对当前AI大模型在实际应用中普遍存在的响应延迟痛点。与传统模型...

2026-06-23 talkingdev

在 AI 大模型竞争白热化的当下，开源模型与闭源旗舰的性能差距一直是业界关注的焦点。知名科技评测媒体 Tech Stackups 发布了一项引人注目的对比测试：将智谱开源的大型语言模型 GLM-5.2 与 Anthropic 的顶级闭源模...

2026-06-23 talkingdev

大型语言模型（LLM）的核心架构是Transformer，它通过引入自注意力机制，从根本上解决了传统循环神经网络（RNN）在处理长序列数据时面临的顺序计算瓶颈与长距离信息衰减问题。本文深入剖析了Transformer的各个关键组...

2026-06-23 talkingdev

在当今 AI 应用爆发式增长的时代，大型语言模型（LLM）动辄拥有数十亿甚至上千亿参数，其设计初衷是追求“全能”，但在实际落地中，这种“大而全”往往意味着在特定场景下的效率低下和资源浪费。Fastino Labs 推出的 Pio...

2026-06-23 talkingdev

一篇来自LessWrong社区的技术文章深入探讨了2023年至2031年间大型语言模型（LLM）规模扩展的物理极限。文章指出，虽然预训练算力是决定模型规模的关键，但一个常被忽视的硬性约束在于推理时的令牌生成速度。具体来说...