大模型的相关内容 - 漫话开发者

2026-07-12 talkingdev

OpenAI发布GPT-5.6：Sol、Terra、Luna三大模型亮相，以更低成本实现前沿智能

OpenAI正式推出GPT-5.6系列模型，包含Sol、Terra和Luna三个版本，其中Sol在编码、网络安全和科学研究等任务中展现出领先的智能与效率。该系列模型通过更少的令牌消耗实现更强的性能，单位算力成本显著下降。Sol在多...

2026-07-12 talkingdev

AI模型在学习过程中不可避免地会掌握大量“双用途知识”——既能用于网络防御、漏洞检测等正面场景，也可能被用于网络攻击和信息窃取等恶意目的。如何在不削弱模型整体能力的前提下，精准管控这类敏感知识，一直是AI安全...

2026-07-12 talkingdev

SpaceXAI 正式推出其最新一代大语言模型 Grok 4.5，该模型被定义为迄今最先进版本，专为三大核心领域深度优化：编码生成与推理、自主代理（Agentic）任务执行以及高复杂度知识工作。与前代产品相比，Grok 4.5 在工具...

2026-07-12 talkingdev

在AI辅助软件开发快速演进的当下，本地运行的大语言模型正成为开发者关注的焦点。Martin Fowler官网近日发布了一篇来自ThoughtWorks同事的实践总结，详细记录了在编程智能体场景中使用本地模型的最新体验。该报告指...

2026-07-12 talkingdev

Anthropic 最新研究提出一种名为 GRAM（Gradient-Routed Auxiliary Modules，梯度路由辅助模块）的方法，旨在以极低的成本实现对 AI 模型中双重用途知识的精细控制。双重用途知识指既可造福社会也可能被滥用的敏感能...

2026-06-30 talkingdev

在人工智能代理（AI Agent）技术飞速发展的当下，如何让代理高效、稳定地与各种外部API和服务进行交互，成为推动自动化与智能化落地的关键瓶颈。近日，GitHub上开源的项目Craft Agents OSS（craft-ai-agents/craft-a...

2026-06-30 talkingdev

DeepSeek近日正式开源了一款名为DSpark的创新框架，旨在显著加速大型语言模型（LLM）的推理过程，据称最高能将解码速度提升85%。这一突破性进展直接针对当前AI大模型在实际应用中普遍存在的响应延迟痛点。与传统模型...

2026-06-29 talkingdev

随着AI编程工具如Claude Code和GitHub Codex的普及，开发者对自主可控、低成本且注重隐私的替代方案需求日益增长。近日，一篇详尽的教程指南提出，利用开源模型和工具搭建本地编码代理成为新趋势。该指南深入剖析了...