大型语言模型的相关内容 - 漫话开发者

2026-03-02 talkingdev

Claude推出记忆导入工具，可跨平台迁移ChatGPT等AI偏好，大模型“护城河”再受挑战

人工智能公司Anthropic近日为其AI助手Claude推出了一项名为“记忆导入”的新功能。该工具允许用户将其在其他主流AI服务（如OpenAI的ChatGPT或Google的Gemini）中积累的上下文对话历史、使用偏好和个性化设置，一键迁移...

2026-03-02 talkingdev

近日，技术博客作者ejholmes在其个人站点发表观点，认为模型上下文协议（MCP）正走向衰落，而传统的命令行接口（CLI）将重新成为人类与AI代理协同工作的核心工具。文章指出，尽管MCP旨在为大型语言模型（LLM）提供标...

2026-02-23 talkingdev

OpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战，旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...

2026-02-23 talkingdev

人工智能安全公司Anthropic近日推出了Claude Code Security的有限研究预览版，标志着AI驱动的代码安全分析领域迈出了重要一步。该系统能够对代码库进行自动化扫描，精准识别依赖于上下文的复杂安全漏洞，并针对性地...

2026-02-21 talkingdev

总部位于印度班加罗尔的AI初创公司Sarvam，于近日正式推出了其名为“Indus”的聊天应用程序Beta版本，该应用面向网页和移动端用户开放。Sarvam的核心战略聚焦于为印度本土语言及用户构建定制化的人工智能模型，此次发...

2026-02-20 talkingdev

人工智能公司GEPA近日推出了一项名为“optimize_anything”的突破性API服务，该服务宣称能够优化任何可表示为文本的“参数”，为人工智能应用开发带来了新的范式。这项技术本质上是一个声明式API，用户只需定义需要优化...

2026-02-16 talkingdev

在GPT-5.x等大型语言模型处理文本之前，所有输入都必须经过一个关键的前置组件——分词器。分词器本质上是一个压缩层，负责将原始文本转换为一系列整数ID序列。近日，一篇深度技术分析文章通过逆向工程OpenAI开源的分...

2026-02-14 talkingdev

近日，一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示，其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果：它独立地提出了一个关于胶子散射振幅的新公...