AI模型的相关内容 - 漫话开发者

2026-05-04 talkingdev

开源|AutoRound：10分钟单GPU搞定7B大模型量化，极致压缩精度不减

在大型语言模型（LLM）和视觉语言模型（VLM）部署中，模型量化是降低计算和存储成本的关键技术。然而，传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍，尤其是在超低位宽（如2-bit、3-bit）下，精度损失...

2026-05-01 talkingdev

OpenAI在一项最新研究中揭示了GPT-5.1模型一个有趣的行为现象：随着使用频率增加，模型在生成文本时越来越倾向于使用“哥布林”（goblin）风格的隐喻表达。研究表明，这一“哥布林怪癖”并非模型随机涌现的幻觉，而是直...

2026-04-30 talkingdev

随着人工智能大模型规模的不断增长，模型评估（Eval）环节正在迅速演变为一个新的计算瓶颈，其成本在某些情况下甚至已经逼近甚至超过了模型训练的开销。根据最新的行业分析，一次全面的AI评估运行费用可能高达数万美...

2026-04-29 talkingdev

人工智能编程领域迎来新玩家，初创公司Poolside正式发布Laguna系列编程模型，包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型，专为长周期、复杂推理的编程任务设计（Long-horizon co...

2026-04-29 talkingdev

Anthropic近日宣布推出名为“Claude Connectors”的新型集成工具，旨在将Claude AI模型无缝嵌入到主流创意软件生态中。首批支持的软件包括Adobe系列（如Photoshop、After Effects）、开源3D创作套件Blender以及Autodes...

2026-04-29 talkingdev

OpenAI首席执行官Sam Altman与AWS首席执行官Matt Garman近日进行了一场深度对话，正式宣布AWS将通过其Bedrock平台提供基于OpenAI模型的托管智能体（Managed Agents）。这一合作标志着OpenAI与微软之间长达数年的云服...

2026-04-28 talkingdev

近期，一款名为Talkie的语言模型在技术社区引起了广泛关注。值得注意的是，该模型并非诞生于当前大模型竞赛的浪潮中，而是宣称其设计理念和数据源自1930年代的文献与知识体系，拥有13B参数。这一独特的“时间胶囊”式...

2026-04-27 talkingdev

随着生成式AI在软件开发中的广泛应用，如何准确衡量AI对代码库的实际贡献成为一项棘手挑战。该文指出，AI的最佳用途有时是启发性的提问，并不直接产生任何代码，因此单纯以代码行数来衡量AI贡献不仅无法反映代码质量...