在大型语言模型(LLM)和视觉语言模型(VLM)部署中,模型量化是降低计算和存储成本的关键技术。然而,传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍,尤其是在超低位宽(如2-bit、3-bit)下,精度损失...
Read MoreOpenAI在一项最新研究中揭示了GPT-5.1模型一个有趣的行为现象:随着使用频率增加,模型在生成文本时越来越倾向于使用“哥布林”(goblin)风格的隐喻表达。研究表明,这一“哥布林怪癖”并非模型随机涌现的幻觉,而是直...
Read More随着人工智能大模型规模的不断增长,模型评估(Eval)环节正在迅速演变为一个新的计算瓶颈,其成本在某些情况下甚至已经逼近甚至超过了模型训练的开销。根据最新的行业分析,一次全面的AI评估运行费用可能高达数万美...
Read More人工智能编程领域迎来新玩家,初创公司Poolside正式发布Laguna系列编程模型,包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型,专为长周期、复杂推理的编程任务设计(Long-horizon co...
Read MoreAnthropic近日宣布推出名为“Claude Connectors”的新型集成工具,旨在将Claude AI模型无缝嵌入到主流创意软件生态中。首批支持的软件包括Adobe系列(如Photoshop、After Effects)、开源3D创作套件Blender以及Autodes...
Read MoreOpenAI首席执行官Sam Altman与AWS首席执行官Matt Garman近日进行了一场深度对话,正式宣布AWS将通过其Bedrock平台提供基于OpenAI模型的托管智能体(Managed Agents)。这一合作标志着OpenAI与微软之间长达数年的云服...
Read More近期,一款名为Talkie的语言模型在技术社区引起了广泛关注。值得注意的是,该模型并非诞生于当前大模型竞赛的浪潮中,而是宣称其设计理念和数据源自1930年代的文献与知识体系,拥有13B参数。这一独特的“时间胶囊”式...
Read More随着生成式AI在软件开发中的广泛应用,如何准确衡量AI对代码库的实际贡献成为一项棘手挑战。该文指出,AI的最佳用途有时是启发性的提问,并不直接产生任何代码,因此单纯以代码行数来衡量AI贡献不仅无法反映代码质量...
Read More