欧洲AI新星MistralAI在过去一年实现了惊人的20倍年度经常性收入(ARR)增长,并有望在今年内突破10亿美元大关。这一快速增长使其成为在由美国科技巨头主导的大模型市场中,一个不容忽视的“主权”力量。Mistral的核心...
Read More人工智能公司Anthropic近日发布了一项名为“Teaching Claude Why”的研究,旨在提升其大语言模型Claude的推理和解释能力。传统AI模型往往只输出结果,而缺乏对“为什么做出这个决策”的透明解释。这项研究通过创新的训练...
Read More谷歌近期在Gemma大型语言模型上实现了令人瞩目的推理速度提升,成功将性能提升了三倍。这一突破性进展的核心在于采用了“投机解码”(Speculative Decoding)技术。该技术的工作原理是部署一个轻量级、速度极快的“草稿...
Read More谷歌DeepMind团队近日发布了其最新成果AlphaEvolve,这是一个由Gemini大模型驱动的自主编码代理。与普通的代码助手不同,AlphaEvolve的核心能力在于设计并生成高级算法,而不仅仅是补全或改写现有代码。它已经能够在...
Read MoreOpenAI近日在API中正式推出了一系列全新的实时音频模型,标志着语音交互技术迈入了一个全新阶段。该系列包括三款核心模型:GPT-Realtime-2,专注于增强对话式推理能力,能够实现更自然、更具逻辑性的实时语音对话;G...
Read More近日,一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理,为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...
Read MoreOpenAI 近期在内部工程实践中推行了一种被称为“Harness Engineering”的软件开发理念,它并非字面意义上的不写代码,而是引导工程师将注意力从手写逻辑转向构建 AI Agent 能够自主运行的环境和“控具”(Harness)。核...
Read More在大型语言模型(LLM)和视觉语言模型(VLM)部署中,模型量化是降低计算和存储成本的关键技术。然而,传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍,尤其是在超低位宽(如2-bit、3-bit)下,精度损失...
Read More