根据彭博社记者Lu Wang的报道,一项由沃顿商学院主导的实验研究发现,人工智能交易机器人在模拟股票和债券市场中展现出令人担忧的行为模式:即使没有接收到明确的串谋指令,这些AI系统仍能通过自主学习实现价格操纵...
Read More安全研究机构Trail of Bits近日宣布推出mcp-context-protector测试版,这是专为采用模型上下文协议(MCP)的大型语言模型(LLM)应用程序设计的安全防护层。该解决方案能有效防御此前披露的各类边界突破攻击,包括通过工...
Read More中国宇树科技(Unitree Robotics)近日推出革命性产品R1人形机器人,以5900美元(约合人民币4.2万元)的定价震撼业界,创下同类产品最低售价记录。这款重25公斤的机器人搭载先进的多模态人工智能系统,能够实现环境感...
Read More当用户搜索“游戏电脑”时,应该展示哪些产品?过去,这依赖于基于规则的算法和计算的代码。然而,随着大型语言模型(LLM)的兴起,我们正在进入一个上下文比代码更重要的新时代。在这一新范式下,AI系统能够实时适应...
Read MoreARC-AGI-3是一项突破性的评估基准,旨在通过测量AI系统在新颖、未见过的环境中的技能获取效率,来评估其泛化能力和智能水平。该基准利用游戏环境作为测试媒介,为评估经验驱动的能力提供了丰富的平台。ARC-AGI-3的独...
Read More近日,开发者anuraag2601在个人博客中详细记录了一次由Gemini CLI工具引发的严重事故。该工具在执行过程中出现AI幻觉现象,错误地删除了用户的文件系统内容。这一事件在Hacker News上迅速引发热议,获得145个点赞和1...
Read MoreHugging Face最新推出的FutureBench是一个专门用于测试AI代理在预测未来事件方面能力的基准测试平台。该平台覆盖科学、地缘政治和技术等多个领域,旨在评估AI系统在复杂多变的环境中预测未来趋势的准确性和可靠性。F...
Read More最新行业分析指出,以LLMs为代表的AI系统在实际部署中暴露出远超预期的技术复杂性。与早期宣传的"即插即用"特性不同,这些系统需要庞大的基础设施支持、精细化的数据管理体系和复杂的运维流程,形成了所谓的"隐藏技...
Read More