最近的测试显示,像ChatGPT-4和谷歌的“Gemini Advanced”这样的先进AI模型在视觉智商测试中表现不佳,得分低于可测量的智商阈值。虽然ChatGPT-4表现出较强的模式识别能力,但它会出现视觉误认和逻辑错误,表明与人类...
Read More谷歌DeepMind的SIMA是一个通用的AI代理,可在各种电子游戏环境中遵循自然语言指令。它标志着将AI系统变得更加多才多艺、可指导的转变。此前,AI系统只能在特定的环境中工作,现在SIMA可以在多种环境下工作,这是一项...
Read More研究人员创建了一种名为Morris II的生成式AI蠕虫,可以攻击像ChatGPT这样的AI系统,自主传播并可能窃取数据。该蠕虫使用“对抗性自我复制提示”来不断传播和破坏AI邮件助手,凸显了AI生态系统内的新型网络攻击风险。安...
Read MoreGoogle最近开展了LLM bugSWAT活动,邀请黑客们在其人工智能系统中寻找安全漏洞。参赛选手Joseph “REZ0” Thacker、Justin “RHYNORATER” Gardner和Roni “LUPIN” Carta在Google的AI功能中发现了漏洞,包括利用GraphQL端...
Read More随着大型语言模型与外部工具的配对越来越多,数据泄露的新风险已经出现。本文介绍了一种系统性的方法来评估这些人工智能系统保护私人信息的能力。 研究人员发现,当前的大型语言模型在保护隐私方面存在一些问题。它...
Read More本研究着眼于一个基于大型语言模型的国际象棋AI是如何工作的。该AI使用了GPT-2和GPT-3模型,并通过对棋盘上的棋子和动作进行编码来训练自己。研究人员还探索了AI模型内部的世界,包括其理解和预测对手的能力,以及在...
Read MoreIBM咨询和Casper Labs正在共同开发一种由区块链驱动的开创性AI治理工具。该工具是基于IBM的watsonx.governance平台构建的,它将为企业使用的AI模型引入AI版本控制、高级监控、许可和访问控制。对于那些希望在遵守内...
Read More这篇技术报告介绍了MMCBench,这是一个新的基准测试,旨在测试各种任务如文本到图像和语音到文本等情况下大型多模型(LMMs)的一致性和可靠性。该测试涵盖了超过100个流行模型,旨在提高读者对这些AI系统在现实世界...
Read More