视觉启用的语言模型(VLMs)如GPT-4o和Gemini,能够赋予自主代理人完成诸如进行购物或编辑代码等任务的能力。然而,这项工作也突出了这些代理人易受到恶意攻击的脆弱性。在现实世界中,我们必须对这些具有视觉理解能...
Read MoreWebCanvas是一个全新的框架,专门用于在动态的、实时的网络环境中评估自主Web代理Agent。该框架的出现,将为Web代理Agent的开发和应用带来革新。WebCanvas以其高度灵活和动态的特性,为Web代理提供了一个广阔的应用...
Read More近日,知名的开源平台GitHub上的Paramount项目公开了一项新的技术——LLMs(Large Language Models)的Agent精度测量。该技术旨在提升大型语言模型的代理精度,助力开发者更加准确地评估和优化模型性能。据了解,LLMs...
Read MoreOpenAI和Google已经推出了先进的AI模型,能够实现实时的多模式理解和响应,带来了AI助手和语音代理的创新。OpenAI的GPT-4o以其前代的两倍速度和一半成本引发了关注,而Google的Gemini 1.5 Flash实现了显著的延迟和成...
Read MoreDecagon正在为客户支持构建人性化的AI Agent。该公司近期从Accel获得了3000万美元的A轮融资,并从a16z获得了500万美元的种子轮融资。Decagon的产品为Eventbrite、Rippling、Webflow、BILT和Substack等公司提供全球支...
Read More近期,开源的本地代理工具Open Interpreter刚刚完成了一次重大升级。据了解,此次升级让这款工具具备了无缝控制计算机的能力,而且可以全程离线、本地运行。这意味着用户无需连接互联网,就可以自由使用这款工具,极...
Read MoreMora是一款创新的视频生成模型,它利用多个视觉AI代理,旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统,这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...
Read MoreGarple是一个在线销售短小、易于发音的.com域名的网站,这些域名非常适合作为初创公司的名称。令人惊奇的是,该网站上所有的代码都是由一个AI编码代理完成的。这标志着人工智能在编程领域的应用已经步入了一个新的阶...
Read More