视觉启用的语言模型(VLMs)如GPT-4o和Gemini,能够赋予自主代理人完成诸如进行购物或编辑代码等任务的能力。然而,这项工作也突出了这些代理人易受到恶意攻击的脆弱性。在现实世界中,我们必须对这些具有视觉理解能...
Read MoreOpenAI和Google已经推出了先进的AI模型,能够实现实时的多模式理解和响应,带来了AI助手和语音代理的创新。OpenAI的GPT-4o以其前代的两倍速度和一半成本引发了关注,而Google的Gemini 1.5 Flash实现了显著的延迟和成...
Read More苹果公司与OpenAI达成了一项前所未有的合作协议,计划将OpenAI的ChatGPT技术整合进iOS系统中。这项合作将成为下周苹果全球开发者大会的重点展示内容。对于苹果而言,这很可能是一项短期内的策略合作,因为他们正在自...
Read More苹果公司与OpenAI签订了一项重要协议,将为iOS 18操作系统提供先进的聊天机器人功能。这一合作将成为今年6月苹果全球开发者大会(WWDC)的核心内容之一。通过这项合作,苹果公司不仅可以继续独立开发自己的聊天机器人...
Read More谷歌近日发布了最新模型Gemini 1.5的技术报告。报告详细介绍了此次升级的主要内容和改进之处,但并未透露过多关于模型或所使用数据的信息。然而,报告中对评估和安全措施的详尽描述,让我们得以深入了解大规模对齐的...
Read More近日,Google发布了新的轻量级模型Gemini Flash。此模型具有多模态推理和高达一百万个符号的长上下文窗口。Google利用其先进的技术,使Gemini Flash在处理大量数据时保持了高效与精确。这种新型的轻量级模型将有助于...
Read More在2024年的Google I/O开发者大会上,Google发布了众多新功能,包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言,这些改进数量惊人,包括扩大到2m的令牌上下文长度,大幅降低的模型价格...
Read More谷歌最近推出了名为Gemini Code Assist的AI代码补全工具,专为企业用户设计。该工具拥有高达一百万个token的上下文窗口,能够提供更为精准的代码建议。同时,Gemini Code Assist支持在多个平台上对本地代码库进行代...
Read More