漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-22 talkingdev

xAI致力于实现Grok多模态功能

Elon Musk的人工智能公司xAI正在提升其Grok聊天机器人的能力,使其能够支持多模态输入。此举将允许用户上传照片,并获得基于文本的回答。这一功能的加入不仅会拓宽Grok的应用场景,还将提高其在用户交互中的智能化水...

Read More
2024-05-21 talkingdev

LeMeViT:通过可学习元令牌加速视觉Transformer

LeMeViT是一种新的方法,通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息,从而显著提高推理速度。与传统的视觉Transformer相比,LeMeViT在保持高精度的同时,大幅减少了计...

Read More
2024-05-21 talkingdev

OpenAI暂停ChatGPT-4o“Sky”语音模式

OpenAI近日宣布暂停ChatGPT-4o的“Sky”语音模式,此举是因为该模式被指涉嫌模仿2013年电影《Her》中斯嘉丽·约翰逊的声音。斯嘉丽·约翰逊本人也正在对这家人工智能公司采取法律行动。这一事件引发了广泛关注,许多人质...

Read More
2024-05-21 talkingdev

3D情景理解:挑战与解决方案

理解3D场景中物体的位置是一个具有挑战性的问题。然而,通过使用语言引导的3D理解,我们可以精确地为3D空间中的物体标记语义标签。语言引导的3D理解是一种新的技术,它允许我们通过使用特定的语言描述,更准确地确定...

Read More
2024-05-21 talkingdev

Art3D:高斯喷射技术引领文本指导的艺术场景生成

人工智能在生成艺术2D图像方面的运用早已让人们感到趣味盎然和富有创造力。而这项新的工作,将这种能力扩展到了3D领域,通过高斯喷射技术,以文本输入作为导向,使艺术场景生成更上一层楼。这种技术的出现,无疑为艺...

Read More
2024-05-21 talkingdev

谷歌推出先锋安全框架,应对未来先进AI模型的风险

谷歌DeepMind近日推出了一项名为“先锋安全框架”的新技术,以应对未来先进AI模型可能带来的风险。这个框架确定了对可能有害的AI能力的关键能力级别(CCLs),并根据这些CCLs对模型进行评估,当达到阈值时,应用缓解策...

Read More
2024-05-21 talkingdev

为什么学习基础知识比具体知识更有价值?

不管你是学习编程、投资、还是其他任何领域,学习基础知识总是比学习具体知识更有价值。学习基础知识可以让你掌握一些通用的规则和技能,这些规则和技能可以应用于许多情况下。相比之下,学习具体知识只能帮助你解决...

Read More
2024-05-20 talkingdev

PaliGemma:谷歌最新实时运行的推理VLM模型

现在,您可以使用GPT-Fast实时运行最新的Google VLM。这为我们打开了一扇强大的大门,因为该模型非常容易为特定任务进行微调。这意味着,我们可以轻松地将其应用到各种下游任务中。PaliGemma的实时运行不仅能够提高...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page