漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-30 talkingdev

开放式Gato复制:全面任务模型JAT的训练与评估

近日,与Hugging Face团队相关联的研究者们,训练并评估了一种名为JAT(Jack-of-All-Trades)的模型,这是一种全面任务模型,能在各种不同的任务上表现出相当的效果。此模型的出现,为深度学习领域的多任务学习提供...

Read More
2024-04-10 talkingdev

戴密斯·哈萨比斯能否挽救谷歌?

DeepMind创始人戴密斯·哈萨比斯目前领导着谷歌统一的人工智能研究部门,致力于通过AlphaGo和AlphaFold等突破性成果保持科技巨头在人工智能领域的领先地位。尽管取得了成功,但将AI集成到实际产品中以及来自OpenAI的C...

Read More
2024-04-05 talkingdev

DeepMind研究实现Transformer模型动态计算优化

现代变压器模型在处理数据时,每个数据单元都使用相同的预测计算量,但事实上,不同数据单元的预测难度差异很大。DeepMind的最新研究突破了这一限制,允许模型在生成过程中根据数据单元的难易程度提前退出,从而减少...

Read More
2024-03-14 talkingdev

谷歌发布SIMA,可在3D游戏中遵循自然语言指令

谷歌DeepMind的SIMA是一个通用的AI代理,可在各种电子游戏环境中遵循自然语言指令。它标志着将AI系统变得更加多才多艺、可指导的转变。此前,AI系统只能在特定的环境中工作,现在SIMA可以在多种环境下工作,这是一项...

Read More
2024-03-04 talkingdev

Genie世界模型:可生成交互式环境

Google DeepMind的Genie是一个基础的世界模型,通过在互联网视频上进行训练,可以从合成图像、照片甚至草图中生成各种可玩(动作可控)的环境。该模型使用了深度强化学习和生成式建模技术,可以为游戏开发、虚拟现实...

Read More
2024-02-23 talkingdev

谷歌开源Gemma对抗Llama,底模基于Gemini

Google已经发布了其Gemma 2B和7B参数模型的权重,可通过HuggingFace获得。这些模型是仅解码器的Transformer,训练了2T和6T个令牌。它们在各种基准测试中都比Llama 2表现出色,并提供基础和指令调整版本。

Read More
2024-02-19 talkingdev

Dinosaur:全球大气建模的可微分动力学

Google团队发布了一款用于大气建模的代码,该代码被用作DeepMind最近的天气模拟工具的核心。该代码名为“Dinosaur”,是一种可微分动力学模型,可用于建立全球范围内的大气模型。这种技术可以帮助科学家更好地理解气候...

Read More
2024-02-14 talkingdev

DeepMind与USC合作开发SELF-DISCOVER框架,LLM推理能力显著提升

DeepMind和南加州大学的研究人员开发出SELF-DISCOVER框架,该框架显著提高了LLM的推理能力,在类似GPT-4的模型任务中比传统方法提升了32%。这个两阶段的框架使得LLMs能够自主地形成和利用推理结构。这个进步代表了AI...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page