DeepMind的相关内容 - 漫话开发者

2024-04-30 talkingdev

开放式Gato复制：全面任务模型JAT的训练与评估

近日，与Hugging Face团队相关联的研究者们，训练并评估了一种名为JAT（Jack-of-All-Trades）的模型，这是一种全面任务模型，能在各种不同的任务上表现出相当的效果。此模型的出现，为深度学习领域的多任务学习提供...

2024-04-10 talkingdev

DeepMind创始人戴密斯·哈萨比斯目前领导着谷歌统一的人工智能研究部门，致力于通过AlphaGo和AlphaFold等突破性成果保持科技巨头在人工智能领域的领先地位。尽管取得了成功，但将AI集成到实际产品中以及来自OpenAI的C...

2024-04-05 talkingdev

现代变压器模型在处理数据时，每个数据单元都使用相同的预测计算量，但事实上，不同数据单元的预测难度差异很大。DeepMind的最新研究突破了这一限制，允许模型在生成过程中根据数据单元的难易程度提前退出，从而减少...

2024-03-14 talkingdev

谷歌DeepMind的SIMA是一个通用的AI代理，可在各种电子游戏环境中遵循自然语言指令。它标志着将AI系统变得更加多才多艺、可指导的转变。此前，AI系统只能在特定的环境中工作，现在SIMA可以在多种环境下工作，这是一项...

2024-03-04 talkingdev

Google DeepMind的Genie是一个基础的世界模型，通过在互联网视频上进行训练，可以从合成图像、照片甚至草图中生成各种可玩（动作可控）的环境。该模型使用了深度强化学习和生成式建模技术，可以为游戏开发、虚拟现实...

2024-02-23 talkingdev

Google已经发布了其Gemma 2B和7B参数模型的权重，可通过HuggingFace获得。这些模型是仅解码器的Transformer，训练了2T和6T个令牌。它们在各种基准测试中都比Llama 2表现出色，并提供基础和指令调整版本。

2024-02-19 talkingdev

Google团队发布了一款用于大气建模的代码，该代码被用作DeepMind最近的天气模拟工具的核心。该代码名为“Dinosaur”，是一种可微分动力学模型，可用于建立全球范围内的大气模型。这种技术可以帮助科学家更好地理解气候...

2024-02-14 talkingdev

DeepMind和南加州大学的研究人员开发出SELF-DISCOVER框架，该框架显著提高了LLM的推理能力，在类似GPT-4的模型任务中比传统方法提升了32%。这个两阶段的框架使得LLMs能够自主地形成和利用推理结构。这个进步代表了AI...