漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-12 talkingdev

DeepMind推出革命性图像-文本模型TIPS,刷新多领域性能标杆

DeepMind近日发布了名为TIPS的新型图像-文本模型,专为密集型和全局视觉任务设计。该模型通过结合对比学习与掩码图像建模技术,并利用合成字幕进行训练,显著提升了空间感知能力。在多项基准测试中,TIPS的表现均超...

Read More
2025-02-14 talkingdev

YouTube Shorts引入Veo 2,AI视频生成技术再升级

YouTube近日宣布,已将DeepMind的Veo 2技术整合至其Dream Screen功能中。这一创新举措使得用户能够通过简单的文本提示生成高质量的AI视频片段。Veo 2的加入不仅提升了视频生成的质量和效率,还为用户提供了更加丰富...

Read More
2025-02-13 talkingdev

DeepMind突破视觉语言模型预训练规模,1000亿图像助力全球任务性能提升

DeepMind近期在视觉语言模型(VLM)预训练领域取得了重大突破,将训练数据规模提升至前所未有的1000亿张图像。这一规模远超以往尝试,显著提升了模型在多样化全球任务中的表现。尽管在西方中心化任务上的性能已趋于...

Read More
2025-02-13 talkingdev

谷歌DeepMind展示微型人形机器人足球赛

谷歌DeepMind最近发布了一段视频,展示了微型人形机器人进行一对一足球比赛的能力。这些机器人不仅能够理解足球比赛的规则,还能预测球的运动方向以及何时拦截对手的射门。这段15秒的视频充分展示了DeepMind在机器人...

Read More
2025-02-12 talkingdev

DeepMind提出新观点:Agency的测量需依赖参考框架

近日,DeepMind发布了一篇立场论文,探讨了如何衡量系统的“Agency”属性。论文指出,Agency的测量并非一个全局属性,而是依赖于特定的参考框架。这意味着,判断一个系统是否具有Agency,需要明确其所在的上下文和参考...

Read More
2025-01-03 talkingdev

探索最佳代码助手:复制与学习之旅

在深度学习领域,尤其是在自然语言处理和代码生成任务中,大型语言模型(LLM)发挥着至关重要的作用。近期的研究趋势显示,通过复制和学习各大顶尖代码助手的最佳实践,可以显著提升代码生成模型的性能和准确性。这...

Read More
2024-10-30 talkingdev

Deepmind:音频生成技术的前沿突破

随着人工智能技术的不断进步,音频生成领域正在迎来前所未有的突破。最新的研究成果显示,通过结合LLM和embedding技术,研究人员能够生成更加自然和富有表现力的音频内容。这一进展不仅为音乐创作、声音模拟等应用带...

Read More
2024-07-22 talkingdev

利用AI使视频游戏中的NPC更真实,Agency获1600万美元融资

前Google DeepMind的科学家在Artificial Agency揭示了一种用于视频游戏中动态NPC的AI行为引擎。他们已经筹集到了1600万美元,以提高游戏中的交互性。他们正在与知名的AAA工作室合作,并期待到2025年能够得到广泛的采...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page