漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-22 talkingdev

谷歌推出Gemini Diffusion:首个采用扩散模型替代Transformer的大语言模型

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破,这是该公司首次采用扩散模型(Diffusion Model)完全替代传统的Transformer架构。技术文档显示,该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

Read More
2025-05-21 talkingdev

谷歌搜索全面推出AI模式,提供多模态搜索体验

谷歌正在向所有美国用户推出搜索中的AI模式,这一更新将带来更深层次的多模态搜索体验。该模式结合了先进的推理能力、后续问题追问功能以及快速生成的AI概述,显著提升了搜索的交互性和信息获取效率。这一技术突破不...

Read More
2025-05-21 talkingdev

Google Meet推出实时语音翻译功能,DeepMind音频语言模型助力跨语言交流

谷歌视频会议平台Google Meet近日宣布推出实时语音翻译功能,该功能基于DeepMind开发的先进音频语言模型,能够在翻译过程中保留说话者的声音、语调和表达方式。这一技术的突破性在于它不仅实现了语言的即时转换,还...

Read More
2025-05-21 talkingdev

[论文推荐]强化学习权威教材更新:涵盖传统方法到DPO、GPRO等前沿技术

谷歌高被引研究员Kevin Murphy近期更新了其200页的强化学习权威教材,系统性地覆盖了从传统方法到直接偏好优化(DPO)、广义策略优化(GPRO)以及推理技术等最前沿进展。该教材作为领域内的标杆性文献,不仅整合了经...

Read More
2025-05-21 talkingdev

独家:谷歌将智能眼镜视为AI的'下一个前沿',并联合三星、Xreal等合作伙伴共同推进

谷歌正通过Android XR平台重新进军智能眼镜领域,整合其Gemini AI技术,旨在通过AR眼镜提供实时视觉分析、翻译和情境辅助功能。此次布局将首先推出与三星合作开发的混合现实头显Project Moohan,随后是Xreal专为开发...

Read More
2025-05-21 talkingdev

谷歌"Jules"加入AI编程竞赛:采用自主代理技术革新开发流程

谷歌于12月启动封闭测试后,现已正式向公众发布其AI编程工具Jules。这款基于Gemini 2.5大模型构建的工具能够克隆整个代码仓库,并在开发者处理其他任务时自主完成编写测试、修复漏洞和构建新功能等工作。当前AI编程...

Read More
2025-05-20 talkingdev

谷歌发布Veo 3、Imagen 4及影视制作新工具Flow,生成式媒体模型再升级

在2025年谷歌I/O大会上,谷歌正式推出新一代生成式媒体模型Veo 3和Imagen 4,以及专为影视制作设计的新工具Flow。Veo 3作为视频生成模型的迭代版本,在动态细节和场景连贯性上实现突破;Imagen 4则进一步提升了文本...

Read More
2025-05-14 talkingdev

Ai2发布小型AI模型Olmo 2 1B,性能超越谷歌、Meta同规模模型

人工智能研究机构Ai2近日推出其最新研发的小型AI模型Olmo 2 1B,该模型拥有10亿参数,在关键基准测试中表现优异,超越了谷歌和Meta等科技巨头发布的同规模模型。这一突破性进展展示了小型化AI模型的巨大潜力,表明在...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page