漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-06 talkingdev

谷歌实验室推出Portraits AI教练工具,携手专家Kim Scott提供个性化指导

谷歌实验室近日发布了名为Portraits的AI教练工具,该工具整合了包括知名专家Kim Scott在内的多位专业人士的经验,通过AI技术为用户提供个性化指导。Portraits利用谷歌Gemini模型的强大能力,创建交互式虚拟形象,模...

Read More
2025-06-05 talkingdev

[开源]谷歌工程师提案:限制网站未经许可访问用户本地网络

谷歌工程师团队在GitHub上发布了一项名为'Local Network Access'的提案,旨在通过技术手段限制网站未经用户明确授权访问其本地网络资源的能力。该提案针对当前Web安全体系中存在的潜在风险,即恶意网站可能利用浏览...

Read More
2025-06-04 talkingdev

[开源] FFmpeg正式合并WebRTC支持,开启多媒体处理新纪元

开源多媒体框架FFmpeg近日在其代码库中正式合并了对WebRTC(Web实时通信)技术的支持(提交哈希:167e343bbe75515a80db8ee72ffa0c607c944a00),这一重大更新标志着FFmpeg开始深度整合现代实时音视频通信能力。WebRT...

Read More
2025-06-02 talkingdev

谷歌低调发布AI Edge Gallery应用:支持本地运行Hugging Face模型

谷歌近日悄然推出一款名为AI Edge Gallery的应用程序,该应用允许用户直接在安卓设备上查找、下载并运行来自Hugging Face的兼容AI模型,且无需联网即可使用。这一突破性进展标志着移动端AI技术的重大进步,使得高性...

Read More
2025-05-26 talkingdev

谷歌Veo AI视频技术亮相Flow TV平台,展示用户生成内容新形态

谷歌旗下实验室推出的Flow TV平台,通过持续流媒体形式展示由用户生成的AI视频片段及其对应提示词,并按主题频道进行分类。该平台基于谷歌最新Veo AI视频生成技术,标志着生成式AI在影视内容创作领域的重大突破。Veo...

Read More
2025-05-26 talkingdev

Gemma 3n架构创新解析:谷歌I/O大会发布的全新轻量化模型成员

谷歌在2024年I/O开发者大会上悄然推出了Gemma系列的新成员Gemma 3n,这一采用自由权重(free weights)设计的轻量化模型引发了AI社区的广泛关注。作为Gemma家族的最新成员,3n版本在模型架构上进行了显著创新,其技...

Read More
2025-05-23 talkingdev

谷歌I/O 2025大会AI亮点回顾:Gemini 2.5 Pro Deep Think与Veo 3重磅发布

谷歌最新一期Release Notes播客深度解析了I/O 2025大会的AI技术突破,重点介绍了三大核心创新:1) Gemini 2.5 Pro Deep Think作为下一代多模态AI系统,通过增强的递归神经网络架构实现复杂逻辑推理,其万亿级参数规...

Read More
2025-05-22 talkingdev

谷歌推出Gemini Diffusion:首个采用扩散模型替代Transformer的大语言模型

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破,这是该公司首次采用扩散模型(Diffusion Model)完全替代传统的Transformer架构。技术文档显示,该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page