漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-16 talkingdev

Google下一代IDE项目IDX,现已进入公开测试阶段

项目IDX是一个以AI为中心的,基于浏览器的开发环境,该项目于8月份以邀请制的形式启动。已有超过10万开发者尝试了该项服务,并现已进入公开测试阶段。Google已经将Google地图平台的集成添加到了这个IDE中,并与Chrom...

Read More
2024-05-15 talkingdev

Google发布PaliGemma优化模型

Google在今天的发布中公布并展示了一些开源模型。其中一个已经发布的模型是基于SigLIP的视觉语言模型。这个模型非常容易调整和扩展到多种任务。这个Colab笔记本展示了如何用简洁、易读的代码来实现这一点。SigLIP是...

Read More
2024-05-15 talkingdev

Ollama在Google Firebase上的新动态

Genkit是一款针对Firebase的新型工具集,专门用于构建和部署生成性产品。Genkit可以用来启动开源语言模型的服务器。Firebase是Google的移动平台,它可以帮助开发者快速开发高质量的应用,增加用户基础,并获取更多的...

Read More
2024-05-15 talkingdev

图像去雨技术的新突破——ESDNet神经网络模型

ESDNet是一个专为图像去雨任务设计的脉冲神经网络(SNN)。这个神经网络模型首次将雨像素的独特属性用于增强脉冲信号强度。其设计理念是利用雨滴的像素值的特性,通过特定的神经网络结构和算法,实现对图像中的雨滴...

Read More
2024-05-15 talkingdev

Google I/O 2024新品发布:Gemini Flash、Veo视频生成、Imagen 3及最新助手Project Astra亮相

在2024年的Google I/O开发者大会上,Google发布了众多新功能,包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言,这些改进数量惊人,包括扩大到2m的令牌上下文长度,大幅降低的模型价格...

Read More
2024-05-15 talkingdev

谷歌AI技术重构搜索引擎,让搜索更聚焦于用户需求

谷歌宣布在I/O开发者大会上推出了多项AI技术,其中包括AI概述功能,旨在为用户提供搜索结果的概述,让用户专注于重点。该功能将出现在搜索结果的顶部,为用户提供由AI生成的摘要。此外,Lens中的一个功能可以通过拍...

Read More
2024-05-14 talkingdev

Pipecat:构建语音及多模态对话Agent框架

Pipecat是一个构建语音和多模式对话代理的框架。这个框架使开发者能够更便捷地创建和管理语音交互系统。多模式对话代理则是指可以处理多种类型输入(如文字、语音、图像等)的人工智能系统。Pipecat不仅适用于创建语...

Read More
2024-05-14 talkingdev

IBM开源其Granite代码模型源代码,推动编程任务更轻松高效

IBM近日宣布,将其Granite代码模型开源,以便更好地服务于开源社区,推动各平台的编程工作更为轻松和高效。这些模型的参数量在3亿到340亿之间,并覆盖了多种编程任务。这一举动,对于开发者们来说无疑是一大福音,他...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page