漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-16 talkingdev

谷歌推出下一代AI模型Gemini 1.5,开发者和企业用户可以提前体验

谷歌推出了Gemini 1.5,开发者和企业用户可以提前体验,而消费者版的全面推出还需要等待。新版Gemini的性能高端,与谷歌最近推出的高端Gemini Ultra相媲美。Gemini 1.5采用了专家混合技术,使得模型对于用户而言更快...

Read More
2024-02-15 talkingdev

亚马逊发布史上最大的文本转语音AI模型,拥有“新兴能力”

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

Read More
2024-02-07 talkingdev

Pearls背景下的上下文贝叶斯试验教程

Pearls是Meta维护的一个RL框架。本教程将介绍如何使用该软件解决基于贝叶斯试验的学习问题。

Read More
2024-01-31 talkingdev

Shortwave发布基于AI的电子邮件自动补全

Shortwave发布了一个基于人工智能的自动补全功能,类似于GitHub Copilot,但专门为撰写电子邮件而设计。它从发送的电子邮件中学习,并提供上下文建议。

Read More
2024-01-23 talkingdev

论文:BriVIS开放词汇视频实例分割

研究人员开发了BriVIS,一种改进开放词汇视频实例分割(VIS)的方法。通过使用一种称为布朗运动桥的技术,BriVIS保持了物体运动在视频帧之间的上下文,从而实现了更准确的视频和文本对齐。

Read More
2024-01-22 talkingdev

FILCO-通过上下文过滤提升AI理解能力

近日,GitHub开源了一项名为FILCO的技术,旨在通过上下文过滤来提高人工智能系统的性能,特别是在回答问题和核查事实等领域。该技术的工作原理是选择最有用的信息,并训练模型来过滤掉不相关的细节。相比传统的人工...

Read More
2024-01-08 talkingdev

论文:无人驾驶中的语义分割技术(CAINet)

研究人员开发了一种名为CAINet的新方法来改进RGB-T语义分割技术,这对于无人驾驶至关重要。该系统独特地结合了不同类型的数据,注重它们的互补性和全局上下文。CAINet使用了一个基于注意力机制的自适应特征融合模块...

Read More
2023-12-19 talkingdev

谷歌发布Gemini Pro,为Vertex AI提供图像和文本处理能力

谷歌推出了Gemini Pro,这是其先进的AI模型Gemini Ultra的轻量级版本,在Vertex AI中公开预览,提供文本和图像处理能力以及可定制的上下文,适用于各种用例。Gemini Pro是一个快速而灵活的解决方案,可以自定义模型...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page