漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-08 talkingdev

CES 2024:AI智能电视、新电动汽车、更大的笔记本电脑和OLED游戏显示器,你期待什么?

CES 2024是一场展示各种技术的展会,今年的这个活动将会带来比任何其他事件都更多的技术新闻。活动将于明天开始,一直持续到星期五。随着对展会的兴奋增加,一些公司已经开始发布公告。本文包含了今年预期的一些最大...

Read More
2023-11-13 talkingdev

Success.ai:利用AI技术的拜访邮件,助力业务增长

Success.ai是一款基于人工智能技术的冷邮件产品,旨在帮助企业实现更高效的业务增长。该产品使用人工智能技术来自动化冷邮件的发送和跟进过程,从而帮助用户节省时间和精力。Success.ai的强大功能包括自动化邮件跟进...

Read More
2023-11-01 talkingdev

MPVSS,视频语义分割的掩码传播技术

最新研究引入了一种名为MPVSS的视频内容分割方法,这种方法通过关注关键帧,然后基于这些关键帧预测其他帧的掩码,从而减少计算负载。在这种方法中,首先选定一些关键帧,然后在这些帧上进行语义分割。接下来,通过...

Read More
2023-10-11 talkingdev

全新视频标记化工具MAGVIT-v2:提升视觉生成的重要武器

近期的一项研究介绍了一种名为MAGVIT-v2的视频标记化工具,有效地将图像和视频输入转化为大型语言模型(LLM)的标记。使用MAGVIT-v2,LLM在视觉生成任务中的表现超过了扩散模型。视频标记化是一种将视觉内容(如图像...

Read More
2023-10-06 talkingdev

CoDA开源:可智能识别和命名3D场景中的新物体

在3D场景中检测和命名新物体一直是一个艰巨的挑战。然而,最近一个名为CoDA的项目提出了一种新的解决方法。该方法通过智能猜测新物体可能出现的位置,然后将这些物体的特征与图片和文本进行匹配,所有这些操作都在一...

Read More
2023-10-03 talkingdev

Microsof的UniLM团队的Kosmos-2.5:将自然语言处理技术拓展至图像领域

近年来,Microsoft的UniLM团队在自然语言处理领域取得了一些显著的成果。他们最近推出的Kosmos模型套件已经进军图像领域。这次的特定实例是用于从图像读取文本密集的文件,并为该文件生成文本或标记。这与最近Meta为...

Read More
2023-10-02 talkingdev

Transformer-VQ:一种高效的线性时间关注模型

最新的研究成果Transformer-VQ,是一种全新设计的Transformer,由于其独特的基于向量的键和缓存功能,使得处理注意力的速度得到了显著的提升。这种新型的Transformer设计,不仅提高了处理速度,同时也保持了数据的准...

Read More
2023-09-28 talkingdev

QA-LoRA的智能构建和微调方法,让LLM更快更小

大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而,一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式,使得大型语言模型能够在维持强大功能的同时,有效...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page