漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-27 talkingdev

DeepFloyd IF代码发布

- Stability AI发布了下一代图像模型代码 - 模型是一个多阶段模型,具有冻结的T5文本编码器和两个超分辨率模型 - 模型能够呈现极高质量的文本,可能首先只面向研究,但会在社区反馈后开放。 深度学习模型 DeepFloyd...

Read More
2023-04-20 talkingdev

机器学习:使用视觉指令调整大型语言模型

本文介绍了一篇新的论文,提出使用机器生成的指令跟踪数据来调整大型语言模型(LLMs)以执行多模态任务。该论文开发了LLaVA,这是一个大型多模态模型,它结合了视觉编码器和仅限于语言的GPT-4。经过调整后,LLaVA展...

Read More
2023-04-19 talkingdev

新技术发布:RT-DETR超越YOLO实现实时物体检测

以下是本次新技术发布的三个核心要点: - 实时物体检测一直是计算代价高昂的问题,而新的Real-Time Detection Transformer (RT-DETR)技术通过采用高效的混合编码器和IoU感知查询选择等优化策略,成功解决了这个问题...

Read More
2023-04-17 talkingdev

AdaM技术:自适应人像抠图技术应用于动态视频

以下是本篇新闻的核心内容: - AdaM是一种适用于动态视频的自适应抠图技术,能够同时预测前景和背景,并捕捉各种不规则视频中的alpha通道细节。 - AdaM利用编码器-解码器网络和转换网络,提高了抠图的真实感和时间...

Read More
2023-04-15 talkingdev

深度解析Transformer模型及其工作原理

新闻内容: Transformer模型是一种深度学习模型,近年来在自然语言处理任务中表现出色。那么,它究竟是什么,又是怎么工作的呢?以下是本文的重点: - Transformer模型是什么 - Transformer模型的历史和发展...

Read More
2023-04-14 talkingdev

AdaM:自适应人像抠图技术,让视频处理更自然

以下是本文报道的主要内容: - AdaM是一种自适应人像抠图框架,适用于动态视频。 - AdaM通过编码器-解码器网络和转换器网络同时区分前景和背景,并捕捉多样化、非结构化视频中的阿尔法抠图细节,解决了无Trimap方法...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5