漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-11 talkingdev

人体姿态与身形编辑技术取得新突破

该项目介绍了一种一次性编辑人类图像的方法,可以在保留人的身份的同时,对姿势和身形进行重大变化。该技术基于深度学习模型,利用对抗生成网络 (GAN) 和条件生成网络 (CGAN) 的方法,用户只需提供一张人体图像,就...

Read More
2023-12-25 talkingdev

Llava多模交互模型:聊天式文本、图像输入和输出

Llava是一个强大的多模型模型。该交互式设计现在允许聊天式交错文本、图像输入和图像输出。Llava是一个深度学习模型,能够对文本和图像数据进行联合建模,并产生准确的输出。与其他模型不同的是,Llava模型不仅考虑...

Read More
2023-11-28 talkingdev

论文:视觉上下文提示:AI视觉任务的新时代

视觉上下文提示(Visual In-Context Prompting)是一种创新的方法,能适应各种提示和上下文,极大地提高了分割任务的性能,并在开放式挑战中展示了令人印象深刻的结果。该方法为深度学习模型提供了更多的信息,从而...

Read More
2023-10-27 talkingdev

RGM,一种多功能的图像像素匹配方法

研究介绍了RGM(Robust Generalist Matching),这是一种专为图像中的稀疏和密集像素匹配而设计的深度学习模型。该方法利用了一种独特的级联GRU模块和一个新的大规模数据集。该模型可以应用于多种场景,具有广泛的适...

Read More
2023-10-24 talkingdev

自动化生成fine-tune.jsonl文件

调整语言模型需要按特定格式创建训练数据。这通常是令人沮丧和缓慢的过程。本文探讨了自动化该过程的简单方法。 深度学习模型的表现受到其训练数据的质量的影响。因此,对于特定任务,调整语言模型的能力非常重要。...

Read More
2023-10-19 talkingdev

论文:用小模型研究大模型,研究人员通过小模型验证大模型训练中的不稳定性

大规模训练中的不稳定性对于大多数研究人员来说很难复制。一项新论文展示了如何在小模型中重现这些不稳定性,并验证了许多常见的修复方法在这些小模型上同样有效。该论文的作者认为,这样做有助于提高大规模训练的可...

Read More
2023-10-18 talkingdev

PyTorch团队推出轻量级runtime,支持在边缘设备上运行

近日,PyTorch团队推出了一款新的轻量级运行时和模型转换工具,以支持在资源受限的边缘设备上运行。此次推出的PyTorch Lite运行时,具有轻量级、高效、低延迟等特点,可以在边缘设备上运行深度学习模型,解决传统云...

Read More
2023-09-18 talkingdev

SPDTransNet开源,应用Transformers进行更深入的睡眠分析

变压器是一种智能算法,通常用于处理文本或图像。这个项目调整了它们,使其能够与EEG数据一起工作,以更好地理解睡眠阶段。变压器的这种新应用打开了一个新的可能性,即通过使用复杂的深度学习模型来解决健康问题,...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page