漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-06 talkingdev

AnimateLCM-高保真视频生成技术实现高质量视频创作

AnimateLCM是一种新的方法,可以通过将学习过程分成两部分来快速创建高质量的视频和改进现有的视频扩散模型。AnimateLCM的第一步是利用低复杂度的运动补偿技术来生成一个低质量的视频序列。 然后,利用一个基于自适...

Read More
2024-02-06 talkingdev

自然语言SQL-7B模型现身,强大的文本转SQL模型

最近,谷歌AI团队发布了一篇论文,介绍了他们新开发的自然语言SQL-7B模型。这一模型使用了一种名为T5的预训练语言模型。这种模型可以将人类语言转换为SQL查询。自然语言SQL-7B模型是目前最强大的文本转SQL模型之一,...

Read More
2024-02-05 talkingdev

Nous Research发布Hermes数据集

OpenHermes-2.5数据集已被用于训练一些最好的开源模型。该数据集包含100多万个高质量数据点的示例。现在已经发布。

Read More
2024-02-02 talkingdev

论文:文本为基础的图像修复技术发布

本文介绍了一个基于场景和手写文本的基准测试和两个数据集。利用原始、损坏和辅助图像,全局结构引导扩散模型(GSDM)利用文本结构有效恢复清晰文本。该技术在识别准确度和图像质量方面显示出显著的改进。

Read More
2024-02-02 talkingdev

Stanchion:SQLite3扩展程序,实现列式存储

Stanchion是一款SQLite 3扩展程序,可以在SQLite中实现列式存储。它将列式存储和数据仓库的所有优势带到了SQLite已经部署的任何地方。相对于行式存储,列式存储在存储和处理指标、日志和事件数据、时间序列数据存储...

Read More
2024-02-01 talkingdev

Lilac Garden快速聚类技术:将语言模型训练效率提高100倍

在训练语言模型时,一个挑战是为任务找到足够多样化的数据集。更难的是,将这些数据可视化。这个很酷的工具使用快速聚类和主题建模,使得可以探索数据,以改善过滤和整体质量。

Read More
2024-01-31 talkingdev

使用不一致掩模进行图像分割

不一致掩模(IM)是一种新的图像分割方法,即使只有有限的数据,也可以发挥作用。该方法在ISIC 2018数据集上进行了测试,击败了传统技术,甚至超过了在完全标记的数据集上训练的模型。

Read More
2024-01-30 talkingdev

HF发布WebDataset格式

HuggingFace最近发布了一种名为WebDataset的数据格式,它可以将多个记录组合在一起。任何具有相同前缀的内容都会被视为同一条记录。这种格式非常适合于流式传输和快速数据加载。WebDataset还可以支持使用并行处理来...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page