漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-04 talkingdev

OnnxStream,在树莓派Zero 2上运行Stable Diffusion 1.5

最近,一款名为OnnxStream的程序在GitHub上引起了广泛的关注。这款程序可以让用户在树莓派Zero 2上运行Stable Diffusion 1.5。这一技术的实现,无疑为那些希望在低功耗设备上运行复杂算法的用户提供了一个新的可能。...

Read More
2023-10-04 talkingdev

稳定运行 Diffusion XL 1.0,仅需 298MB 内存

Diffusion XL 1.0 是一款高性能、低内存占用的消息传递软件,最新版本仅需 298MB 的内存即可稳定运行。该软件支持多种协议和语言,能够提供快速、可靠的数据传输服务,适用于各种场景。此外,Diffusion XL 1.0 优化...

Read More
2023-10-03 talkingdev

Microsof的UniLM团队的Kosmos-2.5:将自然语言处理技术拓展至图像领域

近年来,Microsoft的UniLM团队在自然语言处理领域取得了一些显著的成果。他们最近推出的Kosmos模型套件已经进军图像领域。这次的特定实例是用于从图像读取文本密集的文件,并为该文件生成文本或标记。这与最近Meta为...

Read More
2023-10-02 talkingdev

视觉变换器的需求:寄存器

近几周出现的最酷、最简洁的视觉论文之一。视觉变换器使用“无用”的像素值作为存储全局信息的地方,这使得注意力映射变得难以解读。然而,如果你向词汇表中加入一个简单的 [reg] 标记,模型就会使用它,而不会将信息...

Read More
2023-09-29 talkingdev

Google推出新工具,允许发布者选择是否成为AI训练数据

近日,Google推出一款名为“Google-Extended”的新工具,这款工具让网站发布者有权选择阻止他们的数据被用于Google的人工智能训练。这意味着,即使发布者选择不参与AI训练,他们的网站内容仍然可以在Google搜索结果中...

Read More
2023-09-29 talkingdev

Meta的文字转图片模型超越SDXL,引领新AI助手之路

Meta公司新推出的Emu图像生成模型已在用户偏好调查中超越SDXL。Emu模型是在11亿图像对上进行预训练的,只在几千张精心策划的图像上进行了微调。此模型将作为Meta新AI助手计划的主要支柱。Emu的高效性能,证明了大规...

Read More
2023-09-29 talkingdev

InternLM-XComposer,图文理解与创作的未来

InternLM-XComposer是一个前沿的工具,能够创建文本和图片完美配合的文章。这款工具采用了先进的图像和文本理解技术,可以根据文本内容自动生成与之相符的图片,也可以根据图片生成相应的文本。此外,该工具还支持自...

Read More
2023-09-28 talkingdev

RL在扩散模型上的应用库

利用RL调整语言模型正逐渐成为模型部署流程中的标准步骤。现在,这将通过扩散模型以及DRLX的发布变得更加容易,DRLX允许用户指定奖励模型或使用预定义的模型。扩散模型通过简化了RL在语言模型调整中的实现,为AI技术...

Read More
  1. Prev Page
  2. 55
  3. 56
  4. 57
  5. Next Page