生成技术的相关内容 - 漫话开发者

2024-04-10 talkingdev

Visual Autoregressive Models：图像生成高分辨率解决方案

Visual Autoregressive Models是一个新的GitHub项目，它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开，但目前该项目已经引起了技...

2024-04-09 talkingdev

近期，研究人员开发了一种名为提示自动编辑（Prompt Auto-Editing，简称PAE）的新技术，旨在提升基于文本生成图像的技术水平。该技术利用了Imagen和Stable Diffusion等扩散模型，通过在线强化学习动态调整文本提示中...

2024-04-04 talkingdev

Stability AI近日宣布了其音乐生成模型的下一代产品——Stable Audio 2.0。该模型通过合法授权的音乐数据进行训练，能够生成长达3分钟的高质量音乐作品。Stable Audio 2.0还具备音频到音频的生成技术，这意味着用户可...

2024-03-28 talkingdev

AID及其变体PAID是两种旨在通过加入文本和姿势等条件来改进图像插值的技术。这些方法确保生成的图像在不需要额外训练的情况下，具有更高的一致性、平滑度和真实性。图像生成技术的进步不仅推动了人工智能领域的创新...

2024-03-26 talkingdev

最近的一项研究提出了一种新的图像合成中写实阴影生成的方法，解决了以往在形状和强度准确性方面的挑战。研究人员通过增强ControlNet的强度调节模块以及扩展DESOBA数据集，显著提高了图像中阴影生成的质量。该技术的...

2024-03-22 talkingdev

Cohere近日推出了专为大规模生产而优化的RAG（Retrieval-Augmented Generation）模型Command-R，并宣布将该模型引入NVIDIA新推出的API目录。Command-R模型结合了检索与生成技术，能够助力企业快速进入大规模生产环境...

2024-03-20 talkingdev

本文由前OpenAI科学家撰写，深入探讨了SORA技术及其生成视频的潜在成本。SORA是一种先进的视频生成技术，通过复杂的算法和大量的数据处理，能够创建出高质量的视频内容。文章详细介绍了SORA的工作原理，包括其如何处...

2024-03-15 talkingdev

Assort Health宣布获得350万美元的融资，以扩大其专门为医疗呼叫中心设计的生成式人工智能解决方案。该解决方案将利用AI生成呼叫中心代理人所需的所有内容。Assort Health表示，这将有助于医疗呼叫中心提高效率和质...