质量的相关内容 - 漫话开发者

2023-12-12 talkingdev

LSDM-多条件扩散模型实现场景合成

本项目引入了一种新颖的方法——多条件扩散模型，通过高效地将文本、动作和现有物体融合起来，为人体运动或房间设计等因素引导的场景创作带来了新的视角。该方法将不同条件下的扩散算法结合起来，以生成高质量的合成场...

2023-12-12 talkingdev

RAVE是一种利用现有文本到图像扩散模型来增强视频的视频编辑方法。这种方法可以在保持原始运动和结构的同时实现高质量的视频编辑。

2023-12-11 talkingdev

最近，Mistral发布了一个使用MLX生成文本的示例，这是一种基于人工智能的技术，它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到，它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...

2023-12-11 talkingdev

Kandinsky 3.0是一种文本转图像模型，它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络（GAN）模型，通过学习图像语义和语法，从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

2023-12-08 talkingdev

研究人员开发了Diffusion-SS3D，这是一种改进半监督3D物体检测的新方法，使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布，然后使用扩散模型去噪和生成更好的边界框输出。

2023-12-07 talkingdev

Solve Intelligence是一个基于人工智能的平台，可以帮助高效地起草高质量的专利文件。自7月份推出以来，全球25家以上的知识产权公司正在使用他们的平台，客户报告效率提高了60-90%。该公司从Y Combinator毕业，并最...

2023-12-07 talkingdev

Zero123++是一个使用扩散原理从单个输入图像生成一致的多视图图像的模型。通过利用预训练的2D模型，Zero123++解决了纹理质量和对齐问题等挑战。

2023-11-30 talkingdev

StableVSR是一种新颖的视频超分辨率（VSR）方法，利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比，StableVSR可以更好地处理不同的噪声和失真情况，并且在不需要额外训练数据的情况下也...