本项目引入了一种新颖的方法——多条件扩散模型,通过高效地将文本、动作和现有物体融合起来,为人体运动或房间设计等因素引导的场景创作带来了新的视角。该方法将不同条件下的扩散算法结合起来,以生成高质量的合成场...
Read More最近,Mistral发布了一个使用MLX生成文本的示例,这是一种基于人工智能的技术,它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到,它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...
Read MoreKandinsky 3.0是一种文本转图像模型,它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络(GAN)模型,通过学习图像语义和语法,从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...
Read More研究人员开发了Diffusion-SS3D,这是一种改进半监督3D物体检测的新方法,使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布,然后使用扩散模型去噪和生成更好的边界框输出。
Read MoreSolve Intelligence是一个基于人工智能的平台,可以帮助高效地起草高质量的专利文件。自7月份推出以来,全球25家以上的知识产权公司正在使用他们的平台,客户报告效率提高了60-90%。该公司从Y Combinator毕业,并最...
Read MoreZero123++是一个使用扩散原理从单个输入图像生成一致的多视图图像的模型。通过利用预训练的2D模型,Zero123++解决了纹理质量和对齐问题等挑战。
Read MoreStableVSR是一种新颖的视频超分辨率(VSR)方法,利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比,StableVSR可以更好地处理不同的噪声和失真情况,并且在不需要额外训练数据的情况下也...
Read More