生成技术的相关内容 - 漫话开发者

2023-11-14 talkingdev

Jupyter Notebook实现超快速语音生成技术

Bark是一种文本转语音系统，它可以生成连贯、快速和超长的音频输出。现在，我们可以在Jupyter Notebook中使用Bark，将文本转换为语音文件，使其更加便捷。Bark使用深度神经网络作为其文本到语音模型，具有很高的准确...

2023-11-08 talkingdev

微软的Xbox与Inworld AI合作，提供AI驱动的游戏开发工具，聚焦于叙事和角色创造，以促进和丰富游戏设计流程。Inworld AI的自然语言生成技术将被应用于游戏开发中，以帮助设计师更快地构建角色和编写对话。这种技术将...

2023-10-20 talkingdev

ProductAI是一家提供人工智能（AI）解决方案的公司，日前推出了一项新技术，可通过AI生成高质量的产品照片。这项技术基于计算机视觉和机器学习，能够快速、准确地生成符合规格的产品照片。根据公司表示，这项技术不...

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-10-16 talkingdev

研究人员使用预训练的扩散模型在较小的图像上进行训练，以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题，并将问题指向了模型结构的有限感知能力。

2023-10-04 talkingdev

AI生成技术正在重塑我们对大量数据收集的传统价值观。大型语言模型可以通过最小化的数据进行微调，甚至可以生成合成数据集，这使得专有数据的独特性和重要性可能正在逐渐减弱。在过去，我们通常认为数据量的大小和独...

2023-09-27 talkingdev

由Nvidia赋能的Getty最近推出了一项商业图像生成服务，该服务提供了强大的商业保障。这一服务的推出，将进一步推动图像生成技术的商业应用，特别是在广告、媒体和娱乐等行业，提供更加贴近需求的图像内容。Getty与Nv...

2023-09-18 talkingdev

近期，3D生成领域取得了飞速发展，其中，一个稳定且具有广泛应用前景的项目在GitHub Repo上获得了大量关注。这项工作被认为是最稳定且通用的。用户只需要输入一张图像，模型就能合成多个视图并生成相应的3D模型。这...