漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-14 talkingdev

Jupyter Notebook实现超快速语音生成技术

Bark是一种文本转语音系统,它可以生成连贯、快速和超长的音频输出。现在,我们可以在Jupyter Notebook中使用Bark,将文本转换为语音文件,使其更加便捷。Bark使用深度神经网络作为其文本到语音模型,具有很高的准确...

Read More
2023-11-08 talkingdev

Xbox携手Inworld AI开发AI工具以推动游戏开发创新

微软的Xbox与Inworld AI合作,提供AI驱动的游戏开发工具,聚焦于叙事和角色创造,以促进和丰富游戏设计流程。Inworld AI的自然语言生成技术将被应用于游戏开发中,以帮助设计师更快地构建角色和编写对话。这种技术将...

Read More
2023-10-20 talkingdev

ProductAI推出AI生成产品照片技术

ProductAI是一家提供人工智能(AI)解决方案的公司,日前推出了一项新技术,可通过AI生成高质量的产品照片。这项技术基于计算机视觉和机器学习,能够快速、准确地生成符合规格的产品照片。根据公司表示,这项技术不...

Read More
2023-10-16 talkingdev

minidalle3,提高LLMs的文本到图像生成技术

研究人员正在改进我们与文本到图像模型的交互方式,例如Midjourney和Stable Diffusion,这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”,使人们可以自然地与大型语言模型进行交互,以获得更...

Read More
2023-10-16 talkingdev

ScaleCrafter: 高分辨率图像生成技术开源

研究人员使用预训练的扩散模型在较小的图像上进行训练,以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题,并将问题指向了模型结构的有限感知能力。

Read More
2023-10-04 talkingdev

数据是否仍然是护城河?AI生成技术重新塑造数据价值观

AI生成技术正在重塑我们对大量数据收集的传统价值观。大型语言模型可以通过最小化的数据进行微调,甚至可以生成合成数据集,这使得专有数据的独特性和重要性可能正在逐渐减弱。在过去,我们通常认为数据量的大小和独...

Read More
2023-09-27 talkingdev

Getty联手Nvidia推出商业化图像生成服务

由Nvidia赋能的Getty最近推出了一项商业图像生成服务,该服务提供了强大的商业保障。这一服务的推出,将进一步推动图像生成技术的商业应用,特别是在广告、媒体和娱乐等行业,提供更加贴近需求的图像内容。Getty与Nv...

Read More
2023-09-18 talkingdev

SyncDreamer开源,多视图合成技术进一步提升

近期,3D生成领域取得了飞速发展,其中,一个稳定且具有广泛应用前景的项目在GitHub Repo上获得了大量关注。这项工作被认为是最稳定且通用的。用户只需要输入一张图像,模型就能合成多个视图并生成相应的3D模型。这...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page