Nvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...
Read More近日,GitHub上推出了名为RECURRENTGPT的新技术,它是一种基于语言的循环机制,被嵌入到像ChatGPT这样的大型语言模型中。通过模拟长短期记忆机制,RECURRENTGPT实现了任意长度的文本生成,同时保留了长期记忆。该技...
Read More人工智能公司Apptronik正准备在今年夏季发布其全新的通用机器人。该机器人由上下两部分组成,其中Astra是一个上半身部件,可以安装在其他机器人上,而Draco则是一对机器腿。与特斯拉的Optimus不同,Apptronik的方法...
Read MoreONE-PEACE是一种新模型,无需从预先训练的模型开始,就能出色地理解图像、声音和单词,并在涉及视觉、音频和语言的任务中表现出色。它还具有一个独特的功能,可以在不曾共同出现的不同类型的数据之间找到联系,其灵...
Read More在传统AI训练中,我们使用通常的语言标签(如“积极”或“消极”),但现在有了一种新的方法——符号调整。符号调整是一种新的AI训练方式,它使用随机的符号(如“foo”或“bar”)代替正常的语言标签,迫使AI从输入与标签之间...
Read More近日,一家新兴科技公司发布了新的 SDK,使用户可以使用稳定扩散模型创建动画。这一创新技术可以生成无条件、图像条件或视频条件下的动画,其结果非常美观,但计算成本较高,且具有非常独特的风格。以下是该技术的...
Read More近日,科研团队推出了一种名为 SUR-adapter 的新技术,可升级计算机程序中的扩散模型,将简单的描述转化为详细的图像。通过训练这些模型更好地理解故事,并使用超过 57,000 个样本的新数据集,研究人员使模型更擅长...
Read MoreMosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...
Read More