MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型,并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长,但它们显示出了很...
Read More微软的最新模型现已在HuggingFace上提供研究用途。Phi-2是一种基于Transformers的语言生成模型,它被训练用于生成各种文本,包括问答、对话和自然语言生成。该模型采用的是自回归模式,即在生成下一个单词或字符时,...
Read MoreControlNet是一种为图像合成模型提供细粒度控制的新颖方法。现在有一种类似的音乐生成模型,可以让您控制许多特征,如语音和音调。这种新型音乐生成模型可以为音乐家们提供更多的创作可能性,使其更好地掌握音乐创作...
Read More往往情况下,当你使用生成模型生成一张图片后,它不完全是你想要的。然而,使用同一模型对图像进行编辑是极具挑战性的。Meta有一个关键的想法,即将所有生成视为指令,从而使编辑功能出现。这与新的模型架构的简单性...
Read MoreOpenAI目前通过ChatGPT和API赢得了消费者和企业市场,但他们能否继续这么做还不确定。OpenAI是一家人工智能研究实验室,其目标是创建安全和有益的人工智能。ChatGPT是一种语言生成模型,可以生成与给定输入相关的自...
Read MoreDALLE-3图像生成模型的质量提升的主要驱动力之一是改进后的数据质量。通过使用内部模型进行标题上采样来实现。这里提供了一个使用强大的开源模型进行实现的GitHub开源库。
Read MoreChatGPT的Browse With Bing现已退出Beta测试,DALL-E 3正在进行Beta测试。这是OpenAI最近的两个重要更新,Browse With Bing是一款由OpenAI推出的基于自然语言的浏览器,用户可以通过聊天的方式寻找信息,而DALL-E 3...
Read More人工智能驱动软件的下一步演变并非聊天机器人,而是利用LLMs来完成实际工作的应用。AI基础设施联盟的此篇电子书全面覆盖了此领域的各个方面,包括Prompt工程、LLM逻辑和推理、主要框架如LlamaIndex、LangChain、Hays...
Read More