Contextual团队发布了一种能够同时生成文本和嵌入式编码的模型,名为生成式表征指导调整模型(Generative Representational Instruction Tuning)。该模型在多模态领域表现出色,远远超过了单一专家模型。这种模型的...
Read More研究人员开发了一种基于文本提示进行图像编辑的独特方法。这种方法使用文本到图像模型和边界框生成器来识别需要编辑的区域,从而无需蒙版或草图即可进行更改。该方法可实现文本驱动的图像编辑,可以大大提高图像编辑...
Read MoreNomic-Embed-Text-V1是一种开源、完全可重现的文本嵌入模型,为短文本和长文本任务树立了新的标杆。在透明度方面独树一帜,Nomic-Embed-Text-V1提供完全访问其训练代码、模型权重和包含2.35亿个文本对的大型数据集的...
Read MoreChatDB发布了一系列名为NaturalSQL的模型,这些模型在Text-to-SQL指令上表现出最新的性能。NaturalSQL是一个基于自然语言处理的SQL查询生成器,能够将自然语言指令转化为SQL查询语句。这个开源项目已经在GitHub上开...
Read MoreUDiffText是一种全新的方法,可以提高AI生成图片中的文字质量。通过使用专门的文本编码器和大型数据集进行微调,UDiffText显著减少拼写错误并提高文字准确性。
Read MoreDiff-Text是一种新的无需训练的框架,可用于创建任何语言的具有文本的逼真图像。它通过使用手绘图像作为先验,增强了稳定扩散模型的多语言能力。
Read More谷歌推出了Gemini Pro,这是其先进的AI模型Gemini Ultra的轻量级版本,在Vertex AI中公开预览,提供文本和图像处理能力以及可定制的上下文,适用于各种用例。Gemini Pro是一个快速而灵活的解决方案,可以自定义模型...
Read MoreGoogle推出了Imagen 2,这是一种增强的AI图像模型,可供经批准的Google Cloud Vertex AI用户使用,提供文本渲染,标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...
Read More