人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...
Read MoreRLIPv1是一种帮助计算机将图像与描述性词语相连接的方法,但是它存在一些问题,尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2,这是一个更快速的版本,它使用了一种新的工具ALIF来更好地融合图像和词语。同时...
Read More强化学习可能是当前对齐大型语言模型(甚至视觉模型)最好的工具。然而,当你需要大量的人类数据来训练一个奖励模型时,这就成为了一项挑战。如果你可以只使用“提示”呢?这是RLCF(强化学习计算框架)趋势的又一绝佳...
Read More虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他...
Read MoreInworld AI宣布由Lightspeed Venture Partners领导的新一轮5000万美元的融资,使公司总估值超过5亿美元。这将使Inworld能够加速研发工作,聘请顶级人才,构建更为强大的人物引擎,扩展基础设施,并开源其平台的部分...
Read More最近获得2000万美元投资的together公司,已经对Llama 2进行了微调,通过在位置嵌入上进行线性扩展,使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试,但是他们警告说,现代语言模...
Read MoreWorldcoin已开始在全球范围内推出其服务。该初创公司旨在建立一个可靠的解决方案,以区分在线的人类和人工智能,从而实现全球民主进程并大幅提高经济机会。任何想要获得World ID的人都需要下载World App并访问Worldc...
Read More