漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-22 talkingdev

RLIPv2:一个更优秀的语言视觉模型

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法,但是它存在一些问题,尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2,这是一个更快速的版本,它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

Read More
2023-08-17 talkingdev

强化学习:微型故事模型的对齐工具

强化学习可能是当前对齐大型语言模型(甚至视觉模型)最好的工具。然而,当你需要大量的人类数据来训练一个奖励模型时,这就成为了一项挑战。如果你可以只使用“提示”呢?这是RLCF(强化学习计算框架)趋势的又一绝佳...

Read More
2023-08-17 talkingdev

人工智能在现实世界中展现创造力

这篇文章讨论了三篇最近的实验论文,展示了人工智能在具有现实世界影响的场景中可以展现创造力。

Read More
2023-08-16 talkingdev

专业的食品图像分割技术开源

虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他...

Read More
2023-08-10 talkingdev

Inworld AI成为AI x 游戏领域最资金充足的初创公司

Inworld AI宣布由Lightspeed Venture Partners领导的新一轮5000万美元的融资,使公司总估值超过5亿美元。这将使Inworld能够加速研发工作,聘请顶级人才,构建更为强大的人物引擎,扩展基础设施,并开源其平台的部分...

Read More
2023-07-31 talkingdev

优化后的Llama 2,上下文长度达到32k

最近获得2000万美元投资的together公司,已经对Llama 2进行了微调,通过在位置嵌入上进行线性扩展,使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试,但是他们警告说,现代语言模...

Read More
2023-07-25 talkingdev

Sam Altman推出眼球扫描的Worldcoin,'大幅提高经济机会'

Worldcoin已开始在全球范围内推出其服务。该初创公司旨在建立一个可靠的解决方案,以区分在线的人类和人工智能,从而实现全球民主进程并大幅提高经济机会。任何想要获得World ID的人都需要下载World App并访问Worldc...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page