RL的相关内容 - 漫话开发者

2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS：复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS，这个名字是一个复杂的缩写，全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本，Flamingo...

2023-08-22 talkingdev

RLIPv2：一个更优秀的语言视觉模型

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法，但是它存在一些问题，尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2，这是一个更快速的版本，它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

2023-08-17 talkingdev

强化学习：微型故事模型的对齐工具

强化学习可能是当前对齐大型语言模型（甚至视觉模型）最好的工具。然而，当你需要大量的人类数据来训练一个奖励模型时，这就成为了一项挑战。如果你可以只使用“提示”呢？这是RLCF（强化学习计算框架）趋势的又一绝佳...

2023-08-17 talkingdev

人工智能在现实世界中展现创造力

这篇文章讨论了三篇最近的实验论文，展示了人工智能在具有现实世界影响的场景中可以展现创造力。

2023-08-16 talkingdev

专业的食品图像分割技术开源

虽然段落任意模型（SAM）在各种数据集的分割任务中表现优异，但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性，有效地分割食品图像，甚至识别出场景中的单个食品和其他...

2023-08-10 talkingdev

Inworld AI成为AI x 游戏领域最资金充足的初创公司

Inworld AI宣布由Lightspeed Venture Partners领导的新一轮5000万美元的融资，使公司总估值超过5亿美元。这将使Inworld能够加速研发工作，聘请顶级人才，构建更为强大的人物引擎，扩展基础设施，并开源其平台的部分...

2023-07-31 talkingdev

优化后的Llama 2，上下文长度达到32k

最近获得2000万美元投资的together公司，已经对Llama 2进行了微调，通过在位置嵌入上进行线性扩展，使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试，但是他们警告说，现代语言模...

2023-07-25 talkingdev

Sam Altman推出眼球扫描的Worldcoin，'大幅提高经济机会'

Worldcoin已开始在全球范围内推出其服务。该初创公司旨在建立一个可靠的解决方案，以区分在线的人类和人工智能，从而实现全球民主进程并大幅提高经济机会。任何想要获得World ID的人都需要下载World App并访问Worldc...