漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-02 talkingdev

论文:研究者引入新的异常检测问题,聚焦场景特定的“奇异”对象

最近,研究者提出了一种新的异常检测问题,该问题针对的是相对于场景中其他对象的“奇异”对象。与传统方法不同,这里的异常情况是场景特定的,并通过多个视点进行识别。这种方法不仅能增强异常检测的准确性,也能帮助...

Read More
2024-07-02 talkingdev

改进推理效率的Block Transformer

这个代码库引入了一种新型的Transformer变压器,其KV缓存大小大幅度减少。虽然尚未在大规模上得到证实,但理论上,它可以匹配常规变压器的性能。这意味着,我们现在有了一种新的工具,可以在处理复杂的计算问题时,...

Read More
2024-07-02 talkingdev

UnSAM-无监督SAM自动图像分割技术开源

无监督SAM(UnSAM)是一种新型的全图像分割模型,它消除了对人工注释的需求。UnSAM通过结合自上而下和自下而上的聚类方法,识别视觉场景中的层次结构,采用一种分而治之的方法。在复杂的视觉场景中,这种方法可以更...

Read More
2024-07-02 talkingdev

Composio:赋能Agent,挑战复杂任务

Composio,这是一个在GitHub Repo上的项目,其主要目标是为Agent提供精心制作的工具,使他们能够处理复杂的任务。这些工具不仅易于使用,而且具有高度的灵活性和可定制性。Agent在使用这些工具时,可以更加有效地完...

Read More
2024-07-02 talkingdev

论文:以10亿人格特征来创建合成数据的新方法

近期,一项新的研究将网络文本视为来自某种“人格”,并以此作为条件,显著提高了下游任务的性能。研究人员发现,在数学领域,这种方法使性能提升了20个百分点。这项研究的方法是通过大规模网络文本数据,创造出约10亿...

Read More
2024-07-02 talkingdev

Web2Code开源-网页代码生成的新流程

研究人员已经开发出一种新的流程,以改进Web2Code指令调谐。这个过程涉及到创建新的网页图像-代码配对,优化现有的网页代码生成数据,创建新的文本问题-回答配对,以及优化现有的网页理解数据。这个新进程的开发,不...

Read More
2024-07-02 talkingdev

深度探索:用muP扩展规模

这是一篇关于在扩展模型和数据集大小时调整超参数的极好且易于理解的文章。在大数据时代,如何有效地处理和分析庞大的数据集,是当前科技行业面临的一大挑战。本文主要介绍了使用muP进行规模扩展的技术方法。muP是一...

Read More
2024-07-02 talkingdev

Figma AI:AI驱动的设计工具新选择

Figma AI是一套新的AI驱动工具,为Figma设计师提供了诸如视觉搜索、素材搜索、文本编辑、图像编辑、原型制作、图层重命名以及设计生成等功能。这些特性由第三方AI模型驱动,且在β测试期间是免费使用的。Figma AI的推...

Read More
  1. Prev Page
  2. 72
  3. 73
  4. 74
  5. Next Page