漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-16 talkingdev

SqueezeTime-移动视频理解的新进展

SqueezeTime是一款为移动视频理解设计的轻量级网络,其独特之处在于,它能够将视频的时间轴压缩到频道维度中,从而增强了时间分析的能力。SqueezeTime网络的设计理念是,通过压缩时间轴,可以在不牺牲视频内容质量的...

Read More
2024-03-29 talkingdev

Spice:跨数据源的SQL查询利器

Spice是一个运行时工具,能够简化和加速通过SQL对一个或多个数据源的查询操作。它为开发者提供了一个统一的SQL查询接口,能够本地化实体化、加速和查询来自任何数据库、数据仓库或数据湖的数据表。Spice的出现使得构...

Read More
2024-02-27 talkingdev

如何应对人工智能项目成本上涨?

很多应用程序在发展初期,一旦获得一定的关注度和增长,变量成本就会急剧上升。在增长时必须应对这些问题是非常困难的,因为开发人员必须在引擎仍在运行时有效地重建它。创始人可以通过提前规划,拥有多种基础设施选...

Read More
2024-02-20 talkingdev

程序员将复杂代码库整合为单个120K令牌提示,GPT-4和Gemini 1.5回答7个问题的结果

最近,这位Reddit用户将两个复杂的代码库放入了GPT-4-Turbo-128K和Gemini 1.5中,并向它们提出了问题。代码库实现了一个并行的inet运行时,因此涉及一些难以处理的编译器内容。在理解代码库的任务中,Gemini 1.5完全...

Read More
2024-02-19 talkingdev

Magika:AI驱动的文件类型检测工具

Magika是一款AI驱动的文件类型检测工具。它使用自定义的Keras模型,仅重约1MB,能够在单个CPU上运行时毫秒级别地实现精确的文件识别。Magika的精度和召回率均达到了99%以上。Google在大规模使用Magika来提高用户的安...

Read More
2024-02-09 talkingdev

Yolo-World: 实时开放词汇的目标检测

目标检测是识别物体及其边界框的过程。通常只能为训练前选择的一组固定物体进行检测。本研究介绍了一种实时方法,可以进行开放词汇目标检测,这意味着它可以检测任何在运行时指定的物体组合的边界框。该方法使用了一...

Read More
2024-02-09 talkingdev

LLRT:用于解决快速高效的Serverless应用程序需求的JavaScript运行时

Low Latency Runtime (LLRT)是一种JavaScript运行时,旨在解决对快速高效Serverless应用程序的不断增长的需求。与在AWS Lambda上运行的其他JavaScript运行时相比,它提供了超过10倍的更快启动时间和最多2倍的总体更...

Read More
2023-12-20 talkingdev

机器学习中Jaxtyping 的思考

在机器学习中,形状错误是一种难以调试的问题,通常只有在运行模型时才能发现。通过将形状检查作为类型,您可以消除大部分这种挑战,并更快地开发。Jaxtyping 是一个库,它使用 JAX 的类型系统来提供形状检查,从而...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page