漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-07 talkingdev

[开源]Object Counting:基于特征图与自注意力机制的全自动零样本物体计数方法

GitHub开源项目Object Counting提出了一种突破性的全自动零样本物体计数方法,该方法通过融合深度特征图与自注意力机制,在FSC147数据集上实现了当前最先进的计数精度。该技术的核心创新在于:1)利用预训练视觉模型...

Read More
2025-04-04 talkingdev

[开源]Nebius推出Kvax:基于JAX的Flash Attention优化实现,助力长上下文训练

Nebius近日开源了Kvax项目,这是一个基于JAX框架的Flash Attention实现,专门针对长上下文训练场景进行了优化。Kvax通过创新的上下文并行技术和高效的文档掩码计算,实现了更快的训练速度和更高的数据密度压缩,在性...

Read More
2025-03-27 talkingdev

谷歌全面转向内部开发Android操作系统

谷歌宣布将放弃现有的双管齐下的Android开发策略,从下周起所有开发工作将完全在内部进行。此前,谷歌同时维护一个公共分支和一个内部开发分支,导致公司需要投入大量时间和精力在这两个分支之间的补丁合并上。这一...

Read More
2025-03-20 talkingdev

[开源]AAPM 2025挑战赛:开源代码助力剂量预测模型开发

在医疗技术不断进步的今天,精准的剂量预测模型对于放射治疗至关重要。AAPM 2025挑战赛(GDP-HMM Challenge)旨在推动这一领域的发展,而最近在GitHub上发布的开源代码库为参赛者提供了宝贵的资源。该代码库不仅包含...

Read More
2025-03-13 talkingdev

Bubbles:一款纯JavaScript打造的网页游戏亮相

近日,一款名为Bubbles的网页游戏在技术社区中引起了广泛关注。这款游戏完全基于vanilla JavaScript开发,无需依赖任何外部框架或库,展示了JavaScript在游戏开发中的强大能力。Bubbles的核心玩法简单而富有挑战性,...

Read More
2025-03-10 talkingdev

轻量级自回归流式文本转语音模型发布,适配任意LLM

近日,一款轻量级的自回归流式文本转语音模型在GitHub上发布。该模型仅包含3000万参数,能够与任何语言模型(LLM)结合,使其具备理解和生成语音的能力,以响应通用查询。这一技术的核心优势在于,它无需对底层模型...

Read More
2025-03-10 talkingdev

Distractor Aware SAM:解决视觉分割中的干扰问题

Segment Anything (SAM) 是视觉分析与分割领域的领先模型,但在处理视频中外观相似的对象时,可能会出现混淆。为了解决这一问题,Distractor Aware SAM 应运而生。该技术通过引入额外的记忆增强和训练机制,有效应对...

Read More
2025-02-18 talkingdev

Valve公开《Team Fortress 2》源代码,开发者社区反响热烈

近日,Valve宣布正式公开其经典多人射击游戏《Team Fortress 2》的源代码。这一举措旨在为开发者社区提供更多的资源和工具,以便他们能够更好地理解和扩展游戏的功能。Valve表示,此次发布的代码将包括游戏的核心逻...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page