漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-28 talkingdev

ModelScope推出Diffusion Studio:为扩散模型提供高效抽象平台

ModelScope近日发布了Diffusion Studio,这是一个基于GitHub的开源平台和代码库,旨在为多种类型的扩散模型及其相关的自动编码器提供高效的抽象支持。Diffusion Studio通过简化复杂模型的开发流程,帮助研究人员和开...

Read More
2025-02-28 talkingdev

DeepSeek开源DualPipe:创新并行策略提升模型计算与通信效率

近日,DeepSeek在GitHub上发布了名为DualPipe的开源项目,展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略,旨在优化模型的计算与通信重叠,从而显著提升整体性能。这一策略通过高效的...

Read More
2025-02-27 talkingdev

微软发布全新Phi模型,专为多模态处理优化

微软近日发布了两款全新的开源语言模型Phi-4-mini和Phi-4-multimodal,这两款模型在硬件效率和多模态处理方面表现出色。其中,Phi-4-mini拥有38亿参数,专注于文本任务;而Phi-4-multimodal则具备56亿参数,能够处理...

Read More
2025-02-27 talkingdev

AISafetyLab:全面AI安全框架开源,涵盖攻击、防御与评估

近日,AISafetyLab在GitHub上发布了一个全面的AI安全框架,旨在为研究人员和开发者提供一套完整的工具集,以应对AI系统中的安全问题。该框架不仅包含了多种模型和数据集,还提供了实用的工具和一系列与AI安全相关的...

Read More
2025-02-26 talkingdev

LLM开源项目:AI玩转《Pokémon》游戏

近日,一个名为'LLM plays Pokémon'的开源项目在技术社区引发了广泛关注。该项目利用LLM(大型语言模型)技术,成功实现了AI自主玩转经典游戏《Pokémon》。通过结合LoRA(低秩适应)和RAG(检索增强生成)等技术,该...

Read More
2025-02-26 talkingdev

基于DiNO 2的视线估计算法在GitHub开源,助力商业与安全应用

近日,一款基于DiNO 2的视线估计算法在GitHub上开源,该算法能够高效地估计人们的视线方向,为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点,可以广泛应用于零售场景中的消费者行...

Read More
2025-02-25 talkingdev

Browser Use开源Web Agents,推动自动化浏览技术发展

近日,Browser Use (YC W25) 宣布推出其开源项目——Web Agents,旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术,能够模拟人类在网页上的操作行为,如点击、滚动、填写表单等。通...

Read More
2025-02-25 talkingdev

DeepSeek开源MLA核心框架FlashMLA,推动AI基础设施创新

近日,DeepSeek宣布开源其内部基础设施的一部分,首推MLA(机器学习加速)核心框架FlashMLA。这一开源项目已在GitHub上发布,旨在为开发者提供高效、灵活的机器学习加速工具。FlashMLA通过优化计算资源分配和任务调...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page