开源的相关内容 - 漫话开发者

2025-02-28 talkingdev

ModelScope推出Diffusion Studio：为扩散模型提供高效抽象平台

ModelScope近日发布了Diffusion Studio，这是一个基于GitHub的开源平台和代码库，旨在为多种类型的扩散模型及其相关的自动编码器提供高效的抽象支持。Diffusion Studio通过简化复杂模型的开发流程，帮助研究人员和开...

2025-02-28 talkingdev

近日，DeepSeek在GitHub上发布了名为DualPipe的开源项目，展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略，旨在优化模型的计算与通信重叠，从而显著提升整体性能。这一策略通过高效的...

2025-02-27 talkingdev

微软近日发布了两款全新的开源语言模型Phi-4-mini和Phi-4-multimodal，这两款模型在硬件效率和多模态处理方面表现出色。其中，Phi-4-mini拥有38亿参数，专注于文本任务；而Phi-4-multimodal则具备56亿参数，能够处理...

2025-02-27 talkingdev

近日，AISafetyLab在GitHub上发布了一个全面的AI安全框架，旨在为研究人员和开发者提供一套完整的工具集，以应对AI系统中的安全问题。该框架不仅包含了多种模型和数据集，还提供了实用的工具和一系列与AI安全相关的...

2025-02-26 talkingdev

近日，一个名为'LLM plays Pokémon'的开源项目在技术社区引发了广泛关注。该项目利用LLM（大型语言模型）技术，成功实现了AI自主玩转经典游戏《Pokémon》。通过结合LoRA（低秩适应）和RAG（检索增强生成）等技术，该...

2025-02-26 talkingdev

近日，一款基于DiNO 2的视线估计算法在GitHub上开源，该算法能够高效地估计人们的视线方向，为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点，可以广泛应用于零售场景中的消费者行...

2025-02-25 talkingdev

近日，Browser Use (YC W25) 宣布推出其开源项目——Web Agents，旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术，能够模拟人类在网页上的操作行为，如点击、滚动、填写表单等。通...

2025-02-25 talkingdev

近日，DeepSeek宣布开源其内部基础设施的一部分，首推MLA（机器学习加速）核心框架FlashMLA。这一开源项目已在GitHub上发布，旨在为开发者提供高效、灵活的机器学习加速工具。FlashMLA通过优化计算资源分配和任务调...