漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-17 talkingdev

[开源]Prima CPP:低内存环境下运行大模型的创新方案

Prima CPP是llama.cpp的一个扩展项目,旨在通过内存映射(mmaping)技术,使大型模型能够在低内存环境中高效运行。这一技术突破为资源受限的设备部署先进AI模型提供了可能,尤其适用于边缘计算和移动端场景。通过优...

Read More
2025-04-16 talkingdev

[开源]Auto Deploy (GitHub Repo):NVIDIA推出PyTorch和Hugging Face模型高效部署新方案

NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具,该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器,模型推理速度可提升数倍,特别适...

Read More
2025-04-07 talkingdev

Meta发布Llama 4模型套件,新增四款人工智能模型

Meta公司新推出的Llama 4模型套件包含了四款全新的AI模型,分别是Maverick、Scout、Behemoth和Reasoning。Maverick与Scout两款模型现已开放下载,用户可以在Llama官网以及Hugging Face平台获取,并已集成至Meta AI系...

Read More
2025-04-07 talkingdev

[论文推荐]Rope to Nope:混合注意力机制突破长上下文处理极限

Meta最新发布的Llama 4模型通过创新性的混合位置编码策略,实现了超过1000万tokens的上下文处理能力。该技术核心在于交替使用无位置嵌入(NoPE)和旋转位置嵌入(RoPE),在保持计算效率的同时显著扩展了上下文窗口...

Read More
2025-04-01 talkingdev

[开源]Orpheus:无需GPU的轻量级文本转语音系统

开源项目Orpheus近期引发开发者社区关注,该项目通过C++实现了一个高效易用的文本转语音(TTS)系统。与Llama.cpp类似,其最大技术亮点在于完全脱离GPU依赖,仅需简单安装即可在普通计算设备上运行,显著降低了语音合...

Read More
2025-03-28 talkingdev

本地运行DeepSeek RAG:结合Elasticsearch、Ollama和Kibana的完整指南

近日,Elastic官方博客发布了一篇关于如何在本地环境中运行RAG(检索增强生成)系统的详细教程。该教程指导用户逐步安装Ollama并在容器中运行,随后将其连接到Kibana可视化平台,最终实现基于DeepSeek R1模型的本地R...

Read More
2025-03-18 talkingdev

[开源]面向语音的多模态LLM框架MMS-LLaMA发布

MMS-LLaMA是一款高效的多模态语音大语言模型框架,专注于自动视觉语音识别(AVSR),在优化标记长度的同时保留了语言内容。该框架通过整合视觉和语音数据,提供了一种全新的方法来提升语音识别的准确性和效率。MMS-L...

Read More
2025-03-14 talkingdev

Nous Research推出API,为开发者提供OpenAI和Anthropic未构建的AI模型访问权限

Nous Research近日推出了Inference API,旨在为开发者和研究人员提供其个性化的、无限制的语言模型访问权限。该API支持两种模型:Hermes 3 Llama 70B和DeepHermes-3 8B Preview,并通过候补名单系统管理需求,增加其...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page