Llama的相关内容 - 漫话开发者

2025-04-16 talkingdev

[开源]Auto Deploy (GitHub Repo)：NVIDIA推出PyTorch和Hugging Face模型高效部署新方案

NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具，该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器，模型推理速度可提升数倍，特别适...

2025-04-07 talkingdev

Meta公司新推出的Llama 4模型套件包含了四款全新的AI模型，分别是Maverick、Scout、Behemoth和Reasoning。Maverick与Scout两款模型现已开放下载，用户可以在Llama官网以及Hugging Face平台获取，并已集成至Meta AI系...

2025-04-07 talkingdev

Meta最新发布的Llama 4模型通过创新性的混合位置编码策略，实现了超过1000万tokens的上下文处理能力。该技术核心在于交替使用无位置嵌入（NoPE）和旋转位置嵌入（RoPE），在保持计算效率的同时显著扩展了上下文窗口...

2025-04-01 talkingdev

开源项目Orpheus近期引发开发者社区关注，该项目通过C++实现了一个高效易用的文本转语音(TTS)系统。与Llama.cpp类似，其最大技术亮点在于完全脱离GPU依赖，仅需简单安装即可在普通计算设备上运行，显著降低了语音合...

2025-03-28 talkingdev

近日，Elastic官方博客发布了一篇关于如何在本地环境中运行RAG（检索增强生成）系统的详细教程。该教程指导用户逐步安装Ollama并在容器中运行，随后将其连接到Kibana可视化平台，最终实现基于DeepSeek R1模型的本地R...

2025-03-18 talkingdev

MMS-LLaMA是一款高效的多模态语音大语言模型框架，专注于自动视觉语音识别（AVSR），在优化标记长度的同时保留了语言内容。该框架通过整合视觉和语音数据，提供了一种全新的方法来提升语音识别的准确性和效率。MMS-L...

2025-03-14 talkingdev

Nous Research近日推出了Inference API，旨在为开发者和研究人员提供其个性化的、无限制的语言模型访问权限。该API支持两种模型：Hermes 3 Llama 70B和DeepHermes-3 8B Preview，并通过候补名单系统管理需求，增加其...

2025-03-04 talkingdev

Llama Stack 定义并标准化了将生成式AI应用推向市场所需的核心构建模块。这些构建模块以可互操作的API形式呈现，并由广泛的提供商提供其实现。它们被组装成易于开发者从零到生产的发行版。Llama Stack 的目标是简化...