Llama的相关内容 - 漫话开发者

2024-05-16 talkingdev

Nous Hermes发布首款Theta模型，具有出色的函数调用能力

Nous Hermes发布了全新的Theta模型，该模型是Hermes 2 Pro和Llama 3 8B instruct的结合。它具有出色的函数调用能力，并在各种基准测试中表现强劲。Hermes 2 Pro是一款高性能的模型，而Llama 3 8B instruct则以其强大...

2024-05-15 talkingdev

Genkit是一款针对Firebase的新型工具集，专门用于构建和部署生成性产品。Genkit可以用来启动开源语言模型的服务器。Firebase是Google的移动平台，它可以帮助开发者快速开发高质量的应用，增加用户基础，并获取更多的...

2024-05-14 talkingdev

WebLlama是一个设计精良的模型，能够浏览网页并据此回答相关问题。这种模型可用于生成高质量的预训练数据集，或者执行需要从网页查询信息的研究。WebLlama的目标是通过模型的训练，使其能够更好地理解和处理网络信息...

2024-05-07 talkingdev

DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2，其中激活参数达到210亿。无论是在编码还是推理方面，该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型，但无疑，...

2024-05-03 talkingdev

最近，一位开发者使用WebGPU构建了一个免费的浏览器内Llama 3聊天机器人。Llama 3聊天机器人是一个人工智能聊天机器人，能够回答用户的问题，甚至能够进行基础的对话。与其他聊天机器人不同的是，Llama 3聊天机器人...

2024-05-01 talkingdev

Meta发布了一款名为ExecuTorch的框架，这是一个后训练量化工具包，能够支持在各种iPhone和Galaxy设备上运行Llama模型。该框架能够在运行7B大小语言模型的手机上，每秒获取多达11个令牌。ExecuTorch框架的发布，进一...

2024-04-30 talkingdev

Moondream 2模型作为一种高效的AI模型，其性能强大且体积小巧，现已发布其全功能的VLM可执行文件，名为llamafile。这款全功能的VLM可执行文件是一种完全自包含的程序，可以在边缘设备上运行。这意味着，即使在没有网...

2024-04-29 talkingdev

AI 小镇是一个可以在本地完全运行的人类交互模拟器。这一技术的关键在于，它可以能在本地运行，而不需要依赖云端服务。用户可以在自己的计算机上模拟出人类的各种互动行为。这一创新技术的出现，为人工智能的发展提...