漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-10 talkingdev

开源LLM Gateway,实现多语言模型之间的路由

Portkey AI最近开源了LLM Gateway,实现了多个不同语言模型之间的路由。这个开源项目旨在简化在不同的语言模型之间进行选择和路由的过程,从而更好地利用不同模型的优势,提高语言模型的整体性能。 LLM Gateway是一...

Read More
2024-01-10 talkingdev

DeepSeek LLM技术报告发布:接近GPT-3.5水平

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...

Read More
2024-01-09 talkingdev

用提示增强的视觉语言模型开源

这项项目介绍了一种方法,可以适应各种任务的类似CLIP的视觉语言模型,同时保留其泛化能力。该方法从LLM数据中学习提示,避免了需要标记图像的需求。

Read More
2024-01-04 talkingdev

Pykoi开源:采用RLHF提高LLMs性能

Pykoi是一个开源的Python库,旨在通过RLHF(Reinforcement Learning with Hamiltonian Flows)提高LLMs(Latent Linear Models)的性能。Pykoi是一个基于TensorFlow 2的库,提供了一系列的LLMs和RLHF的实现,可以直...

Read More
2024-01-03 talkingdev

2024年伊始:漫话LLMs和编程

在2023年,大型语言模型(LLMs)已经成为程序员的无价之宝,显著加快了代码编写速度并帮助理解复杂的API或框架。虽然在复杂的系统编程方面存在局限性,但LLMs在Python高级编程和单调任务方面表现出色,是提高生产力和...

Read More
2024-01-03 talkingdev

现代LLM领域热门课程话题解析

LLM领域的热门话题一直是法学、政治学和经济学等领域的研究重点。本文将对LLM领域的融合、GGUF、量子化、DPO等热门话题进行分析,旨在帮助初学者、科学家和工程师快速了解该领域的最新进展。在本文中,我们将介绍LLM...

Read More
2024-01-03 talkingdev

论文:微软研究使用LLM改进文本嵌入技术

微软的研究人员使用合成数据来训练基于Mistral的解码器,以改进嵌入技术。该技术是同类产品中最佳的。有趣的是,他们使用GPT-4的两步提示策略来生成合成检索训练数据。

Read More
2024-01-03 talkingdev

2023年AI探索总结:如何在个人设备上运行LLMs

本文旨在总结2023年人工智能发展的亮点。它涵盖了如何在个人设备上运行LLMs、微调模型、易受骗问题、LLM应用等方面。LLMs可以为有效使用它们的人提供显著的生活品质提升。它们实际上相当容易构建,但仍有许多未知数...

Read More
  1. Prev Page
  2. 27
  3. 28
  4. 29
  5. Next Page