漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-08 talkingdev

BenchLLM开源,测试大型多模态模型的基准

这个项目介绍了BenchLMM,一个专门设计用于测试GPT-4V和LLaVA等大型多模态模型对各种图像样式的鲁棒性的基准。

Read More
2023-12-06 talkingdev

如何将LLMs作为函数使用

在将语言模型嵌入到您的代码库中时,一个有用的心理模型是将它们视为具有标准输入和输出的函数。这篇博客是由React Native的创始人撰写的,展示了几种您可以这样建模模型以及这种方式的好处。

Read More
2023-12-06 talkingdev

Perplexity AI推出在线LLM,或将取代谷歌搜索

Perplexity AI将网络索引和最新信息与会话式AI聊天机器人界面相结合,有可能取代谷歌。该公司最近发布了从Mistral和Meta开源模型中微调和增强的版本。这些模型旨在提供有用、真实和最新的信息。它们是第一个基于网络...

Read More
2023-12-05 talkingdev

LLM可视化(网站)

LLM可视化是一个展示nano-gpt模型的网站,该模型有85000个参数。它展示了该模型如何将一个包含6个字母的序列按字母顺序排列。此网站可以帮助人们更好地了解和理解自然语言处理中的模型和算法。

Read More
2023-11-30 talkingdev

使用LLM的成本是多少?

对不同模型的LLM常见问题的详细回顾表明,目前它真的是成本限制的。随着最新的OpenAI公告和开源模型的进展,这种情况可能会发生变化。虽然LLM在预测和生成自然语言方面表现出色,但目前的成本可能会限制其广泛应用。...

Read More
2023-11-30 talkingdev

Tanuki:轻松构建LLM技术驱动的应用,让应用变得更便宜、更快速

LLM是一种全新的机器学习技术,可以让应用程序在运行时不断学习和优化,从而实现更高效的性能和更低的成本。Tanuki是一款基于LLM技术的应用程序构建工具,可以帮助开发人员轻松创建这种具有自我学习和优化能力的应用...

Read More
2023-11-30 talkingdev

llamafile:运行在多个CPU微架构上的单文件分发工具

近日,llamafile发布了新的GitHub Repo,它是一种新的单文件分发工具,允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行,而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...

Read More
2023-11-29 talkingdev

CoachLM引入新型AI技术可提高指令质量

针对LLM(语言模型)的指令数据集,CoachLM引入了一种新型AI技术,通过修改而非删除低质量样本独特地改进了数据集,从而显著提高了LLM遵循指令的效果。

Read More
  1. Prev Page
  2. 31
  3. 32
  4. 33
  5. Next Page