漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-26 talkingdev

生产环境中的LLM应用评估指标

本文讨论不依赖于基准数据的评估指标。文章探讨了通用的以及特定于RAG、聊天机器人和摘要的评估方法。所有指标都附带Python实现。

Read More
2024-01-03 talkingdev

2023年AI探索总结:如何在个人设备上运行LLMs

本文旨在总结2023年人工智能发展的亮点。它涵盖了如何在个人设备上运行LLMs、微调模型、易受骗问题、LLM应用等方面。LLMs可以为有效使用它们的人提供显著的生活品质提升。它们实际上相当容易构建,但仍有许多未知数...

Read More
2024-01-02 talkingdev

2023年人工智能发展亮点盘点

本文总结了2023年人工智能发展的亮点,包括如何在个人设备上运行LLM,微调模型,易受欺骗的问题,LLM应用等等。LLM可以为有效使用它们的人提供显著的生活质量提升。它们实际上相当容易构建,但仍有很多未知数,对于...

Read More
2023-12-19 talkingdev

DeepEval,开源LLM应用评估框架

DeepEval是一款全能的LLM应用评估框架,可让用户轻松识别和迭代不令人满意的LLM输出。它目前提供了14+种评估指标,如幻觉、摘要、G-Eval、RAGAS等,供用户以Pytest样式或组件化方式评估整个数据集。

Read More
2023-11-23 talkingdev

开发者指南:将LLM应用程序部署到生产环境

开发LLM应用程序是一回事,成功在生产环境中部署它们是另一回事。本文通过剖析复杂性,为开发人员提供指南,帮助他们将LLM应用程序从开发环境转换到严峻的生产环境,最大限度地提高准确性。在生产环境中,LLM应用程...

Read More
2023-11-17 talkingdev

LLM Sherpa提供战略性API,加速LLM应用

LLM Sherpa(GitHub Repo)提供了一组战略API,使得大型语言模型应用能够更加高效地运行。这些API提供了强大的功能,可以大大加速自然语言处理、机器翻译和对话系统等应用。LLM Sherpa也提供了一些基于Python的示例...

Read More
2023-11-02 talkingdev

开源的LangChain模板仓库

这些模板是一组参考架构,适用于各种流行的LLM用例,是构建生产就绪的LLM应用程序最简单和最快速的方法。

Read More
2023-10-31 talkingdev

探索现代LLM应用程序架构

本篇博客旨在为读者提供构建第一个LLM应用程序所需的一切知识。它还介绍了一些读者今天可以开始探索的问题空间。本博客涵盖了LLM应用程序的新兴架构以及LLM的现实影响。提供了进一步阅读的资源。

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page