漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-28 talkingdev

语言控制记忆系统

- 语言控制记忆系统(SCM)是一个全新的系统,它可以让语言模型代理(LLMs)处理长输入。 - SCM由三个关键模块组成:语言模型代理、内存流和内存控制器。 - SCM已被证明在处理长输入方面非常有效,并且它有潜力用于...

Read More
2023-04-24 talkingdev

Weights & Biases 推出 W&B Prompts 工具套件

Weights & Biases (W&B) 宣布推出 W&B Prompts 工具套件,专为处理大型语言模型(LLMs)的 Prompt 工程师设计。新工具包括一行代码的 LangChain 和 OpenAI 集成,用于日志记录,W&B Launch 与 OpenAI Evals 集成,以...

Read More
2023-04-21 talkingdev

微软推出代码集成LLMs的工具包

微软推出了一款名为Semantic Kernel (SK) 的轻量级SDK,可将人工智能大型语言模型(LLMs)与传统编程语言集成。这款创新型模型将自然语言语义功能、本地代码功能和基于嵌入式内存的功能融合在一起,以增强应用程序的...

Read More
2023-04-20 talkingdev

机器学习:使用视觉指令调整大型语言模型

本文介绍了一篇新的论文,提出使用机器生成的指令跟踪数据来调整大型语言模型(LLMs)以执行多模态任务。该论文开发了LLaVA,这是一个大型多模态模型,它结合了视觉编码器和仅限于语言的GPT-4。经过调整后,LLaVA展...

Read More
2023-04-19 talkingdev

亚马逊杰出科学家揭秘LLMs

本文是一篇采访亚马逊的两位杰出科学家Sudipta Sengupta和Dan Roth的转录,谈论机器学习技术。在谈话中,两位科学家帮助解密了从单词表示到定制硅上的专业计算等一切事项。从2019年以来,神经网络架构Transformers已...

Read More
2023-04-14 talkingdev

利用LLM构建应用程序

本篇文章主要介绍了Chip Huyen的一些见解,它是她长篇有用内容系列中的又一篇。具体而言,有两个见解-使用LLMs轻松构建出令人惊叹的应用程序,但将其准备好投入生产却异常困难。这主要是由于自然语言的歧义性以及如...

Read More
2023-04-13 talkingdev

Engshell:一款由LLMs驱动的跨平台英文Shell

Engshell是一个由LLMs驱动的英文Shell,可在任何操作系统上使用。 以下是Engshell的三个核心特点: - 跨平台:Engshell可在任何操作系统上使用。 - 英文界面:Engshell的界面为英文,方便国际用户使用。 - 支持LLM...

Read More
2023-04-12 talkingdev

深入探讨LLMs的任务、缺陷及其优化策略

本文将探讨LLMs技术,包括其能够执行的任务、存在的缺陷以及各种优化策略。以下是本文的三个核心要点: - 介绍LLMs的概念和任务范围 - 分析LLMs存在的缺陷和局限性 - 探讨优化LLMs的策略,包括prompt engineering

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20