LLMs的相关内容 - 漫话开发者

2023-10-24 talkingdev

评估LLMs在多轮对话中的聊天能力

本研究评估了大型语言模型（LLMs）在进行类似于人类的多轮对话时的能力。研究人员使用了一种名为Persona-Chat的数据集，该数据集包含有关对话参与者偏好和兴趣的信息。研究结果表明，LLMs在某些方面表现出了与人类类...

2023-10-20 talkingdev

小型LLMs可能会超越大型LLMs，因为它们具有更快的训练速度、能够在没有专门硬件的情况下本地运行、具有经济性、延迟较低、部署容易、可能具有更好的可解释性和可重现性等优势。

2023-10-20 talkingdev

近年来，大型语言模型(LLMs)在自然语言处理领域引起了广泛关注，但它们如何表达真相仍然是一个有待研究的问题。为了解决这个问题，研究人员开发了一些交互式图表，可以帮助用户更好地理解LLMs如何表示真相。这些图表...

2023-10-18 talkingdev

本研究介绍了LLM4SGG弱监督场景图生成方法，该方法利用大型语言模型的能力，从图像标题中更好地提取和对齐关系，解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

2023-10-17 talkingdev

MemGPT允许开发者创建带有自我编辑记忆的永久聊天机器人。它智能地管理LLMs中的不同记忆层，以有效地提供扩展上下文。MemGPT知道何时将关键信息购买到向量数据库中，以及何时在聊天中检索它，从而实现永久对话。该存...

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-10-12 talkingdev

近日，由一群开发者共同开发的开源系统OpenLLMetry正式发布。OpenLLMetry基于OpenTelemetry，旨在提供对LLMs的观测性能分析。LLMs是轻量级的微服务，可以在边缘设备上运行，OpenLLMetry的发布将为开发人员提供更好的...

2023-10-11 talkingdev

研究人员正在探究数据增强技术对提高大型语言模型（LLMs）数学推理能力的影响。他们通过增强现有数据集中的查询，创建了一个新的数据集AugGSM8K，并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...