LLM的相关内容 - 漫话开发者

2024-02-15 talkingdev

OpenLLMetry-JS：基于OpenTelemetry的扩展提供完整的LLM应用可观测性

OpenLLMetry-JS是建立在OpenTelemetry之上的一组扩展，为开发人员提供了完整的LLM应用程序可观测性。它可以连接到现有的可观测性解决方案。OpenLLMetry-JS可以对OpenTelemetry已经仪表化的一切进行仪表化。此外，它...

2024-02-14 talkingdev

苹果发布了一款新的代码，使用多模态语言模型来改进人类提供的自然语言图像编辑。这个新的代码的核心思想是使用大型语言模型来指导用户对图像进行编辑，从而提高编辑的质量和效率。该代码的具体实现是将图像与自然语...

2024-02-14 talkingdev

DeepMind和南加州大学的研究人员开发出SELF-DISCOVER框架，该框架显著提高了LLM的推理能力，在类似GPT-4的模型任务中比传统方法提升了32%。这个两阶段的框架使得LLMs能够自主地形成和利用推理结构。这个进步代表了AI...

2024-02-14 talkingdev

SGLang是一种针对大型语言模型设计的结构生成语言。它的设计目标是使与语言模型的交互更快速、更可控。SGLang提供了一种基于结构的生成方法，使用户能够更好地控制生成的文本。此外，它还提供了一些实用工具，如生成...

2024-02-13 talkingdev

Llmware是一个统一的框架，用于开发基于LLM的应用程序模式，包括检索增强生成。它提供了一个通用的API，使得开发人员能够轻松地使用不同的LLM模型和数据集。Llmware还为开发人员提供了一组可自定义的工具，用于自动...

2024-02-13 talkingdev

本研究着眼于一个基于大型语言模型的国际象棋AI是如何工作的。该AI使用了GPT-2和GPT-3模型，并通过对棋盘上的棋子和动作进行编码来训练自己。研究人员还探索了AI模型内部的世界，包括其理解和预测对手的能力，以及在...

2024-02-12 talkingdev

FunSearch是一种新的AI驱动方法，它将大型语言模型与评估算法相结合，已经在数学科学领域做出了可验证的发现，包括解决了长期存在的cap set问题和更高效的bin-packing问题算法。它引入了演化方法来生成和评估代码，...

2024-02-09 talkingdev

一项新研究揭示了多模态大型语言模型（MLLMs）如GPT-4V的一个弱点：它们难以处理特定类型的图像-文本输入，从而导致错误。CorrelationQA是一个基准测试，旨在评估MLLM在图像可能会误导或与文本相矛盾的情况下的表现...

2024-02-08 talkingdev

针对多模态大语言模型（MLLM）中的幻觉问题，研究人员开发了MHaluBench，一个新的评估幻觉检测方法的基准。该工具可以帮助研究人员更好地评估语言模型的幻觉能力，从而有效提高模型的质量和准确性。目前，该工具已经...

2024-02-06 talkingdev

ChatLLM for VS Code是AI辅助自动完成的开源替代品。它现在支持任何Ollama模型，以及使用封闭的API模型。在这个自动化和机器学习越来越流行的时代，ChatLLM提供了一种开源替代方案，为人们提供了更多的选择。