大语言模型的相关内容 - 漫话开发者

2024-06-06 talkingdev

XRec：利用大语言模型提升可解释推荐系统

XRec是一种模型无关的框架，它利用大型语言模型的语言能力来增强可解释推荐系统。该框架的核心在于通过自然语言处理技术，为用户提供更透明和易理解的推荐理由。这不仅提升了用户对推荐系统的信任度，还为开发者提供...

2024-06-04 talkingdev

TrainAllInfAttn是一种能够在数据稀缺的专业领域提升大语言模型表现的方法。随着人工智能技术的不断发展，如何在数据有限的情况下仍能保持模型的高效性和准确性成为了一个重要的研究方向。TrainAllInfAttn通过优化模...

2024-05-24 talkingdev

最近，一项新的研究表明，大语言模型可以用来帮助金融分析师更快地分析公司的财务报表。这些模型可以利用自然语言处理技术，自动识别和解释公司的财务数据，为分析师提供更准确的预测和决策。这种方法已经在一些金融...

2024-05-24 talkingdev

近年来，大型语言模型在自然语言处理领域取得了显著进展，但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题，研究人员提出了一种新的方法：Streaming Infinite Retentive LLM（SirLLM）。这种方法允...

2024-05-23 talkingdev

Reworkd公司近日发布了一款名为Tarsier的新工具，旨在通过使用括号和ID对网页元素进行视觉标记，增强大语言模型（LLMs）的网页交互任务处理能力。Tarsier利用OCR生成的文本表示，使得没有视觉功能的LLM也能理解网页...

2024-05-23 talkingdev

MathBench是一项旨在全面评估大语言模型数学能力的新基准。这一基准的设计初衷是为了填补当前评估工具在数学领域的空白，提供一个更加系统化和科学化的评估方法。MathBench不仅涵盖了基础数学运算，还包括高级数学理...

2024-05-10 talkingdev

阿里巴巴云已经发布了其最新版的大语言模型 - Tongyi Qianwen Qwen2.5。这一新版本在推理、代码理解以及文本理解等方面相比于Qwen2.0有了显著的改进。Qwen2.5的推出标志着阿里巴巴在人工智能语言模型开发上取得了重...

2024-02-26 talkingdev

GradSafe是一种新的方法，用于检测大型语言模型中的不安全提示，无需进行大量的训练。它通过分析特定参数的梯度，比当前方法更有效地识别不安全的提示。