大型语言模型的相关内容 - 漫话开发者

2023-12-18 talkingdev

论文：LLMs如何提高3D场景理解能力

一种新的研究方法通过在大型语言模型中引入物体标识符来改善对3D场景的理解并回答相关问题。该方法专注于识别和关联场景中的物体，在解释复杂的空间关系方面取得了有希望的结果，使得人工智能更加擅长这方面的任务。

2023-12-18 talkingdev

本文包含几个新的人工智能发展故事。这些故事涵盖了人工智能领域的竞争、行业就业现状、人工智能战略、Sourcegraph的Cody AI编码助手正式上线等。多年来致力于为其代码添加注释的工程师们为大型语言模型推理其代码提...

2023-12-18 talkingdev

本指南分享了优化大型语言模型效果的策略和技巧。这些方法有时可以组合使用以获得更好的效果。其中一些示例仅适用于最具能力的模型。获取更好效果的策略包括编写更清晰的说明、提供参考文本、将复杂任务分解成简单子...

2023-12-15 talkingdev

HyperRouter方法提高LLM训练效率。该方法通过动态调整路由器参数，进一步提高了大型语言模型训练的效率。

2023-12-15 talkingdev

这项研究介绍了一种使用降阶建模压缩大型语言模型的方法，可以显著减少内存和时间限制，而无需高端硬件。由于大型语言模型在自然语言处理中的应用越来越广泛，因此压缩这些模型以提高计算效率变得尤为重要。研究人员...

2023-12-15 talkingdev

FunSearch是一种人工智能系统，可以与特别训练的大型语言模型进行交互，创建生成数学问题解决方案的计算机程序。该系统会检查这些解决方案是否优于已知的解决方案，如果不是，它会向LLM提供反馈，以便下一轮改进。它...

2023-12-13 talkingdev

KwaiAgents是一个先进的代理系统，使用大型语言模型来模仿人类认知技能。该系统可以应用于自然语言处理、语音识别等领域。KwaiAgents的开放源代码已经上传至GitHub平台，使得更多的研究人员可以参与到该项目中来。该...

2023-11-24 talkingdev

本次大型语言模型介绍将讨论它们是什么，它们的发展方向，与现有操作系统的比较和类比以及该领域的一些安全相关挑战。大型语言模型是如今人工智能研究中一个非常重要的部分，近年来得到了广泛关注和应用。它们的出现...