大型语言模型的相关内容 - 漫话开发者

2024-07-17 talkingdev

DeRTa-提升LLMs安全性，解耦拒绝训练方法

近日，一种名为解耦拒绝训练（DeRTa）的新方法被提出，这种新方法通过解决拒绝位置偏差问题，进一步提高了大型语言模型（LLMs）的安全性调优效果。LLMs在各类应用场景中起着重要作用，安全性问题也因此变得尤为重要...

2024-07-12 talkingdev

Lookback Lens是一个直接的模型，用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息，来解决大型语言模型（LLM）在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...

2024-07-10 talkingdev

研究人员已经开发出一个新的框架，该框架将大型语言模型与强化学习相结合，以提高交通信号控制系统的性能。这种新的方法借助AI的能力，使交通信号控制系统能够更有效地管理交通流量，提高道路效率，降低交通拥挤，从...

2024-07-03 talkingdev

LLaRA是一个使用大型语言模型（LLM）来通过对话式的指令-响应对提高机器人行动政策的框架。通过整合视觉输入，这些视觉语言模型（VLM）处理状态信息并生成最优的政策决策。LLM的使用增强了机器人的理解和应对能力，...

2024-07-02 talkingdev

NLUX是一个可为大型语言模型提供用户界面的交谈式AI JavaScript库。它极大地简化了将强大的大型语言模型集成到Web应用程序的过程。NLUX具有React组件和钩子，LLM适配器，流式LLM输出以及自定义渲染器。这些特性使得N...

2024-07-02 talkingdev

AutoCodeRover是一款新的工具，专门用于自动化软件改进，包括修复漏洞和添加功能。该工具结合了大型语言模型（LLM）和先进的代码搜索技术，以实现优化和提升。通过使用这款工具，开发者可以更有效地进行代码的修改和...

2024-06-28 talkingdev

科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型（SLMs），苹果和微软引入的模型具有明显较少的参数，但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议，我们正在超越LLMs的时...

2024-06-27 talkingdev

Slack的工程师们采用了混合方法，结合了抽象语法树变换和AI大型语言模型，自动化地将超过15,000个Enzyme单元测试转化为React测试库。通过整合Anthropic的Claude 2.1 AI模型并捕获React组件的DOM树，团队在自动化转换...