模型的相关内容 - 漫话开发者

2024-06-28 talkingdev

苹果、微软缩小AI模型以提升性能

科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型（SLMs），苹果和微软引入的模型具有明显较少的参数，但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议，我们正在超越LLMs的时...

2024-06-28 talkingdev

据外媒报道，研究人员正在开发一种名为CriticGPT的新技术，以帮助找出GPT-4可能存在的错误。CriticGPT 是在 GPT-4 模型的基础上构建的，它通过分析 GPT-4 模型的输出，找出其中的错误和偏差。相比目前的技术，Critic...

2024-06-27 talkingdev

这款7b模型在医疗数据上进行了训练，当由医生进行人类偏好评估时，其与GPT-4打成了平手。这表明了医疗领域AI技术的强大进步。这款模型的性能与GPT-4相当，显示出其在理解和解析医疗数据方面的强大能力。这项成就不仅...

2024-06-27 talkingdev

Slack的工程师们采用了混合方法，结合了抽象语法树变换和AI大型语言模型，自动化地将超过15,000个Enzyme单元测试转化为React测试库。通过整合Anthropic的Claude 2.1 AI模型并捕获React组件的DOM树，团队在自动化转换...

2024-06-27 talkingdev

本篇文章分享了两种关键方法，帮助Agent从实验阶段走向真实世界：长期规划和系统级的鲁棒性。这些方法引入了为代理人制定高阶计划的能力，同时允许在剧情中途进行适应，以及采用系统方法智能地协调提供更高精度和性...

2024-06-27 talkingdev

RES-Q是一个全新的评估工具，专门用来评估大型语言模型在根据自然语言指令编辑代码库的能力。这个评估标准的出现，为开发者提供了一个全新的工具，可以更准确地评估和比较不同语言模型在代码编辑方面的性能。RES-Q的...

2024-06-27 talkingdev

近日，一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器（Trajectory Diffusion Transformer）和多视图...

2024-06-27 talkingdev

在预训练中，如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本，仍然能匹配各种任务的最新技术。在这个过程中，他们采用了一种名为“联合样...