漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-27 talkingdev

医疗模型与GPT 4达到同等水平

这款7b模型在医疗数据上进行了训练,当由医生进行人类偏好评估时,其与GPT-4打成了平手。这表明了医疗领域AI技术的强大进步。这款模型的性能与GPT-4相当,显示出其在理解和解析医疗数据方面的强大能力。这项成就不仅...

Read More
2024-06-27 talkingdev

Slack利用AI技术将Enzyme单元测试转化为React测试库

Slack的工程师们采用了混合方法,结合了抽象语法树变换和AI大型语言模型,自动化地将超过15,000个Enzyme单元测试转化为React测试库。通过整合Anthropic的Claude 2.1 AI模型并捕获React组件的DOM树,团队在自动化转换...

Read More
2024-06-27 talkingdev

基于LLM的Agent未来,如何扩展其能力范围

本篇文章分享了两种关键方法,帮助Agent从实验阶段走向真实世界:长期规划和系统级的鲁棒性。这些方法引入了为代理人制定高阶计划的能力,同时允许在剧情中途进行适应,以及采用系统方法智能地协调提供更高精度和性...

Read More
2024-06-27 talkingdev

RES-Q-代码库编辑能力的新评估标准

RES-Q是一个全新的评估工具,专门用来评估大型语言模型在根据自然语言指令编辑代码库的能力。这个评估标准的出现,为开发者提供了一个全新的工具,可以更准确地评估和比较不同语言模型在代码编辑方面的性能。RES-Q的...

Read More
2024-06-27 talkingdev

Director3D开源-现实世界3D场景AI生成框架

近日,一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器(Trajectory Diffusion Transformer)和多视图...

Read More
2024-06-27 talkingdev

论文:DeepMind通过联合样本选择进行数据策划,进一步加速多模态学习

在预训练中,如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本,仍然能匹配各种任务的最新技术。在这个过程中,他们采用了一种名为“联合样...

Read More
2024-06-27 talkingdev

深度挖掘:稀疏自编码器(SAEs)的应用与实践

Golden Gate Claude 是一个出色的案例,展示了如何使用SAEs(稀疏自编码器)进行模型的驾驭和解读。该工作为我们提供了一个直观的解释,解释了它是如何工作的,并提供了一些用于训练这些模型的示例代码。自编码器是...

Read More
2024-06-27 talkingdev

论文:利用检索增强指令调整进行命名实体识别

检索增强指令调整(RA-IT)通过大型语言模型对信息进行提取,从而提高了信息提取的效率。这种技术的出现,为我们理解和处理大量信息提供了新的可能。RA-IT不仅可以提高信息提取的速度,还可以提高提取信息的准确性,...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page