漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-25 talkingdev

大模型LLM幻觉排行榜

最近,一份名为“Hallucination Leaderboard”的GitHub仓库开始在自然语言处理领域引起轰动。该仓库汇集了多种模型在摘要短文档时产生幻觉的性能比较数据,让人们更好地了解这些模型的优势和不足。据悉,该排行榜是由...

Read More
2024-01-23 talkingdev

机器学习工程开源书籍发布

机器学习工程开源书籍发布,该项目是一个开放的方法论集合,旨在帮助成功训练大型语言模型和多模态模型。该材料适用于LLM/VLM培训工程师和运营人员。书籍包含大量脚本和复制粘贴命令,以使读者能够快速解决问题。该...

Read More
2024-01-21 talkingdev

LLM评估方法的局限性,需要更有效方法

本文探讨了评估LLM的挑战,将其与人类员工评估进行比较。文章讨论了衡量LLM智能和实用性的困难,突出了当前评估方法的局限性和需要更有效方法的必要性。在人工智能领域,评估是至关重要的,因为它决定了LLM的质量和...

Read More
2024-01-21 talkingdev

Codium开源基于AI的代码生成模型

AlphaCodium推出了一种新颖的方法来增强LLMs的代码生成能力。这种多阶段、基于测试的迭代过程显著提高了像GPT-4这样的模型在解决复杂编程问题时的准确性,如在CodeContests数据集上所展示的。

Read More
2024-01-21 talkingdev

DoraemonGPT:基于LLM的AI系统在视频理解方面迈出重要一步

最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...

Read More
2024-01-16 talkingdev

Sleeper Agents:如何训练具有持久性的LLMs

Anthropic发布了一项非常有趣的研究,该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现,它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说,一旦模型被污染,就无法使用当前的工具消除不良...

Read More
2024-01-11 talkingdev

医学领域的LLM技术专家Agent开源

研究人员开发了一种新的多学科协作框架,以提高大型语言模型在医学领域的理解和推理能力。这种方法涉及到AI代理,扮演一起分析、讨论和达成共识的医学主题的角色扮演游戏。

Read More
2024-01-11 talkingdev

SpeechAgents-多模态LLMs实现人类沟通模拟

SpeechAgents是一个多模态人工智能系统,能够以惊人的真实度模拟人类的交流。这个系统由多模态LLM支持,可以处理多达25个代理人。它可以通过模仿人类对话,包括连贯的内容、真实的节奏和表达丰富的情感,来创造戏剧...

Read More
  1. Prev Page
  2. 26
  3. 27
  4. 28
  5. Next Page