漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-05 talkingdev

区块链为生成式AI系统提供透明度和审计能力的解决方案

IBM咨询和Casper Labs正在共同开发一种由区块链驱动的开创性AI治理工具。该工具是基于IBM的watsonx.governance平台构建的,它将为企业使用的AI模型引入AI版本控制、高级监控、许可和访问控制。对于那些希望在遵守内...

Read More
2024-01-25 talkingdev

论文:MMCbench新基准测试大型多模型

这篇技术报告介绍了MMCBench,这是一个新的基准测试,旨在测试各种任务如文本到图像和语音到文本等情况下大型多模型(LMMs)的一致性和可靠性。该测试涵盖了超过100个流行模型,旨在提高读者对这些AI系统在现实世界...

Read More
2024-01-24 talkingdev

自我提升AI:通过选择独特数据的DiverseEvol方法

最近,一种名为DiverseEvol的新方法在GitHub上发布,它可以让AI模型选择自己的训练数据,使其在不需要人工或其他先进AI系统的帮助下变得更好。DiverseEvol方法包括两个步骤:第一步是从数据集中选择用于训练模型的样...

Read More
2024-01-22 talkingdev

FILCO-通过上下文过滤提升AI理解能力

近日,GitHub开源了一项名为FILCO的技术,旨在通过上下文过滤来提高人工智能系统的性能,特别是在回答问题和核查事实等领域。该技术的工作原理是选择最有用的信息,并训练模型来过滤掉不相关的细节。相比传统的人工...

Read More
2024-01-21 talkingdev

DoraemonGPT:基于LLM的AI系统在视频理解方面迈出重要一步

最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...

Read More
2024-01-20 talkingdev

Vlogger开源,AI系统提供分钟级别的短视频制作

近日,AI系统Vlogger在GitHub上推出了自己的仓库,为用户提供分钟级别的视频博客制作服务。Vlogger的制作流程分为四个阶段:脚本、演员、节目制作和配音,每个阶段都代表着视频制作的不同方面。用户只需要向Vlogger...

Read More
2024-01-15 talkingdev

我的AI时间表再次加速

本文是对2020年一篇文章的更新,该文章预测了人工通用智能(AGI)将何时被实现。它将AGI定义为在几乎所有经济价值工作上与人类相匹配或超越的AI系统。先前的文章预测2035年有10%的几率实现,但现在已经变成了2028年...

Read More
2024-01-11 talkingdev

SpeechAgents-多模态LLMs实现人类沟通模拟

SpeechAgents是一个多模态人工智能系统,能够以惊人的真实度模拟人类的交流。这个系统由多模态LLM支持,可以处理多达25个代理人。它可以通过模仿人类对话,包括连贯的内容、真实的节奏和表达丰富的情感,来创造戏剧...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page