漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-07 talkingdev

多Agent协同:LLMs随着Agent数量的增加而性能扩展

研究人员发现,当涉及到复杂的任务时,使用更多的代理人可以显着提高LLMs的性能。这项研究的结果表明,LLMs的性能随着代理人数量的增加而线性扩展。这是因为更多的代理人可以提供更多的观察和决策,使LLMs更好地理解...

Read More
2024-04-04 talkingdev

Opera推出本地运行大型语言模型的新功能

近日,知名浏览器Opera推出了一项创新功能,使用户能够在本地计算机上下载并运行大型语言模型(LLMs)。目前,该功能提供了超过150种不同的模型,涵盖50多个家族,为用户提供了前所未有的便利和灵活性。这些模型可以...

Read More
2024-04-02 talkingdev

微软推出面向初学者的生成型人工智能课程

微软在其广受欢迎的大型语言模型(LLMs)、向量数据库、提示技术以及低代码应用课程的基础上,发布了第二版的课程内容,现已上线GitHub。该课程共包含18课,虽然部分内容具有前瞻性,但依然是踏入该领域的良好起点。...

Read More
2024-04-02 talkingdev

LLMs如何引领RPA流程自动化新时代

尽管RPA(机器人流程自动化)在早期取得了一些成功,但其在企业范围内的部署并没有达到预期效果。德勤的一项调查显示,仅有3%的公司能够成功扩大其RPA项目规模。然而,人工智能的最新进展有望改变这一现状。大型语言...

Read More
2024-04-01 talkingdev

EvoEval:全新代码基准测试套件,全面提升大型语言模型编程能力评估

EvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

Read More
2024-03-28 talkingdev

通过街头霸王游戏测试基准语言模型

语言模型(LLMs)的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...

Read More
2024-03-27 talkingdev

人工智能模型Claude-3展现特殊智能,超越人类智商

近期,由Anthropic开发的最新人工智能模型Claude-3在高级认知任务上的表现超越了普通人类智商,并且在某些领域胜过了业界知名的GPT-4模型。然而,尽管在这些复杂任务上表现出色,Claude-3在处理一些人类认为简单的谜...

Read More
2024-03-21 talkingdev

利用LLM生成随机模糊测试工具

像Claude这样的大型语言模型(LLMs)能够为解析代码生成有效的模糊测试工具,这一过程传统上需要大量的人力投入。尽管LLMs通常在精确度上不足以进行静态分析,但它们似乎非常适合创建模糊测试工具,因为模糊测试的随机...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page