漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Cognition发布AI软件工程师Devin

talkingdev • 2024-03-13

549243 views

Cognition发布了一款名为Devin的新系统,该系统在测试AI编写代码能力的挑战性基准测试SWE-Bench上获得了14%的分数,而GPT-4则只得到了1.7%。该模型显示具有强大的上下文学习能力。

核心要点

  • Cognition发布AI编写代码能力测试新系统Devin。
  • Devin在SWE-Bench上获得14%的分数,而GPT-4仅得1.7%。
  • Devin具有强大的上下文学习能力。

Read more >