漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-24 talkingdev

L-Eval:长篇语境语言模型的标准化评估工具(GitHub项目)

近日,一项名为L-Eval的项目引起了广泛关注。该项目旨在为长篇语境语言模型提供一套标准化的评估工具。L-Eval评估套件包含了超过2000个跨领域的查询-回应对,能够全面而系统地评估各种长篇语境语言模型的性能。通过...

Read More