漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

SEAHORSE:一种评估多语言摘要系统的工具

talkingdev • 2023-05-25

1393418 views

SEAHORSE是一个数据集,用于评估多语言摘要系统的质量。该数据集包含96,000个摘要,这些摘要已经根据六个重要方面(清晰度、重复、语法、归因、主要观点和简洁性)由人类进行了评分。这个数据集不仅可以作为自动化度量性能的基准,还为训练这些度量提供了有价值的资源,帮助研究人员推进多语言摘要评估领域的发展。 SEAHORSE数据集的三个核心点: - 评估多语言摘要系统的质量 - 包含96,000个摘要,根据六个重要方面进行了评分 - 为训练自动化度量提供了有价值的资源,帮助推进多语言摘要评估领域的发展。