DeepEval是一款全能的LLM应用评估框架,可让用户轻松识别和迭代不令人满意的LLM输出。它目前提供了14+种评估指标,如幻觉、摘要、G-Eval、RAGAS等,供用户以Pytest样式或组件化方式评估整个数据集。
Read More本项目介绍了一种新的技术,用于估计图像中的光照,克服了当前依赖HDR全景数据集的现有方法的局限性。通过使用扩散模型将铬球渲染到标准图像中,该技术揭示了铬球与扩散噪声之间的独特关系。这种技术有助于提高图像...
Read More视频理解是一个古老的领域,现在才开始获得成功。成功的主要推动因素是高质量的数据集。Meta的这项工作包括许多传感器数据源和手势。它为现有方法提供了基准性能。
Read MoreFIND推出了一个多用途AI模型接口,使得AI模型能够更好地理解图像和数据集,而无需更改核心模型。该接口使用了一种新的嵌入对齐方法,能够将不同任务的嵌入空间对齐起来,从而提高模型的泛化能力。这一技术的研发背后...
Read More稳定性人工智能公司发布了StableLM Zephyr 3B稳定聊天模型,该模型是StableLM 3B-4e1t模型的一个扩展,灵感来源于Zephyr 7B模型,旨在实现高效的文本生成,特别是在指令跟踪和问答上下文中。该模型已经使用直接偏好...
Read More这个GitHub仓库公布了两个重要贡献:RDVS数据集,包含丰富多样的RGB-D视频场景,以及DCTNet+,一种专门用于RGB-D视频对象检测的网络,配备了创新功能,以精确预测和改进现有模型的性能。
Read More近日,OpenAI推出了数据伙伴计划,旨在与机构合作生产训练人工智能模型所需的数据集。该计划已经与包括冰岛政府和非营利组织Free Law Project在内的众多机构建立了合作关系。数据伙伴计划旨在通过与合作伙伴共享数据...
Read More科学家们开发出一种新方法,使用生成扩散技术创建代理数据集,这种数据集具有更好的代表性和更多样化,同时需要的计算资源更少。这种方法可以通过在代理数据集中训练神经网络来提高模型的性能。这种方法可以降低计算...
Read More