漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

Giskard开源:针对从表格到LLMs的模型测试框架

Giskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

Read More
2023-11-07 talkingdev

Giskard:LLM和ML模型的开源测试框架

Giskard是一个Python库,可以自动检测从表格模型到LLM的AI模型的漏洞,包括:性能偏见、数据泄露、虚假相关性、幻觉、毒性、安全问题等等。让您的模型快速、安全地投入生产。在GitHub上安装Giskard或在Colab中尝试。

Read More
2023-06-27 talkingdev

Giskard:一个专注于机器学习模型测试的开源框架

Giskard是一个专注于机器学习模型测试的开源框架,适用于从表格模型到LLM(Language Learning Models)的各种模型。该框架提供了一套强大的工具和方法,帮助开发人员测试和验证机器学习模型的准确性和鲁棒性。Giskar...

Read More