测试框架的相关内容 - 漫话开发者

2023-12-12 talkingdev

Giskard开源：针对从表格到LLMs的模型测试框架

Giskard是一个开源的测试框架，用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力，还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

2023-11-07 talkingdev

Giskard是一个Python库，可以自动检测从表格模型到LLM的AI模型的漏洞，包括：性能偏见、数据泄露、虚假相关性、幻觉、毒性、安全问题等等。让您的模型快速、安全地投入生产。在GitHub上安装Giskard或在Colab中尝试。

2023-09-26 talkingdev

Minum是一款极简实验性Web框架。它具有带有磁盘持久化的内存数据库、服务器端模板、日志和测试框架、HTML解析等功能。 Minum的编译大小只有150千字节，其中包括必需的依赖项在内，生产代码仅有3,757行。

2023-08-18 talkingdev

Turmoil是一个用于分布式系统的测试框架。它可以在单个线程中运行多个并发主机，以提供确定性执行。Turmoil通过手动控制或使用种子环来改变模拟网络，从而向系统引入困难。

2023-06-27 talkingdev

Giskard是一个专注于机器学习模型测试的开源框架，适用于从表格模型到LLM（Language Learning Models）的各种模型。该框架提供了一套强大的工具和方法，帮助开发人员测试和验证机器学习模型的准确性和鲁棒性。Giskar...