漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

Giskard开源:针对从表格到LLMs的模型测试框架

Giskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

Read More
2023-11-07 talkingdev

Giskard:LLM和ML模型的开源测试框架

Giskard是一个Python库,可以自动检测从表格模型到LLM的AI模型的漏洞,包括:性能偏见、数据泄露、虚假相关性、幻觉、毒性、安全问题等等。让您的模型快速、安全地投入生产。在GitHub上安装Giskard或在Colab中尝试。

Read More
2023-09-26 talkingdev

Minum:一款极简实验性Web框架

Minum是一款极简实验性Web框架。它具有带有磁盘持久化的内存数据库、服务器端模板、日志和测试框架、HTML解析等功能。 Minum的编译大小只有150千字节,其中包括必需的依赖项在内,生产代码仅有3,757行。

Read More
2023-08-18 talkingdev

分布式系统测试框架Turmoil开源

Turmoil是一个用于分布式系统的测试框架。它可以在单个线程中运行多个并发主机,以提供确定性执行。Turmoil通过手动控制或使用种子环来改变模拟网络,从而向系统引入困难。

Read More
2023-06-27 talkingdev

Giskard:一个专注于机器学习模型测试的开源框架

Giskard是一个专注于机器学习模型测试的开源框架,适用于从表格模型到LLM(Language Learning Models)的各种模型。该框架提供了一套强大的工具和方法,帮助开发人员测试和验证机器学习模型的准确性和鲁棒性。Giskar...

Read More