测试工具的相关内容 - 漫话开发者

2025-05-01 talkingdev

SALT开源-跨传感器与场景的半自动标注工具

卡文迪什实验室开发的SALT（Semi-Automatic Labeling Tool）为LiDAR点云处理领域带来突破性解决方案。该工具通过创新的零样本适应技术，能够在不进行额外训练的情况下，直接适配不同厂商的激光雷达传感器（如Velodyn...

2025-04-25 talkingdev

开发者Anders和Tom近日在Hacker News上宣布推出Magnitude，一个完全开源的、基于视觉大模型（VLM）的端到端Web应用测试框架。该框架旨在解决传统浏览器代理测试工具速度慢、成本高且结果不一致的问题。Magnitude采用...

2025-04-03 talkingdev

DeepMind最新研究推出的Snowplow是一种创新的内核模糊测试工具，其核心在于采用了基于学习的白盒变异器（learned white-box mutator），能够显著提升测试变异的效率。该工具在Linux内核模糊测试中表现出色，不仅大幅...

2025-04-01 talkingdev

近年来，Linux系统的二进制兼容性问题日益成为开发者关注的焦点。由于Linux生态中发行版众多，内核版本、库依赖以及ABI（应用二进制接口）的差异，导致同一二进制文件在不同Linux环境下运行时可能出现兼容性问题。专...

2025-03-13 talkingdev

PromptPex是一个创新的开发者工具，它将AI模型中的提示词（prompts）视为函数，并自动生成测试输入，从而实现对AI模型提示词的系统化单元测试。这一工具的诞生标志着AI开发工具链的进一步完善，尤其是在提示工程（Pr...

2025-03-01 talkingdev

近日，Maestro作为下一代移动UI自动化工具，正式亮相。该工具旨在通过先进的自动化技术，显著提升移动应用的用户界面测试效率。Maestro不仅支持多种移动操作系统，还能无缝集成到现有的开发流程中，极大地简化了测试...

2025-02-26 talkingdev

近日，EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相，旨在评估多模态大语言模型（MLLMs）在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务，这对模型的感知、推理和执行能力提...

2025-02-14 talkingdev

近日，GitHub上发布了一个专门用于评估AI模型在复杂函数调用方面表现的基准测试工具库。该工具库旨在为研究人员和开发者提供一套全面的测试框架，以衡量不同LLM在处理复杂函数调用时的性能。通过这一工具，用户可以...