YoloE 是一种创新的小型视觉模型,能够通过多种方式进行提示,以实现开放词汇检测。这意味着用户可以使用类别、图像和文本来决定模型应该检测的内容。特别值得一提的是,YoloE 的运行速度高达 300 帧每秒(fps),使...
Read More随着AI agent技术的快速发展,其应用场景日益广泛,但同时也带来了潜在的滥用风险。近期,业界开始聚焦于如何有效检测AI agent的使用与滥用行为。通过结合LLM、embedding、LoRA和RAG等先进技术,研究人员正在开发更...
Read MoreLOKI 是一个用于评估视觉语言模型(VLMs)在检测新颖和具有挑战性项目方面表现的合成基准测试工具。该基准测试通过生成复杂的多模态数据,帮助研究人员更好地理解模型在处理未知或复杂场景时的能力。LOKI 的设计旨在...
Read More近日,GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力,包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解;口语语言识...
Read More最近,一种名为ChangeViT的框架引起了科技界的广泛关注。该框架采用视觉变压器(ViTs)进行遥感图像中大规模环境变化的检测。遥感技术作为一种非接触式获取地球表面信息的手段,在环境监测、气候变化研究等领域有着重...
Read MoreSplatPose提出了一种新颖的3D高斯喷溅方法,有效解决了不同姿态下3D物体异常检测的难题。该技术通过模拟光线在物体表面的散射过程,实现了对物体表面细节的精确捕捉。即使在物体姿态多变的情况下,也能够准确地识别...
Read More最新的研究提出了一种从弱到强的引导框架,用于改进多摄像头3D物体检测(MC3D-Det)中的周边精细化处理。该领域借助鸟瞰技术得到了显著增强。该框架通过优化算法,提高了物体检测的精确度和实时性,对于自动驾驶、机...
Read MoreSeaBird,一种创新的3D检测方法,专门针对大型物体的识别而设计,相较于传统的单目检测器在此类场景下表现更加出色。该技术的出现,为大型物体的准确检测提供了新的解决方案。在实际应用中,SeaBird能够高效地识别和...
Read More