Sakana.ai正在东京建立世界级研究实验室,以建立更小、更高效的基础模型。该公司由前谷歌研究员David Ha和Llion Jones创立,他们负责转型、世界模型和LoRA等突破性技术。它已获得了来自Lux Capital的Brandon Reeves...
Read More近日,一项名为UV-SAM的新技术通过GitHub仓库公开,该技术是对视觉基础模型和Segment Anything模型的改进,利用卫星图像可以准确识别出城市村庄的边界。与传统的现场调查相比,UV-SAM提供了一种高效的替代方案,结合...
Read More本研究介绍了UV-SAM,这是一种基于视觉基础模型和Segment Anything Model的改进模型,可以准确地识别城市村庄的边界。UV-SAM将不同的图像表示结合起来,为精确探测提供了高效的替代方案。相对于传统的野外调查,UV-S...
Read More本文探讨了开发自动驾驶汽车视觉基础模型(VFMs)所面临的挑战。通过分析超过250篇研究论文,它提供了有关数据准备,预训练和AI任务适应的见解,重点介绍了NeRF和3D高斯点渲染等前沿技术。
Read MoreAI法律初创公司Harvey AI利用OpenAI技术开发的一种法律服务,已经获得了另一轮融资,其估值超过7亿美元。该初创公司使用OpenAI构建基础模型,用于法律和法律实践应用。
Read MoreNous Research (Hugging Face Hub)发布了一种名为Capybara的新的语言基础模型和Obsidian的多模态扩展模型,该模型拥有30亿参数,可以在手机等边缘设备上运行。
Read MoreMeta最近发布了一篇关于音频AI基础模型的论文,并发布了更多的样本和引人入胜的演示。该项目的主要目标是生成可控制风格的音频内容,所有风格都来自同一个模型。
Read More谷歌将推迟Gemini的发布时间,从下周推迟到明年一月份。Gemini是谷歌的下一代基础模型,由于AI在处理非英语查询方面存在一致性问题而导致推迟。
Read More