漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-20 talkingdev

Fuyu-8B:面向AI Agent的多模态架构

HuggingFace 上现已推出 Fuyu-8B,这是一款专为数字代理设计的多模态模型。与其他多模态模型不同的是,它具有简化的架构,并支持任意图像分辨率,在不到 100 毫秒的时间内响应大图像。尽管针对特定应用程序,Fuyu-8B...

Read More
2023-10-17 talkingdev

Insanely Fast Whisper: 使用OpenAI模型,300分钟音频转录不到10分钟

Insanely Fast Whisper是一个使用OpenAI的Whisper Large v2模型的音频转录工具,它可以在不到10分钟的时间内转录300分钟的音频。该工具快速且易于使用,同时可提供基准测试结果。

Read More
2023-10-16 talkingdev

Hugging Face发布Mistral模型,重点优化聊天表现

Hugging Face团队通过直接优化偏好进行训练,推出了Mistral模型,该模型在各种基准测试中提高了聊天表现。

Read More
2023-09-22 talkingdev

论文:模型如何理解声音和视觉的结合?

这项研究介绍了AV-SUPERB,这是一个新的基准测试,用于测试训练模型在各种任务中对声音和视觉数据的理解程度。AV-SUPERB的目标是推动音频和视觉共同理解的发展,并为未来的研究提供一个统一的平台。这项研究突出了模...

Read More
2023-09-15 talkingdev

MLPerf结果强调了生成AI和存储的日益重要性

MLPerf发布了两个基准测试套件的结果:MLPerf Inference v3.1和MLPerf Storage v0.5。前者显示了创纪录的参与度和性能提升,后者评估了机器学习训练工作负载的存储系统性能。推理基准测试套件引入了一个大型语言模型...

Read More
2023-09-13 talkingdev

AI模型运行速度新基准测试发布,Nvidia和Intel名列前茅

最近,MLCommons推出了一项新的基准测试,用于评估顶级硬件运行AI模型的速度。在这次的评估中,Nvidia和Intel分别获得了第一和第二的位置。这项测试的发布,不仅为科技界提供了一个公平、公正的评估标准,也为消费者...

Read More
2023-09-01 talkingdev

评估计算机视觉模型的公平性:Meta发布DINO v2模型

在持续推动成为AI领域的开源贡献者的过程中,Meta公司近日公布了他们的DINO v2模型,并采用了更为宽松的许可证,允许社区在其基础上进行构建。此外,他们还发布了一个数据集,有助于确定并对各种计算机视觉模型中的...

Read More
2023-08-28 talkingdev

精调版Llama编码模型在编码基准测试上超过GPT-4

拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page