漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-01 talkingdev

论文:AI模型的视觉感知能力得到提升

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈,并创建了Q-Pathway数据集,以分析其清晰度、色彩和亮度。

Read More
2024-02-29 talkingdev

字节跳动开发 MegaScale 系统,可用于训练大型语言模型

据悉,字节跳动开发了一种名为 MegaScale 的系统,可用于训练大规模并行的大型语言模型。该系统成功地在 12,288 个 GPU 上训练了一个 175B 的语言模型,达到了 55.2% 的模型 FLOPs 利用率,相当惊人。此外,字节跳动...

Read More
2024-02-28 talkingdev

多场景3D重建技术框架开源

该项目介绍了一个多视角3D重建框架,不需要先验场景深度知识。它智能地选择最相关的源帧,使其适用于包括大规模室外和俯视建筑环境在内的各种场景。这项技术的突破将极大地提高3D重建的效率和精度,可应用于数字娱乐...

Read More
2024-02-26 talkingdev

Stability AI发布Stable Diffusion 3,模型参数达80亿

Stability AI宣布推出Stable Diffusion 3,这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型,参数范围从8亿到80亿,这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

Read More
2024-02-26 talkingdev

BlueSky是如何工作的?

BlueSky是一家使用微博应用程序BlueSky来证明认证转移协议(atproto)可行性的公司。atproto是一种用于大规模分布式社交应用程序的联合协议,由于其联合性质,无法由任何一个组织进行控制——与彼此通信的系统的各个部...

Read More
2024-02-19 talkingdev

Cohere For AI发布Aya,覆盖100多种语言的LLM

Cohere的非营利研究实验室C4AI发布了一个名为Aya的模型,这是一个新的最先进的开源大规模多语言研究LLM,涵盖101种语言,包括50多种以前未得到服务的语言。

Read More
2024-02-19 talkingdev

Figma的CEO:Adobe失败后的生活

Figma的CEO Dylan Field提供了离职补偿金给想要离开公司的员工,因为其向Adobe的大规模出售被监管机构阻止。4%的员工接受了他的提议。虽然Figma似乎比最初同意向Adobe出售时处于更强的位置,但Field还将公司的内部估...

Read More
2024-02-19 talkingdev

Magika:AI驱动的文件类型检测工具

Magika是一款AI驱动的文件类型检测工具。它使用自定义的Keras模型,仅重约1MB,能够在单个CPU上运行时毫秒级别地实现精确的文件识别。Magika的精度和召回率均达到了99%以上。Google在大规模使用Magika来提高用户的安...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page