规模的相关内容 - 漫话开发者

2024-03-01 talkingdev

论文：AI模型的视觉感知能力得到提升

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈，并创建了Q-Pathway数据集，以分析其清晰度、色彩和亮度。

2024-02-29 talkingdev

据悉，字节跳动开发了一种名为 MegaScale 的系统，可用于训练大规模并行的大型语言模型。该系统成功地在 12,288 个 GPU 上训练了一个 175B 的语言模型，达到了 55.2% 的模型 FLOPs 利用率，相当惊人。此外，字节跳动...

2024-02-28 talkingdev

该项目介绍了一个多视角3D重建框架，不需要先验场景深度知识。它智能地选择最相关的源帧，使其适用于包括大规模室外和俯视建筑环境在内的各种场景。这项技术的突破将极大地提高3D重建的效率和精度，可应用于数字娱乐...

2024-02-26 talkingdev

Stability AI宣布推出Stable Diffusion 3，这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型，参数范围从8亿到80亿，这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

2024-02-26 talkingdev

BlueSky是一家使用微博应用程序BlueSky来证明认证转移协议（atproto）可行性的公司。atproto是一种用于大规模分布式社交应用程序的联合协议，由于其联合性质，无法由任何一个组织进行控制——与彼此通信的系统的各个部...

2024-02-19 talkingdev

Cohere的非营利研究实验室C4AI发布了一个名为Aya的模型，这是一个新的最先进的开源大规模多语言研究LLM，涵盖101种语言，包括50多种以前未得到服务的语言。

2024-02-19 talkingdev

Figma的CEO Dylan Field提供了离职补偿金给想要离开公司的员工，因为其向Adobe的大规模出售被监管机构阻止。4%的员工接受了他的提议。虽然Figma似乎比最初同意向Adobe出售时处于更强的位置，但Field还将公司的内部估...

2024-02-19 talkingdev

Magika是一款AI驱动的文件类型检测工具。它使用自定义的Keras模型，仅重约1MB，能够在单个CPU上运行时毫秒级别地实现精确的文件识别。Magika的精度和召回率均达到了99%以上。Google在大规模使用Magika来提高用户的安...