漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-30 talkingdev

Pix2Gestalt:零样本全景分割框架开源

Pix2Gestalt是一种针对零样本全景分割的框架。它擅长在部分遮挡的情况下重建完整的物体形状和外观。利用大规模扩散模型,Pix2Gestalt在挑战性场景中表现出色,包括那些不符合通常模式的艺术图像。Pix2Gestalt的创新...

Read More
2024-01-30 talkingdev

HF发布WebDataset格式

HuggingFace最近发布了一种名为WebDataset的数据格式,它可以将多个记录组合在一起。任何具有相同前缀的内容都会被视为同一条记录。这种格式非常适合于流式传输和快速数据加载。WebDataset还可以支持使用并行处理来...

Read More
2024-01-26 talkingdev

MIT研究团队展示了一种快速打印金属的新方法

麻省理工学院的一个团队宣布了一种新的金属3D打印方法,该方法将打印速度和规模优先于分辨率。它能够以至少比可比金属添加制造过程快10倍的速度打印大型铝制品。该技术利用了一层100微米玻璃珠来创建一个结构,然后...

Read More
2024-01-24 talkingdev

我的AI时间表再次加速

本文作者根据模型扩展的进展修改了其人工智能时间表预测。他们现在估计,到2028年有10%的机会实现人工智能通用智能,并且到2045年有50%的机会。这些变化归因于大型语言模型的有效性以及多个智能能力可能会在规模上出...

Read More
2024-01-24 talkingdev

DepthAnything:通过大规模数据集提高单目深度估计精度

Depth Anything是一种新的单目深度估计方法,它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督,该模型实现了令人印象深刻的泛化能力,并在深度估计方面树立了新的标准...

Read More
2024-01-24 talkingdev

苹果汽车自动驾驶规模缩小,计划于2028年推出

据悉,苹果现在将集中精力开发更接近特斯拉汽车的驾驶辅助功能,其自动驾驶系统将具备转向和制动/加速支持,但驾驶员仍将控制汽车,并必须注意道路情况。

Read More
2024-01-23 talkingdev

提升视觉基础模型性能:ViSFT开源

针对图像-文本训练中使用的视觉基础模型,研究人员提出了一种名为ViSFT的新方法,以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先,该模型使用大规模的无监督预训练来学习图像...

Read More
2024-01-23 talkingdev

微软利用AI发现了新的电池材料

微软和太平洋西北国家实验室利用人工智能和大规模云计算发现了一种新的电池材料,这种材料是一种新型的固态电解质。与锂离子电池相比,它可能导致电池更不容易爆炸。虽然还需要测试材料是否是锂离子电池的可行替代品...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page