漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-16 talkingdev

深度解析:视频扩散模型的生成与应用

本文深入探讨了如何训练扩散模型以生成视频,如何适配图像模型,甚至在无需额外训练的情况下,如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型,已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...

Read More
2024-04-15 talkingdev

BabyLM挑战赛:探索用婴儿级数据训练顶级文本与视觉模型

近期,科技界发起了一项名为BabyLM的挑战,旨在推动研究人员和开发者在极度有限的数据条件下,训练出性能卓越的文本和视觉模型。这一挑战的核心理念是模仿人类婴儿在成长初期所接触到的数据量,大约为1000万个token...

Read More
2024-04-15 talkingdev

xAI发布Grok-1.5视觉预览,性能媲美顶尖模型

xAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...

Read More
2024-04-12 talkingdev

ButternutAI,助力20秒打造梦幻网站

Butternut AI作为一款创新的人工智能产品,引领了网站建设的新风潮。用户只需简单几步操作,便可在短短20秒内构建个性化的专属网站。该产品通过深度学习算法,智能分析用户需求,并提供丰富的模板和设计元素供用户选...

Read More
2024-04-12 talkingdev

论文:新型立体匹配网络MoCha-Stereo,增强几何细节识别

MoCha-Stereo即Motif Channel Attention Stereo Matching Network,是一种全新的立体匹配方法,它能够有效保留在传统立体匹配技术中常常丢失的几何结构。这一技术的出现有望在计算机视觉领域带来一场革命,尤其是在...

Read More
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-04-10 talkingdev

Visual Autoregressive Models:图像生成高分辨率解决方案

Visual Autoregressive Models是一个新的GitHub项目,它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开,但目前该项目已经引起了技...

Read More
2024-04-09 talkingdev

神经网络局限性阻碍通用人工智能发展

当前神经网络在超出其训练数据的情况下泛化能力有限,这限制了它们的推理和可靠性。为了实现人工通用智能(AGI),我们需要寻找替代方法。专家认为,尽管深度学习和神经网络在特定任务上取得了显著成就,但它们距离...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page