漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-14 talkingdev

OpenAI发布新型模型GPT-4o,性能卓越,更有全新桌面应用

OpenAI近日宣布推出一款名为GPT-4o的全新模型。此款模型是一种天生的多模型处理,其性能在文本处理方面已超越GPT-4,并在各种模式上展现出最先进的性能。OpenAI同时也发布了一款全新的桌面应用,一个接近实时的音频...

Read More
2024-05-13 talkingdev

论文:自动检测大型语言模型中的未充分训练的标记

语言模型依赖于单独训练的标记生成器。这些标记生成器可能会产生在语言模型训练过程中从未见过的标记。即使在最强大的现代语言模型中,也存在许多此类标记。本文探讨了这种现象,并提出了识别和处理这些标记的方法。...

Read More
2024-05-10 talkingdev

图像中的增强变化检测:DiffMatch的新型半监督方法

DiffMatch是一种新颖的半监督变化检测方法,它利用视觉语言模型为未标记的数据合成伪标签,从而提供额外的监督信号。通过这种方式,DiffMatch能够更精确地检测图像中的变化,提高了图像处理和分析的效率和准确性。此...

Read More
2024-05-06 talkingdev

人工智能硬件困境:创新还是挑战?

近期,一些人工智能驱动的硬件产品如Humane Pin和Rabbit R1在发布之后备受争议,但这并没有减少风险投资对该领域的关注和投入,著名投资人Sam Altman等人对其进行了大量投资。这种吸引力在于人工智能有可能通过创新...

Read More
2024-05-06 talkingdev

Mantis-训练视觉模型新进展,单图和多图指令调整

最近,科技领域出现了一种全新的数据集和训练视觉语言模型,它能够在多图之间实现更高质量的指令跟踪。这种新的训练模型采用先进的视觉语言处理技术,可以识别并理解图片中的信息,并根据这些信息生成相应的指令。这...

Read More
2024-05-03 talkingdev

使用对抗调优技术进行图像分割:Meta AI推出ASAM模型

Meta AI最新推出的Segment Anything Model(简称SAM)是计算机视觉领域的一个重要的基础模型,该模型在图像分割方面表现出色,但在某些特定领域中却显得力不从心。为了解决这个问题,Meta AI推出了一项新的项目,即A...

Read More
2024-04-30 talkingdev

论文:以FP6-LLM新装包格式加速训练,实现全张量核心利用

浮点精度的降低能够提高训练速度,但可能会导致不稳定的现象。最新的研究论文展示,通过新的装包格式FP6-LLM,可以在不引发常见不稳定性或由于尝试不当引发的训练速度下降的情况下,实现全张量核心的利用。这一突破...

Read More
2024-04-28 talkingdev

实时角色控制:运用概率模型生成高质量动画

近日,一个新的角色控制框架被引入市场。这个框架采用了运动扩散概率模型,能够根据用户动态命令产生各种各样高质量的动画,并能立即做出反应。这一技术的引入为动画制作行业带来了新的可能性,改变了传统的角色控制...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page