漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-12 talkingdev

新 SDK 允许用户使用稳定 AI 文本转动画生成独特风格动画

近日,一家新兴科技公司发布了新的 SDK,使用户可以使用稳定扩散模型创建动画。这一创新技术可以生成无条件、图像条件或视频条件下的动画,其结果非常美观,但计算成本较高,且具有非常独特的风格。以下是该技术的...

Read More
2023-05-10 talkingdev

新技术提升图像生成模型能力:SUR-adapter

近日,科研团队推出了一种名为 SUR-adapter 的新技术,可升级计算机程序中的扩散模型,将简单的描述转化为详细的图像。通过训练这些模型更好地理解故事,并使用超过 57,000 个样本的新数据集,研究人员使模型更擅长...

Read More
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-05 talkingdev

关注ChatGPT等技术,哪些科技被忽视了?

新闻内容: 以下是Hacker News上的讨论线,介绍了一些目前没有引起足够关注的新技术: - 彩色电子纸显示屏(现在刚刚开始表现出色) - 大众化RISCV芯片(有些已经进入大规模生产) - 生成式人工智能和量子计算云(...

Read More
2023-05-04 talkingdev

新技术:Unlimiformer可以轻松处理超长文本

Unlimiformer是一种新的方法,可以与任何基于transformer的模型配合使用,使其能够处理超长的输入文本,而不会出现限制。这种酷炫的技术可以改善BART和Longformer等模型,使它们能够对超长文本进行概括,甚至是整本...

Read More
2023-05-04 talkingdev

新技术“文本-动作检索”问世,将3D人类动作检索提升至新高度

近日,研究人员开发出一种新的方法——文本-动作检索(TMR),可根据文本描述快速搜索3D人类动作,比以往技术更加精准,甚至将中位数排名从54降至19。以下是该技术的核心要点: - TMR技术可根据文本描述快速搜索3D动...

Read More
2023-04-20 talkingdev

新技术来袭:文本转换为视频合成进入新时代

以下是本篇新闻的三个核心要点: - 最近在图像合成方面取得的进展是通过使用“潜在扩散”来实现的,这样合成就可以在较小的空间内完成,既节省成本又保持高质量的生成。 - 现在这种技术也可以应用于视频生成领域。通...

Read More
2023-04-19 talkingdev

新技术发布:RT-DETR超越YOLO实现实时物体检测

以下是本次新技术发布的三个核心要点: - 实时物体检测一直是计算代价高昂的问题,而新的Real-Time Detection Transformer (RT-DETR)技术通过采用高效的混合编码器和IoU感知查询选择等优化策略,成功解决了这个问题...

Read More
  1. Prev Page
  2. 30
  3. 31
  4. 32
  5. Next Page