漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-07 talkingdev

Myreader:让AI回答你对一本书的问题

Myreader是一款让你能够向人工智能提问有关一本书的问题的产品,从本质上来说,它允许AI为你阅读一本书。

Read More
2023-07-03 talkingdev

Filtered Guided Diffusion:高效的图生成图方法(GitHub仓库)

这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。

Read More
2023-06-29 talkingdev

FunQA:专注于惊喜内容的视频问答数据集

FunQA是一个创新的数据集,旨在测试和提升模型对令人惊喜的视频的理解能力,例如幽默或创意视频片段,推动模型在时间戳定位、视频描述和推理等领域的能力。

Read More
2023-06-23 talkingdev

Svelte 4发布!下一代Svelte编译器和运行时的重写即将到来

Svelte 4现已发布。这主要是一个维护版本,但它为下一代Svelte的到来做好了准备,将涉及对Svelte编译器和运行时的重写。Svelte 4具有显著减小的包大小,对自定义元素生成方式进行了全面改进,改进了IDE的作者体验等...

Read More
2023-06-09 talkingdev

中文视频理解领域的重量级数据集发布(GitHub仓库)

近日,一份论文发布了有关优酷视频数据集Youku-mPLUG的介绍,这是目前公开的最大中文视频-文本数据集。该数据集由来自视频共享平台Youku的一千万个精选视频-文本对组成。在研究人员的努力下,借助这个数据集和创新的...

Read More
2023-05-24 talkingdev

利用LLMs进行视频分析的工具

近日,一种名为VideoLLM的系统利用语言处理模型的强大能力,将所有视频输入转换为一种可以更高效地分析的语言类型。经过在多个数据集上成功测试,VideoLLM证明它可以处理各种任务,表明语言模型的推理能力可以有效地...

Read More
2023-05-12 talkingdev

用AI和素描创造更好的视频内容

近日,有一篇论文介绍了一种使用人工智能(AI)和文本生成视频内容的新方法。这种方法将两种技术——Text-to-Video Zero和ControlNet结合在一起,可以创建高质量的、与用户意图非常接近的一致性视频,多次实验证明其效...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page