漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-18 talkingdev

新技术发布:多语言文本转图像模型

以下是该模型的三个核心要点: - 该模型能够处理多种语言的文本转图像,输出的质量非常高。 - 该模型基于LAION HighRes和内部专有图像数据集进行训练,尽管无法处理漫反射,但作者提供了在线演示。 - 该模型的参数...

Read More
2023-04-18 talkingdev

1.2万亿数据集发布,可复现Llama训练

近日,Meta发布了一份1.2万亿标记数据集,可用于复现Llama模型的训练过程。该数据集是基于Llama论文中的训练混合比例构建而成,旨在解决由于许可限制而无法商业化应用的问题。 以下是该新闻的三个核心要点: - Met...

Read More
2023-04-14 talkingdev

Meta公开了一个将涂鸦转换为动画的AI项目

以下是新闻要点: - Meta开源了Animated Drawings,这是一个将人们的涂鸦变为动画的AI项目。 - 该项目使用目标检测、姿态估计和图像处理模型来捕捉涂鸦的数字版本,然后使用传统的计算机图形技术来将图像动画化。 -...

Read More
2023-04-14 talkingdev

元宇宙公司发布儿童绘画数据集,开源并遵循隐私保护协议

元宇宙公司日前发布了一份儿童绘画数据集,并开源了其中的10万多个例子、动画代码、姿势寻找等内容。该数据集对于对自动化动画领域感兴趣的人非常有用。同时,该公司在筛选数据集时还采取了额外的隐私保护措施,以便...

Read More
2023-04-13 talkingdev

Wombat:从RLHF到RRHF,以“正确”的方式对齐人类喜好(GitHub代码库)

## 新闻内容: Wombat是一种新的RLHF(Reinforcement Learning with Human Feedback,即通过人类反馈进行强化学习)学习范式,它通过更高效地将语言模型输出与人类喜好对齐,在需要更少的模型的情况下提供了简单的P...

Read More
2023-04-13 talkingdev

Databricks发布Dolly 2.0:开源指令调整模型

Databricks发布了他们模型Dolly 2.0的新版本,该模型基于EleutherAI Pythia模型,经过指令调整后使用全新的商业可行数据集。虽然不清楚它与基于llama的模型或GPT 3.5 turbo的模型相比如何,但这是一项更加开放的工作...

Read More
2023-04-12 talkingdev

Google提出Video-kMaX:在线和近在线视频全景分割的简单统一方法

研究人员从Google提出了Video-kMaX,这是一种统一的在线和近在线视频全景分割方法,包括一个视频内分割器和一个视频间关联器。通过利用clip-kMaX和HiLA-MB这两个组件,该方法在KITTI-STEP、VIPSeg和VSPW数据集上建立...

Read More
2023-04-09 talkingdev

1.5GB字符串

一项新的技术突破已经实现,能够处理高达1.5GB的字符串。这项技术创新将有助于处理大型数据集,从而提高生产力和效率。 ## 核心要点: - 实现了能够处理高达1.5GB字符串的技术突破 - 该技术创新有助于处理大型数据...

Read More
  1. Prev Page
  2. 30
  3. 31
  4. 32