漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-27 talkingdev

深度学习模型 DeepFloyd IF 能够根据文本提示生成高质量图片

深度学习模型 DeepFloyd IF 是一种模块化的模型,旨在根据文本提示生成高质量的图像。该基础模型可以创建 64x64 像素的图像,而两个超分辨率模型可以创建 256x256 像素和 1024x1024 像素版本的图像。在 COCO 数据集...

Read More
2023-04-27 talkingdev

DeepFloyd IF代码发布

- Stability AI发布了下一代图像模型代码 - 模型是一个多阶段模型,具有冻结的T5文本编码器和两个超分辨率模型 - 模型能够呈现极高质量的文本,可能首先只面向研究,但会在社区反馈后开放。 深度学习模型 DeepFloyd...

Read More
2023-04-27 talkingdev

人工智能公司Anthropic宣布与Scale合作

- Anthropic公司宣布与Scale合作,以利用Scale的模型监控、部署解决方案、安全和数据集成等优势。 - 这个合作对Anthropic公司的商业化推进是有帮助的。 - Scale的优势提高了模型的竞争力。

Read More
2023-04-26 talkingdev

360°渲染:HOSNeRF解锁单目视频中的动态人-物-场景交互

HOSNeRF是一种360°自由视点渲染方法,可以从单个单目视频中重建神经辐射场,实现动态的人-物-场景交互,解决了复杂物体运动和不同交互的挑战。该方法在两个数据集上显著优于现有技术,LPIPS提高了40%-50%,并提供...

Read More
2023-04-26 talkingdev

全稀疏融合技术提高3D物体检测效率

以下是本文的主要内容: - 本文研究了如何将图像模态整合到全稀疏架构中,以实现高效的远程3D检测。 - 该方法使用实例查询将2D实例分割与基于LiDAR的3D分割进行融合,从而实现了nuScenes和Argoverse 2数据集上的最...

Read More
2023-04-21 talkingdev

学习自然语言编程

## 新闻内容: - 自然语言作为编程语言的使用可以提高大型语言模型(LLM)在复杂任务中的性能。 - 学习编程(LP)方法使LLM可以从复杂任务数据集中学习自然语言程序,并使用它们指导推理,从而使AMPS数据集上的直接...

Read More
2023-04-20 talkingdev

Lift3D:将2D GAN提升到3D生成辐射场,合成3D训练数据(GitHub仓库)

以下是新闻要点: - Lift3D是一个反向的2D-to-3D生成框架,通过为下游任务提供适应性分辨率和准确的3D注释,解决了基于NeRF的3D GAN的局限性,并提供了逼真的输出。 - 该框架在自动驾驶数据集上进行了评估,展示了...

Read More
2023-04-20 talkingdev

Stability AI训练了数十亿令牌的HuggingFace语言模型

以下是该新闻的要点: - Stability AI的新款StableLM模型已经训练了大约800B个令牌,目标是达到1.5T个令牌 - StableLM模型有3B和7B个参数,并且具有4k令牌的上下文长度 - StableLM模型是经过允许商业使用的许可证的...

Read More
  1. Prev Page
  2. 37
  3. 38
  4. 39
  5. Next Page