漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-26 talkingdev

360°渲染:HOSNeRF解锁单目视频中的动态人-物-场景交互

HOSNeRF是一种360°自由视点渲染方法,可以从单个单目视频中重建神经辐射场,实现动态的人-物-场景交互,解决了复杂物体运动和不同交互的挑战。该方法在两个数据集上显著优于现有技术,LPIPS提高了40%-50%,并提供...

Read More
2023-04-26 talkingdev

全稀疏融合技术提高3D物体检测效率

以下是本文的主要内容: - 本文研究了如何将图像模态整合到全稀疏架构中,以实现高效的远程3D检测。 - 该方法使用实例查询将2D实例分割与基于LiDAR的3D分割进行融合,从而实现了nuScenes和Argoverse 2数据集上的最...

Read More
2023-04-21 talkingdev

学习自然语言编程

## 新闻内容: - 自然语言作为编程语言的使用可以提高大型语言模型(LLM)在复杂任务中的性能。 - 学习编程(LP)方法使LLM可以从复杂任务数据集中学习自然语言程序,并使用它们指导推理,从而使AMPS数据集上的直接...

Read More
2023-04-20 talkingdev

Lift3D:将2D GAN提升到3D生成辐射场,合成3D训练数据(GitHub仓库)

以下是新闻要点: - Lift3D是一个反向的2D-to-3D生成框架,通过为下游任务提供适应性分辨率和准确的3D注释,解决了基于NeRF的3D GAN的局限性,并提供了逼真的输出。 - 该框架在自动驾驶数据集上进行了评估,展示了...

Read More
2023-04-20 talkingdev

Stability AI训练了数十亿令牌的HuggingFace语言模型

以下是该新闻的要点: - Stability AI的新款StableLM模型已经训练了大约800B个令牌,目标是达到1.5T个令牌 - StableLM模型有3B和7B个参数,并且具有4k令牌的上下文长度 - StableLM模型是经过允许商业使用的许可证的...

Read More
2023-04-19 talkingdev

新技术发布:RT-DETR超越YOLO实现实时物体检测

以下是本次新技术发布的三个核心要点: - 实时物体检测一直是计算代价高昂的问题,而新的Real-Time Detection Transformer (RT-DETR)技术通过采用高效的混合编码器和IoU感知查询选择等优化策略,成功解决了这个问题...

Read More
2023-04-18 talkingdev

RedPajama-Data(GitHub代码库)

本文介绍了RedPajama-Data GitHub代码库的内容,以下是该代码库的三个核心要点: - 该代码库包含可重现RedPajama数据的数据配方。可以使用它来重新创建LLaMA训练数据集。 - 该代码库包含七个数据集,总共有超过1.2...

Read More
2023-04-18 talkingdev

Multimodal C4:一个开放的、具有十亿级图像的文本语料库

以下是本新闻的三个核心要点: - Multimodal C4(mmc4)是一个公开可用的数据集,它将纯文本的c4语料库与交错的图像相结合,支持像Flamingo这样的上下文视觉和语言模型。该数据集使用带有CLIP特征的线性分配算法创...

Read More
  1. Prev Page
  2. 30
  3. 31
  4. 32
  5. Next Page