漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-11 talkingdev

利用大型语言模型提升视频理解能力——FAVOR新方法的引入

研究人员推出了一种名为FAVOR的新方法,该方法通过在帧级别精细融合音频和视觉细节,使大型语言模型能够理解视频。FAVOR方法的推出,为大型语言模型的视频理解能力提供了新的发展空间。这种新方法通过在帧级别精细融...

Read More
2023-10-06 talkingdev

CoDA开源:可智能识别和命名3D场景中的新物体

在3D场景中检测和命名新物体一直是一个艰巨的挑战。然而,最近一个名为CoDA的项目提出了一种新的解决方法。该方法通过智能猜测新物体可能出现的位置,然后将这些物体的特征与图片和文本进行匹配,所有这些操作都在一...

Read More
2023-10-02 talkingdev

Transformer-VQ:一种高效的线性时间关注模型

最新的研究成果Transformer-VQ,是一种全新设计的Transformer,由于其独特的基于向量的键和缓存功能,使得处理注意力的速度得到了显著的提升。这种新型的Transformer设计,不仅提高了处理速度,同时也保持了数据的准...

Read More
2023-09-29 talkingdev

联合训练大型多模态模型:一种新的算法取得了突破

模型通常针对特定任务(例如,语言生成和图像生成)进行单独训练。然而,最近提出的一种名为联合自回归混合(JAM)的算法,通过巧妙地交叉注意力和温和的微调,成功地将不同的模型结合在一起。这种新颖的方法在多种...

Read More
2023-09-28 talkingdev

论文:RankVicuna,使用语言模型重新排序搜索结果

大型模型如ChatGPT已被用于提升搜索结果的效果,但由于这些测试往往是隐蔽或秘密进行的,所以很难进行重复。研究人员推出了RankVicuna,这是一个开源工具,能够使用语言模型重新排序搜索结果。这款工具的出现为我们...

Read More
2023-09-28 talkingdev

ChatGPT现已支持实时网络搜索

OpenAI近日重新启用了ChatGPT的一项功能,使其能够通过“Browse with Bing”功能获取当前网络信息。这项功能初步针对Plus和Enterprise订阅者开放。ChatGPT借助这项功能,能够实时获取、处理并提供网络上的各类信息,让...

Read More
2023-09-27 talkingdev

LAION推出OpenLM:中等规模模型的新选择

OpenLM是一个专为训练最多可达70亿参数的中等规模语言模型设计的库和框架。它的设计理念是注重GPU速度和可修改性。作为收敛性验证,已经有在1.25T标记上训练的模型可供使用。这种新型的框架和库能够更好地满足中等规...

Read More
2023-09-26 talkingdev

Odin开源:使用GPT-4从您的数据生成知识图谱

最近,GitHub Repo上的一个新项目Odin引起了业界的广泛关注。Odin的主要功能是利用GPT-4技术从用户的数据中生成知识图谱。知识图谱是一种以图形方式表示知识的方法,能够帮助用户更好地理解数据,并从中提取有价值的...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page