漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-12 talkingdev

Covariant宣布推出通用机器人AI平台

Covariant宣布推出机器人基础模型,使机器人具备类似于人类的推理能力。这个具有80亿参数的RFM-1模型可以通过更多的数据消耗来扩展其能力。它将图像、视频、关节角度、力读数、吸盘强度等多种信息整合到其预测引擎中...

Read More
2024-03-11 talkingdev

01.AI发布Yi开放基础模型

01.AI团队发布了一篇论文,详细介绍了Yi模型的数据收集和训练过程。Yi模型一直是最强大的开放语言模型之一。

Read More
2024-02-23 talkingdev

Lorax-多LoRA模型推理服务器开源

Lorax是一款支持将多个LoRA模型热插拔到单个基础模型上的推理服务器。这意味着在支持广泛的模型调整范围的同时,RAM内存占用会大幅减少。

Read More
2024-02-15 talkingdev

GenTranslate:利用LLM进一步提高翻译准确性

GenTranslate是一种新的方法,它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。

Read More
2024-02-15 talkingdev

论文:提高AI数学技能的新方法

研究人员开发了一种新技术,通过使用基础模型自主选择高质量的数学内容来提高语言模型在数学方面的能力。这种新技术利用基础模型来选择数学内容,然后将其注入到现有的语言模型中,以提高其在数学方面的表现。这项技...

Read More
2024-02-14 talkingdev

Lag-Llama:基于Transformer的概率时间序列预测基础模型

Lag-Llama是一种基于Transformer的模型,可在零样本和少样本泛化方面表现出色,并在广泛的时间序列数据上进行了预训练。通过对少量数据进行微调,它超越了现有深度学习方法的最新性能,标志着时间序列分析基础模型的...

Read More
2024-02-02 talkingdev

Weaver-专注于讲故事的基础模型

Weaver是一系列专门用于讲述故事的模型。最大的模型(34B参数)在故事讲述基准测试中表现优于GPT-4。

Read More
2024-01-23 talkingdev

提升视觉基础模型性能:ViSFT开源

针对图像-文本训练中使用的视觉基础模型,研究人员提出了一种名为ViSFT的新方法,以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先,该模型使用大规模的无监督预训练来学习图像...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page