漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-28 talkingdev

VSP-LLM可视化语音识别框架开源

Visual Speech Recognition with Language Models(VSP-LLM)框架在视觉语音识别和翻译中引入了新的方法,通过集成LLMs来高效处理视频输入,通过去重嵌入视觉特征和使用低秩适配器进行成本效益训练。

Read More
2024-02-28 talkingdev

ConceptMath:一种全新的测试LLMs数学技能的方法

ConceptMath是一种新的双语基准,用于测试LLMs在英语和中文的数学技能。它的独特之处在于它将数学问题分解为特定的概念,从而允许更详细地评估AI在数学上的优势和劣势。 这项技术将有助于开发更准确的AI模型,以应对...

Read More
2024-02-27 talkingdev

使用LLMs进行注释的论文精选

这是一份关于使用LLMs进行注释的精选论文列表,LLMs是一种基于机器学习的语言模型,能够自动预测文本中的下一个单词或字符。使用LLMs进行注释可以提高注释的准确性和效率,目前在自然语言处理和计算机视觉领域被广泛...

Read More
2024-02-27 talkingdev

专家级稀疏化技术提高LLMs效率

研究人员开发了一种新方法,通过采用专家级稀疏化方法来使LLMs更加高效和易于使用,该方法可以在不损失性能的情况下减少模型大小。这对于Mixture-of-Experts LLMs尤其有用,这种模型通常太大而不易处理。

Read More
2024-02-23 talkingdev

GTBench-评估游戏中的LLMs

GTBench是一个用于测试类似GPT-4这样的LLMs在各种游戏场景中发现其在策略推理方面的优势和劣势的平台。虽然这些模型在基于概率的游戏中表现出很大的潜力,但在确定性游戏中表现不佳,并且在设计和训练上表现也有所不...

Read More
2024-02-22 talkingdev

BoCoEL开源:利用贝叶斯优化准确评估LLMs

近日,开源项目BoCoEL在GitHub上发布。BoCoEL是一个用于准确评估LLMs的工具,采用贝叶斯优化方法,能够从大量的LLMs中找到最佳的架构和超参数组合。BoCoEL可以帮助研究者更快地训练出高效的LLMs,提高模型的准确性和...

Read More
2024-02-20 talkingdev

阿里Qwen发布1.8B和72B LLMs

Qwen团队发布了两个新的语言模型,分别是1.8B和72B的LLMs,与Llama 2相似,这些模型训练了3T个标记,并且在许多任务上表现出色。除了发布聊天版本和量化版本外,这些模型还在推理、数学和代码方面表现出色。

Read More
2024-02-20 talkingdev

OpenMathInstruct-用LLMs提高数学技能

研究人员创建了OpenMathInstruct-1,这是一个用于训练开源大型语言模型数学的新数据集,可与闭源模型的性能相匹配。这一突破包含180万个问题解决对,为更加可访问和有竞争力的数学教学AI工具打开了大门。

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page