漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-10 talkingdev

学习在测试时:新型RNN变体超越Mamba

最近,一种新型的循环神经网络(RNN)变体在多项任务中的表现超过了Mamba。这种新型的RNN变体的重要特点是其更新函数本身就是一个机器学习(ML)模型。这使得它可以处理长上下文和在上下文中进行学习。在现今的机器...

Read More
2024-07-10 talkingdev

论文:将系统2精炼为系统1:COT新思维链模型提升计算和推理效率

系统2模型是一种使用类似于思维链的方法,通过更多的测试时间计算来提升推理的模型。最新的研究发现,我们可以将这种行为提炼为一个系统1模型,使其运行速度更快,而准确性相似。系统1模型的主要优势在于其高效的运...

Read More
2024-07-10 talkingdev

Video-STaR:自我训练助力视觉语言模型的提升

Video Self-Training with augmented Reasoning (Video-STaR)是一种新的方法,用于改进大型视觉语言模型(LVLMs)。通过自我训练和增强推理,Video-STaR能够提高模型的学习能力和预测准确性。这种方法的主要优势在于...

Read More
2024-07-09 talkingdev

SenseVoice开源:具有多重语音情感理解能力的基础模型

近日,GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力,包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解;口语语言识...

Read More
2024-07-09 talkingdev

MIT利用阴影构建3D场景模型,包括被遮挡的物体

MIT和Meta的研究人员开发了一种名为PlatoNeRF的人工智能技术,该技术利用阴影和单光子激光雷达来创建3D场景模型,包括被遮挡的区域。这种方法可以增强自动驾驶车辆的安全性,并改善AR/VR体验。PlatoNeRF超越了传统方...

Read More
2024-07-09 talkingdev

微软开源Minference,大幅提升模型推理速度

微软近日发布了Minference,这是一款能够显著提升支持模型推理速度的系统。通过一系列系统性的改进,Minference能够在不损失准确性的前提下,大大提升模型的推理速度。这一创新举措显示了微软在人工智能领域的巨大投...

Read More
2024-07-09 talkingdev

Meta发布AI新突破:多token预测模型现已开放研究

Meta推出了利用全新的多令牌预测方法的预训练模型,该方法可以同时预测多个未来的词汇,承诺提升性能并大幅度缩短训练时间。这种新颖的多令牌预测方法改变了我们对于未来词汇的预测方式,将其从单一的词汇预测转变为...

Read More
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page