漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-10 talkingdev

高盛发布报告质疑生成式AI的性价比

高盛最近发布了一份题为《Gen AI: Too Much Spend, Too Little Benefit?》的31页的重要报告,该报告主张生成式AI的生产力益处和回报显著有限,而且其电力需求将极大地增加公共设施的开支。报告显著地对AI是否能够改...

Read More
2024-07-10 talkingdev

GraphRAG:以全新方式探索无结构文本

GraphRAG 是一种借助语言模型力量来探索无结构文本的新方法。这是一个在 Azure 上运行的快速启动项目,使得用户能够轻松启动和探索无结构文本。GraphRAG 的核心技术是基于语言模型,可以有效处理、分析并提取无结构...

Read More
2024-07-10 talkingdev

illm-tsc: 利用AI增强交通信号控制框架开源

研究人员已经开发出一个新的框架,该框架将大型语言模型与强化学习相结合,以提高交通信号控制系统的性能。这种新的方法借助AI的能力,使交通信号控制系统能够更有效地管理交通流量,提高道路效率,降低交通拥挤,从...

Read More
2024-07-10 talkingdev

MobileLLM:专为移动设备优化的超千万参数语言模型

MobileLLM 是一款新的技术工具,专为设备使用情景优化具有数亿参数的语言模型。这款工具的出现,将大大提高设备上语言模型的效率和性能。其优化能力强大,可以处理具有高达数十亿参数的语言模型,这对于需要在设备上...

Read More
2024-07-10 talkingdev

学习在测试时:新型RNN变体超越Mamba

最近,一种新型的循环神经网络(RNN)变体在多项任务中的表现超过了Mamba。这种新型的RNN变体的重要特点是其更新函数本身就是一个机器学习(ML)模型。这使得它可以处理长上下文和在上下文中进行学习。在现今的机器...

Read More
2024-07-10 talkingdev

论文:将系统2精炼为系统1:COT新思维链模型提升计算和推理效率

系统2模型是一种使用类似于思维链的方法,通过更多的测试时间计算来提升推理的模型。最新的研究发现,我们可以将这种行为提炼为一个系统1模型,使其运行速度更快,而准确性相似。系统1模型的主要优势在于其高效的运...

Read More
2024-07-10 talkingdev

Video-STaR:自我训练助力视觉语言模型的提升

Video Self-Training with augmented Reasoning (Video-STaR)是一种新的方法,用于改进大型视觉语言模型(LVLMs)。通过自我训练和增强推理,Video-STaR能够提高模型的学习能力和预测准确性。这种方法的主要优势在于...

Read More
2024-07-10 talkingdev

a16z努力通过Oxygen计划维持AI的活力

风险投资公司Andreessen Horowitz已经获取了成千上万的AI芯片,包括Nvidia H100 GPU,以此与他们的AI投资组合公司进行股权交换。这项行动是他们为了维持AI的活力并推动其发展所进行的'Oxygen'计划的一部分。Andreess...

Read More
  1. Prev Page
  2. 555
  3. 556
  4. 557
  5. Next Page