漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-10 talkingdev

illm-tsc: 利用AI增强交通信号控制框架开源

研究人员已经开发出一个新的框架,该框架将大型语言模型与强化学习相结合,以提高交通信号控制系统的性能。这种新的方法借助AI的能力,使交通信号控制系统能够更有效地管理交通流量,提高道路效率,降低交通拥挤,从...

Read More
2024-07-10 talkingdev

MobileLLM:专为移动设备优化的超千万参数语言模型

MobileLLM 是一款新的技术工具,专为设备使用情景优化具有数亿参数的语言模型。这款工具的出现,将大大提高设备上语言模型的效率和性能。其优化能力强大,可以处理具有高达数十亿参数的语言模型,这对于需要在设备上...

Read More
2024-07-10 talkingdev

学习在测试时:新型RNN变体超越Mamba

最近,一种新型的循环神经网络(RNN)变体在多项任务中的表现超过了Mamba。这种新型的RNN变体的重要特点是其更新函数本身就是一个机器学习(ML)模型。这使得它可以处理长上下文和在上下文中进行学习。在现今的机器...

Read More
2024-07-10 talkingdev

论文:将系统2精炼为系统1:COT新思维链模型提升计算和推理效率

系统2模型是一种使用类似于思维链的方法,通过更多的测试时间计算来提升推理的模型。最新的研究发现,我们可以将这种行为提炼为一个系统1模型,使其运行速度更快,而准确性相似。系统1模型的主要优势在于其高效的运...

Read More
2024-07-10 talkingdev

Video-STaR:自我训练助力视觉语言模型的提升

Video Self-Training with augmented Reasoning (Video-STaR)是一种新的方法,用于改进大型视觉语言模型(LVLMs)。通过自我训练和增强推理,Video-STaR能够提高模型的学习能力和预测准确性。这种方法的主要优势在于...

Read More
2024-07-10 talkingdev

a16z努力通过Oxygen计划维持AI的活力

风险投资公司Andreessen Horowitz已经获取了成千上万的AI芯片,包括Nvidia H100 GPU,以此与他们的AI投资组合公司进行股权交换。这项行动是他们为了维持AI的活力并推动其发展所进行的'Oxygen'计划的一部分。Andreess...

Read More
2024-07-10 talkingdev

Quora的Poe开放新功能:用户可以创作并分享网络应用

Quora的Poe近日推出了一项名为“预览”的新功能,该功能使得用户能够通过聊天机器人互动直接创建交互式应用,如数据可视化和游戏等。用户可以利用这项新功能,无需编程知识,便可以快速构建并分享自己的网络应用。此项...

Read More
2024-07-10 talkingdev

PySkyWiFi:长途航班上不可思议的免费Wi-Fi揭秘

近期,一位技术开发者在飞行旅途中发现了一个令人难以置信的漏洞,使得他能够在通过航空公司Wi-Fi支付菜单时,实现免费上网。这位开发者通过编辑自己的航空公司常旅客账户数据,成功发送和接收HTTP请求和响应,从而...

Read More
  1. Prev Page
  2. 39
  3. 40
  4. 41
  5. Next Page