漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-11 talkingdev

利用强化学习教授语言模型解决数独问题

这项研究探索了如何通过强化学习来教授AI语言模型解决数独谜题,特别采用了Group Relative Policy Optimization (GRPO)技术,应用于Qwen 2.5等模型,无需依赖外部数据或更大模型的蒸馏。研究设计了一个多方面的奖励...

Read More
2025-03-11 talkingdev

AI语言模型通过强化学习掌握数独解题能力

最新研究展示了如何通过强化学习技术,使AI语言模型具备解决数独谜题的能力。该研究采用了Group Relative Policy Optimization (GRPO)方法,并在Qwen 2.5等模型上进行了实验,无需依赖外部数据或更大模型的蒸馏。研...

Read More
2025-03-10 talkingdev

STORM模型通过Mamba适配器提升长视频理解能力

在视频理解领域,大多数模型通常逐帧处理视频数据,这使得处理时间相关的问题变得具有挑战性。STORM模型通过引入Mamba适配器,增加了时间注意力操作,从而显著提升了长视频的理解能力。与Qwen模型相比,STORM在处理...

Read More
2025-03-06 talkingdev

基于Qwen的Spark Text To Speech模型:支持情感提示的强大语音克隆技术

近日,GitHub上发布了一款名为Spark Text To Speech的语音克隆模型,该模型基于Qwen架构,能够通过文本输入生成高质量的语音。值得注意的是,该模型支持情感提示功能,用户可以通过输入情感指令来调整生成语音的情感...

Read More
2025-03-06 talkingdev

Qwen团队推出QwQ 32B推理模型,性能媲美DeepSeek R1

Qwen团队近日发布了一款名为QwQ 32B的开源推理模型,该模型基于Apache 2.0许可证,性能与DeepSeek R1相当,甚至优于许多更大的蒸馏模型。团队通过结合基于结果的奖励机制、形式化验证和测试用例检查,使模型在数学和...

Read More
2025-02-27 talkingdev

Allen AI推出OlmOCR:基于Qwen VL的PDF文本提取新突破

Allen AI近日宣布,其通过持续微调Qwen VL模型,成功训练出一款强大的PDF文本提取工具——OlmOCR。该模型基于超过20万份PDF文档进行训练,能够高效、精准地提取PDF中的文本内容。OlmOCR的推出标志着PDF文本提取技术的...

Read More
2025-02-27 talkingdev

Qwen推出全新推理模型,数学与代码能力表现卓越

近日,Qwen公司预览了一款全新的推理模型,该模型在数学和代码领域表现出色,取得了显著的成果。Qwen计划将这一模型与其强大的Max模型一同以开放权重的形式发布。这一举措不仅展示了Qwen在人工智能领域的技术实力,...

Read More
2025-02-21 talkingdev

Qwen 2.5 VL技术报告发布:最强开源视觉语言模型亮相

近日,Qwen团队发布了Qwen 2.5 VL技术报告,详细介绍了其最新研发的视觉语言模型。该模型被誉为目前最强的开源权重视觉语言模型,具备卓越的多模态处理能力,能够高效地理解和生成图像与文本的结合内容。Qwen 2.5 VL...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page