漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-06 talkingdev

Qwen团队推出QwQ 32B推理模型,性能媲美DeepSeek R1

Qwen团队近日发布了一款名为QwQ 32B的开源推理模型,该模型基于Apache 2.0许可证,性能与DeepSeek R1相当,甚至优于许多更大的蒸馏模型。团队通过结合基于结果的奖励机制、形式化验证和测试用例检查,使模型在数学和...

Read More
2025-02-14 talkingdev

论文:Jakiro利用Mixture of Experts优化Speculative Decoding,提升推理速度

近日,Jakiro团队通过引入Mixture of Experts(MoE)技术,成功优化了Speculative Decoding的性能。该方法通过生成多样化的预测结果,减少了候选预测之间的相关性,从而显著提升了推理速度。Speculative Decoding作...

Read More
2024-03-22 talkingdev

PuzzleVQA数据集:挑战GPT-4V等大型多模态模型的抽象推理能力

PuzzleVQA是一个专为测试大型多模态模型,如GPT-4V的抽象推理能力而设计的数据集。该数据集通过一系列复杂的视觉问题和答案对,评估模型在理解和推理方面的表现。这些问题往往需要模型进行深层次的逻辑思考和抽象概...

Read More
2024-03-21 talkingdev

交互式推理技术助力大型视觉语言模型更精准理解图像

Chain-of-Spot(CoS)技术近日提出了一种交互式推理方法,该方法大幅提升了大型视觉语言模型(LVLMs)处理和理解图像的能力。CoS通过识别图像中对于特定问题或指令的关键区域,使得LVLMs能够在不损失图像分辨率的前...

Read More
2023-12-25 talkingdev

苹果最新AI研究或将完全改变您的iPhone

苹果公司发布了两篇论文,介绍了新的三维头像和高效语言模型推理技术,这些技术可以让AI系统在iPhone和iPad上运行。这些技术的引入将使iPhone和iPad变得更加智能,更加个性化。这意味着用户可以在他们的设备上运行更...

Read More