R1的相关内容 - 漫话开发者

2025-03-20 talkingdev

[开源] Hugging Face的R1项目复现（GitHub仓库）

Hugging Face的Open-R1项目旨在提供一个更为稳健和功能完备的解决方案，同时保持其最小化和可扩展性。该项目通过增加监督微调（SFT）步骤和数据蒸馏技术，进一步提升了模型的性能和适应性。这些改进使得Open-R1在处...

2025-03-18 talkingdev

近日，钛媒体AGI独家获悉，小红书即将接入DeepSeek-R1开源模型，其AI搜索产品“点点”App将推出“深度思考”功能，目前该功能正处于内测体验阶段。这一举措标志着小红书在AI技术应用领域的进一步深化。截至2024年6月，小...

2025-03-17 talkingdev

近日，GitHub上发布了一个名为'Visual reasoning models'的开源工具包，旨在训练视觉语言模型（VLMs）以提升其基础逻辑和推理能力。该工具包由groundlight团队开发，主要专注于增强模型在处理复杂视觉数据时的理解和...

2025-03-13 talkingdev

Hugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现：当针对竞争性编程进行专门调优时，小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...

2025-03-06 talkingdev

Qwen团队近日发布了一款名为QwQ 32B的开源推理模型，该模型基于Apache 2.0许可证，性能与DeepSeek R1相当，甚至优于许多更大的蒸馏模型。团队通过结合基于结果的奖励机制、形式化验证和测试用例检查，使模型在数学和...

2025-02-27 talkingdev

近期，一项针对OpenAI的o1/o3和DeepSeek的R1等推理型LLM的研究揭示了这些模型在逐步逻辑推理能力方面的表现。研究通过对比人类认知能力，对这些模型进行了基准测试。结果显示，尽管LLM在复杂任务中表现出色，但在需...

2025-02-26 talkingdev

Rabbit近日展示了其AI agent控制Android应用的能力，实现了其早期R1发布时的承诺。该AI能够执行诸如查找视频和收集鸡尾酒配料等任务，尽管目前仍存在一些效率问题。Rabbit表示将继续优化这一agent，并计划在不久的将...

2025-02-26 talkingdev

近日，R1-OneVision作为一种多功能的大型多模态模型，正式在GitHub上发布。该模型通过整合视觉与文本数据，在数学、科学、深度图像理解及逻辑推理等复杂任务中表现出色。R1-OneVision的设计旨在解决传统单一模态模型...