DeepSeek的相关内容 - 漫话开发者

2025-03-20 talkingdev

Concierge AI：用自然语言与你的应用程序对话

随着人工智能技术的飞速发展，Concierge AI 提供了一个创新的解决方案，使用户能够通过自然语言无缝连接和操作各种应用程序。无论是电子邮件、日历、文件管理还是支付系统，用户只需选择其偏好的 AI 模型（如 GPT、C...

2025-03-18 talkingdev

近日，钛媒体AGI独家获悉，小红书即将接入DeepSeek-R1开源模型，其AI搜索产品“点点”App将推出“深度思考”功能，目前该功能正处于内测体验阶段。这一举措标志着小红书在AI技术应用领域的进一步深化。截至2024年6月，小...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-03-13 talkingdev

Hugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现：当针对竞争性编程进行专门调优时，小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...

2025-03-06 talkingdev

Qwen团队近日发布了一款名为QwQ 32B的开源推理模型，该模型基于Apache 2.0许可证，性能与DeepSeek R1相当，甚至优于许多更大的蒸馏模型。团队通过结合基于结果的奖励机制、形式化验证和测试用例检查，使模型在数学和...

2025-02-28 talkingdev

近日，DeepSeek在GitHub上发布了名为DualPipe的开源项目，展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略，旨在优化模型的计算与通信重叠，从而显著提升整体性能。这一策略通过高效的...

2025-02-27 talkingdev

近期，一项针对OpenAI的o1/o3和DeepSeek的R1等推理型LLM的研究揭示了这些模型在逐步逻辑推理能力方面的表现。研究通过对比人类认知能力，对这些模型进行了基准测试。结果显示，尽管LLM在复杂任务中表现出色，但在需...

2025-02-26 talkingdev

科技界瞩目的人工智能公司DeepSeek正加快步伐，提前推出其备受期待的R2模型。原先计划于5月初发布R2模型的DeepSeek，现决定提前发布日期。新一代R2模型有望在编码技能上有所提升，并且能够处理除英语外的其他语言。...