DeepSeek的相关内容 - 漫话开发者

2025-03-28 talkingdev

本地运行DeepSeek RAG：结合Elasticsearch、Ollama和Kibana的完整指南

近日，Elastic官方博客发布了一篇关于如何在本地环境中运行RAG（检索增强生成）系统的详细教程。该教程指导用户逐步安装Ollama并在容器中运行，随后将其连接到Kibana可视化平台，最终实现基于DeepSeek R1模型的本地R...

2025-03-26 talkingdev

DeepSeek最新发布的V3-0324模型在多个基准测试中表现优异，全面超越GPT 4.5，展现出显著的性能提升。这一新模型的推出不仅标志着DeepSeek在人工智能领域的技术突破，也为行业带来了新的技术标杆。V3-0324在自然语言...

2025-03-20 talkingdev

随着人工智能技术的飞速发展，Concierge AI 提供了一个创新的解决方案，使用户能够通过自然语言无缝连接和操作各种应用程序。无论是电子邮件、日历、文件管理还是支付系统，用户只需选择其偏好的 AI 模型（如 GPT、C...

2025-03-18 talkingdev

近日，钛媒体AGI独家获悉，小红书即将接入DeepSeek-R1开源模型，其AI搜索产品“点点”App将推出“深度思考”功能，目前该功能正处于内测体验阶段。这一举措标志着小红书在AI技术应用领域的进一步深化。截至2024年6月，小...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-03-13 talkingdev

Hugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现：当针对竞争性编程进行专门调优时，小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...

2025-03-06 talkingdev

Qwen团队近日发布了一款名为QwQ 32B的开源推理模型，该模型基于Apache 2.0许可证，性能与DeepSeek R1相当，甚至优于许多更大的蒸馏模型。团队通过结合基于结果的奖励机制、形式化验证和测试用例检查，使模型在数学和...

2025-02-28 talkingdev

近日，DeepSeek在GitHub上发布了名为DualPipe的开源项目，展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略，旨在优化模型的计算与通信重叠，从而显著提升整体性能。这一策略通过高效的...