DeepSeek发布200B+参数模型——DeepSeek-V2
talkingdev • 2024-05-07
538572 views
DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2,其中激活参数达到210亿。无论是在编码还是推理方面,该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型,但无疑,DeepSeek-V2的发布为开放模型生态系统带来了新的一员。深度学习领域的研究者可以借此机会,以该模型为基础,进行更多的研究和开发。
核心要点
- DeepSeek发布了一个具有超过2000亿参数的模型DeepSeek-V2
- DeepSeek-V2在编码和推理方面的表现极为出色
- DeepSeek-V2的发布为开放模型生态系统带来了新的一员