中国的相关内容 - 漫话开发者

2025-05-28 talkingdev

DeepSeek-R1-0528：开源大模型新突破

DeepSeek团队在Hugging Face平台发布了最新的大语言模型DeepSeek-R1-0528，引发了技术社区的广泛关注。该模型在Hacker News上获得了330个点赞和148条评论，显示出业界对其技术价值的认可。作为开源大模型领域的重要...

2025-05-05 talkingdev

阿里巴巴近日正式推出Qwen 3系列人工智能模型，该系列模型采用混合专家架构（Mixture of Experts），具备先进的推理能力，并宣称其性能可媲美谷歌和OpenAI的顶级模型。Qwen 3系列模型支持119种语言，训练数据规模高...

2025-05-05 talkingdev

中国人民大学自然语言处理实验室推出的WebThinker框架，标志着大语言模型（LRMs）向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构，使LRMs具备三项突破性能力：1）智能化的全网信息检索系统，可自主定...

2025-04-30 talkingdev

作为中国自主x86处理器设计商，兆芯最新发布的KX-7000系列处理器引发行业广泛关注。该处理器采用全新微架构设计，在芯片性能、能效比及指令集兼容性方面实现显著提升，标志着国产CPU在核心技术领域的又一重要突破。...

2025-04-28 talkingdev

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2，这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露，R2模型将采用创新的混合架构设计，整合了稀疏专家模型(MoE)与密...

2025-04-07 talkingdev

DeepSeek最新研究论文《Inference-Time Scaling for Generalist Reward Modeling》提出了一种创新方法，通过推理时缩放技术优化奖励模型，从而引导更强大的推理模型生成。该技术标志着这家中国初创公司的一项战略布...

2025-04-02 talkingdev

阿里巴巴集团主席蔡崇信近日对人工智能行业发出警示，指出当前AI领域可能正显现泡沫迹象。这一警告源于行业对数据中心的巨额投资与实际需求不匹配的现象。尽管全球范围内已承诺投入520亿美元用于AI技术研发，但过度...

2025-01-29 talkingdev

中国DeepSeek公司的领头人梁文峰，原本是一位对数学充满热情的极客，却意外地被投资界所吸引。他所管理的对冲基金High-Flyer，规模高达80亿美元，成为中国最大的量化基金之一。梁文峰被形容为亲力亲为的领导者，他有...