漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-28 talkingdev

DeepSeek-R1-0528:开源大模型新突破

DeepSeek团队在Hugging Face平台发布了最新的大语言模型DeepSeek-R1-0528,引发了技术社区的广泛关注。该模型在Hacker News上获得了330个点赞和148条评论,显示出业界对其技术价值的认可。作为开源大模型领域的重要...

Read More
2025-05-05 talkingdev

阿里巴巴发布Qwen 3系列AI模型,号称可媲美谷歌与OpenAI顶级模型

阿里巴巴近日正式推出Qwen 3系列人工智能模型,该系列模型采用混合专家架构(Mixture of Experts),具备先进的推理能力,并宣称其性能可媲美谷歌和OpenAI的顶级模型。Qwen 3系列模型支持119种语言,训练数据规模高...

Read More
2025-05-05 talkingdev

[开源]WebThinker:赋能大语言模型的深度研究框架

中国人民大学自然语言处理实验室推出的WebThinker框架,标志着大语言模型(LRMs)向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构,使LRMs具备三项突破性能力:1)智能化的全网信息检索系统,可自主定...

Read More
2025-04-30 talkingdev

国产x86处理器新突破:兆芯KX-7000架构深度解析

作为中国自主x86处理器设计商,兆芯最新发布的KX-7000系列处理器引发行业广泛关注。该处理器采用全新微架构设计,在芯片性能、能效比及指令集兼容性方面实现显著提升,标志着国产CPU在核心技术领域的又一重要突破。...

Read More
2025-04-28 talkingdev

DeepSeek发布2025年新一代AI模型R2,引领大语言模型技术革新

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...

Read More
2025-04-07 talkingdev

[论文推荐]DeepSeek提出推理时缩放技术,革新通用奖励模型训练范式

DeepSeek最新研究论文《Inference-Time Scaling for Generalist Reward Modeling》提出了一种创新方法,通过推理时缩放技术优化奖励模型,从而引导更强大的推理模型生成。该技术标志着这家中国初创公司的一项战略布...

Read More
2025-04-02 talkingdev

阿里巴巴主席蔡崇信警告AI行业显现泡沫迹象

阿里巴巴集团主席蔡崇信近日对人工智能行业发出警示,指出当前AI领域可能正显现泡沫迹象。这一警告源于行业对数据中心的巨额投资与实际需求不匹配的现象。尽管全球范围内已承诺投入520亿美元用于AI技术研发,但过度...

Read More
2025-01-29 talkingdev

数学怪才梁文峰:从数据极客到全球颠覆者的转变

中国DeepSeek公司的领头人梁文峰,原本是一位对数学充满热情的极客,却意外地被投资界所吸引。他所管理的对冲基金High-Flyer,规模高达80亿美元,成为中国最大的量化基金之一。梁文峰被形容为亲力亲为的领导者,他有...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page