漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-02 talkingdev

开源|富士通发布OneComp:面向大语言模型的后训练量化开源库

富士通研究院近日开源了名为“OneCompression”(简称OneComp)的Python库,这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法,包括GPTQ和DBF,旨在帮助开发者和研究人员高效地将庞大的LL...

Read More
2026-03-30 talkingdev

开源|AutoBe革命性突破:函数调用成功率从6.75%跃升至99.8%,AI自动生成后端代码迈入新阶段

近日,开源AI智能体项目AutoBe发布了一项突破性技术成果,其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率,从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发,...

Read More
2026-02-25 talkingdev

通义千问Qwen3.5-35B-A3B模型发布:支持26万超长上下文,集成多模态与强化学习突破

近日,通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破,旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

Read More
2026-02-04 talkingdev

阿里发布Qwen3-Coder-Next:专为智能体编程优化的开源模型,混合MoE架构实现高效代码合成

阿里巴巴近日推出了专为编程智能体(Coding Agent)优化的开源模型Qwen3-Coder-Next。该模型基于创新的混合专家(Mixture of Experts, MoE)架构构建,旨在显著提升智能体在代码生成与执行环境交互方面的能力。其核...

Read More
2026-02-04 talkingdev

论文推荐|SWE-Universe:从GitHub PR构建百万级可验证软件工程环境

近日,一项名为SWE-Universe的研究提出了一种革命性的可扩展框架,旨在从GitHub的拉取请求中自动构建真实世界的软件工程可验证环境。该研究成功解决了自动化构建中长期存在的三大挑战:构建成功率低、验证机制薄弱以...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page