漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-13 talkingdev

强化学习赋能递归语言模型:小模型也能媲美Claude Sonnet,成本大幅降低

大型语言模型的部署成本一直是其广泛应用的主要障碍之一。一篇来自AlphaXiv的最新研究提出了一种创新解决方案:通过强化学习微调递归语言模型(RLMs)。该方法的核心在于训练一个共享的策略,同时驱动父模型和子模型...

Read More
2025-11-20 talkingdev

AI学术平台alphaXiv完成700万美元种子轮融资,打造arXiv论文协作社区

人工智能学术研究平台alphaXiv于近日宣布获得700万美元种子轮融资,本轮融资由Menlo Ventures和Haystack共同领投。该平台致力于构建围绕arXiv预印本论文的开放学术社区,允许研究人员对论文进行实时批注、评论和深度...

Read More
2024-09-09 talkingdev

alphaXiv:在arXiv基础上开启开放研究讨论

alphaXiv是一个新兴的平台,旨在为研究人员提供一个开放的讨论空间,尤其是在科学和技术领域。该平台建立在arXiv的基础之上,允许研究人员在上传论文时与同行进行互动,分享观点和反馈。这种开放的讨论形式不仅可以...

Read More