漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-14 talkingdev

论文:Jakiro利用Mixture of Experts优化Speculative Decoding,提升推理速度

近日,Jakiro团队通过引入Mixture of Experts(MoE)技术,成功优化了Speculative Decoding的性能。该方法通过生成多样化的预测结果,减少了候选预测之间的相关性,从而显著提升了推理速度。Speculative Decoding作...

Read More
2025-02-14 talkingdev

Meta发布MobileLLM:轻量级移动端语言模型新突破

近日,Meta在Hugging Face Hub上发布了其最新研发的MobileLLM模型检查点。这一系列模型专为移动设备优化,尽管体积小巧,但性能强大,能够在资源受限的环境中高效运行。MobileLLM的推出标志着Meta在移动端AI技术领域...

Read More
2025-02-14 talkingdev

BigQuery推出SQL管道语法公共预览版

近日,Google Cloud宣布其数据仓库服务BigQuery正式推出SQL管道语法的公共预览版。这一新功能允许用户在SQL查询中使用管道符号(|)来简化复杂的数据处理流程。通过管道语法,用户可以将多个操作串联起来,例如数据...

Read More
2025-02-13 talkingdev

Page Assist开源:本地语言模型助力网页浏览

近日,GitHub上发布了一款名为Page Assist的新工具,旨在通过本地语言模型(LLM)提升网页浏览体验。Page Assist作为众多新兴工具之一,专注于利用本地化的语言处理能力,为用户提供更高效、个性化的网页浏览支持。...

Read More
2025-02-13 talkingdev

ESM2蛋白质折叠模型在Equinox GitHub仓库中发布

ESM2是一款卓越的蛋白质折叠模型,现已在广受欢迎的Jax包中发布了维护良好的版本。该模型利用先进的机器学习技术,能够高效预测蛋白质的三维结构,为生物医学研究和药物开发提供了强大的工具。此次发布的版本经过优...

Read More
2025-02-13 talkingdev

DeepScaleR:通过扩展RL训练,1.5B模型超越O1-Preview

近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...

Read More
2025-02-13 talkingdev

Imapsync:高效邮件迁移工具的技术解析

Imapsync 是一款专为邮件迁移设计的开源工具,广泛应用于企业邮件系统的迁移和同步任务。它支持多种邮件服务器协议,包括 IMAP 和 POP3,能够高效地在不同邮件服务之间迁移邮件、文件夹结构以及元数据。Imapsync 的...

Read More
2025-02-12 talkingdev

DeepMind提出新观点:Agency的测量需依赖参考框架

近日,DeepMind发布了一篇立场论文,探讨了如何衡量系统的“Agency”属性。论文指出,Agency的测量并非一个全局属性,而是依赖于特定的参考框架。这意味着,判断一个系统是否具有Agency,需要明确其所在的上下文和参考...

Read More
  1. Prev Page
  2. 132
  3. 133
  4. 134
  5. Next Page