模型的相关内容 - 漫话开发者

2025-02-14 talkingdev

MEAP技术开源：通过掩码增强自回归预测提升推理能力

近日，一项名为Mask-Enhanced Autoregressive Prediction（MEAP）的技术在GitHub上发布，该技术通过将Masked Language Modeling（MLM）整合到仅解码器的Transformer中，显著提升了信息检索任务的性能，同时保持了强...

2025-02-14 talkingdev

近日，研究人员通过优化技术展示了大型语言模型（LLMs）在减少非embedding参数的同时仍能保持学习能力。研究表明，通过用优化的子网络替换密集层，LLMs可以在减少高达77%的参数的情况下，依然保持与原有模型相当的性...

2025-02-14 talkingdev

近日，GitHub上发布了一个专门用于评估AI模型在复杂函数调用方面表现的基准测试工具库。该工具库旨在为研究人员和开发者提供一套全面的测试框架，以衡量不同LLM在处理复杂函数调用时的性能。通过这一工具，用户可以...

2025-02-14 talkingdev

近日，Jakiro团队通过引入Mixture of Experts（MoE）技术，成功优化了Speculative Decoding的性能。该方法通过生成多样化的预测结果，减少了候选预测之间的相关性，从而显著提升了推理速度。Speculative Decoding作...

2025-02-14 talkingdev

近日，Meta在Hugging Face Hub上发布了其最新研发的MobileLLM模型检查点。这一系列模型专为移动设备优化，尽管体积小巧，但性能强大，能够在资源受限的环境中高效运行。MobileLLM的推出标志着Meta在移动端AI技术领域...

2025-02-14 talkingdev

蛋白质设计的终极目标之一是从无到有地构建全新的酶。传统上，科学家通过在自然界中发现酶，然后通过试错方法对它们进行改进和适应。AI的最新进展可能最终引领我们从头开始创建定制酶的道路，但这一过程仍然是一个巨...

2025-02-13 talkingdev

卡尔曼滤波器作为一种高效的递归滤波器，广泛应用于信号处理、导航系统、机器人技术等领域。其核心思想是通过对系统状态的预测和测量值的更新，逐步优化状态估计的准确性。卡尔曼滤波器通过最小化估计误差的协方差矩...

2025-02-13 talkingdev

近日，GitHub上发布了一款名为Page Assist的新工具，旨在通过本地语言模型（LLM）提升网页浏览体验。Page Assist作为众多新兴工具之一，专注于利用本地化的语言处理能力，为用户提供更高效、个性化的网页浏览支持。...