资源的相关内容 - 漫话开发者

2024-05-27 talkingdev

LoRA-Ensemble：提升自注意力网络的预测精度

LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配（LoRA）的应用，通过隐式集成实现了在不增加传统集成方法高计算成本的情况下，仍能做出准确且校准良好的预测。这种方法不仅在精...

2024-05-27 talkingdev

Mistral近日宣布推出其官方模型微调仓库，这一举措将为开发者提供更方便的工具来优化和定制Mistral的模型。该官方仓库已经在GitHub上开放，用户可以通过访问该仓库获取相关资源和文档。Mistral的微调仓库支持多种机...

2024-05-27 talkingdev

研究人员提出了一种新的方法，通过使用分类器引导来定制扩散模型，从用户提供的参考图像中生成保持身份特征的图像。与传统方法需要大量特定领域的训练不同，这种技术利用分类器引导扩散模型，无需额外的训练。此方法...

2024-05-24 talkingdev

Cohere最新发布的Aya项目包含3种不同规模的模型，能够使用101种语言进行对话，其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目，研究人员和开发者能够更广泛地获...

2024-05-24 talkingdev

Llama cpp现已支持跨多台机器的分布式推理。这一功能目前仅限于FP16（半精度浮点数），但对于开源部署来说，这无疑是一个巨大的进步。通过分布式推理，开发者可以更高效地利用集群资源，提升模型推理的速度和效率。...

2024-05-24 talkingdev

该项目推出了一种用于遥感图像变化描述的新型概率扩散模型（RSICC）。这一模型的引入旨在通过对时间推移中的环境变化进行描述，提高遥感图像的解读能力。遥感图像变化描述（RSICC）技术在环境监测、灾害评估及土地利...

2024-05-23 talkingdev

Alphabet 这家自封的“月球工厂”正在为项目开辟一条新路径，可以将其剥离为创业公司。虽然公司最初不愿让外部投资者分享其投资成果，也不愿冒险损害知识产权，但高管们最终决定，这比让有前途的技术凋零要好。这项新...

2024-05-22 talkingdev

智能专家系统是一种利用大型语言模型（LLMs）进行文本分类的新方法。该系统通过减少对广泛的预处理和领域专业知识的需求，大大简化了文本分类过程。LLMs具备强大的自然语言处理能力，能够更高效地理解和分类复杂的文...