模型定制的相关内容 - 漫话开发者

2025-07-04 talkingdev

本地运行与微调Gemma 3N指南：基于llama.cpp与Unsloth的实践方案

谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行，技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点：1）利用llama.cpp的量化推理优化实现低资...

2025-06-19 talkingdev

Sakana AI研究团队开发出一项突破性技术——Text-to-LoRa（T2L）系统，该系统仅需文本描述即可即时定制大型语言模型，无需传统方法所需的训练数据或耗时微调过程。该技术的核心创新在于将数百个LoRA适配器（一种高效轻...

2025-03-28 talkingdev

上周，超过2万名与会者齐聚圣何塞市中心参加2025年NVIDIA GTC大会。AI开发者们从Bria.ai了解到如何大规模构建可预测、可控且符合品牌形象的视觉内容，同时尊重艺术家的权利。Bria.ai在大会上展示了几个关键主题：基...

2025-03-12 talkingdev

Nebius AI Studio近日推出了精细调优功能，旨在让用户能够根据特定需求定制领先的AI模型。这一功能支持超过30种SOTA模型，并允许用户从无服务器架构通过AI Studio无缝扩展到预留云环境，所有操作均在Nebius生态系统...

2024-06-06 talkingdev

Mistral近日宣布，通过其平台和API推出模型定制功能。这一新功能允许开发者根据具体需求对Mistral的模型进行微调，从而提高模型在特定应用场景下的性能。Mistral表示，此次推出的定制化服务将为企业和开发者提供更大...

2024-05-27 talkingdev

Mistral近日宣布推出其官方模型微调仓库，这一举措将为开发者提供更方便的工具来优化和定制Mistral的模型。该官方仓库已经在GitHub上开放，用户可以通过访问该仓库获取相关资源和文档。Mistral的微调仓库支持多种机...