AI模型的相关内容 - 漫话开发者

2025-03-26 talkingdev

[开源] Qwen 2.5 32B 视觉语言模型发布，性能卓越且支持消费级硬件

近日，Qwen团队发布了一款名为Qwen 2.5 32B的视觉语言模型，该模型不仅具备强大的多模态处理能力，而且完全开源，能够在消费级硬件上高效运行。这一重大突破为AI领域的研究者和开发者提供了更加灵活和便捷的工具，尤...

2025-03-25 talkingdev

近日，Unsloth团队宣布已成功解决了来自DeepMind的新开源权重模型——Gemma 3的一些技术难题。通过与Unsloth的工具包集成，开发者现在可以在免费的Google Colab实例上对Gemma 3进行微调训练。这一突破性进展不仅降低了...

2025-03-25 talkingdev

Roblox近日开源了其最新的AI模型Cube 3D，该模型能够通过文本提示生成3D对象，旨在提升创作效率。Cube 3D采用了先进的标记化技术，并通过授权和公开可用的数据集，以及Roblox自身的体验数据进行训练。未来，Cube 3D...

2025-03-24 talkingdev

Hugging Face近期对其分析仪表盘进行了重大升级，新增了实时更新的AI推理终端监控功能。这一改进不仅显著加快了数据加载速度，还提供了关于请求延迟、错误率和性能指标的即时洞察。此次升级将使开发者能够更高效地监...

2025-03-19 talkingdev

谷歌DeepMind近日发布了Gemini Robotics和Gemini Robotics-ER两款AI模型，显著提升了机器人的精细运动技能和现实应用中的适应性。Gemini Robotics整合了视觉、语言与行动能力，使机器人能够完成如折纸等复杂任务。初...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-03-17 talkingdev

近年来，许多被标榜为“开源”的AI模型实际上附带了限制性许可条款，这对于依赖这些技术的中小企业可能带来不利影响。近期，谷歌新发布的Gemma 3模型以及Meta的类似产品引起了广泛关注，它们的商用限制条款被认为可能...

2025-03-14 talkingdev

Nous Research近日推出了Inference API，旨在为开发者和研究人员提供其个性化的、无限制的语言模型访问权限。该API支持两种模型：Hermes 3 Llama 70B和DeepHermes-3 8B Preview，并通过候补名单系统管理需求，增加其...