语言模型的相关内容 - 漫话开发者

2025-04-23 talkingdev

突破性研究：如何教会大语言模型进行实体建模

近日，一项关于大语言模型（LLMs）在实体建模领域应用的研究引发了科技界的广泛关注。该研究探索了如何让LLMs掌握实体建模这一传统上需要专业CAD软件技能的复杂任务。研究者通过创新的训练方法，使LLMs能够理解三维...

2025-04-23 talkingdev

Cohere公司最新推出的Embed 4多模态嵌入模型，代表了企业级AI搜索与检索技术的重大突破。该模型具备三大核心优势：首先，在100多种语言中实现了领先的多模态与多语言处理能力，大幅提升跨语言业务场景的适用性；其次...

2025-04-23 talkingdev

Physical Intelligence团队近期对其研发的家用清洁机器人Pi-0.5进行了测试，结果显示该机器人在全新的、未见过的环境中表现卓越。这一成果得益于团队采用的视觉语言模型（VLM）训练与动作标记化（action tokenizatio...

2025-04-23 talkingdev

大型语言模型(LLM)在训练、评估或实施阶段常因被忽视的问题而表现不佳。图灵公司推出的5分钟快速评估工具，可帮助企业精准定位所处发展阶段，并明确后续优先事项。该工具提供三大核心价值：快速诊断组织的AI准备成熟...

2025-04-22 talkingdev

开发者Adi和Arnav在尝试让大语言模型（LLM）处理研究论文和说明书中的问题时，发现现有RAG（检索增强生成）系统无法有效解析PDF中的图像和图表内容，甚至GPT-4o和O3模型也表现不佳。为此，他们开发了开源项目Morphik...

2025-04-22 talkingdev

近日，科技社区热议的π0.5（Pi-0.5）模型在开放世界泛化能力上取得重要进展。该视觉语言模型（VLA）通过创新架构设计，在未见过的新场景中展现出超越同类模型的零样本学习能力。技术博客透露，其核心突破在于动态多...

2025-04-22 talkingdev

DeepMind近日发布了其几何模型AlphaGeometry的重大升级版本AlphaGeometry 2，该模型在解决几何问题上的正确率从先前方法的54%大幅提升至84%。这一突破性进展主要得益于Gemini语言模型的整合以及更高效的搜索算法。Al...

2025-04-22 talkingdev

近期技术分析指出，OpenAI新一代推理模型存在明显的O3（Objective Over-Optimization）过度优化现象。研究表明，该公司在特定目标函数上的极端优化导致模型出现结构性脆弱，表现为逻辑链断裂概率上升和幻觉生成（hal...