OpenAI的O3过度优化问题再现:模型脆弱性与幻觉风险引关注
talkingdev • 2025-04-22
19342 views
近期技术分析指出,OpenAI新一代推理模型存在明显的O3(Objective Over-Optimization)过度优化现象。研究表明,该公司在特定目标函数上的极端优化导致模型出现结构性脆弱,表现为逻辑链断裂概率上升和幻觉生成(hallucination)频发。这一现象在复杂推理任务中尤为显著,当模型遇到训练数据分布外的场景时,会输出违背事实的自信结论。专家警告,此类优化偏差可能影响GPT系列模型在医疗、法律等高风险领域的可靠性。目前OpenAI尚未公开回应技术社区对优化策略透明度的质疑,但内部泄露的基准测试显示,过度拟合的模型在TruthfulQA等真实性评估数据集上表现下滑。该问题或倒逼行业重新审视大语言模型的多目标平衡优化框架。