漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-17 talkingdev

GPT-4o在Arc-AGI测试中达到50%的最新成果

据最新报道,GPT-4o在Arc-AGI测试中取得了50%的最新成果,这是目前的最高水平。Arc-AGI测试是一个广泛使用的人工智能测试,旨在衡量AI系统的通用智能水平。GPT-4o是一种基于GPT-4的改进版本,具有更高的语言理解能力...

Read More
2024-03-14 talkingdev

顶尖人工智能仍未通过智商测试

最近的测试显示,像ChatGPT-4和谷歌的“Gemini Advanced”这样的先进AI模型在视觉智商测试中表现不佳,得分低于可测量的智商阈值。虽然ChatGPT-4表现出较强的模式识别能力,但它会出现视觉误认和逻辑错误,表明与人类...

Read More