Gemini 3 Pro登顶背后的冷思考：31%事实错误，你敢直接用吗？--怡心湖

01一份“高分”榜单，揭开AI的真相裂缝

Google DeepMind 在2025年12月9日发布的FACTS基准测试报告，把“地表最强”大模型再次推上热搜。 Gemini 3 Pro 以68.8的总分力压GPT-5与Grok 4，稳坐第一，但耀眼数据背后，却藏着让人背脊发凉的细节：31.2%的长文本输出存在 事实性错误或瑕疵。

继续阅读：事实背后错误

此文由怡心湖编辑，若您觉得有益，欢迎分享转发！：首页 > 赞·中华 > 经验谈 » Gemini 3 Pro登顶背后的冷思考：31%事实错误，你敢直接用吗？

相关推荐