怡心湖

Gemini 3 Pro登顶背后的冷思考:31%事实错误,你敢直接用吗?

01一份“高分”榜单,揭开AI的真相裂缝

Google DeepMind 在2025年12月9日发布的FACTS基准测试报告,把“地表最强”大模型再次推上热搜。 Gemini 3 Pro 以68.8的总分力压GPT-5与Grok 4,稳坐第一,但耀眼数据背后,却藏着让人背脊发凉的细节:31.2%的长文本输出存在 事实性错误或瑕疵

此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 赞·中华 > 经验谈 » Gemini 3 Pro登顶背后的冷思考:31%事实错误,你敢直接用吗?

()
分享到:

相关推荐