刚刚!Google Gemini 3.1 Pro发布:推理能力暴涨2倍,AI终于学会说'我不知道'了
Google于2026年2月20日正式发布Gemini 3.1 Pro,在ARC-AGI-2基准测试中斩获77.1%高分,推理能力相比前代暴涨2倍以上。更值得关注的是,新模型的幻觉率腰斩——AI终于学会说"我不知道"了。这两个突破分别代表了AI在"聪明程度"和"可靠性"上的跨越式进展,可能成为大模型发展的重要转折点。
Read our latest articles and insights
Google于2026年2月20日正式发布Gemini 3.1 Pro,在ARC-AGI-2基准测试中斩获77.1%高分,推理能力相比前代暴涨2倍以上。更值得关注的是,新模型的幻觉率腰斩——AI终于学会说"我不知道"了。这两个突破分别代表了AI在"聪明程度"和"可靠性"上的跨越式进展,可能成为大模型发展的重要转折点。
就在半年前,还有不少声音嚷嚷着'大模型遇到天花板了',结果Gemini 3.1 Pro今天一出手,直接在ARC-AGI-2测试中拿下了77%的恐怖分数。更让人震惊的是,它的幻觉率竟然被砍掉了一半。三个月时间,从31%到77%,这样的跃升速度让人眩晕——我们是否正在见证AI技术的又一次质变?
今天上午,谷歌突然扔出了一颗重磅炸弹——Gemini 3.1 Pro正式亮相。别被名字里的“.1”骗了,这可不是什么小修小补,推理性能直接翻倍,ARC-AGI-2得分77.1%。在2026年这个AI模型大爆发的月份,谷歌这次是真的动真格了。