刚刚!Google Gemini 3.1 Pro发布:推理能力暴涨2倍,AI终于学会说'我不知道'了
Google于2026年2月20日正式发布Gemini 3.1 Pro,在ARC-AGI-2基准测试中斩获77.1%高分,推理能力相比前代暴涨2倍以上。更值得关注的是,新模型的幻觉率腰斩——AI终于学会说"我不知道"了。这两个突破分别代表了AI在"聪明程度"和"可靠性"上的跨越式进展,可能成为大模型发展的重要转折点。
Read our latest articles and insights
Google于2026年2月20日正式发布Gemini 3.1 Pro,在ARC-AGI-2基准测试中斩获77.1%高分,推理能力相比前代暴涨2倍以上。更值得关注的是,新模型的幻觉率腰斩——AI终于学会说"我不知道"了。这两个突破分别代表了AI在"聪明程度"和"可靠性"上的跨越式进展,可能成为大模型发展的重要转折点。
就在半年前,还有不少声音嚷嚷着'大模型遇到天花板了',结果Gemini 3.1 Pro今天一出手,直接在ARC-AGI-2测试中拿下了77%的恐怖分数。更让人震惊的是,它的幻觉率竟然被砍掉了一半。三个月时间,从31%到77%,这样的跃升速度让人眩晕——我们是否正在见证AI技术的又一次质变?