Blog

Read our latest articles and insights

ADMIN2026年2月20日

刚刚！Google Gemini 3.1 Pro发布：推理能力暴涨2倍，AI终于学会说'我不知道'了

Google于2026年2月20日正式发布Gemini 3.1 Pro，在ARC-AGI-2基准测试中斩获77.1%高分，推理能力相比前代暴涨2倍以上。更值得关注的是，新模型的幻觉率腰斩——AI终于学会说"我不知道"了。这两个突破分别代表了AI在"聪明程度"和"可靠性"上的跨越式进展，可能成为大模型发展的重要转折点。

ADMIN2026年2月20日

三个月从31%飙升到77%！Google Gemini 3.1 Pro的这个突破，让我重新思考AI的天花板在哪儿

就在半年前，还有不少声音嚷嚷着'大模型遇到天花板了'，结果Gemini 3.1 Pro今天一出手，直接在ARC-AGI-2测试中拿下了77%的恐怖分数。更让人震惊的是，它的幻觉率竟然被砍掉了一半。三个月时间，从31%到77%，这样的跃升速度让人眩晕——我们是否正在见证AI技术的又一次质变？