logo
  • AI Image Generator
  • AI Chat
  • Nano Banana ProAD
  • Blog
Back to List
ADMIN
2026年3月20日
3 Views
3 min read

2025年大模型回顾:那些让我意外的进展和2026年的期待

2025年大模型盘点:推理模型超预期、开源社区重心转移,以及2026年对Agent、扩散模型和RAG的展望。

刚看到一篇很全面的2025年大模型盘点文章,里面提到了不少让我挺意外的点,也分享了作者对2026年的五大展望。说实话,读完之后我有些自己的思考想聊聊。

首先让我意外的几个点:推理模型表现超预期——已有数款推理模型在主流数学竞赛中达到金牌水平,包括OpenAI的某款未定名模型、Gemini Deep Think以及开源的DeepSeekMath-V2。我没想到这会在2025年就实现,原本以为要等到2026年。另一个意外是开源社区重心的转移——Llama 4在开源社区几乎完全失宠,Qwen(通义千问)在受欢迎程度、下载量以及衍生项目数量上已全面超越Llama。这说明开源生态的竞争格局真的在变化。

关于2026年的展望,文章提到了扩散模型、Agent和RAG这几个方向。我特别认同Agent会是重点。最近豆包手机成功出圈、Meta高价收购Manus等事件,确实让人们对AI Agent的期待成倍提升。但我觉得从“演示”到“可用”还有很长的路要走,2026年可能只是关键验证年,真正大规模落地可能还要更久。

另外文章提到架构的融合趋势,比如Mistral AI在2025年12月发布的Mistral 3中采用了DeepSeek V3的架构。这其实挺有意思的,说明即使是不同的公司,也开始在优秀架构上达成某种共识或借鉴。整体来看,2025年确实是进展非常快的一年,但我感觉2026年可能会更务实一些——不是追求参数规模,而是看谁能真正解决实际问题。