745B参数、完全开源!智谱GLM-5终于来了,这可能改变整个开源AI格局
刚刚刷到消息的时候,我第一反应是——真的假的?
智谱AI在今天正式发布了GLM-5,而且这一次他们玩了个大的:745B参数,完全开源,性能直接逼近Claude Opus。
说实话,作为一个关注国产大模型这几年的科技博主,看到这个消息还是挺感慨的。
神秘的「Pony Alpha」终于揭开面纱
事情还得从前几天说起。OpenRouter平台上突然出现了一个叫"Pony Alpha"的匿名模型,性能表现异常亮眼,尤其是在代码能力方面,直接把不少付费模型都比下去了。社区里各种猜测满天飞,有人说这是OpenAI的秘密武器,有人说是谷歌的实验性产品。
结果今天智谱官方亲自出来认领了:没错,Pony Alpha就是GLM-5。
这波营销我给满分。先让模型以匿名方式在社区里"实战测试",收集真实用户反馈,等热度起来了再正式公布身份。这比传统的大厂发布会玩得高级多了。
参数狂飙背后的技术选择
745B参数,这是什么概念?上一代GLM-4.7才300多亿,这次直接翻倍还多。
但真正让我意外的是智谱的技术路线选择——GLM-5采用了DeepSeek V3/V3.2的架构,特别是稀疏注意力机制(DSA)和多Token预测(MTP)。
这说明什么?说明国产大模型厂商之间其实没有那么剑拔弩张,技术路线上的共识正在形成。DeepSeek去年引爆的技术创新,现在已经被其他头部玩家采纳并进一步优化。这种"技术扩散"对整个国产AI生态来说,绝对是好事。
更关键的是,GLM-5采用了MoE(Mixture of Experts)架构,总参数745B,但活跃参数只有44B。这意味着它既有超大模型的理解和推理能力,又能在推理时保持相对高效。这种设计思路,跟Meta Llama 3.1 405B如出一辙。
开源才是王道
GLM-5最让我兴奋的一点,是它的开源策略。
根据目前披露的信息,GLM-5将采用完全开源的方式发布,开发者可以免费获取模型权重和推理代码。在Claude、GPT-4O这些闭源模型越来越强大的今天,智谱选择了一条不同的路。
想想看,如果GLM-5的性能真的达到了Claude Opus的水平,而且完全开源,那对整个开源社区来说简直是核弹级别的利好。开发者再也不用局限于Llama系列,有了国产的替代选择。
2026年的"春节档"有点拥挤
有意思的是,GLM-5的发布恰好撞上了一个异常拥挤的档期。
DeepSeek也在酝酿新模型,Qwen 3.5据说要来了,MiniMax M2.2也有消息。2026年的"春节档",AI比电影还热闹。
但从市场反应来看,智谱这波应该是赢麻了——有的渠道说两天涨了60%,有的说直接涨了200%。资本市场用真金白银投票,说明市场对GLM-5的期待值还是很高的。
我的一点思考
写到这里,突然想聊聊更宏观的东西。
这两年,国产大模型的发展速度,说实话超出了我最初的预期。从早期的"追赶者",到现在在某些领域能够直接对标国际顶尖水平,这个进步速度确实惊人。
但更让我欣慰的是,国产厂商不再是一味地堆参数、刷榜单,而是在技术路线、商业模式、生态建设上有了自己的思考和选择。智谱选择完全开源,就是一种非常有勇气的战略决策。
开源不是慈善,是生态。GLM-5如果真的能建立起开发者社区,形成自己的应用生态,那对智谱的商业价值,远比几个付费用户的订阅费要大得多。
试试新模型
GLM-5现在已经可以在chat.z.ai上直接使用了,API也已经开放。我打算这几天好好体验一下,看看它到底有没有宣传的那么强。
如果真的能跟Claude Opus掰手腕,那我可能会毫不犹豫地把主力模型切换到GLM-5。毕竟,支持国产不应该是情怀,而应该是因为它真的好用。
写在最后
国产大模型的竞争还在继续,2026年注定会更加精彩。GLM-5的发布只是开始,接下来肯定还有更多惊喜。
作为技术爱好者,我们何其有幸,能亲眼见证这个时代。
如果你已经试用了GLM-5,欢迎在评论区分享你的体验。我很好奇,在真实场景下,它到底能不能打。
最后说一句:智谱这波操作,我给满分。
(PS:如果这篇文章对你有帮助,别忘了点赞收藏,关注我获取更多AI前沿动态~)