除夕夜的惊喜：阿里千问3.5来了，这次真的有点不一样

阿里在除夕夜悄然发布千问3.5系列，3970亿总参数却仅激活170亿，"以小胜大"的性能突破让人眼前一亮。API价格仅为Gemini 3的1/18，华为昇腾同步适配——这个春节档，国产大模型的技术内卷有点猛。

大年初一的早上，我还在睡懒觉的时候，群里就炸了。阿里在除夕夜悄悄把千问3.5给放出来了。

说实话，最开始我还没太当回事。这两年大模型新闻看得多了，各家发布新模型就跟下饺子似的，早就有点麻木了。但当我看到具体的参数时，手里的瓜子差点掉了。

3970亿总参数，激活170亿。

这是什么概念呢？简单来说，就是一个3970亿参数的大模型，每次推理只需要激活170亿参数。就像是请了个大脑袋的数学家，但他只在需要的时候才把那部分脑子用起来，其他时候该干嘛干嘛。这不就是我们一直想要的"聪明又省电"吗？

更让人惊讶的是，这个"以小胜大"的模型，性能居然超过了自家万亿参数的Qwen3-Max。根据官方的测试数据，在多个基准测试上已经能跟Gemini-3-pro和GPT-5.2掰手腕了。

说到这儿，可能有小伙伴会说："参数少了，性能还强，这不科学吧？"

其实这背后是模型架构的突破。传统的稀疏激活技术大家早就知道，但真正做好的没几个。阿里这次是在MoE（混合专家模型）的基础上做了深度优化，不仅激活参数只有1/23，部署显存还降低了60%，推理吞吐量最高能提升19倍。

翻译成人话就是：更省资源，跑得更快，还更便宜。

说到便宜，这个得重点夸一下。API价格是Gemini 3的1/18。我知道现在很多开发者都被各种大模型的调用费用搞得头大，这价格优势真的能救命。

还有个细节挺有意思：华为昇腾官宣0 Day适配Qwen3.5。要知道之前很多开源模型都是先支持英伟达，昇腾那边得等上一段时间。这次同步支持，说明国内AI生态正在加速形成自己的节奏。

当然，也有人不服。说阿里这是在春节档蹭热度。但我觉得吧，能蹭得有技术含量，那就是本事。毕竟你看看春节档各家都放了什么：字节的豆包2.0、智谱的GLM-5、MiniMax的M2.5...哪个不是干货？

2026年才刚开始两个月，大模型圈就这么热闹。记得去年这个时候，大家还在纠结国产模型什么时候能赶上国际水平。现在呢？已经有人在讨论国产模型什么时候能反超了。

不过话说回来，千问3.5再厉害，也得看实际应用。开源只是第一步，怎么让开发者真正用起来，怎么在各行各业落地，这才是更难啃的骨头。

对了，听说Qwen3.5-397B-A17B是开源旗舰版本，这意味着又有新的开源大模型可以玩了。等有空了我也去试试，看看实际效果是不是真如传闻中那么神。

最后说句掏心窝子的话：作为科技爱好者，看到国产模型能在技术架构上实现这样的突破，心里还是有点小激动的。不是因为爱国情怀什么的，单纯就是觉得，这事儿挺酷的。

那么问题来了：你们觉得千问3.5和GPT-5.2，谁更强？

Related Posts