logo
  • AI Image Generator
  • AI Chat
  • Nano Banana ProAD
  • Blog
Back to List
ADMIN
2026年2月17日
17 Views
5 min read

除夕夜的惊喜:阿里千问3.5来了,这次真的有点不一样

阿里在除夕夜悄然发布千问3.5系列,3970亿总参数却仅激活170亿,"以小胜大"的性能突破让人眼前一亮。API价格仅为Gemini 3的1/18,华为昇腾同步适配——这个春节档,国产大模型的技术内卷有点猛。

大年初一的早上,我还在睡懒觉的时候,群里就炸了。阿里在除夕夜悄悄把千问3.5给放出来了。

说实话,最开始我还没太当回事。这两年大模型新闻看得多了,各家发布新模型就跟下饺子似的,早就有点麻木了。但当我看到具体的参数时,手里的瓜子差点掉了。

3970亿总参数,激活170亿。

这是什么概念呢?简单来说,就是一个3970亿参数的大模型,每次推理只需要激活170亿参数。就像是请了个大脑袋的数学家,但他只在需要的时候才把那部分脑子用起来,其他时候该干嘛干嘛。这不就是我们一直想要的"聪明又省电"吗?

更让人惊讶的是,这个"以小胜大"的模型,性能居然超过了自家万亿参数的Qwen3-Max。根据官方的测试数据,在多个基准测试上已经能跟Gemini-3-pro和GPT-5.2掰手腕了。

说到这儿,可能有小伙伴会说:"参数少了,性能还强,这不科学吧?"

其实这背后是模型架构的突破。传统的稀疏激活技术大家早就知道,但真正做好的没几个。阿里这次是在MoE(混合专家模型)的基础上做了深度优化,不仅激活参数只有1/23,部署显存还降低了60%,推理吞吐量最高能提升19倍。

翻译成人话就是:更省资源,跑得更快,还更便宜。

说到便宜,这个得重点夸一下。API价格是Gemini 3的1/18。我知道现在很多开发者都被各种大模型的调用费用搞得头大,这价格优势真的能救命。

还有个细节挺有意思:华为昇腾官宣0 Day适配Qwen3.5。要知道之前很多开源模型都是先支持英伟达,昇腾那边得等上一段时间。这次同步支持,说明国内AI生态正在加速形成自己的节奏。

当然,也有人不服。说阿里这是在春节档蹭热度。但我觉得吧,能蹭得有技术含量,那就是本事。毕竟你看看春节档各家都放了什么:字节的豆包2.0、智谱的GLM-5、MiniMax的M2.5...哪个不是干货?

2026年才刚开始两个月,大模型圈就这么热闹。记得去年这个时候,大家还在纠结国产模型什么时候能赶上国际水平。现在呢?已经有人在讨论国产模型什么时候能反超了。

不过话说回来,千问3.5再厉害,也得看实际应用。开源只是第一步,怎么让开发者真正用起来,怎么在各行各业落地,这才是更难啃的骨头。

对了,听说Qwen3.5-397B-A17B是开源旗舰版本,这意味着又有新的开源大模型可以玩了。等有空了我也去试试,看看实际效果是不是真如传闻中那么神。

最后说句掏心窝子的话:作为科技爱好者,看到国产模型能在技术架构上实现这样的突破,心里还是有点小激动的。不是因为爱国情怀什么的,单纯就是觉得,这事儿挺酷的。

那么问题来了:你们觉得千问3.5和GPT-5.2,谁更强?