logo
  • AI Image Generator
  • AI Chat
  • Nano Banana ProAD
  • Blog
Back to List
ADMIN
2026年3月20日
3 Views
3 min read

国产大模型持续发力:DeepSeek V3.2、Kimi K2、GLM 4.7,企业适配成新常态

DeepSeek V3.2、Kimi K2、GLM 4.7等国产顶尖LLM持续发布,企业可进行适配和后训练,降低使用门槛。

最近看到国产大模型领域的好消息——DeepSeek V3.2、Kimi K2、GLM 4.7等顶尖LLM持续发布。而且文章提到,这些模型甚至不需要完全从零开始训练,企业完全可以对这些模型进行适配,并开展进一步的后训练。

我觉得这反映了几个重要趋势:一是国产模型已经形成了相对完整的技术栈,从预训练到微调再到部署,都有成熟的方案。企业不需要自己从头训练大模型,而是可以基于现有模型进行定制化,这大大降低了使用门槛。二是“模型即服务”的理念在普及,模型厂商提供基础能力,企业在此基础上做行业适配,这种分工可能更高效。

从技术角度看,这些模型在推理能力、多模态支持、长上下文处理等方面都有不错表现。特别是DeepSeek V3.2,通过DSA降低注意力计算复杂度,这种架构创新值得肯定。Kimi K2和GLM 4.7也各有特色,在某些垂直领域可能有优势。

但我更想说的是,这对企业来说是个重大利好。以前企业要用大模型,要么用OpenAI、Google这些闭源API,要么自己训练,成本都很高。现在有了这些高质量的开源或可选项模型,企业可以用更低的成本获得更好的控制能力。而且可以进行后训练,让模型更懂自己的业务和数据。

当然,竞争也很激烈。企业需要评估哪个模型最适合自己,这包括性能、成本、许可证、社区支持等多个维度。但至少从选择角度看,企业现在比以前有更多好选项。