logo
  • AI Image Generator
  • AI Chat
  • Nano Banana ProAD
  • Blog
Back to List
ADMIN
2026年3月16日
5 Views
7 min read

杨立昆豪掷75亿押注「世界模型」:大语言模型真的走到尽头了吗?

图灵奖得主杨立昆离开Meta创办AMI Labs,首轮融资75亿人民币,要做的不是更大的ChatGPT,而是能真正理解物理世界的「世界模型」。这是大语言模型时代的终结,还是AI发展的新起点?

今天,科技圈被一条重磅消息刷屏了——图灵奖得主、"深度学习三巨头"之一杨立昆(Yann LeCun)正式宣布离开效力13年的Meta,创办AI新公司AMI Labs,首轮融资高达10.3亿美元(约75亿人民币),融资前估值35亿美元。

这个数字什么概念?相当于OpenAI在GPT-3发布后的首轮融资规模。而投资人阵容更是豪华到让人窒息:英伟达、三星、贝索斯家族基金、谷歌前CEO埃里克·施密特、马克·库班……几乎囊括了科技圈的顶级资本。

为什么是现在?

说实话,看到这条消息的时候我一点都不意外。杨立昆在过去几年里,几乎在每一个公开场合都在" diss "大语言模型。他有个著名的论断:"大语言模型只是鹦鹉学舌,它们并不真正理解世界"

当ChatGPT引爆全球、所有人都忙着做大模型的时候,他却在一次会议上直言:"如果我们只盯着大语言模型,AGI永远不会到来。"

这话当时听着挺刺耳,但现在回想起来,人家早就看透了本质。

大语言模型的致命缺陷

用过ChatGPT的朋友应该都有过这种经历:问它一个简单的事实问题,它能滔滔不绝地胡编乱造,而且编得一本正经。这在AI圈叫"幻觉"问题。

在聊天、写代码这些场景下,你可以说"大不了我多问几次"。但想象一下,如果这是医疗诊断、自动驾驶决策呢?

杨立昆说得对:大语言模型只能处理文字,它"看到"的只是token和token之间的关系,而不是物理世界的因果关系。它知道"苹果从树上掉下来"这句话,但它并不真正理解重力是什么。

「世界模型」到底是什么?

杨立昆的答案叫做"世界模型"(World Model)。

简单来说,它不再是那种给一堆文本让它预测下一个token的模式,而是要让AI像人类一样,在脑子里"模拟"世界的运作。它能理解因果关系、物理规律,能"想象"未来可能发生的事情。

举个例子:你告诉世界模型"我把杯子从桌子上拿走",它不是在预测下一个词是什么,而是在脑子里构建一个场景——杯子被拿起后,桌子上会留下空位,如果杯子很重,你的手可能会感受到重量,如果不小心掉了,杯子会掉到地上碎掉……

这不是靠训练海量文本得来的,而是对世界运行规律的本质理解。

这和大语言模型有什么本质区别?

大语言模型是在做"概率预测"——基于上下文猜下一个词最可能是什么。

世界模型是在做"因果推理"——理解事物之间的真实关系。

前者像是一个背下了整本书的学生,你可能问他任何句子他都答得上来,但他不知道为什么这本书是这样写的;后者像是一个真正读懂了这本书的人,他能举一反三,甚至根据书的逻辑写出下一章。

资本为什么买单?

投资人不是傻子。他们押注的不是某个技术路线,而是AI发展的下一个阶段

看看这两年,大语言模型的发展已经进入瓶颈期了:参数越堆越大,成本越来越高,但能力提升却越来越边际。OpenAI的GPT-5迟迟不发,Google的Gemini2也陷入争议,连Meta自己都在缩减大模型研发投入。

这时候,杨立昆带着一个完全不同的技术范式出现了,而且他可是图灵奖得主,是卷积神经网络的发明人,他的技术判断力可不是随便谁质疑的。

行业会怎么变?

我的判断是:未来3-5年,我们会看到一场技术路线的大分化

一边是继续做大语言模型的,他们会在参数规模、多模态能力上死磕;另一边是走世界模型路线的,杨立昆现在就是带头大哥。

对开发者来说,这可能意味着未来的AI工具不再是单一选择——你需要根据场景来选:写文案、写代码,用大语言模型就够了;但要做自动驾驶、机器人、复杂决策,可能得等世界模型成熟。

普通人该怎么看?

说实话,作为科技博主,我对这事挺兴奋的。

过去两年,大语言模型确实让AI走进了大众视野,但也让大家对AI产生了一些不切实际的期待——以为只要模型够大,什么都能解决。

杨立昆这75亿砸下去,至少说明了一件事:AI的路线之争还远没有结束。这不是某个公司赢了,而是整个行业都在往前走。

世界模型会不会成功?现在下结论还为时过早。但至少,有人敢在大模型都玩得风生水起的时候,站出来说"不对,还有别的路"。这种勇气和远见,比任何技术突破都更难得。

2026年的春天,AI的故事好像才刚刚开始。