75亿融资!杨立昆离职Meta创办AMI Labs,大语言模型的时代要结束了吗?
今天一早刷推特的时候,一条重磅消息直接把我从困意中震醒——图灵奖得主、"深度学习三巨头"之一的杨立昆(Yann LeCun)正式宣布离开效力13年的Meta,创办了新公司AMI Labs。
更炸裂的是融资规模:首轮融资高达10.3亿美元(约75亿人民币),融资前估值35亿美元。投资人阵容简直是豪华到了极点:英伟达、三星、贝索斯家族基金、谷歌前CEO埃里克·施密特、马克·库班……这名单随便拿出一个都能在科技圈掀起波澜。
但最让我意外的是这家公司要做的事情——不是更大的ChatGPT,不是更强的Claude,而是一个完全不同的东西:世界模型(World Model)。
杨立昆其实不是第一次公开质疑大语言模型了。他一直认为,大语言模型虽然在文本处理上表现惊人,但本质上是一条"走不通的路"。LLM只能处理文字,无法真正理解物理世界的因果关系。在医疗、自动驾驶这些高风险场景下,模型的幻觉问题可能致命——你敢让一个经常胡说八道的AI帮你做手术吗?
世界模型的核心思路是让AI像人类一样"理解世界"。它要理解因果关系,理解物理规律,更重要的是——能够在脑海中"模拟未来"。比如,看到一个小球从桌子上滚下来,它不是靠训练数据"猜"到球会掉到地上,而是真的理解了重力的作用,能够预判球会怎么滚、掉在哪里。
这让我想起了几年前那个经典的"房间实验":把一个从来没见过房间的小孩放进去,他能很快理解门可以打开、桌子有高度、椅子可以坐。这种对物理世界的直觉理解,就是世界模型想要实现的东西。
从技术角度看,世界模型可能结合了因果推理、物理引擎和强化学习等多种技术。它不再只是基于统计规律预测下一个字,而是构建一个内部的世界表征,在这个"虚拟世界"中进行推演和规划。这听起来是不是有点像人类的大脑?
当然,我也不是盲目乐观。大语言模型这几年发展太快了,从GPT-3到GPT-5.4,从Claude到Ernie,性能提升令人咋舌。OpenAI、Anthropic、Google、百度这些巨头投入了巨额资源,LLM生态已经相当成熟。AMI Labs想要后来居上,难度不小。
但杨立昆毕竟是图灵奖得主,深度学习领域的奠基人之一。他的判断力值得重视。而且,从投资人的阵容来看,资本市场显然对他有信心。75亿人民币的融资,不是小数目。
更深层的问题是:AI的发展方向到底是什么?是继续把LLM做得更大、更强、更聪明?还是寻找一条完全不同的路径,让AI真正理解世界?
我个人的看法是,这两者可能并不是对立的。世界模型和大语言模型也许会走向融合——一个既能理解物理世界,又能处理复杂文本的AI,才是真正的通用人工智能(AGI)。
不管怎样,这场融资背后反映的是AI行业的路线之争。从2022年ChatGPT横空出世到现在,我们见证了太多奇迹,也经历了太多争议。现在,一个新的玩家带着75亿入场,说"我不玩你们的游戏,我要自己开个新赛道"。
这很有趣,不是吗?
对于开发者来说,这是一个值得关注的信号。如果世界模型真的能实现,将带来全新的技术栈和开发范式。现在学习LLM开发的同学,也许可以开始关注这个方向了。
至于我,作为一名科技博主,我能做的就是把这条消息传递出去,然后静静观察这场"AI路线之战"会如何发展。毕竟,身处这样一个变革的时代,本身就是一种幸运。
你们怎么看?世界模型真的能取代大语言模型吗?还是会形成互补?欢迎在评论区讨论。