震惊!杨立昆拿了75亿要颠覆大语言模型,世界模型到底是啥?
今天刷到一条重磅新闻,简直惊掉下巴——图灵奖得主、被誉为'深度学习三巨头'之一的杨立昆(Yann LeCun)宣布离开Meta,创办了AMI Labs,首轮融资就高达10.3亿美元(约75亿人民币),融资前估值更是达到35亿美元!
说实话,看到这个消息的时候我是真的有点懵。要知道杨立昆在Meta效力了整整13年,是Facebook AI研究院(FAIR)的创始首席科学家,就这样转身离开,还拿了这么多钱,肯定是要搞大事啊。
更让我惊讶的是投资人的阵容——英伟达、三星、贝索斯家族基金、埃里克·施密特、马克·库班……这简直就是硅梦之队级别的豪华配置。这些人可不是钱多得没处花,他们肯砸这么多钱,说明杨立昆的新方向一定有特别吸引人的地方。
重点来了!杨立昆一直认为,大语言模型(LLM)这条路其实是走不通的。他多次公开批评ChatGPT这类模型存在根本性缺陷——它们只是学会了统计规律和语言模式,并没有真正理解世界的运作机制。说白了,就是会'说'但不会'懂'。
那么杨立昆的新公司AMI Labs要做什么呢?答案是——世界模型(World Model)。
说实话,'世界模型'这个词我也关注挺久了,但之前总觉得离实际应用还挺远。简单理解的话,世界模型就是希望构建一个能够真正理解和模拟现实世界运作规律的AI系统,而不是像当前的大语言模型那样,只是基于概率来生成文本。
想象一下,如果AI真的理解了物理世界的规律,理解因果关系,理解空间和时间的概念,那会是什么样的场景?它不仅仅是能够陪你聊天,而是能够真正帮你解决问题、做出决策,甚至进行创造性的工作。这才是杨立昆眼中有意义的AI。
我一直在想,为什么杨立昆对大语言模型这么不感冒?后来看到他的一些访谈才明白——他觉得现在的LLM就像是一个'概率鹦鹉',说得再漂亮,也没有真正的理解能力。而世界模型追求的,是让AI能够像人类一样构建内心的世界模型,理解现实世界的基本规律。
当然,我也不是盲目乐观。世界模型这条路,说实话比大语言模型难多了。大语言模型虽然有缺陷,但至少已经证明了scale up的威力,数据量越大、模型越大,效果就是会变好。但世界模型呢?目前连基本的架构都还在探索阶段,更别提工程化落地了。
不过,正是因为难,才值得杨立昆这样级别的科学家去挑战。如果这条路真的走通了,那AI的发展可能会迎来质的飞跃,而不是像现在这样不断堆参数、堆算力,边际收益越来越低。
说实话,作为一个在AI行业摸爬滚打几年的从业者,我对大语言模型的发展轨迹也有点审美疲劳了。从GPT-3到GPT-4,再到各种微调和应用,技术上的突破越来越少,更多是在工程化和产品化上下功夫。杨立昆的选择,某种程度上也是我的心声——我们真的需要一些根本性的创新,而不是把同一条路走到黑。
75亿人民币,这可不是小数目。杨立昆能用这笔钱推动世界模型的研究和应用吗?说实话我也不知道。但我觉得,至少他给了AI行业一个新的方向,一个不同于scaling law的新思路。
作为普通用户和从业者,我们能做的可能就是保持关注,看看这个世界模型到底能不能真正落地。如果杨立昆真的做到了,那AI的发展轨迹可能会被彻底改写。如果失败了,那至少也证明了这条路走不通,帮助行业避坑。
无论如何,2026年的AI行业,看来又要有新的故事了。杨立昆和他的世界模型,会成为下一个改变游戏规则的力量吗?让我们拭目以待吧。
PS:今天先写到这里,如果大家对世界模型感兴趣,我后续会出一些更深入的技术分析文章。别忘了点赞关注,我们下次见!