人类洞察力:永远的护城河,当我们把地球上所有的资源都用来训练模型,这真的是通往智能的正确道路吗?
Ref.: https://news.qq.com/rain/a/20251112A03Q ... hatgpt.com
引言:一场意料之中的离开
2025年10月下旬,就在Meta宣布裁员约600名AI部门员工后不到一周,《硅谷101》的主持人陈倩对话了这场裁员风波中的关键人物——田渊栋。
田渊栋何许人也?他是Meta AI研究院FAIR(Facebook AI Research)的前研究总监,在Meta服务超过十年的资深AI科学家。他曾参与围棋AI等重要项目的研发,在强化学习、大语言模型推理等领域有深入研究,发表过多篇具有影响力的论文。作为这次"超级智能实验室"大规模裁员的亲历者,他的视角和反思对理解当前AI行业的变革具有独特价值。
然而,当我们采访他时,却听到了一个出人意料的回答:"我其实在被裁之前就已经有offer了。“这场裁员对他而言,更像是一个"恰好的机会”——离开待了十多年的公司,去看看外面的世界。
这不是一个关于裁员受害者的悲情故事,而是一个在AI浪潮中保持清醒思考的科学家,对行业、对技术路线、对人才选择的深刻反思。在所有人都在追逐大模型、Scaling Law和AGI的时刻,他提出了一些令人不安但值得深思的问题:当我们把地球上所有的资源都用来训练模型,这真的是通往智能的正确道路吗?
AI裁员潮:不是偶然,而是必然
自动化吞噬AI从业者
"我觉得应该从行业趋势来讲。"当被问及Meta这次大规模裁员时,田渊栋并没有纠结于公司内部的具体情况,而是将视角拉到了整个行业。
他的判断令人震惊:AI行业本身自动化程度最高,未来会有越来越少的人做AI本身的工作。
这听起来像是一个悖论——AI行业裁掉AI从业者。但田渊栋的逻辑很清晰:过去需要人工标注数据,现在模型更强了,标注人员就少了;过去模型训练到一半崩溃需要on-call紧急修复,现在自动化工具和系统设计完善了,这种情况大幅减少;各种pipeline(项目流程)逐渐成熟和自动化,真的还需要那么多人吗?
“大趋势就是会有越来越少的人被裁掉,或者说越来越少的人做这个东西。到有一天,所有人都会失业。”
这不是危言耸听。他进一步解释:未来可能不会有传统意义上的工作——被公司雇佣然后为公司干活。当一个小公司CEO手中掌握了强大的AI工具,他会发现很多事情根本不需要那么多人,许多任务可以用agents高度自动化完成。
谁会留下,谁会离开?
那么,哪些人会留下?田渊栋给出了一个清晰的分层:
- Foundation Model的研究者会减少:按照之前的工程逻辑训练模型的人会越来越少,因为大家都是同样的逻辑训练,代码都能跑通、都有效,为什么需要那么多人?
- 探索性研究者会增加:真正做研究、做探索性工作的人会增多。
- 应用开发者会大量增加:但这些应用往往是在特定垂直领域实现的,而不是通用应用。
- 中间层执行团队会大幅缩减:那些做重复性劳动的人,随着工具自动化程度提高,会越来越少。
这个判断的背后,是对AI本质的理解:AI的终极目标是让机器完成人类的工作,而AI从业者恰恰是最容易被AI替代的那群人。
LLM的困境:数据饥渴与效率鸿沟
一个1000倍的差距
当被问及是否认为LLM是正确的路径时,田渊栋的回答颇为谨慎:“我觉得LLM是一个很有意思的路径,但我不知道它是不是对的路径。”
他指出了大语言模型目前最大的问题:需要海量数据。虽然训练出来的模型质量很好,但效率远不如人类。
“人类一生能学到的样本数量很小,特别是文本token,最多也就是100亿量级。但大语言模型的训练数据轻松就是10万亿、30万亿,差了1000倍。”
这个1000倍的差距,揭示了当前AI发展的根本矛盾:人类可以用极少的样本学得很好,历史上无数天才科学家在没有太多书籍和数据的情况下,就能发现独特的定理、证明和发明。他们的能力从何而来?
如果把这么多token喂给大语言模型,它真的达到人类的能力了吗?这是一个大大的问号。田渊栋认为,这说明我们现在的训练算法可能还没有达到最优状态,可能有更好的算法、更好的逻辑、更好的方式来学习数据中涌现出来的表征,并用它去解决问题。
"梯度下降可能不是一个特别好的solution,可能有一天我们不用梯度下降了,可能有别的方法。"他甚至大胆猜测,“整个训练的框架可能要变。”
人类洞察力:永远的护城河
在用GPT-5完成最近一篇论文的经历中,田渊栋深刻体会到了AI的局限。他每天和GPT-5对话,告诉它要解决的问题和研究方法,模型会给出方案。
但问题在于:没有领域知识的方案,往往缺乏创新性和原创性。而作为研究者,对问题有深刻理解,知道某个方案、它的影响或者思考方式有致命缺陷,就能让GPT-5更深入地探讨,最终得到更好的结果。
“人类这种高层的洞察力,人类的知识和对问题独特的insight(洞见),是现在模型所没有的。你需要有这些东西,才能让模型变得更强。”
他举了一个生动的类比:这就像当年自动驾驶一样。刚开始进展很快,大家都觉得很快就能代替人了。但是越往后走,问题越大。为什么?因为好的insight和好的数据越来越稀缺,越来越难找。数据少了,模型就训练不出来。
而人类获取数据和深度挖掘数据的能力,永远会超过计算机——至少在目前,超过所有的模型。同样的问题,人类可能只需要一两个样本就能看出本质,而计算机或者今天的大模型,至少需要几百上千个样本才能大概摸出一个轮廓。
如果这样的话,AI只能永远跟在人类后面。人类通过更好的信息处理方式获得insight,然后喂给计算机和AI,让AI在这个方向上做得更好。这就是现状。
Scaling Law:一个悲观的未来
一个"很奇怪"的话题
对于业界热捧的Scaling Law(规模定律),田渊栋给出了一个出人意料的评价:Scaling Law是一个悲观的未来,而且坦白讲,Scaling Law这个话题本身是很奇怪的。
他解释道:过去如果告诉机器学习科学家,加指数级的样本或者指数级的算力,会让性能线性增长,大家会觉得这是trivial(平凡)的事情。因为不管什么模型,你都可以得出这样的结论:喂更多数据,结果就会更好。
但我们真正应该追求的,是一个能在这条路上更高效、更有效、更快速地前进的模型,而不是简单地满足于这个"规律"。
“因为这个’规律’导向的是一个比较悲观的未来——意味着你需要喂指数级更多的样本才能得到一个还不错的结果。如果是那样的话,有一天地球上所有的资源都会被耗尽,地球上所有的能源、所有的电都会被用来训练大模型。在那种情况下,我们还能靠这种能力改变我们的世界吗?”
这是一个巨大的问号。田渊栋认为,在某个时间点,人们会意识到算力不是一切,我们可能需要对模型有更深的理解。这个改变会逐渐发生。
他相信,我们需要一个更高效的方式来发展智能。尽管现在大语言模型的能力已经非常强,即使现在模型能力停滞,它对各个行业的影响依然巨大。但从长远来看,我们不能仅仅依靠堆算力和数据。
强化学习的价值:主动学习的力量
不是神秘的东西,而是更好的数据
近期业内对强化学习(RL)有一些争议,特别是Andrej Karpathy在播客中表达了一些负面看法。作为在这个领域工作多年的研究者,田渊栋给出了他的见解。
他认为,强化学习的好处在于它本质上是一个搜索过程。给它一些难题让它去搜索,在搜索过程中学到的数据和信息,质量比直接喂给它的数据要高。
这就像一个人在自己解题,而不是听老师讲课。听老师讲课相当于监督学习(SFT),而自己解题获得的能力更根本、更能解决问题。
“强化学习最大的好处是它是主动学习(active learning),它能对数据的分布产生很正向的影响。这是它的核心,而不是说它的objective function(目标函数)或者训练算法不一样。”
田渊栋强调,许多文章证明了在很多问题上,特别是推理问题上,强化学习比SFT更强。你需要强化学习才能真正让模型学会推理。SFT可能只是记住了之前的推理过程,但没有泛化能力。在新的问题上,它的泛化能力可能更弱。特别是大量做SFT之后,模型的质量可能会下降。
但他也指出,强化学习并没有什么神秘的东西,它的最终目的还是改变权重,就像SFT一样,只是改变权重的方法不一样。最终可能有一个统一的方法,可以把强化学习和SFT统一起来。
对大多数人来说,强化学习就是一种不同的数据获取方法——它在搜索的同时收集数据,把数据放在一起训练。这本质上是一种主动学习的方法,和SFT不同。因此,收集到的数据质量不同,这才是它能解决一些更难问题的原因。
开源vs闭源:不是0或1的选择
开源会消失吗?
外界有一种声音认为,在大公司架构中开源走不通,因为前沿模型竞争太激烈,别人都闭源,你可能坚持不了开源。那么,开源和闭源模型的差距会越来越大吗?
田渊栋的回答是:开源肯定还会有。硅谷仍然有很多公司在做开源,比如Reflection AI、Allen Institute for AI(Ai2)等。OpenAI之前也做过开源模型GPT-OSS。
但更大的问题是:这些模型的用途是什么?
无论开源还是闭源,模型出来之后可以作为聊天工具、搜索工具、生产力工具——大公司可能会做这些。但还有很多其他方向,比如用于科研、科学家工作,或者垂直领域的工作,小公司可以做这些。
关键问题是:在不同领域,我们真的需要一个在各方面都很强的模型吗?未必。可能只需要在你关心的领域很强就够了。
这时候,分化就可能开始了。每个人、每个模型可能有自己的想法,每个公司做这个模型可能有自己的目的。在这种情况下,就会有各种不同的策略。
有些模型可能想开源,因为开源之后大家可以用它来建立社区,或者作为工具平台。比如,训练一个模型,它能调用某个标准的工具包,用这个模型做一个平台给大家用,那肯定会开源。
但对于其他领域,比如个性化搜索或个性化推荐,可能就不太愿意开源这样的模型。
最终,这取决于最终目的,而不是开源或闭源哪个更好。这取决于公司的战略,因为每个公司、每个人的战略都不一样。
田渊栋认为,在最先进(SOTA)的模型上,开源模型确实很难直接和闭源模型竞争。但是在很多更小的、垂直领域的模型上,开源还是有非常非常多的机会。
研究与工程:理想主义者的平衡术
FAIR的遗憾:应该做更多工程
当被问及对FAIR有什么遗憾时,田渊栋的回答颇为意外:“我觉得我在FAIR的工程工作应该做得更多一些,可能会更好。”
他回顾了自己在FAIR的历程:刚加入的头几年做了大量工程工作,比如围棋项目。当时甚至被批评说,作为研究科学家(research scientist)老是在做工程,别人的屏幕上都是文章,他的屏幕上都是代码。
于是从2015年到2018年,他主要在做工程;2018年之后到现在,做的研究更多一些。
但现在他发现,在这个时代,工程能力强的人更抢手。研究能力强的人也很受欢迎,但理想情况下应该是工程和研究能力都很强——这非常难,但他认为自己可以做到。
“我觉得我最大的收获应该是2018年之后,这段时间应该有了很多的研究品味(research taste)。”
什么是研究品味?就是对研究的欣赏和对研究方法的理解。这种品味是可以慢慢培养的,在近几年的发文中越来越明显。
有研究品味对一个人未来的职业道路非常有帮助,因为只做工程的人有一个很大的问题:可能只会做工程难题,但不懂它的应用。而有研究品味,意味着给自己设一条路,可以一直往前走。这对人生极其有利。
AI人才:不要追逐市场信号
在当前AI人才竞争白热化、公司花大价钱争夺人才的情况下,什么样的AI人才最稀缺?
田渊栋首先纠正了这个问题的前提:不要去想现在谁最稀缺,因为稀缺的定义可能两年后就变了。想想Yann LeCun在边缘坐了那么多年,后来突然拿了图灵奖。
“我觉得每个人应该想想自己真正想做什么,而不是做公司可能喜欢的事情。”
他详细分析了过去和现在的差异:
过去的逻辑:
市场发出信号,说需要什么样的人才
信号传到大学,说未来10年什么人才最抢手
大学扩招相应的系,招更多教授
学生报考那些系,经过4年以上培训
这些学生最终满足市场需求
这个流程之所以可行,是因为整个逻辑和速度比较慢,行业周期可能是10年、20年的波动。
现在的逻辑:
整个周期可能非常快
当你想学市场上的热门技术时,全世界都在学
总有人学得比你快、学得比你好、能马上上手把东西做出来
学了半年一年,可能还是竞争不过别人
市场又变了,可能明年这个技能就不是最重要的了
你再去学,可能永远在跟着别人的脚步走
因此,田渊栋建议:未来大家可能会突然发现,与其跟着市场的指令走,不如做自己想做的事情。做得开心,而且一旦这个东西被发现,收益是巨大的。
当然,这是理想情况。现实中肯定需要两边结合:自己判断这个东西未来会不会有用,加上自己的兴趣,两边结合之后才能投入更多精力去做。
理想主义的研究还存在吗?
在当前市场竞争如此激烈的情况下,很多文化和信念可能会偏离。那么,还有相对理想主义的研究实验室吗?
田渊栋的回答是:不应该把大公司看成是铁板一块。实际上有很多group(小组),这些小组中很多有研究团队,这些团队本身有研究精神和研究自由。这个永远会存在。
FAIR只是一个非常有名、大家都知道的地方。但有很多地方,可能没有FAIR那么有名,但也有自由的空间去做研究。甚至在Meta内部,也有很多组有空间做研究。
即使是创业公司,也可能发现问题很前沿,那肯定是可以做的。因为研究本身的过程,就是对难题找新的解决方法,这就叫研究(re-search)。
“我觉得有很多地方可以做,不是铁板一块的概念,也不是说大公司做不了、小公司能做。完全取决于哪个组、哪些人、什么资源、什么样的事情,这些人聚在一起会产生什么样的化学反应。”
研究会一直延续下去,只是它的形态可能会变得更像游击战——不是某些非常有名的研究机构说"我们把所有时间精力投入研究",可能不是这样。但你永远会发现很多理想主义的人和小的组织在继续做他们想做的事情。
结语:在巨变时代保持清醒
采访结束时,田渊栋的下一步还没有确定。从被裁到采访,还不到一周时间。但他已经收到了几乎所有你能想到的大公司的高层接触,还有很多小公司和联合创始的机会。
他的思考方向很明确:希望找到一个能够赋能科研、同时又能做很多其他事情的机会。这是不是结合了应用和科研?
“我的答案当然是,最好是两者结合。”
这或许正是当前顶尖AI人才正在探索的道路——既不放弃对前沿问题的探索,也不脱离工程实践和应用场景;既保持理想主义的研究精神,也理解商业化和产品化的必要性。
田渊栋的经历和思考,为我们提供了一个难得的视角:在AI狂飙突进的时代,如何保持清醒,如何做出选择,如何平衡理想与现实。
他对Scaling Law的质疑、对数据效率的担忧、对人类洞察力的强调,都指向一个核心问题:我们是否在用最正确的方式追求智能?
答案可能还需要时间来揭晓。但有一点是确定的:那些保持独立思考、不盲目追逐潮流、既有工程能力又有研究品味的人,无论在哪个时代,都不会缺少机会。
正如田渊栋所说:“首先想一个不可能的目标,然后去想什么能够支撑它。这样可能会给你一个更好的方向去走。”