从谷歌无人车到Meta裁员:DarkForest之父田渊栋的二十年AI征途,拒绝OpenAI、写科幻小说,下一步创业?

张开发
2026/4/17 15:03:33 15 分钟阅读

分享文章

从谷歌无人车到Meta裁员:DarkForest之父田渊栋的二十年AI征途,拒绝OpenAI、写科幻小说,下一步创业?
从谷歌无人车到Meta裁员DarkForest之父田渊栋的二十年AI征途拒绝OpenAI、写科幻小说下一步创业导语他是上海交大走出的AI天才是早于AlphaGo的围棋AI先驱他在Facebook AI ResearchFAIR坚守十年从研究员成长为研究科学家总监他拒绝过OpenAI的橄榄枝也领导过Llama 4的推理工作他发表过ICCV马尔奖提名论文也出版过30万字科幻小说《破晓之钟》。2025年当Meta的裁员名单上出现他的名字时整个AI圈都炸了——不是因为他能力不行而是因为Meta亲手把一位顶尖AI大脑“倒贴”给了竞争对手。他是田渊栋。今天我们用一篇长文回顾他二十年的开挂人生。一、学霸之路从上海弄堂到卡内基梅隆1.1 向明中学→上海交大别人家的孩子田渊栋是土生土长的上海人。他在上海市向明中学度过了初中加高中整整七年高考后进入上海交通大学计算机系。在交大他进入了“联读班”——前两年在数学物理基地班打底大三才选计算机专业。当时班里100多人绝大多数选了电子信息工程只有10个人选了计算机他是其中之一。大三那年他去了美国普渡大学做了一年交换生那是他第一次真正走出上海。本科毕业后他继续在交大读硕士同时花大量时间在**微软亚洲研究院MSRA**实习前前后后加起来有一年之久。正是在MSRA他结识了汤晓鸥老师港中文并拿到了后来申请博士的关键推荐信。1.2 CMU机器人研究所强化学习的起点2008年田渊栋远赴匹兹堡进入卡内基梅隆大学CMU机器人研究所攻读博士。CMU的机器人所是全球AI的圣殿之一从这里走出了无数计算机视觉、机器人和强化学习的大牛。在CMU田渊栋的研究聚焦于强化学习与机器人控制这为他日后在动态环境中做智能决策打下了坚实的理论基础。博士最后一年他关于图像对齐中非凸优化的全局最优解的工作获得了2013年ICCV马尔奖荣誉提名Marr Prize Honorable Mentions——这是计算机视觉领域的顶级荣誉。此外他还拿到了2011年微软博士研究奖学金。2013年他顺利拿到博士学位正式踏上工业界的征程。二、职业生涯从谷歌无人车到Meta FAIR十年老兵2.1 谷歌X无人车最早投身自动驾驶的中国面孔之一博士毕业后田渊栋手上有好几个offer其中甚至有硅谷做深度学习的职位。但他最终选择了谷歌X实验室的无人驾驶汽车项目后来的Waymo。那是2013年深度学习刚刚靠AlexNet引爆计算机视觉整个CMU机器人系还有很多人对神经网络持怀疑态度。但他直觉上感到兴奋甚至专门给AlexNet的作者Alex Krizhevsky发邮件讨论开源代码的细节。在谷歌无人车组他是最早一批投身无人车的中国面孔。他后来在CSDN博客中写道“刚进组时满怀热情眼界大开发现工业界的问题还可以用算法之外的办法处理颇有新鲜感。同事们都很牛都非常努力。老板不怎么主动管……”他在谷歌学到最重要的一课是“总是解决不了的问题先想办法绕开它。”但时间长了他越来越觉得这不是自己想要的路。每天看到深度学习论文不断刷新纪录自己却困于无人车的琐碎工程问题他开始在业余时间研究神经网络理论。这种“每天每晚在脑中回响的声音”让他明白自己并不属于这里。于是他做了一个让家人反对的决定——离开谷歌。他充分发挥“小说家的想象力”写下了跳槽后可能的上、中、下三种结局惨的非常惨。给妻子看后妻子说“可行”。他加入了当时由Yann LeCun掌舵的Facebook AI ResearchFAIR。“回想起来这才是属于我的青春。”2.2 FAIR十年从研究员到研究科学家总监2014年底田渊栋加入FAIR一待就是整整十年。他从研究员做起一路成长为研究科学家总监Research Scientist Director领导了多个重量级项目。时期研究方向代表成果2015-2017围棋AI 游戏DarkForestGo、ELF OpenGo2017-2019强化学习组合优化AI引导的组合优化、彩票假说2019-2022自监督学习与表示学习Lottery Ticket假设、表示学习理论2022-2025大模型推理与效率Llama 4推理、Searchformer、Dualformer、Coconut三、围棋AI早于AlphaGo的“黑暗森林”3.1 DarkForest被AlphaGo光环掩盖的先驱2015年5月田渊栋与实习生朱岩共同启动了DarkForest项目。这个名字来源于刘慈欣《三体》中的“黑暗森林法则”——一个关于宇宙文明博弈的经典隐喻。这个命名本身就透露出他对围棋博弈本质的理解在有限信息下做出最优决策。DarkForest的技术架构在当时极具前瞻性深度卷积神经网络CNN 蒙特卡洛树搜索MCTS走子网络训练时预测三步棋而非一步显著提升策略质量策略网络在KGS平台达到3D水平搜索机制优先探索策略网络推荐的前3-5个方案延迟展开叶子节点以节省GPU资源关键时间线2015年11月团队在ICLR提交论文宣布DarkForest达到围棋五段水平。而此时DeepMind的AlphaGo论文还没有发表。2016年1月成果获得Facebook CEO扎克伯格的公开表扬。DarkForest于2016年3月被部署到KGS围棋服务器上进行实战对弈与后来震惊世界的AlphaGo几乎同期。虽然DarkForest最终未能像AlphaGo那样击败李世石但它是独立于DeepMind之外、最早达到职业水平的围棋AI之一被业界视为AlphaGo之外最重要的里程碑。3.2 ELF OpenGo单GPU击败世界冠军申真谞AlphaGo Zero和AlphaZero论文发表后田渊栋团队迅速跟进。2018年他们基于ELF框架完整开源复现了AlphaZero算法推出了ELF OpenGo。训练过程动用了2000块V100显卡训练两到三周后模型“基本上超过了强职业的水平”。更令人震惊的是ELF OpenGo仅靠单块GPU进行推理就能连续以20:0击败4位韩国职业棋手其中包括当时世界排名第一的申真谞。2019年ELF OpenGo全面开源——论文、模型、代码、自我对弈数据集全部公开成为学术界和工业界研究强化学习、模仿学习的重要基准。即便如此田渊栋在接受采访时依然非常谦逊一开始就说“原则上本次参赛我们倒数第一”。当被问及是否可以通过堆砌资源触摸到“围棋之神”的境界时他冷静地回应“首先围棋状态还是太多现在探索到的只是很小一部分……现有的CNN还做不到而且通过堆砌资源可能永远做不到。”四、大模型时代推理与效率的探索者4.1 拒绝OpenAI的“固执”选择2019年OpenAI联合创始人Ilya Sutskever亲自邀请田渊栋加入共同研发语言模型。彼时GPT-2刚刚发布OpenAI即将开启GPT系列的传奇。但田渊栋婉拒了。他的理由非常“不合时宜”“我希望专注于理解神经网络模型的工作原理而不是简单地训练发布模型。”在他看来虽然Scaling Law很火但“一味跟风、亦步亦趋并不是我的风格”。这个选择在当时看来或许有些固执——但今天回看这恰恰体现了他作为科学家的底色他始终在追问“智能到底是什么”而不是“如何做出更大的模型”。4.2 Llama 4背后的推理先锋进入大模型时代田渊栋的研究重心转向了LLM的推理、规划与效率优化。2025年1月他调任Meta GenAI研究科学家总监直接领导Llama 4的推理工作。他团队在这一时期的代表性贡献包括成果核心内容影响力Attention Sink(2023)发现注意力汇聚现象提出StreamingLLM被广泛应用于开源GPT模型解决长序列推理GaLore(2024)将7B模型预训练内存压缩至24GB以内单张消费级显卡可预训练大模型Searchformer / Dualformer(2024)长短混合思维链推理动态切换“快思考”与“慢思考”较早发现超长CoT对Scaling Laws的正面影响Coconut连续思维链(2024)将推理轨迹压缩到连续隐空间而非离散自然语言在某些需要搜索回溯的数据集上优于传统CoT神经网络动力学(2025)1层Transformer训练动态的数学推导揭示“均匀关注→判别式扫描”的相变机制刻画了涌现和“顿悟”的动力学过程MobileLLM(2024)移动端高效模型系列优化端侧AI部署Re3故事生成器(2022)基于大语言模型的长篇故事生成框架将AI与创意写作结合2021年他还以第一作者身份获得ICML杰出论文荣誉提名强化学习方向。五、学术荣誉顶会认可的硬核实力田渊栋的研究成果获得了国际学术界的广泛认可2013年ICCV马尔奖荣誉提名计算机视觉顶会2021年ICML杰出论文荣誉提名机器学习顶会2022年CGO杰出论文奖代码生成与优化顶会2023年ICML SODS研讨会杰出论文奖此外他长期担任NeurIPS、ICML、ICLR、AAAI、CVPR、AIStats等顶级会议的领域主席Area Chair。六、另一面人生科幻小说家6.1 《破晓之钟》30万字的AI内核科幻在繁忙的科研之余田渊栋还有一个令人惊讶的身份——科幻小说家。2021年他开始在知乎连载长篇科幻小说**《破晓之钟》全书30万字全部手写没有借助AI**他后来透露第二部小说将尝试AI辅助写作。2024年这本书正式出版。创作背景写作始于ChatGPT热潮之前却“预言”了后来围绕算力与智能的攻防战。故事设定类似于《三体》的宏大背景——几位初出茅庐的科学家面对来自外太空的挑战处理人类危机。但与《三体》不同的是书中的技术背景距离我们当前的时代更近元宇宙、纳米机器人、超级智能……几乎全是当下全球热议的前沿技术。核心科幻概念“到那时高级文明最想要的宇宙资源会是good idea。”田渊栋认为每个技术时代都对应不同的科幻命题——蒸汽时代、电气时代、信息时代、智能时代。他想写出真正有AI内核的科幻。书中“大师兄”研究员这个角色被他投射了自己的影子“一开始非常渴望做出震惊世界的科研成果但入校后才发现原来全世界最聪明的人都在做科研你能力不够。”6.2 知乎大V技术之外的深度思考田渊栋长期活跃在知乎IDYuanfeng是“人工智能”“深度学习”话题的优秀回答者被知乎er称为“大神”。他的文章深邃而富有可读性代表作包括《博士五年总结》2013《博士五年之后五年的总结》2018《技术之外》系列他在一篇总结中写道“个人要跳出纯技术的圈子不能太过沉迷自己的长处而看不到短处。交流不是为了沉浸在过去的成就中而是为了让将来的工作做得更大更强。”七、2025意外转折与被裁后的下一站7.1 Meta裁员风暴AI老兵“被毕业”2025年10月Meta宣布大规模裁员。令整个AI圈震惊的是——田渊栋的名字赫然出现在裁员名单上。消息传出后业界一片哗然。麦吉尔大学兼职教授、强化学习专家Rishabh Agarwal在社交媒体上评论“Yuandong在Meta内部备受尊敬他注重细节技术敏锐这次裁员毫无道理。这是Meta的损失。”据《硅谷观察》报道田渊栋本人证实了裁员消息但婉拒了采访。多家AI公司随即向他抛出橄榄枝bagel.com的CEO甚至公开喊话“如果您之前在Meta从事闭源超级智能工作并且想构建开源超级智能请直接发消息给我。”业内人士普遍认为Meta此举是**“将资深AI研究人员倒贴送给竞争对手”**。7.2 真相被裁之前已“心不在焉”不过根据田渊栋后续透露的信息他在被裁之前其实已经拿到了其他offer并且已经向上司表达过不满。裁员只是加速了他的离开。他在个人年终总结中写道“我已经待在Meta十多年了最近几年更是抱着‘公司快把我开了吧’的心态。也算是因祸得福——还给小说创作提供了很多新素材。”更令人意外的是他没有选择加入任何大厂而是决定趁年轻去创业成为一家新初创公司的联合创始人。他在总结中说了一句很“田渊栋”的话“AI中心时代职级已无意义愿望比神灯值钱。”八、田渊栋的AI哲学给年轻人的四句话8.1 对Scaling Law的反思作为AI领域的“少数派”田渊栋对当下的Scaling Law狂热始终保持冷静“Scaling Law代表一个非常悲观的未来——它意味着我们只需要堆算力、堆数据不需要理解模型内部机制。”他始终坚持**“理解神经网络工作原理”**的研究路线致力于让大模型“透明化”。他曾坦言“现有的梯度下降和概率预测模型可能永远无法模拟人类的‘顿悟’瞬间。要实现真正的人类水平智能整个训练算法或许都需要被彻底替换。”8.2 给年轻研究者的建议在多次访谈和知乎回答中他分享过几条朴素而有力的心得选对方向坚持到底“选对人生的职业方向及坚持这个方向是最重要的。”跳出舒适区“不能太过沉迷自己的长处而看不到短处。”主观能动性“一旦有了主观能动性工作就不再是负担而是自觉自愿的行为。”做一个独一无二的人“一个人一生中只要做出一两件让大家惊叹的事情就足够了。”九、结语传奇仍在继续从向明中学到上海交大从CMU到谷歌X无人车从Facebook FAIR到Meta GenAI从DarkForest到ELF OpenGo从拒绝OpenAI到领导Llama 4推理从ICCV马尔奖提名到《破晓之钟》——田渊栋用二十年时间走出了一条极少数人敢走的道路。他从不追逐风口却总能在关键节点做出独立判断他既是严谨的科学家也是浪漫的科幻作家他既能用2000块GPU训练出世界级围棋AI也能用一支笔写尽30万字的人类未来。2025年的裁员对他而言不是终点而是一个新的起点。正如他在个人总结中写的“接下去的十年会更有趣。”对于整个AI研究社区而言田渊栋的下一步去向无疑是未来几年最值得关注的悬念之一。而对于年轻的研究者来说他的经历本身就是最好的启示在AI这个快速迭代的领域唯有坚持初心、深耕底层、保持好奇才能走得更远。

更多文章