嘉宾商学吴婷:李飞飞,AI教母诞生记

案例·线下访学 · 2025-05-13

全球AI界有两位大神,一男一女,刚好都是华人。男生就是黄仁勋,家喻户晓了;女生李飞飞,人称AI教母,如果没有她,AI的发展进程,可能还会晚个一二十年。


她创办的ImageNet,是全球第一个大型AI数据库,是AI视觉研究的基石。


她33岁成为斯坦福终身教授,45岁成为美国三大权威科学院的院士,在AI界更是桃李满天下,英伟达、谷歌、OpenAI,都有她的高徒。她还担任过谷歌副总裁,推动成立了谷歌AI中国中心。


今天,一口气带你认识李飞飞。


先说家世。


1976年,李飞飞出生在北京的一个知识分子家庭。


爸爸是工程师,妈妈是人民教师。这样的家庭,按说应该拼命鸡娃。


而李飞飞的童年却没有这些,而且她爸爸在世俗眼里还有点“不着调”。


比如李飞飞这个名字的由来,就很有戏剧性。李飞飞出生当天,爸爸因为在公园看鸟忘了时间,错过了孩子的出生时刻。回家后要给孩子起名,他还满脑袋都是鸟,孩子就叫“飞飞”吧。


成为新手爸爸后,他也没有为人父的压力和焦虑,什么奥数班英语班,都靠一边,他只想着带孩子疯玩。


比如带飞飞去公园看鸟,去田里捉昆虫,还会找来各种零件,DIY自行车,载着飞飞到处逛。


李飞飞后来回忆说,爸爸就是个迷失在成年人身份中的大孩子。


爸爸的“不着调”,本质上是纯粹的好奇心,这反而成为李飞飞的科学启蒙。以至于上完物理课,她骑自行车转弯时,都要思考加速度和角动量的变化。


如果说爸爸培养起了飞飞的好奇心,那妈妈就是拼尽了全力保护她的求知欲。


上初中时,有次飞飞被叫了家长,班主任说:别人家孩子都看奥数、背单词,再不济的也翻翻《意林》《读者文摘》,记点作文素材,你家孩子看的都是什么?《不能承受的生命之轻》,海洋生物之谜、UFO……这些又不能提高分数,你作为家长的怎么不管管?


老师倒是一片苦心,可飞飞妈妈不干了,她直接回怼:我家孩子就爱看这些书,有问题吗?老师被噎得说不出话来。


飞飞不只是爱看闲书,上学时她还把头发剪得跟男生一样短,天天跟一群男生聊战斗机和UFO。


过了俩月,老师又找上门了,说飞飞天天打扮得跟个男生似的,没有一点女孩子的样子,不能仗着脑瓜聪明就不守纪律。


这次妈妈也没怂,她说:飞飞首先是一个独立的个体,然后才是女孩。


这件事也让她开始思考,这样的教育环境,是飞飞想要的吗?这是我对她的期望吗?也许飞飞和我一样,都不属于这里。


没过多久,夫妻俩就辞去工作,全家到美国新泽西州定居,飞飞的人生从此发生巨变。


除了父母,李飞飞家还有位特殊的成员,那就是她在异国他乡的避风港,萨贝拉老师。


1992年,15岁的李飞飞来到美国。黄皮肤、亚洲人、语言不通,这几个因素一叠加,几乎预告了李飞飞艰难的求学路。好在她遇到了数学老师萨贝拉。


有次数学考试,李飞飞得了89.4分,90分才能拿A,就差0.6。从小就是尖子生的李飞飞很难受,她去办公室找萨贝拉老师通融,结果被直接拒绝。萨贝拉说:想要A,只能靠你自己努力,其他免谈。


看着是吃了闭门羹,但李飞飞一点没往心里去,反而激发了她的好胜心。她天天往办公室跑,一边练口语、一边学数学。一次她让萨贝拉推荐几本书,老师推荐了自己喜欢的科幻小说,结果李飞飞刚好读过,从此俩人靠着这个共同爱好打开了话匣子,越聊越投机。从分享书籍聊到家长里短,李飞飞还时不时跑到老师家里蹭饭,相处的跟自家人一样,萨贝拉老师也把飞飞当干女儿。


飞飞考上大学,他帮着研究入学文件;飞飞母亲生病,他帮着联系医院;飞飞一家想开干洗店,他更是大手一挥,借出去好几万美元。


在爸爸妈妈和老师的帮助下,李飞飞考上著名的藤校普林斯顿。与其说李飞飞改变了世界,不如说这三个她最感谢的人,共同托举起了一个天选科学家。


那李飞飞是怎么成长为科学家的呢?她又为什么在AI界有这么高的地位呢?


先做个轻科普,新一代AI技术有三大基石,GPU、神经网络和数据集。GPU提供算力,神经网络负责算法,数据图集则是训练的资源。


AI史上第一个数据图集ImageNet,正是李飞飞20年前带队完成的。


下面我来带你复盘一下ImageNet的诞生记。


回到2000年,24岁的李飞飞面临人生的一个分水岭,是成为拿着高薪的华尔街精英,还是继续完成心中的科研梦想。李飞飞选择了后者。


从普林斯顿毕业之后,她来到加州理工继续求学,成为钱学森和钱伟长的学妹,主攻的正是AI和视觉识别。


当时AI研究已经停滞了很多年,科学家们前赴后继地努力提升模型和算法,却一无所获。


但李飞飞意识到,只关注模型和算法没有用,还得把数据重视起来。这跟学数学一样,光训练逻辑思维没用,你要让他做足够多的题。


比如你想让机器识别出更多图片,就得先让机器学习海量标注好的图片。


但问题是,这些素材图片从哪来?当时可没有现在的技术发达,敲个代码就能搞定。没有别的办法,只能一个个手动收集。


于是在加州理工,她带着几个本科生,手敲出来一个有101个分类、9000多张图片的数据集,叫Caltech101,在科研圈引发了不小的关注。


有了成绩之后,李飞飞想要继续完善这个数据库,好推动进一步的研究。


但这个想法立马被同行们泼了一盆冷水。因为当时在AI圈,算法才是绝对C位,数据集基本没人关注。


一连串的质疑也让她无力反驳:怎么做?你有计划吗?能做成吗?靠谱吗?


他们倒不是打击飞飞,而是视觉识别这个科研方向太冷门了,不但拉不到经费,还可能因此一辈子评不上教授。


而且要想实现李飞飞的设想,需要的图像分类可就不是101个了,而是3万个。


光是上百个分类,他们就加班加点干了好几个月,如果没有资金支持,按这个进度,三万个至少要干上百年!这是李飞飞遇到的第一个坎儿。


不过在一片质疑声之外,李飞飞也遇到了一位支持者,李凯。他和李飞飞是普林斯顿计算机科学系教师中唯二的中国移民。


之所以他会站出来支持,不仅仅是因为同是华人,而是李凯本来就是这方面的专家,还是一位成功的创业者,不差钱。


商人加学者的双重身份,让他笃信大规模数据集的未来。李教授不仅捐了一套工作站(一种计算机)给李飞飞团队,还把自己的学生邓嘉推荐给了她。


2007年,在李教授和邓嘉的支持下,李飞飞的数据集终于正式启动,这就是ImageNet。


她规划了22000个类别,每个类别配1000张图,一共2200万张。这还只是成品,为了选出这2200万张,需要先找到至少10亿张。


这工作量绝对是天文数字,好在找图、标注没啥技术含量,他们雇了一群本科生,每小时10美元,做一个无情的标注机器。


但即便如此,ImageNet完工也得整整19年。


为了提高效率,李飞飞和邓嘉想了不少办法,比如优化图片下载流程,原本需要点三下鼠标,给它压缩到一下搞定;再比如自动在谷歌输入图片类别,提高下载速度。


一顿操作猛如虎,到头来,预计只能把19年的开发周期压缩到18年,还因为下载太多,被谷歌封了账号。


其实要提速也简单,撒钱招人就行了,但每小时10美元是个天文数字,而且他们也没有多大的办公场地可用。ImageNet再次陷入了僵局,这是李飞飞遇到的第二个坎儿。


在绝望之下,李飞飞茶不思饭不想,甚至想过开几家干洗店,一边赚钱一边养开发。不过好在幸运女神再次眷顾了她。


一个叫孙民的研究生有一天突然找到她,说有种工作模式叫众包,就是可以远程分配工作,全世界的人都可以同时参与,而且价格绝对比线下找本科生便宜,亚马逊就有这种服务,正好可以解决李飞飞的问题。


听到这个消息,她立马转向众包模式,团队的标注员开始指数级增长。最多时有来自167个国家的4.8万人参与,开发时间也从十几年缩短到5年、2年和不到1年,胜利就在眼前,但很快,李飞飞发现口袋里又没钱了,研究资金再次告急。这是李飞飞遇到的第三个坎儿。


她到处洽谈投资合作,最后斯坦福抛来了橄榄枝,而代价则是让他们整个团队搬到斯坦福所在的加州。


本来已经安居乐业的李飞飞,要离开工作生活了十几年的地方,再次陷入两难。有母校,有亲人朋友,有熟悉的工作环境,但当李飞飞看到跟着自己奋斗好几年的同事们,李飞飞最终决定冒险一把。


2009年初,李飞飞带团队跳槽到斯坦福,当年6月,ImageNet的初始版本问世,收录了1500万张图片,涵盖22000个类别,而且每张图片都经过了手工标注,并在层次结构中进行了组织,经过了三重验证,建立起人工智能史上最大的人工编辑数据集。


回首看,ImageNet的完成,除了李飞飞团队的日夜辛苦,还要归功于当时互联网、数码相机、搜索引擎等等更多技术的融合,所有这些大时代里的趋势汇集到一起,相互成就,才促成了最后的成功。


但是回到2009年,ImageNet的诞生跟“科研硕果”、“改写历史”这些词一点都沾不上边,李飞飞带着ImageNet去参加计算机视觉与模式识别大会,结果被忽视,只在会场边上的海报上展示一下,几乎无人问津。


后来她想到办比赛,号召全球的AI算法从业者,用ImageNet训练他们的模型,最后比一比谁的效果最厉害。


这样既能提高知名度,还能在各类算法模型的测试中优化自己,一箭双雕。


但2010年5月首届比赛的结果公布后,她的心又凉了半截,获胜的算法团队,还是当时公认的行业标准,成绩也没比在其他数据集训练的好多少。


到第二届,报名人数差点腰斩,比赛结果跟第一年也差不多。


李飞飞一度怀疑自己是不是错了。


直到2012年8月,第三届比赛的结果出炉,获胜的是一个神经网络算法团队,而且准确率比上届冠军高10%。


所有人都震惊了,因为神经网络并不是当时正统的算法,甚至有点“老古董”的感觉。


这就好比一个名不见经传的老头,一下击败了各大门派,拿下了武林盟主。


李飞飞当即决定,必须要亲自见见这个团队,看看到底是何方神圣。


而这个团队的老大我们都很熟了,就是拿下2024年诺贝尔物理学奖的辛顿教授。


辛顿教授团队开发的算法模型AlexNet,在这次比赛中的识别准确率达到85%,创下世界纪录。更奇怪的是,AlexNet属于卷积神经网络,这是一个20多年都没什么进展的算法方向,这次究竟是出现了神迹,还是辛顿撞了大运?都不是,这其实是科学界的一次风云际会。


简单说,神经网络的思路相当于模拟人脑,模拟生物进化。比如视觉识别,别的算法都是预先决定先找图片的哪些特征,而AlexNet没有预设,完全靠训练数据学习,来培养自己的敏感度,逐渐形成对世界的认知,跟婴儿认知世界的方式一样。


辛顿教授之所以坐20年冷板凳,不是因为神经网络的思路有问题,而是它缺少资源,其中最核心的是算力和数据。


而ImageNet,恰好提供了足够多的数据,内置了CUDA的英伟达GPU,又恰好提供超强算力。这次科学界的风云际会,成就了李飞飞,正名了辛顿,造富了黄仁勋。


AlexNet的成功让神经网络正式成为AI主流,2年后,机器的人脸识别准确率正式超越人类。


李飞飞用大数据训练神经网络的想法也被业内疯狂追捧,从图像扩展到语音、文字、视频等其他领域,AI革命被彻底点燃。


即便已经功成名就,李飞飞也没有躺平,而是继续推动AI进化。2024年1月,她创立了World Labs,要把AI模型从2D像素提升到3D世界,赋予和人类世界一样丰富的空间智能。今年她又亲自下场,基于通义千问,只用了50美元,就训练出一个媲美DeepSeek R1的新模型S1。


李飞飞“AI教母”称号的含金量,还在不断地提高。


作者 | 吴婷


参考资料:

[1]李飞飞.我看见的世界.中信出版集团.2024

[2]50美元复现DeepSeek R1,李飞飞团队也选了阿里Qwen.硬ai.2025

[3]阿里云回应李飞飞团队50美元训练出AI模型.观点网.2025