21世纪引用量第一,三度封神CVPR:何恺明的“开挂”人生
21世纪引用量第一三度封神CVPR何恺明的“开挂”人生他是广东省高考满分状元却放弃清华保送资格只为证明自己。他是CVPR创办25年来首位华人最佳论文得主此后又两次站上顶会之巅。他的一篇论文被《自然》杂志评为21世纪引用量第一超过28万次的引用记录至今无人能破。他让神经网络从20层走向152层奠定了现代深度学习的基石。从微软到Facebook从MIT终身教职到谷歌DeepMind杰出科学家何恺明——这个被称为“AI大神”的80后用20年时间书写了一段科学界的传奇。一、少年状元放弃保送的“狂妄”少年1984年何恺明出生于广州是家中的独子。父母在企业从事管理工作为他创造了良好的成长环境。童年时期他并非在游乐场度过而是在少年宫的画架前静默成长——那些描摹的日子悄然铸就了他坚毅沉稳的性格。在广州市执信中学就读期间何恺明展露惊人天赋全国物理竞赛一等奖、广东省化学竞赛一等奖荣誉接踵而至。2003年5月凭借这些成绩他获得了保送清华大学机械工程及自动化专业的资格。然而这个少年做出了一个令所有人惊讶的决定——放弃保送走入高考考场。“他想证明自己。”多年后熟悉他的人这样解释。那年6月何恺明以标准分900分的成绩成为广东省9位高考满分状元之一。进入清华后他又放弃了原本保送的专业转向更有挑战性的基础科学班。在清华物理系何恺明连续3年获得奖学金。2007年还未毕业的他进入微软亚洲研究院MSRA实习出于对计算机图形图像课程的兴趣他加入了视觉计算组实习导师是后来影响深远的孙剑博士。这个选择改变了他的人生轨迹。二、一鸣惊人亚洲第一篇CVPR最佳论文进入MSRA的头两年何恺明并不顺利。他尝试了各种课题却一直发不了论文。对于头顶高考状元光环的他来说这是不小的打击。他把更多时间投入研究甚至在电脑游戏中寻找灵感。那些带有雾气的游戏场景深深吸引了他——如何才能有效去除雾气让画面更清晰这个问题始终萦绕在他脑海中。2009年何恺明当时还是香港中文大学博士生师从汤晓鸥与合作者投出了他的第一篇论文《Single Image Haze Removal Using Dark Channel Prior》基于暗原色的单一图像去雾技术。这篇论文一出手便震惊学界——获得IEEE国际计算机视觉与模式识别会议CVPR年度最佳论文奖。这是CVPR创办25年以来首次有华人乃至亚洲学者获此殊荣。导师汤晓鸥当时开玩笑说“你一出手就到了巅峰从此以后你的学术生涯就只能往下走了。”事实证明这个预言大错特错——何恺明的路才刚刚开始。三、ResNet21世纪引用量第一的“封神之作”2011年何恺明在香港中文大学获得博士学位后正式加入微软亚洲研究院。彼时深度学习面临一个巨大难题网络层数越深梯度消失问题越严重训练效果反而越差。当时最深的网络也只能训练到20多层。何恺明和团队提出了一个天才般的解决方案——深度残差网络ResNet。他们在网络的每一层引入一个直连通道skip connection让信息可以绕过非线性变换直接传递。这个看似简单的想法解决了困扰学界多年的难题。从此人们可以有效训练超过百层的深度神经网络。何恺明团队构建的152层ResNet-152在2015年ImageNet图像识别大赛中击败谷歌、英特尔、高通等全球顶尖团队夺得第一。2016年这篇名为《Deep Residual Learning for Image Recognition》的论文再次获得CVPR最佳论文奖。此后ResNet的影响力呈指数级爆发截至目前单篇引用量超过28万次《自然》杂志将其评为21世纪引用量最高的论文位居榜首如今几乎所有现代深度学习模型——从Transformer到AlphaGo Zero从AlphaFold到GPT系列——都在使用残差连接李沐曾评价“假设你在使用卷积神经网络有一半的可能性就是在使用ResNet或它的变种。”汤晓鸥在世界人工智能大会上总结“何恺明把网络做深了谷歌把网络入口拉大了才成就了今天的大模型。”四、三连炮十年间三度封神顶会ResNet之后何恺明的研究继续一路走高。2016年8月在Facebook首席AI科学家杨立昆的邀请下何恺明加入Facebook AI ResearchFAIR担任研究科学家。在FAIR期间他接连抛出重磅成果2017年Mask R-CNN横空出世。这一算法解决了图片中的实例级对象分割问题不仅能检测图像中的目标还能为每个实例生成高质量的分割掩码。这项研究获得ICCV 2017最佳论文奖马尔奖。同年他参与的研究《Focal Loss for Dense Object Detection》获得ICCV 2017最佳学生论文奖。至此何恺明成为世界上少有的毕业不到10年三次以第一作者身份获得CVPR、ICCV最佳论文的学者。业界称其为“三连炮”演绎了一段AI佳话。此后他继续输出重量级研究2020年提出MoCo动量对比开启了计算机视觉自监督学习的新篇章2021年以一作身份发表MAE掩码自编码器将自编码思想用于视觉领域的非监督学习2022年至今研究聚焦模型性能优化、生成模型新范式五、荣誉等身从PAMI青年到院士何恺明的荣誉簿越来越厚2018年获得CVPR大会PAMI青年研究者奖2022年入选AI 2000人工智能全球最具影响力学者榜单综合排名第一2023年获得未来科学大奖数学与计算机科学奖奖金33.3万美元2025年当选美国国家人工智能科学院院士更令人惊叹的是他的论文影响力。截至2025年他的谷歌学术总引用量已超过71万次。这意味着他的研究成果正成为奠定行业发展的基石。2025年10月又一殊荣降临。他在2015年发表的论文《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》获得ICCV 2025 Helmholtz Prize。这一奖项被业内视为“十年影响力奖”只颁给十年前的论文中“改变领域轨迹”的工作。同月他参与的Faster R-CNN论文获得NeurIPS时间检验奖。从2009到2025何恺明的论文跨越十余年仍在收获荣誉——这是对“经典”最有力的定义。六、回归学界MIT终身教职与谷歌兼职2023年何恺明宣布了一个重磅决定离开FAIR2024年加入**麻省理工学院电气工程与计算机科学系MIT EECS**担任教职。消息传出后英伟达科学家Jim Fan感叹“如果别人加入MIT我会祝贺他如果是恺明加入MIT我会祝贺MIT将拥有恺明。”在MIT何恺明开设课程《Advances in Computer Vision》受到学生热烈欢迎。2024年7月他获颁道格拉斯·罗斯软件技术职业发展教授席。2025年6月仅仅入职一年多他就获得了MIT终身教职。同月何恺明再次带来惊喜以“兼职杰出科学家”身份加入谷歌DeepMind。事实上他与谷歌团队早有合作。2024年他和谷歌DeepMind团队提出Fluid模型2025年2月又与谷歌全华人班底合作发表《Fractal Generative Models》开辟生成模型新范式。从学术界到产业界再回归学术界如今又“双轨并行”——何恺明在不同身份间自如切换始终站在计算机视觉研究的最前沿。七、双轨天才简单的想法深远的影响何恺明为何能持续产出顶级成果熟悉他的人总结他拥有卓越的科研直觉总是能准确找到最核心的问题提出简明扼要的解决方案。即使是开创性的论文他的表述也简明易读用最直观的方式解释“简单”的想法不使用花哨的trick没有不必要的证明。这种风格背后是极致的投入。香港中文大学时期认识他的人称他为“拼命三郎”——早上六点多出门晚上十二点回寝室日复一日。天才尚且如此拼命普通人无法企及。汤晓鸥曾评价“何恺明多次按响深度学习的门铃。”从去雾算法到ResNet从Mask R-CNN到MAE每一次门铃响起都为计算机视觉领域打开一扇新的大门。如今他的门下弟子也开始崭露头角。2024年他的首批MIT学生曝光——4位研究者中有3位是华人包括国际数学、信息学双料奥赛金牌得主、清华姚班学霸邓明扬。薪火相传未来可期。八、结语门铃还会再次响起吗2025年的何恺明身兼MIT终身教授、美国国家人工智能科学院院士、谷歌DeepMind杰出科学家数职。他的引用量仍在增长他的研究仍在继续。不久前他在MIT演讲中分享了未来的研究方向AI for science聚焦视觉与NLP大一统的self-supervised学习。他在思考生成建模有没有可能也走向端到端历史能否在生成模型领域重演那个在广州少年宫画架前静默描摹的男孩那个放弃保送走进高考考场的少年那个用5年时间憋出第一篇论文的博士生如今已成为影响世界的科学家。但他的方式从未改变——用最简单的想法解决最核心的问题。门铃还会再次响起吗以何恺明的方式答案或许是当所有人都认为门已敞开时他正在寻找下一扇门。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2424260.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!