>首页> IT >

汤晓鸥:我入睡前听于谦,机器怎么可能超过这样有趣的灵魂?-每日短讯

时间:2023-07-06 18:27:36       来源:腾讯网

7月6日,2023世界人工智能大会在上海开幕,香港中文大学教授汤晓鸥介绍了他和他的团队在原始创新领域的最新进展。


(资料图片仅供参考)

汤晓鸥首先回顾了过去十年他的三个学生王晓刚、何恺明、林达华在各自岗位上对深度学习的原创贡献。

香港中文大学教授汤晓鸥,图源:新民晚报

汤晓鸥介绍的第一个学生是王晓刚。王晓刚本科是中国科大少年班,并且是00班的第一名,硕士期间在汤晓鸥实验室就读,在MIT博士毕业后回到汤晓鸥在香港中文大学的实验室做教授。2011至13年CVPR和ICG两个视觉领域最重要的会议上,全球共有29篇文章做深度学习,其中有14篇出自汤晓鸥的实验室,全世界其他的实验室做了15篇。

王晓刚的第二项工作是首次让机器做的人脸识别超过了人的眼睛,比Facebook还早。2015年,王晓刚带队取得了中国学者第一个ImogeNet世界冠军,当年的对手是谷歌。

汤晓鸥介绍的第二个学生是何恺明。2009年,何恺明在汤晓鸥实验室读硕士期间就发了第一篇文章,取得了CVPR最佳论文,这是CVPR25年历史上从亚洲出来的第一篇最佳论文。汤晓鸥曾跟何恺明开玩笑:“你一出手就到了巅峰,从此以后你的学术生涯就只能往下走了”,结果他去微软和Facebook工作以后仍然一路走高。

何恺明的第一项工作是在MSR做的,获得了2016年的最佳论文。在2015年之前,深度学习最多只能训练到20多层,何恺明在网络的每一层引入了一个直联通道,从而解决了深度网络梯度传递的问题。

何恺明的第二项工作Mask R-CNN获得了ICCV2017年最佳论文。汤晓鸥表示,何恺明是世界上唯一一个在毕业不到十年内,三次以第一作者的身份获得CVPR、ICCV最佳论文。

第三个学生林达华的第一项工作是OpenMMLab,在2018年从一个小团队开始,在没有推广投入的情况下,以口口相传的形式成为国际上最具影响力的视觉算法开源体系,目前用户遍及全球140多个国家和地区。

汤晓鸥还介绍林达华的另两项工作成果,即将正式发布的国内首个千亿参数、8K的多语种大语言模型“书生·浦语”以及全球首个城市级实景三维大模型LandMark。

汤晓鸥对三位学生的成就评价道:“王晓刚在深度学习兴起的最初几年,洒下了很多原创的种子。何恺明将深度学习的根基打得非常牢、打得很深。林达华通过开发和大模型让他枝繁叶茂。”

汤晓鸥表示:“让我非常欣慰的是,这颗大树已经开始开花结果。就在两周前,我们的自动驾驶大模型从9155篇文章中脱颖而出,获得了CVPR2023年的最佳论文奖。”

根据谷歌学术统计,这是改革开放40多年来第一篇全部由中国学者完成的国际计算机视觉三大顶会的最佳论文,文章的牵头作者是王晓刚带出来的博士。此外,OpenMMLab是林达华带出来的博士陈恺做出来的,当年汤晓鸥实验室做的另一篇超过人眼的人脸识别的文章的作者陆超超,也从剑桥大学博士毕业回到了上海,正在和中国唯一的图灵奖获得者姚期智先生在上海期智研究院合作,从事AI基础理论研究。

“新一代的学生已经在上海成功起步。”他感叹。

汤晓鸥接着说:“作为一个在上海工作的东北人,我想再一次感谢上海,说一声‘上海,你好’,我想对王晓刚、何恺明、林达华、陈恺、陆超超,以及所有我曾经合作过的学生、老师们,还有今天上海在座的朋友们,讲一句:‘我不是在最好的时光遇见了你们,而是遇见了你们才有了这段最好的时光。’”

这句话是于谦老师的电影《老师好》中的一句经典台词。“这句话非常优美,富有诗意,也发自我的内心,”汤晓鸥说,“每天晚上睡觉前,我都是一边听着于谦老师的相声,一边想:‘机器怎么可能超过这样有趣的灵魂?我不信。’”

关键词: