文章目录
- 1. Introduction
- 2. Main
- 3. Biography
- 4. My Thoughts
- Reference
- 彩蛋环节
1. Introduction
汤晓鸥的逝世是继孙剑博士逝世之后,华人在计算机视觉领域的又一损失。
以下文章为汤晓鸥教授的一篇旧文,我重发此文以纪念作者。
2. Main
汤晓鸥:天下第一铭
2003年3月8日,陪秋梅过了最后一个属于我们二人世界的妇女节(一直觉得妇女节比情人节重要),第二天,我们安静的二人世界就变成了吵闹的三口之家。新来的第三者白白胖胖,叫铭铭,是在香港威尔士亲王医院10层楼的产科病房出生的。铭铭出生的那天,11层楼住进了一个特殊的病人,说是肺病。可是我们那几天太高兴了,根本没注意。过了两天医生叫我们去他办公室问我们要不要提前出院,因为楼上有个传染病人。我们觉得还有很多东西要和护士学,肺炎也没什么可怕的,不想早出院。等我们回到病房,发现一个层楼的新任妈妈都在收拾行李,已经走的差不多了。我们才明白问题很严重。回家后的两个多月,再没敢带铭铭出门一步。后来才知道11层的病人是香港第一例SARS.
铭铭的全名叫汤之铭,是佛教大师南怀瑾先生起的名字。一直觉得是老先生取的名字保佑了铭铭。名字是老先生根据2000多年前的一部畅销书《大学》里面的典故起的。经历了SARS的苦其心志,又有老先生的保佑, 我一直觉得天将降大任于铭铭,常和秋梅讲,铭铭将来很可能成就“天下第一铭”。真是想什么来什么,果然四个月大时,就显灵了。
那时我父母第一次从国内来看铭铭,第二天就要到了,可是我们一直在为一件很头疼的事伤脑筋,铭铭已经14天没大便了,看了几次医生,都说孩子活蹦乱跳的没问题,可能消化太好,听医生讲14 天可能是香港地区的纪录了,不知是不是华南地区纪录。不管怎样说,我儿子有了他自己的第一个地区级纪录了,可惜后来再没能破此纪录,最多一次才四天,可能上次太难受了,看来铭铭也不傻,不愿为虚名太苦了自己。好在我父母来的头一天,问题解决了。父母来了后抱着铭铭说,这孩子没照片上看着胖了,怎么这么轻,我当时后悔不已,不该逼铭铭做他不愿意做的事,否则铭铭至少比头一天重一倍。这孩子其实用心良苦。
铭铭六个月大的时候,妈妈的假期结束了,不得不回北京工作了。铭铭当然毫不犹豫地决定跟妈妈走(主要是从他的哭声中判断的),这样我又开始了对微软亚洲研究院的经久不息的访问。可能是访问实在太频了,结果我访问的媒体计算组的主任,时任研究院副院长的张宏江问我愿不愿意接管他的媒体计算组,还没等我们开始谈条件,没过多久,研究院重组,宏江成了新成立的工程院院长,另一位副院长Harry(沈向洋)成了研究院新院长。Harry好像觉得我来管媒体计算组不大合适。我也没问为啥。过了没多久,一个周三的下午,Harry突然来电邮说想和我谈谈。原来Harry想找我接管他自己的视觉计算组,又觉得对不起媒体计算组,所以干脆将两个组合并成一个,问我愿不愿带。我第二天就答应了,Harry也怕夜长梦多,隔天我们就把很多细节敲定了,没有经过任何面试,我就在几天之内成了研究院的人了。周六,我就买了房子。那一周,感觉上像两个恋人生怕对方反悔而匆匆领了结婚证。
我当然不会反悔,我对研究院其实爱慕已久,研究院在我心里很像铭铭,大有天下第一铭的气势。我一直觉得Bill一生中做了两个了不起的决定,第一是和IBM签了DOS协议,第二就是建立了微软亚洲研究院。当然,有些同学可能不同意这种说法,我有时也想,和世界上最大的计算机公司签约怎么能和同世界上最大的国家签约相比呢,所以也许建立了亚洲研究院应该更重要。
北京的学校差不多集中了中国十几亿人中最优秀的人才。研究院是中国唯一的一所由跨国公司成立的从事基础研究的地方。和国外一流研究机构相比,研究院近水楼台;和国内的一流研究院比,亚洲研究院具有国际一流的理念和管理模式;和 IBM 及Google 在中国的研究院比,亚洲研究院从事基础研究而不是产品开发。这样独树一帜的地位,天下无双。
其后果自然是人才的高度集中。其程度让我想起了中国科大和麻省理工学院(MIT)。三个地方的人都挺好,却不太一样。说起来上世纪80年代的科大最难进,因为她只看高考成绩,没什么别的好说的。这样的后果是人才比较同质化,大家的长处都差不多,学生都很像运动员,会比赛,但缺少解决实际问题的能力。MIT就好申请多了,允许书面申请,这样即使某一方面较弱也可以申诉,强调自己的强项。课外活动有超常的地方也可以加分不少。微软亚洲研究院就更好进了,不但有书面申请,还可以当面申诉(面试),有机会全面表现自己。当然,全面表现的后果也很严重,就是进去以后要全面兑现。研究能力,编程能力,写作能力,吹牛能力,缺一不可。
视觉计算组的同事就具有这样的特性,感觉和他们在一起,没有什么题目做不出来的。所以我又想起了铭铭,总感觉和铭铭在一起的时间太少,想把每一分钟都记录下来,结果照了大量照片。于是很自私地号召大家做照片管理方面的研究,就有了我们在SIGCHI 注1 上的第一篇长论文。接着为了更方便地把照片中的人像一次从多张照片中分割出来,又做了多图分割的题目。为了快速方便地查找图像,我们做了实时图像检索技术。为了找到更多有趣的应用,又用人脸检测和照片管理技术做了一个将真人头像植入卡通图片的技术,于是很容易的用铭铭的照片将“小兵张嘎”动画图片系列变成了“小兵汤嘎”。我在研究院和一些高校做报告时经常把我们的研究课题总结为“下一代”图象处理技术,因为我们的技术多是应用在我们“下一代”儿童的照片上。
铭铭的照片经常用在视觉计算组的各种实验数据里,成了组里最受欢迎的形象模特。
我们做的一些好玩的技术已经开始影响微软的图像管理和搜索产品开发。在计算机研究领域有个矛盾,要想在实际产品中应用,一项技术必需简单实用,要想发表文章,这项技术又必需显得复杂深奥。要想既像Google那样做出实用产品,又像MIT那样在顶级会议发表文章,就要付出更多辛苦。作为一个做基础研究的地方,我们对在顶级会议发表文章的重视程度和MIT没有什么区别。在过去三年中,我们在一流的计算机视觉会议(ICCV 注2, CVPR 注3, ECCV 注4)发表了60多篇论文。至少在数量上已差不多“天下第一铭”。我常讲做研究就像比武论剑一样,要论剑就要到华山论剑,如果你一定要去太行山论剑, 去挺进大别山,那别人只能当你是游击队, 永远也别想成正规军。在计算机视觉领域,农村是永远也包围不了城市的。华山以外,很难论出好剑。
发这些论文的另外一个好处是吸引了很多好学生,这些年我见过很多非常优秀的学生,有些已不能用优秀来形容,只能说是天才。晓刚 注5 是我见到的第一个天才学生,在硕士阶段就发表了五篇CVPR/ICCV。他的才华和人品如此出众,以至于我毫不犹豫地将妹妹嫁给了他。后来我的另一个天才级学生达华 注6 发表了更多的文章,可是我已经没有妹妹可以再嫁了。好在最近的一个天才级学生靖宇 注7,来的时候就有女朋友了。靖宇编程打字的速度是如此之快,以至于我看不清他在键盘上快速移动的手。这三个学生共同特点是都收到 MIT 和斯坦福的全额奖学金。晓刚和达华去了MIT, 靖宇选择了斯坦福。我有种感觉,将来他们都会非常成功,成为各自领域的“天下第一铭”。我有种感觉,他们会越来越多。我更有种感觉,铭铭不属于他们。
铭铭让我自豪的地方也很多。比如铭铭长的很漂亮。这不是我一个人说了算,你可以去问晓晓,桃桃,月月,同同,扬扬,希希…… 我家院里每个四五岁大的小女孩儿都认为铭铭是她最好的朋友。铭铭四岁前所结交的女朋友(在幼儿园结识的不算)已超过他爸爸四十年艰苦努力的成果(在研究院结识的不算)。
可惜铭铭对学习的态度就像功夫熊猫阿波对面条的感觉,毫无兴趣。铭铭对面条的感觉倒像阿波对功夫的感觉,兴趣盎然。铭铭的人生理想和同龄孩子很不一样,不是做医生,警察,或宇航员,而是“吃饭,睡觉,做佳菲猫”。而且说到做到,铭铭唯一喜欢的课程是厨艺课。厨艺课老师Mariana也觉得铭铭是五岁孩子中厨艺最精湛的了。可惜和同龄孩子一起的时候,极少有比厨艺的时候,反倒是认字,背诗经常被拿出来做表演项目。为了培养铭铭对体育的兴趣,对艺术的热爱,及对中华民族的自豪感,秋梅和我一起带铭铭去看了奥运会开幕式。对于这场人类历史上最精彩最完美最盛大的演出,铭铭印象最深刻的是我在现场餐厅为他买的两根烤香肠。想起来那一定是这世界上代价最高的两根香肠了。
也许铭铭的血液里真的是流淌着面条汤?希望铭铭长大时,可以选择的已不只华山这一条路,总不能人人都上华山,太挤了,希望有更多的山可以上,有更多的路可以走。总得给铭铭这样不爱学习又厨艺精湛的孩子一条出路吧,但愿那条路不像面条一样弯延曲折。
秋梅近来常怪我乱讲天下第一铭,给讲坏了。我只好苦笑,怪自己当初求上帝的时候忘了说是正着数还是倒着数了。我就安慰秋梅说“在认字,背诗,音乐,数学,中文,英文,这几个小的方面,铭铭是比别人差一点,好吧,不只一点,差一节,一大节,我们可能也不用太担心,或许铭铭是想后发制人。”
秋梅温柔地看了我一眼,冷冷地说,“制谁呀!你看后面还有人么?”
3. Biography
以下内容转自商汤科技SenseTime公众号
青衫磊落,格究智理,学贯中西,胸怀报国宏图志,悲憾科海巨星陨,阴阳割昏晓
丹心耿介,矢志原创,千古文章,情倾桃李满天下,惟愿此去山水寄,天地一沙鸥
2023年12月19日,商汤科技创始人、人工智能科学家、浦江实验室主任、上海人工智能实验室主任、香港中文大学教授汤晓鸥先生遗体告别仪式在上海龙华殡仪馆举行。
汤晓鸥先生因病救治无效,于2023年12月15日23时45分在上海逝世,享年55岁。
汤晓鸥先生逝世后,中央领导同志、其他有关方面领导同志以各种方式表示关心、慰问和深切哀悼。龙华殡仪馆大厅内气氛庄重肃穆,汤晓鸥先生的遗体安卧在鲜花丛中。10时30分许,陈吉宁、龚正、胡文容、陈家昌、张为、李政等向汤晓鸥先生遗体三鞠躬,作最后送别。市人大常委会、市政府相关负责同志,有关部门和单位负责同志,汤晓鸥先生亲属、同事、学生、生前友好及各界人士前往送别。汤晓鸥先生逝世后,国务院港澳办、中央政府驻港联络办、科技部、人力资源社会保障部、国家卫生健康委、全国政协办公厅、中国科学院、中国工程院、中央广播电视总台、中国科协、中国地震局、中国气象局等送花圈或发唁电。
汤晓鸥先生1968年1月出生于辽宁鞍山。
1985年至1990年就读于中国科学技术大学,获学士学位。
1990年至1991年就读于美国罗切斯特大学,获硕士学位。
1991年至1996年就读于美国麻省理工学院,获博士学位。
1996年至1997年在麻省理工学院伍兹霍尔海洋研究所从事研究工作。
1998年起,任教于香港中文大学,并于其间创立多媒体实验室(MMLab),兼任微软亚洲研究院视觉计算组主任、中国科学院深圳先进技术研究院副院长等职。
2014年创立商汤科技。
2020年任上海人工智能实验室主任。
2021年任浦江实验室主任。
他是中国人民政治协商会议第十四届全国委员会委员,中国人民政治协商会议北京市第十三届、第十四届委员会委员,国际电气和电子工程师协会(IEEE)会士,曾作为首位华人科学家任计算机视觉国际期刊IJCV主编。
汤晓鸥先生是全球人工智能领域最具影响力的科学家之一。他凭借深厚的科学素养和敏锐的学术思维,在人脸识别、底层视觉、深度学习等研究方向取得了多项开创性成果,2014年研发了全球首个超过人眼识别能力的面部识别算法,推动我国在相关领域跃居世界领先地位;发现了自然图像中的暗原色基本准则,提出了暗原色图像去雾技术,获得计算机视觉三大顶级会议之一国际计算机视觉与模式识别会议(CVPR)2009“最佳论文奖”,是CVPR自1983年举办以来亚洲学者首次获奖。据统计,汤晓鸥先生论文累计被引用近14万次,位居全球华人计算机科学家前列。
汤晓鸥先生是人工智能产业化浪潮的开拓者。他带领团队创立了商汤科技,以“坚持原创,让AI引领人类进步”为使命,推动人工智能赋能百业,开启了人工智能技术规模化落地的时代;领导商汤迅速成为我国人工智能领域的龙头企业,并建设了首个智能视觉国家新一代人工智能开放创新平台。
汤晓鸥先生是具有强烈爱国情怀的战略科学家。他受命组建上海人工智能实验室和浦江实验室,以国际视野快速集聚了一大批优秀青年人才,创新科研组织方式,打造人工智能国家战略科技力量。面向国家重大需求,前瞻性布局实验室科研任务,领导团队于2023年再次获得CVPR“最佳论文奖”,署名单位全为中国大陆的科研机构属历史首次;领导取得了“书生”通用大模型体系、“浦源”开源体系、DeepLink计算体系等一系列具有重要影响的高水平成果,提升了我国人工智能领域创新策源能力,有力支撑了上海科创中心建设。
汤晓鸥先生是人工智能顶尖青年人才的培育者和引路人。他将发掘、培养、助推青年英才成长作为重中之重,秉持科学家精神率先垂范、悉心栽培,营造一流工作平台与环境,培养了百余名高水平研究生,其中不少人成长为中国乃至世界人工智能领域的顶级学者和企业领军人物。他带领多媒体实验室于2016年跻身世界十大人工智能先锋实验室。
汤晓鸥先生学识渊博、治学严谨、求真务实、开拓创新,他甘为人梯、奖掖后学、矢志创新、勇担重任,把全部精力奉献于计算机科学研究和人才培养,积极推动原创技术发展,为我国人工智能领域科技事业发展做出了卓越贡献。
汤晓鸥先生胸怀“国之大者”,为人正派,甘于奉献,作风民主,在业界具有强大的感召力。他儒雅亲和,风趣幽默,热爱生活,友爱他人,富有家庭责任感,有着独特的人格魅力。
汤晓鸥先生的一生,是热爱祖国、服务社会、追寻理想、不懈拼搏的一生。他的辞世,使我们失去了一位杰出科学家、行业领军人物和可敬可爱的良师,这是我国科技界和世界人工智能发展的重大损失。我们沉痛悼念汤晓鸥先生!我们将化悲痛为力量,继承他未竟的事业,为我国科学技术进步和科技造福人类接续奋斗!
https://mp.weixin.qq.com/s/BD-cwcK2i7Ox_tFS3nPeSA
4. My Thoughts
Artificial Intelligence / AGI promises to free humans from heavy intellectual labor, and Robotics promises to free humans from heavy physical labor, and that’s the exciting future I see.
从基础视觉、视觉大模型、数字孪生、3D Vision、通用视觉推理、多模态大模型交互,到具身智能、生命科学、OICT融合,AI数字化 正在电子信息世界 展现出重塑变革现有社会方方面面的巨大潜力。
生命的意义是什么?希望每一位读者在承担起学业、事业或家庭、社会责任的同时,都能收获到满意的结果、快乐和幸福。祝每一位AI从业者身体健康,平平安安。
Reference
注1,SIGCHI: Special Interest Group for Computer Human Interaction,是世界上人机交互领域最大的专业组织,这是一个多学科交叉的学术组织,包括计算机科学家、软件工程师、心理学家、交互设计人员、图形设计人员、社会学家和人类学家等等。大家共同理念是”设计有用且可用的技术是一个多学科交叉的过程,这一过程的恰当实施可以改变人们的生活”。
注2,ICCV: International Conference on Computer Vision,由IEEE主办的国际计算机视觉大会。作为世界顶级的学术会议,首届国际计算机视觉大会于1987年在伦敦揭幕,其后两年举办一届。2005年第10届ICCV在北京举行。
注3,CVPR: Computer Vision and Pattern Recognition, 由IEEE主办的国际计算机视觉与模式识别大会,它是计算机视觉领域最顶级的三大学术会议之一。
注4,ECCV: European Conference on Computer Vision,两年举办一次,是计算机视觉领域三大顶级学术会议之一。
注5,王晓刚:中国科大本科毕业,少年班第一名,郭沫若奖学金获得者,于香港中文大学取得硕士学位,现于麻省理工学院攻读博士学位。
注6,林达华:中国科大本科毕业,于香港中文大学取得硕士学位,获香港中文大学工程院优秀硕士论文奖(每年度全院只选一人),现于麻省理工学院攻读博士学位。
注7,崔靖宇:清华大学本科及硕士毕业,随汤晓鸥在研究院做了一年半的实习生,获微软学者奖学金,现于斯坦福大学攻读博士学位。
彩蛋环节
历史的车轮滚滚向前
https://blog.google/technology/ai/google-gemini-ai/#performance