用“执着”与“极致”诠释科研初心
——记国家自然科学奖二等奖获得者高新波教授
■记者 吴华
在国家自然科学基金重点项目、国家杰出青年科学基金等项目支持下,围绕视觉计算基础理论问题,进行长达十五年的科研攻关,取得的研究成果丰富了传统的视觉计算理论,建立了基于信息-物理-认知三元空间融合的视觉计算框架,提出了图像结构建模新方法、视觉表观重构新模型,以及视觉质量评价新准则。
因为这一创新性研究成果,今年年初,作为“图像结构建模与视觉表观重构理论方法研究”项目负责人,beoplay体育提现综合业务网理论及关键技术国家重点实验室主任高新波教授,在国家科学技术奖励大会上,接过了国家自然科学奖二等奖证书。
十五年磨一剑。高新波与他的团队,用胸中的“执着”与手中的“极致”,诠释了千锤百炼之钢背后的科研初心。
2016年国家自然科学二等奖领奖现场
远方:瞄准国家重大需求,解决基础理论问题
当今,视频监控、VR/AR、无人系统、机器人视觉等各种新兴感知平台不断涌现,感知数据每日海量产生,迫切需要发展高效的视觉计算方法。视觉计算理论创始人Marr指出,图像的“结构建模”和“表观重构”是视觉计算的核心。
2001年,29岁的高新波完成了香港中文大学多媒体实验室的博士后研究工作,回到母校beoplay体育提现,组建起“影像处理系统实验室”,并与香港中文大学多媒体实验室的李学龙、陶大程两位学者保持科研上的密切合作,围绕“社会公共安全”国家重大需求和“信息-物理-认知三元空间融合”国际学术前沿,探索视觉计算与协同认知的新理论,着重解决异质图像重建和图像质量感知中的瓶颈问题,在图像结构建模与视觉表观重构领域进行了十余年的联合攻关。
“项目立项之初,图像结构表示尚未建立完备的理论体系,视觉感知模型对图像结构的表示机理尚不明确;同时,视觉表观重构与图像结构表达和视觉感知机理之间的内在关系尚待发现。”令高新波感到欣慰的是,团队十余年来围绕这一基础问题展开的研究,最终取得突破。“团队建立起了图像结构的紧致张量表示模型,构建起视觉表观的非均匀重构框架,并基于视觉系统的通道选择性和掩蔽机理,建立起了图像质量评价模型。”
成果具有广泛的应用前景。高新波介绍说:“团队提出的图像结构建模可应用于图像分析、图像检索和模式识别,为特征提取提供理论指导,表观重构理论和方法可应用于高分辨对地观测相机的研制。此外,成果还可应用于异质图像合成与识别系统,如基于可见光近红外成像的身份认证系统、基于素描画像-照片的犯罪嫌疑人排查系统等,这在网上支付、智能门禁、刑侦破案等应用中,将能发挥重要作用。”
“作家柳青先生说过,‘人生的道路虽然漫长,但要紧处常常只有几步,特别是当人年轻的时候’。”这一点,高新波深有体会,“博士毕业后的五年是个人的快速成长期,精力充沛、思维活跃,且具备了良好的研究基础,若能迅速设定合适的研究方向和奋斗目标,将为日后的成功埋下基石。”
丰羽:“没有比脚更长的路,没有比人更高的山”
科研的道路并非坦途,“苦”与“乐”的风景总是交错呈现。团队在图像质量评价方面的研究成果得到国际认可的艰难过程,是让高新波印象尤为深刻的一段“颠簸路”。
2008年,高新波与他的博士生路文,以及陶大程、李学龙合作撰写了论文“Image qualityassessment based on multiscale geometric analysis”,提出了基于多尺度几何分析的部分参考型图像质量评价的一种新测度。
文章投至图像处理领域的顶尖期刊IEEE Trans. on Image Processing,经过长达半年多的评审,编辑部返回了四位评审人的评审意见——一共20条大问题和18条小问题。“显然,评审人不愿意承认和接受我们的工作。但,幸运的是,主编给了我们申诉的机会。”
一条条异常严苛的问题,需要大量的理论分析和实验数据予以解释、支撑。
没有任何抱怨和等待——
当时正值春节期间,但分处西安、香港、伦敦三地的四人,却无心品味正浓的年味儿,大年初三就全部投入到论文的修改中,每日通过邮件、电话沟通讨论。终于,经过13天通宵达旦和问题“死磕”,在元宵节当天,每一个“问号”都被拉直,得到了完美的解答。对于这篇14页的论文,回答评审人的问题足足用了20页。
相关论文谷歌引用情况
修改稿投出后,又经历了两轮严格评审,最终得到录用。论文在线发表后,连续五个月在IEEE Xplore数据库中下载量名列Top100榜单,同年获得了微软杯IEEE125周年优秀论文奖。目前,这篇论文在Google Scholar数据库中已被引用200余次,所提出的图像质量评价测度,已被学术界广泛认可。
如今,“图像结构建模与视觉表观重构理论方法研究”项目的成果已得到60多个国家、地区,包括近10位美、英、加等国院士和30余位IEEE/ACM/IAPR/IETFellow等国际同行的高度认可,获得国家发明专利20项。这些成果中,20篇主要论文SCI他引近1000次,Google Scholar被引用2300余次。1篇论文入选ESI 2009年新热点论文,2篇论文入选ESI高被引论文,2篇论文获Signal Processing2009-2012年“Most CitedArticle”国际论文奖。
“只管攀登莫问高。做科研,要相信没有比脚更长的路,没有比人更高的山。”高新波深切体会到,要想锻造出科研利刃,对“远方”的坚守与对细节的追求缺一不可。
破茧:打破“天花板效应”,将一件事做到极致
2008年至2010年,用高新波的话来讲,“是埋首苦拼的三年,也是竭力突破的三年。”
彼时,团队已经有了较好的积累,做到了国际期刊上有文章、国际讲坛上有声音,也承担着国家和部委的面上课题。“但是,一切都按部就班,长时间地在同一水平上徘徊、搁浅。”高新波敏锐发现了阻碍团队前行的“暗礁”,“显然,研究遭遇了平台期。”
为了破解“天花板效应”,高新波提出,将“承担大项目、产出大成果、融入大交流”作为团队起跳的“撑杆”。
为此,团队主动对接国家重大需求,竞争2008年国家自然科学基金重点项目“临地空间信息栅格网理论及关键技术”。面对当时并不熟悉的新领域,在申请书撰写阶段,团队成员分头出差学习调研,再汇总分析讨论,经常夜以继日地运转,在不断的否定之否定中形成研究方案,终于,赶在项目截止期的最后时刻提交了申报书。
初评通过,团队获得了参加会评竞争的资格。答辩提纲初稿完成后,团队又先后到微软亚洲研究院、中科院自动化所、清华大学、北京航空航天大学等单位走访领域内知名专家寻求建议。
每次都是兴冲冲地去拜访,垂头丧气地回宾馆。为了对专家提出的诸多挑战性问题给出有的放矢的回答,大家绞尽了脑汁。经过近一个月的煎熬,答辩提纲更新了近100个版本。
煎熬的同时,也让大家心里更有了底。高新波说,正是由于这样充分的准备,在最终的答辩中,团队脱颖而出,获得了重点项目的资助。
“工作中的高老师堪称完美主义者。”路文这样描述自己的导师,“他会为了一页PPT的格式,甚至其中一幅图片的摆放、一个标点的位置,不断尝试直到大多数人看了满意为止。潜移默化地,将一件事做到极致,也成为了团队的集体追求。”
重点项目答辩成功大大提振了团队士气,2009年,团队又一次顺利获得了陕西省科学技术一等奖。同年,为了“融入大交流”,团队通过竞争获得了2010年国际图像与视频检索会议(CIVR)承办权,团队的知名度在本领域得到大幅提升,向心力和凝聚力也愈加强大。
承办2010年国际图像与视频检索会议
“一项接一项看似不可能的任务,最终都接力实现了!”按下记忆的“播放键”,一帧帧奋战的场景令高新波感慨万分。
新征:“千万别在最能吃苦的年龄选择了安逸”
“团队注重锻炼大家‘舍我其谁’的领袖意识,和‘我不下地狱谁下地狱’的担当精神。”作为“头雁”,高新波对这个平均年龄不足40岁,正值创新旺盛期的“雁阵”,寄予了很高期望,他鼓励大家到国际知名大学访学,了解国际同行研究方向、进展,自觉用国际标准衡量自己的研究成果,“做到既不夜郎自大,也不妄自菲薄。”
高新波教授与团队成员研讨问题
十余年中,团队成员在高新波带领下充分发挥各自特点,优势互补,相互支撑。
团队成员在各自方向上也都取得了不错的“成绩单”,在IEEE Trans上发表论文80余篇,在CCF推荐的A类国际会议上发表论文20篇,Google Scholar统计的论文引用9000余次,10余次获得国际、国内会议的最佳论文或高引论文,获国家自然科学二等奖1次、省部级科学技术一等奖3次、二等奖1次。
“高老师身上有着中国传统意义上知识分子的责任担当,以及时代赋予他的包容并蓄、富于创新的独特气质。”博士毕业后即加入团队的邓成,如今已是教授、博导,提起自己的快速成长,他认为主要得益于团队的“火炉效应”。
旁人眼中具有敏锐科研直觉、深刻洞察力、准确预见性及一语道破问题关键能力的高新波,要求自己在工作中做到尽善尽美的同时,也时常告诫年轻人,“千万别在最能吃苦的年龄选择了安逸。”
在高新波眼里,前行的脚步容不得半点停歇。“我们希望在图像的超分辨重建上设计更为先进的算法,在人脸画像-照片的合成与识别上开发更有效的人员排查和认证系统,实现人机混合智能,并在智慧安全、智慧金融、智慧交通和智慧健康等领域取得应用的突破。”
对于已将“远方”设定为“更好地让科技改善生活、服务人类”的高新波和他的团队来说,下一步“风雨兼程”要实现的“小目标”已立在眼前。