李甲 北京航空航天大学


北京航空航天大学李甲教授访谈

2020年2月15日,CCF CV《专委简报》“委员风采”栏目在线采访了北京航空航天大学博士生导师、2019年国家优秀青年科学基金获得者,李甲教授。下面是采访实录。


李老师,您好!首先,请您介绍一下您的个人学习和研究经历。

我是2001年从山东考到北京上大学,先后在清华、中科院计算所、新加坡南洋理工、北大、北航等五家高校和科研机构学习和工作,中间还去盛大公司创新院做了一年多的“盛斗士”,体验了工业界的生活。在多个单位的学习和工作经历,使我得到了很多锻炼的机会,也促使我习惯于从多个不同的视角思考问题。



您在视觉注意、显著性、图像视频计算与解析方面有很多的研究成果,能否跟大家分析一下这个领域目前的研究现状和未来发展趋势?

我从06年开始接触视觉注意和显著性计算这个领域,当时大家期望通过模拟人类视觉认知机理来突破部分计算机视觉任务的瓶颈,涌现了很多对眼动预测和显著物体分割的研究。但12年后深度学习的爆发,使得大家可以通过端到端的方式绕过对视觉认知机理的简单模拟,因此这个领域的发展逐渐出现了分化。


一方面,借助眼动仪开展眼动和视觉注意预测的研究有所减少,最主要的问题是说不明白通过这种方式预测出的视觉注意有什么用,而对视觉注意本身的研究也在逐渐开始探索人类视觉认知的底层生理机理。另一方面,得益于大量的代码和数据集开源,显著物体分割目前成为了研究热点,目前的趋势包括研究弱监督和无监督环境下的显著物体分割和共分割。这个领域现在的问题在于,缺少“非它不可”的杀手级应用。

除了注意力和视觉显著以外,我们也在积极探索新的道路,尝试了很多图像视频计算与解析的新任务。目前来看,“精益求精”和“见微知著”是两条可行的发展道路。 其中“精益求精”是指视觉认知粒度越来越细,细到样例级和部件级,“见微知著”是视觉认知既要适应充满噪声的真实大数据环境,又要理解万事万物的细微差别。这也是我们课题组未来将重点关注的两个方向。


您的所有研究中,您认为最有应用价值、最有前途的一项研究成果是什么?能否跟大家分享一下?

我们近期取得了一些与应用场景结合比较紧密的研究成果,包括近似车辆重识别、全景图像拼接、互联网图像视频分类、机载目标检测等,每项成果都或多或少的具有一定应用价值和发展前景。其中,与无人机应用场景相关的一些工作可能具有更好的应用价值和发展前景,因为这些工作既能体现出北航的航空航天特色,又能增强我们与其他课题组工作的区分度。



您申请了多项国内和国际专利,能否跟大家分享一下您对申请专利的认识和建议?

我在读博期间就养成了申请专利的习惯。当时高文老师团队对申请专利的要求很高,需要经过多位老师会议评估创新性和实用性才允许申请。因此当时申请的专利多数是以论文算法为基础进一步开发的应用系统,比如视频广告插入系统等,其中少数与华为公司合作研发的系统申请了国际专利。后来到北航之后,赵沁平老师团队非常鼓励将高水平工作申请专利,因此我们课题组内部制定了一个标准:值得投稿高水平刊物和会议的工作可以申请国内专利,其中部分开创性的高质量工作可以申请国际专利。个人认为,申请专利要变成一种科学研究的习惯动作,不要仅仅只对少数重点工作申请专利,而是要在自己的主战场上,对高水平的工作持续申请专利,形成系列的专利壁垒,方便在合适时机开展转化。



您曾于新加坡南洋理工大学、盛大创新院、北京大学等机构从事科研工作,请问最后为什么选择了北京航空航天大学呢?能否介绍下您作为“卓越百人”被引进到北京航空航天大学工作的经历?

选择北航的两个主要原因是:学校好,上升趋势明显,青蝇之飞,不过数武,附之骥尾,可致千里;离家近,只隔一条马路,以每天通勤节省1小时计,每年将多出1.5个月的8小时工作日。


做为卓越百人副教授进入北航后,有三件事情对我触动很大。第一,14年刚进校时,怀校长安排了一个项目申请工作,计算机学院抽调多名教师在会议室连续奋战24小时,从第一天中午12点干到第二天中午12点,从无到有地完成了申请书初稿和PPT初稿。并且,夜里2点时,学院领导给大家送来了KFC,说是刚开完一个会议,陪大家工作一小时,然后稍微休息下再去参加早上8点的另一个会议。第二,15年初参与重点项目申请,给一位青年老师和一位博士生打电话,问可否来开会讨论,答曰“刚到食堂打了饭”,于是就没有催促,没想到十分钟后两人就出现了,说是听到会议通知,没有吃饭就跑步回来。第三,17年给一位学生通过QQ发了个信息“在么”,发完后发现忙得忘记了时间,已经接近晚上12点。本来没期望得到回复,没想到学生秒回三句话:“我在”,“刚回到寝室,什么事”,“如果需要,我马上赶回来”。从这三件事情,才切身感受到了北航的魅力与特色,实实在在的归心于北航,认可自己是一名北航人。这种归属感,也是我从工业界返回学术界、从国外返回国内、从多个科研机构中选择北航时的最大收获。


您于2018年12月曾获得“北京航空航天大学优秀教学奖二等奖”,请问能否跟大家分享一下您的获奖经历,以及您的教学经验?

首先声明,这个奖并不难,我们学院的老师在2018年获得了一个一等奖和四个二等奖。不过当时我只是第二年从事教学工作,能获奖还是有点意外。究其原因,还是在于“感同身受”四个字。我在上课时,经常会想,如果是我坐在下面,凭什么不让我玩手机而是去听课呢?答案很简单,把课程讲得比微信朋友圈的段子更有趣,比王者荣耀参与度更强,比网络小说的包袱更多,自然就能吸引学生。当然,做到这几点很难,我也在不停的尝试和改进。另外,还有很重要的一点是,把每个听课的学生,都当成自己“名下”的学生,希望他们能真的学到东西,而不是走形式凑课时,学生自然能感受得到,也会给出相应的反馈。由于我还是教学领域的新兵,很多事情还在摸索,这些经验未必正确,仅供大家参考。



您于2018年6月曾获得“图像识别挑战赛WebVision2018冠军”,能跟大家分享一下您的挑战历程么?

当时我们和百度联合组队参加了这项比赛,其目的是尝试一种新的校企合作模式。大致流程是,鼓励完成基础科研训练(例如:投出一篇CCF A类论文)的优秀硕士生做为实习生,安排到企业参加比赛,并且做为高校团队和企业团队相互沟通的桥梁。参加比赛时,由企业团队负责提供大规模GPU资源和工程调参,高校团队辅助提出算法设计和技术路线建议;比赛后,高校团队负责撰写论文和投稿,企业团队辅助提供补充实验。打完比赛后,优秀的硕士生就地转正至企业工作,实现“三赢”。WebVision 2018时,我们使用这种策略获得了冠军,发表了一篇IEEE TPAMI论文,参与比赛的硕士生获评为北京市优秀毕业生,并为百度提供了一名已经熟悉了相关工作内容的高素质员工。



能否介绍一下您现在的研究团队,您团队目前研究工作的重点和特色,以及您对团队的管理和规划?

课题组现在除了我之外,还有1名助理研究员、6名博士生、8名硕士生,以及多名已保研直博和硕士的本科实习生。课题组目前正处于转型期,从早期以视觉显著为单一研究重心,转向检测、分割、识别三路齐头并进。近期的主要发展思路是:维持视觉显著计算,深耕物体精细识别,开拓微小目标检测,强化航空航天应用。从长远来看,课题组希望在当前扩张的研究领域基础上,凝聚出1-2个具有较高创新潜力和应用价值、能够支撑重要行业领域发展的研究方向,并引进具有共同学术理想和共同发展目标的青年教师组成学术团队,通过开展“更高端”、“更大气”、“更有用”的研究,使课题组能够逐步发展为有个性、有能力、有担当的国际高水平学术团队。



您在TPAMI、CVPR等国际知名期刊/会议上发表了很多高水平的论文,能否分享一下您发表高水平论文的经验?

课题组的论文发表主要包括两个阶段。第一阶段是2017年及以前,以我为主力输出,既要自己作实验和写论文,又要帮学生想idea,设计实验和修改/重写论文。这一阶段主要经验为:瞄准顶级,多写多练,唯手熟尔。第二阶段是2018年起至今,以高标准重点培养部分有潜质学生的基础科研能力,并辐射带动所有学生的科研工作。对每个学生,制定高水平的投稿目标和有潜力的研究方向,明确时间结点,定期检查进展。在学生开展研究时,具体论文选题、实验设置、论文撰写等以学生为主,并且明确导师给出的是仅供参考的Advice,而非强制性的Supervision。近两年的实践表明,通过充分调动学生的主观能动性,鼓励学生主动开展探索和积极试错,保障好学生日常生活和开展实验的软硬件环境,能够很好地促进高水平论文的发表。当然,这些经验仅为一家之言,是否普适仍需要继续进行测试。



请问您是如何处理“科研与教学”、“工作与家庭”这些复杂关系的?

这些关系之所以显得复杂,主要是因为什么都想要,什么都急着要。以科研与教学为例,我觉得自己更擅长科研,那么就专心把最擅长的事情做好,努力把不擅长的事情做完。工作与家庭亦然,一方面分配的精力多些,另一方面就需要别人帮你分担份外的责任,比如工作方面的其他青年教师和高年级博士生,以及家庭方面的配偶和父母。为此,需要维持时间和精力分配的动态平衡,如需取舍,可致良知。



如果让吐露研究者心声,您最想说的是什么?

       年方少仗剑入京,十九载诸事未成。

       庸庸碌规行矩步,战战兢如履薄冰。

心茫然拔剑四顾,忆往昔岁月峥嵘。

重收拾竹杖芒鞋,愿他日手挽天倾。

李甲



李甲

博士,教授,博士生导师,中国民主同盟盟员,国家自然科学基金优秀青年基金获得者。2005年7月于清华大学电子工程系取得学士学位,2011年1月于中国科学院计算技术研究所取得博士学位。此后,曾于新加坡南洋理工大学、北京大学、盛大创新院等机构从事科研工作。2014年6月被聘为北京航空航天大学计算机学院副教授,现任北京航空航天大学计算机学院教授。目前是IEEE/CCF/CIE高级会员和ACM会员,担任第十二届民盟中央青年工作委员会委员、中国计算机学会的计算机视觉专委委员、虚拟现实与可视化技术专委委员,以及中国图象图形学学会视觉大数据专委委员,兼任国际期刊IET Computer Vision编委,曾任Frontier of Computer Science青年编委。研究领域包括计算机视觉、虚拟现实和人工智能技术,主要研究兴趣为视觉场景智能理解与内容生成。先后主持国家自然科学基金面上项目、国家863计划课题(军口部分)、国防科技创新特区课题等纵向与横向项目12项;参与国家自然科学基金重点项目(排名2)、国家242信息安全计划课题(排名2,副组长)等纵、横向项目10项。在IEEE TPAMI/TIP、IJCV等著名国际期刊以及ICCV、CVPR等著名国际会议发表论文74篇,包括中国计算机学会推荐的A类论文33篇;中国美国专利申请受理57项(美国10项),授权32项(美国8项);出版Springer英文学术专著1部(第一作者)。2019年获国家自然科学基金优秀青年科学基金资助,2017年入选北京市科技新星计划,2016年入选北航“校青年拔尖人才支持计划”,2014年入选北航“卓越百人计划”,2012年分别获评为北京市优秀博士学位论文和中国科学院优秀博士学位论文;获2018年中国电子学会自然科学二等奖(排名1)、2010年度教育部科学技术进步奖一等奖(排名9)、IEEE国际会议BigMM 2015唯一最佳论文奖、图像识别国际挑战赛WebVision 2018冠军。




责任编委 余烨 赵振兵