吴建鑫 南京大学
南京大学吴建鑫教授访谈
2019年5月5日,专委秘书处采访了南京大学优秀青年学者吴建鑫教授。下面是采访实录。
您在计算机视觉与模式识别等领域做出了很多高水平研究工作,获得了国家自然科学基金优秀青年基金支持,入选了中组部青年海外高层次人才引进计划(青年千人计划),是青年科技工作者学习的楷模。您能否向我们介绍一下您现在主要的研究方向是什么?您是如何选择现在的研究方向的?您对于如何选择研究方向有什么建议吗?
现在最感兴趣的研究方向,我造了一个词组,叫“资源受限的深度学习”。深度学习模型,比如卷积神经网络CNN,在视觉领域很多问题效果特别好,但是运算量巨大、模型本身参数超多、运行时占用显存和能源也很多,这是深度学习对计算资源的需求非常大。同时,深度神经网络的一个著名特点就是:要学到好的模型,需要海量有准确标注的训练数据,这是深度学习对数据资源的需求非常大。那么,怎么在计算和/或数据资源受限的情况下有效的完成模型的训练(学习)和应用(部署),就是我所感兴趣的问题和研究方向。
事实上,从2000年左右开始从事与研究相关的工作时起,我的每项研究内容多多少少都和计算、数据这两种资源的绝对数量受限或相对数量受限有关。现在回头来看的话,发现还是挺有连续性的。
应该说,这种研究方向上的连续性并不是我主动追求的结果。在确定了自己的研究兴趣和研究品味之后,如果能在研究工作中有一定的自由度的话,每位研究人员只要能够坚持这种兴趣与品味,即便大领域有着潮起潮落,也能找到其中适合自己的定位与小方向。
您在国际顶级期刊和会议上发表了多篇论文并被多次引用,相关成果也很多应用在解决实际问题中。在您取得的这些成果中,有哪些工作让您印象特别深刻?有没有哪些不为人知的艰辛或者有趣经历?
我自己印象比较深刻的一个例子是ThiNet,主要是提出了一种神经网络以滤波器为单位的压缩方法,实验效果很好,也方便在实际应用中使用。ThiNet的关键是利用网络后面一层的输出变化指导前一层的压缩,并通过定义一个清晰的优化问题来求解。
其实在提出ThiNet之前,我们还尝试了一些其他方法。但是却发现这些方法,包括已经发表的很多方法,他们的实际效果甚至比不上随机选择。我是在一次吃饭过程中想到了ThiNet的主要思想的,随即当天晚上就在纸上推导出优化问题的形式化定义。第二天到办公室扫描后发给罗建豪同学(论文的第一作者)。他对算法和实现做了优化并得到很好的效果。
有趣的是,在后来的一些审稿经历中,不止一次遇到有投稿声称他们首次提出了某种算法(或准则、方法),其实就是ThiNet方法,甚至这些投稿还引用了ThiNet论文!
高效的科研团队对于深入开展课题研究有着至关重要的作用。您作为南京大学机器学习与数据挖掘研究所的教授,您能否简要介绍一下您所在的科研团队?以及是如何高效管理科研团队的?
机器学习与数据挖掘研究所(LAMDA)是周志华教授建立的一个科研团队,主要包括机器学习、数据挖掘及相关不同应用方向上的教师和同学们。我们团队的学术氛围很浓厚,也已经有很好的成果产出。至于科研团队的管理,我自己也还是在探索和学习过程中。
作为博士生导师,您在招收研究生时最注重学生的哪些方面?能否跟大家分享一下您在指导学生方面的心得体会?在您的实验室是否有某种奖罚制度用以激励学生?
我在面试研究生的时候主要考察以下几个方面:第一,身心健康、并且知道自己未来的目标是什么;第二,能和导师、同学和睦相处;第三,有一定的数学和计算机基础,有机器学习、计算机视觉相关基础是加分项。
在指导学生时主要感受是三点:第一要有比较广阔的视野,不能因为现在深度学习很热就一头扎进去、别的什么都不管;第二是编程能力,即使将来不做研究也可以从事其他工作;第三是(特别是对博士生来说)培养研究品味,了解什么样的研究是有价值的。
对学生没有惩罚措施(国家和学校也没给我们这个权力),但是研究出有趣的东西或者发表好的论文会有一些小的奖励。
科研基金是开展科研工作的前提,您认为书写基金申请书时应注意哪些问题?能否分享一下您个人申请科研基金的成功经验或者失败原因?
我写基金本子的经验不是太多,审本子的经验倒是略有一些。我觉得从科学或者技术的角度能“自圆其说”很重要,也就是写申请书的时候在科学问题、技术路线这方面自己确实形成了一个整体思路,至少能够说服自己。胡乱拼凑的材料确实很容易被评审专家看出来。从我自己的经验来看,是否有这么一个能自圆其说的整体思路对于申请获批与否很关键。另外,申请材料的格式统一规范、文字简洁通顺、图表美观易懂,这些要求看似简单,其实要花大量精力才能做到,这些方面对于申请科研基金也是很重要的。
您是多个期刊和会议的编委或审稿人,您能否结合自己的审稿经历,分享一下学术论文写作投稿过程中需要注意哪些方面的问题?或者有哪些建议?
写论文我觉得和写项目申请书很像(当然具体要求不同),所以前面的一些经验这里也适用。对于论文投稿,我建议作者在写完之后可以从审稿人的角度来考虑一下:实验自己觉得够了,但是审稿人会不会觉得不足?有些结论自己觉得理论或实验结果可以支撑,但是审稿人会不会觉得claim太强了?自己的方法当然自己觉得好,但是审稿人会不会发现一些其他的缺点?比如说,请领域相近但是没有参与论文研究的同行读一遍就有可能发现很多问题和可以改进的地方。
您认为计算机视觉与模式识别领域未来比较有潜力的研究方向主要有哪些?您认为未来哪些技术的在社会上的应用需求会比较大?
计算机视觉和模式识别涉及的范围很广,值得研究的方向非常多,对其中之一我非常感兴趣:如何打破现有方法的一些限制,使得深度学习能够适用于更多的场景?这些限制包括资源(例如计算和数据资源)方面的限制,也包括深度学习目前暂时还不能处理的一些场景与数据。
在应用需求方面,对高度非线性、动态变化的数据进行有效处理可能是很有社会价值的技术,例如辅助驾驶(及自动驾驶)、传统产业的智能化等方面。
您对现在深度学习技术发展的看法是什么?您认为优势和劣势都有哪些?未来的发展趋势是什么?
我觉得挺乐观的,因为深度学习现在有不少直接影响我们日常生活的落地应用,所以就算对他的投入降低了,大概也是“降温”而已,不太可能会出现“寒冬”。
深度学习的优势和劣势都很明显,对一些应用效果特别好是优势,需要大量资源、应用范围比较窄、理论基础不足是劣势。
趋势的话不太好评论,我自己倒是愿意往两个相反的方向努力:促进深度学习实用化(“落地”)和构建深度学习理论基础。
您可否可以大家分享一下您的业余生活?是否经常进行体育锻炼?以及您是如何协调工作和家庭的呢?
我大概是比较“宅”的一个人,平常有空的时候喜欢看书。不过家里的书橱里面基本上没有本专业的资料,大多是一些历史、科普、小说之类的,比如阿加莎克里斯蒂的全集有八十几本。
偶尔也会和家人一起去看看电影、出去旅游一下。工作和家庭都需要大量的时间,但是总时间是有限的,所以这两者肯定是冲突的。家人们已经给了我很多支持,我也尽量多花些时间在家里,所以有时候对一些国内外学术活动的邀请只能婉拒了。记得有次在接受了成都的一次活动邀请之后,主办方还挺惊讶的,大概我“宅”的特性已经“恶名远扬”了吧。
关于体育锻炼,我当然也希望能够经常锻炼,但是确实比较忙、人也懒,所以只能(间隔周期比较长)每次绕着南大仙林校区慢跑一圈。如果有时候特别忙、以至于人很疲惫的话,对我来说出去跑一圈是特别有效的恢复方法。
吴建鑫
南京大学教授,博士生导师,曾获国家优秀青年科学基金资助,入选青年海外高层次人才引进计划(青年千人计划)。现任《自动化学报》编委,《Pattern Recognition》期刊编委(Associate Editor),曾任重要国际会议ICCV、CVPR、AAAI、IJCAI等在内的国际会议领域主席或高级程序委员。主要从事计算机视觉与机器学习领域的研究工作。在重要国际期刊如《IEEE Trans. Pattern Analysis and Machine Intelligence》、《International Journal of Computer Vision》、《Artificial Intelligence》等以及重要国际会议如ICCV、CVPR、ICML、NIPS、IJCAI、AAAI等发表论文90余篇;据Google Scholar统计,发表的论文被40余个国家和地区的学者引用8200余次,H-index为38。
(责任编辑:黄岩 余烨 )