操晓春 中科院信工所


中科院信工所操晓春教授访谈



2018111日,专委秘书处采访了中科院信工所优秀青年学者操晓春教授。下面是采访实录。

您在计算机视觉与模式识别等领域做出了很多高水平研究工作,获得了国家自然科学基金优秀青年基金支持,入选了国家“万人计划”青年拔尖人才支持计划和中国科学院“百人计划”,是青年科技工作者学习的楷模。您能否向我们介绍一下您现在主要的研究方向是什么?是如何选择现在的研究方向的?

我目前主要研究计算机视觉、多媒体大数据内容理解与安全,研究方向与目前所在的工作部门(即中科院信工所信息安全国家重点实验室)的定位是密切相关的,主要是面向国家和行业相关安全部门在信息内容安全方面的需求,对具有前瞻性、基础性的科学问题和关键技术进行研究。

您在国际顶级期刊和会议上发表了多篇论文并被多次引用,在您取得的这些成果中,有哪些工作让您印象特别深刻?其中有哪些不为人知的艰辛过程或者有趣经历?

相对于改进已有方法的“更好方法”工作,我对一些“新问题”的工作印象更加深刻。例如,我们曾经研究过一个图像篡改方面的新问题:Image Colorization。在图形学和图像处理领域,Image Colorization研究有相当长的历史,但是这种编辑类篡改尚未被图像取证领域的学者关注,我们团队提出这个新颖的研究问题后,连续2篇工作发表在图像取证领域权威CCF-A类期刊IEEE TIFS上。

研究中的艰辛过程有很多,比如曾经有一次我们向一个计算机学会推荐的A类会议投稿近10篇论文,最后却只中了1篇,email列表里满篇的: “We regret to inform you that your paper, …”。但是,我们并不气馁,因为评审人提出了很多具有建设性的意见,这对我们改进现有工作帮助很大。

高效的科研团队对于深入开展课题研究有着至关重要的作用,您能否简要介绍一下您的科研团队?以及您是如何高效管理科研团队的?

我回国后就开始组建自己的科研团队,经过10年的努力,目前团队已经有研究系列和工程系列员工10余人,研究生数十人。我本人非常重视组内学术交流,每个月都会召开多次组会,大家一起学习、讨论。并且,每次组会的强度很高,大家会问到公式、图表的细节。

作为博士生导师,您在招收研究生时最注重学生的哪些方面?能否跟大家分享一下您在指导学生方面的心得体会?

在基础能力方面,我比较看重学生数学方面的能力。因为我们在研究模型算法的过程中会比较多地涉及到数学运算以及逻辑思维能力。另外,博士生平时需要阅读大量的英文文献以及向国际同行交流我们的工作,因此我对学生在英语阅读、写作、口语方面的能力要求也比较高。在基础能力之外,还会着重考察学生的个人追求,看其是否具有投身科研的兴趣和追求卓越的决心。如果自身追求较高,那么他努力的动力就很足,反之如果学生没有学术追求,导师即使频繁督促也不一定会有作用。

在指导学生方面,我经常鼓励学生要有选择性的精读论文。如果不能把论文每块内容包括公式上下标弄明白的话,就不能重复别人的工作。此外,尽管大部分学生们主观上不太愿意听取其他方向的研究工作,但我还是经常鼓励不同研究方向的同学们之间要多交流,因为很多有影响力的工作都是不同研究方向相互启发的结果。

科研基金是开展科研工作的前提,您认为申请基金时应注意哪些问题?能否分享一下您个人申请科研基金的成功经验或者失败原因?

科研基金申请的政策每年都在变化,比如今年的一个变化就是基金委新规定只列出个人最具代表性的5项成果。背景是,咱们中国每年发表的论文数量在部分学科领域已经比肩美国了,但是在原创性和影响力方面还有差距。

现在随着研究人员越来越多、国内科研实力越来越强,基金申请的竞争也越来越激烈,所以撰写基金时特别需要突出创新性和特色,这样评审人才能够把申请人的研究工作和已有工作区分开来。

您是多个期刊和会议的编委或审稿人,您能否结合自己的审稿经历,分享一下学术论文写作投稿过程中需要注意哪些方面的问题?或者有哪些建议?

我目前是三个IEEE Transactions的编委,偶尔看到很不错的工作不被审稿人认可,在论文写作投稿方面我的建议主要有两点。第一,把自己的工作投向最适合的期刊。每个工作都有适合它的期刊,且不同的期刊侧重接收的文章风格也不一样,所以事先选择适合自己工作的期刊是一件事半功倍的事情。太盲目的投稿只会造成双方时间的浪费。第二,在投稿甚至做一项工作之前,要想清楚工作的创新性到底在什么地方,我指的这个创新性是领域内的创新性,譬如将数学家在图论方向的最新成果应用到社会计算领域,更好解决一个社会计算领域的一个问题,也有望发表在社会计算领域的期刊上。

您对现在深度学习技术发展的看法是什么?您认为优势和劣势都有哪些?未来的发展趋势是什么?

深度学习是目前目标识别和检测任务的主流方法之一,在很多其它任务上都在不断刷新当前最好的精度。但是计算机视觉很多问题是病态问题,比如,从一张2D平面图像中恢复3D立体场景信息。虽然可以从大数据驱动的深度学习中学出一种可能的3D立体场景,但这完全依赖于训练数据的完备程度以及与测试场景的匹配度。人类进行研判时会结合常识、直觉还有主动调整视觉输入等方法,这可能是未来的发展方向。

您可否和大家分享一下您的业余生活?以及您是如何协调工作和家庭的呢?

我的业余生活还是比较“丰富”的,大部分周末时间都花在出差和加班上。其实,我们研究人员的工作和生活分的不是特别开。我们的很多工作完全可以自主安排,地方也不受限制,甚至在家里也可以进行。我本身也比较享受这种自由切换工作和生活的状态。

可以跟大家分享一个故事,就是我在攻读博士学位期间,我的导师经常让我们周末去他家讨论问题,譬如CVPR投稿文章的修改意见。他在家里草坪的椅子上读着paper、晒着阳光、也看着孩子,还指导了学生的科研工作。这种工作和家庭两不误,做自己喜爱的科研工作让我感觉很幸福,也直接影响了我后面的职业生涯选择。

最后,借谭铁牛院士经常说的一句话,送给所有科研工作者:Enjoy Life! Enjoy Research!

图片1


操晓春

中国科学院信息工程研究所信息安全国家重点实验室研究员、中国科学院特聘研究员“特聘骨干人才”、中国科学院大学岗位教授。国家自然科学基金委优秀青年基金获得者,入选国家“万人计划”青年拔尖人才支持计划、中国科学院“百人计划”(结题优秀)、教育部“新世纪优秀人才支持计划”。国际期刊IEEE Transactions on Image Processing, IEEE Transactions on Multimedia以及IEEE Transactions on Circuits and Systems for Video Technology编委(Associate Editor)、英国工程技术学会会士(IET Fellow)。就读于北京航空航天大学和美国中佛罗里达大学。曾就职于美国ObjectVideo公司和天津大学。主要从事多媒体内容安全和计算机视觉领域的研究,主持了国家自然科学基金重点项目、国家重点研发计划课题等数项国家级科研任务,取得了多项创新研究和实践成果,应用于国家重要部门。

                                           (责任编辑:黄岩 余烨 )