郝然 中国科学院大学
中国科学院大学郝然教授访谈
2019年6月15日,专委秘书处采访了中国科学院大学国家优秀青年科学基金获得者赫然教授。下面是采访实录。
赫教授,您在图像模式识别理论研究方面取得了一些成果,获得了国家优秀青年科学基金、北京市首届杰出青年科学基金等多项人才项目资助。特别在损失函数(或最优值函数)等价优化基础上的稀疏学习、信息理论学习和生成对抗学习三个方面做出很多优秀工作。您能否向我们介绍一下您如何选择现在的研究方向?以及怎么沿着当前的研究方向慢慢做深的?
模式识别是一个智能任务,是人工智能的重要组成部分。正是在人脸识别和物体分类等经典模式识别问题的深度突破和广泛应用推动了人工智能的快速发展。但另一方面,模式识别基础理论的研究依旧薄弱。初次接触科研,我的导师推荐给我“先见森林,后见树木”的思想。在接触信息理论学习和稀疏学习的初期,我花了半年左右时间仔细阅读了信息理论的经典教材,并且旁听了中国科学院数学所开设的数学课程。这些学习使我对相关研究领域有了较全面的了解,并打下了一定的数学基础。因此,在博士期间以及职业生涯刚刚开始的时期,我主要研究了一簇常用的最优值函数。从共轭函数角度分析了他们之间的区别和联系,提出了它们的半二次展开方式和优化方法,进而建立了信息理论学习和稀疏学习的统一半二次框架,为一些图像模式识别问题的研究提供了不同的解决思路,并取得了一些成果。
随着存储能力和计算能力不断提升,如何使现有理论和深度学习技术相结合,以更低的成本创造出更高的价值,是模式识别领域亟待解决的挑战之一。2014年Goodfellow等提出了生成对抗网络,它可以通过对抗博弈的策略从低维白噪声生成高维图像。这促进了生成式机器学习模型的飞速发展,为图像模式分析的研究带来了新的思路。图像生成,一方面可以给人类视觉带来更美好、随心的体验,另一方面可以推动模式分类模型在小样本学习上的发展。人脸图像生成技术是图像生成的一个重要分支,相比于自然场景图像,人脸具有更稳定的拓扑结构,更便于在深度学习技术上进行验证;恰巧我们团队在人脸方向已经有了一些探索,生成模型又与信息理论学习密不可分,之前研究的最优值函数也可以广泛应用于深度学习。综合以上两方面原因,我们选择了人脸图像生成(合成)作为课题组的一个重要研究方向,并在国内较早地实现百万像素(1024分辨率)的人脸图像无条件生成和人脸图像属性变换。由于大规模人脸图像生成的理论和方法研究涉及到很多研究领域的多方面内容,并且人脸图像生成又有着众多具体应用场景,因此我们本着“目标有限、重点突出”的原则,结合华为、百度、地平线等公司的应用需求,从“生成对抗网络理论”以及“高维图像生成方法”两个方面深入研究人脸图像生成。
您在国际顶级期刊和会议上发表了学术论文140篇,其中第一作者IEEE TPAMI论文4篇、IEEE TIP论文3篇、IEEE TNNLS论文2篇、IEEE CVPR论文3篇并被多次引用,在您取得的这些成果中,有哪些工作让您印象特别深刻?
做研究一定要有严谨的科研态度与习惯,它不是与生俱来的,或者一朝一夕可以养成的,需要经历长期培养和自我规范。对于学术论文的写作,要不断从失败中汲取教训,从而实现锻炼和提升。例如,初次投稿计算机视觉及模式识别领域顶尖期刊IEEE TPAMI时,我经历了四次论文小修(minor),历时1年半才最终被接收。这真的是一次十分磨人耐性的修改经历,但同时更加提醒了我“做科研要非常严谨,语言表达要准确”。自那以后,这句话也常被我挂在嘴边,用来督促自己和学生。
科研项目的申请对于广大科研工作者,尤其是刚刚步入科研行业的青年科技工作者,其重要性不言而喻。您获得了很多国家级和省部级项目,科研项目的选题和撰写应该注意哪些问题?能否分享一下您在申请科研项目的成功经验?
科研项目的选题首先要结合自身的研究方向和研究兴趣,切不可做“墙头草”人云亦云;其次,要淡泊名利,以解决国家和社会面临的重要问题为目标,敢于进行学术界的前沿性探索。此外,项目申请书的结构与写作也是十分重要的,尽量做到结构清晰、图文并茂、高度凝练,并听取不同领域专家的意见,反复修改校正。每一次写完项目申请书,我们会请学生仔细校对,一方面检查申请书是否还存在文字错误,另一方面也让学生了解未来的工作重点,共同探讨更好的解决方案和技术路线。
您近年多次被受邀到一些国际学术机构进行学术访问和交流,并作相关主题报告,如美国马里兰大学(计算机视觉权威学者、IEEE Fellow、多届ICCV和CVPR大会主席Larry Davis教授),美国普林斯顿大学(信息理论权威学者、IEEE TIT前主编、美国三院院士Vincent Poor教授)等。请您分享一下如何做好学术报告,特别在这个方面是如何训练您的学生的?
我们主要以谭铁牛院士的PE3C模型(Passionate, Enthusiastic, Confident, Considerate, Clear)为目标来提高自己的学术报告水平。为了提升学生的演讲能力,我们主要通过以下几个方面进行培养:鼓励学生在日常组会报告中使用英文演讲,并对其演讲效果从内容、结构、表达、时长、声音、热情和互动等方面进行打分;鼓励学生参加国际会议,并和国际知名学者面对面交流;鼓励学生参加国内的PRCV会议和VALSE论坛并了解模式识别领域的前沿动态;鼓励学生积极参与CCF-CV专委举办的ICCV、CVPR、ECCV中国预会议并介绍学生自己的研究工作,并根据专家的反馈意见进一步提高报告水平。另外,在谭老师的倡导下,我们研究中心每半年举行一次内部研讨会,为每位同学提供总结、展示、交流的舞台。
科学研究需要团队的合作,请问您的团队是如何协作的?分享一下您在团队建设方面的成功经验?
我所在的团队是谭铁牛院士带领的智能感知与计算研究中心团队,我的课题组是团队下的研究方向之一。我们把“立德树人”作为课题组建设的宗旨,在科研工作的同时努力实现全程育人和全方位育人。我们主要根据每位成员自身的能力和兴趣分配不同的任务,使每位成员能充分发挥其特长,也能在其他成员的帮助下弥补不足。团队建设要格外注重及时有效地沟通,每一次的周组会都是我们发现问题、讨论问题和解决问题的时候,大家坐在一块面对面沟通效率往往是最高的。一个默契的团队不仅需要科研上的相互配合,也需要情感上的相互关心。我们中心也会不定期为大家组织丰富的娱乐活动,例如春游、秋游、新年茶话会等,在科研之余让大家放松身心,享受生活。
请问您是如何选拨博士生和硕士生?能否和大家分享一下您在研究生管理和培养方面的成功经验?
在学生的选择和培养方面,我们以“德才兼备、以德为先”为首要标准,重点考察学生的思想水平和道德品质,然后考虑学生是否具有“动脑、用心、尽责”三个特质。在选拔研究生的时候,我们会让高年级博士生参与进来,与候选人讨论具体的科研问题,考察候选人的科研兴趣、数学基础和协作能力。学术研究有个入门的过程,在培养新生时,我们采用“传、帮、带”方式,指定一到两位高年级学生来帮助新生,尽可能缩短新生跟上学术前沿的时间。另外,我们会根据每位同学自身的能力和兴趣因材施教,为其提供发展建议,鼓励学生互相合作,一起探索前沿挑战科学问题。除了科研交流之外,我们还定期邀请其他领域的知名学者进行讲座,拓展学生视野,丰富学生生活。最近,我们邀请了中医领域的博士来讲解现代养生观念,希望以此来培养学生合理安排作息时间,提高科研效率。
现在有很多大学或研究机构开始鼓励本科生开展学术研究,您对此有什么看法,您有什么样的建议提供给他们吗?
为贯彻落实国家关于深化本科教改的精神,着力培养学生创新精神和科技创新能力,中国科学院自2015年开始实施了“中国科学院大学生创新实践训练计划”,旨在提高在学大学生科技创新能力,帮助大学生了解中国科学院和我国科技的最新进展。多名本科生依托该计划参与到我们的研究工作中,并在模式识别领域的权威国际会议ICCV、AAAI、SIGIR等上发表了论文,其中三名本科生(中国地质大学 黄睿 2017;北京科技大学 陈禹嘉 2018;北京工业大学 宋荣 2019)被美国卡耐基梅隆大学(Carnegie Mellon University,CMU)计算机系录取深造。黄睿同学在ICCV 2017以第一作者身份发表的论文到目前为止已经被引用153次(Google Scholars)。大学生参与中国科学院的创新训练计划有助于提高大学生的科技创新能力,但是凡事都要有度。从事过多的科研项目或辗转过多的实习单位会过犹不及,甚至适得其反。大学生最重要的还是要夯实基础,学好数学和编程,有课余时间的同学最好选择一个研究团队对一个前沿课题进行长期研究。
您最想和众多博士生、学术研究路上的青年学者们分享的是什么?
如今人工智能研究蓬勃发展,每年都有数以万计的相关学术论文发表。但在这种光鲜的表面之下,我们要明白“发表一篇文章,不一定能够解决一个实际问题;解决一个实际问题,一定能够发表一篇好文章”的道理。做科研的最终目标并不应该是发表文章,而应该是解决实际问题。如果能从解决国家和社会面临的关键问题出发,踏踏实实做科研,努力做出能够写入教科书的工作,有影响力的科研成果自然会水到渠成。另外,做科研切忌朝三暮四,盲目跟风。“生也有涯,而知也无涯。以有涯随无涯,殆已”;每个人的时间和精力都是有限的,哪个都想做只会哪个都做不好。反之,科研中要盯住重要问题,扎实积累,追求卓越,有时甚至需要有甘做无名英雄的勇气和信念。
赫然
中国科学院自动化研究所模式识别国家重点实验室研究员/博士生导师,中国科学院脑科学与智能技术卓越创新中心年轻骨干,中国科学院大学人工智能学院岗位教授。2001、2004年于大连理工大学获计算机科学学士和硕士;2009年于中国科学院自动化研究所,获模式识别与智能系统工学博士。2010年至今,在模式识别国家重点实验室任助理研究员、副研究员、项目研究员、研究员。从事模式识别、信息理论学习和稀疏学习基础理论研究,并应用到生物特征识别和计算机视觉。近期主要聚焦在生成式概率深度学习以及图像生成中遇到的瓶颈问题,展开图像模式分析基础理论研究。出版信息理论学习专著1部;在IJCV、IEEE TPAMI、TIP、TIFS、TNNLS、TKDE、TBD、TSMCS等权威国际期刊以及NIPS、ICCV、CVPR、IJCAI、AAAI、SIGIR、ACM MM等权威国际会议发表论文130篇,研究工作获得国家自然科学基金优秀青年科学基金和北京自然科学基金杰出青年科学基金资助。
(责任编辑:张汗灵 余烨 黄岩)