2016年10月28日,中国计算机学会计算机视觉专委会(CCF-CV)走进高校系列报告会第22期活动在中国科学院深圳先进技术研究院A504学术报告厅成功举行,报告会现场气氛热烈。
本期报告会特别邀请了来自中山大学的赖剑煌教授、北京大学的刘宏教授、微软研究院俞栋研究员以及华南理工大学的金连文教授做精彩演讲。中国科学院深圳先进技术研究院乔宇研究员担任执行主席。会议共吸引了来自深圳先进技术研究院、北京大学深圳研究生院等相关科研院所与高校、以及联想、华为等企业的工程技术人员200余人参会,为珠三角地区特别是深圳地区计算机视觉与深度学习领域的科研工作者、相关企业研发人员等提供一个高层次的学术交流平台。
来自北京大学的刘宏教授长期从事智能机器人视觉听觉及运动规划领域的教学、科研和产业化工作,本次报告刘教授围绕题为“Online Growing Neural Gas forAnomaly Detection in Changing Surveillance Scenes”展开,分享了其团队在视频监控中异常行为检测的最新研究成果。
华南理工大学的金连文教授以“Drop to Gain ——浅谈深度学习中的舍弃训练技术及其应用”为题展开,简要回顾深度学习领域中Dropout、DropConnect等多种基于舍弃思想的训练技术,介绍其团队提出的几种Drop Learning(DropSample、DropStroke、DropSegment、DropRegion)训练方法及技术,及其在文字识别中的应用,并现场演示了其团队研发的手写文字识别应用演示系统,引发现场观众极大兴趣。
微软研究院的俞栋博士以“Permutation Invariant Training ofDeep Models for Speaker-Independent Multi-Talker Speech Separation”为题展开,详细介绍了其团队提出的一个新的深度模型,不同于大多数现有技术对语音分离为多类回归问题和深层的聚类技术,认为这是一个分割(orclustering)的问题,模型优化了分离回归误差,忽略的混合源的顺序。这一策略巧妙地解决了长期的标签排列问题是阻碍进步的语音分离技术的深度。
中山大学的赖剑煌教授的报告主题是“行人再标识问题的若干研究新进展”,报告首先综述该领域的研究进展,然后重点介绍本团队在行人再标识方向的若干研究进展,包括了基于时空线索的行人再标识、行人的动态匹配模型、行人的镜像表示、跨视域的鉴别成分分析、基于深度学习的再标识等方法。
CCF-CV走进高校系列报告会活动旨在推动我国计算机视觉学科专业领域的学术与技术交流,促进国内外学者间的了解与合作,促进国内计算机视觉的学科发展,目前已成功举办22期。此次会议的成功举办不但充分展示了计算机视觉与深度学习相关领域最新的研究成果,也为学术界和产业界搭建了沟通的桥梁,对促进双方了解与合作也具有重要和积极的意义。期待CCF-CV能够走进更多的高校和科研院所。