CCF-MM走进郑州大学

2017年11月02日,由中国计算机学会(CCF)多媒体技术专业委员会组织的“CCF走进高校”活动来到郑州大学,在三位讲者的各自研究方向上为郑州大学师生作了最前沿的报告。报告由郑州大学信息工程学院帖云教授主持,学院老师、研究生及校外研究人员近200人聆听了本次报告。

学术报告前,首先由CCF多媒体技术专委会秘书长、清华大学计算机系孙立峰教授为师生们介绍了中国计算机学会(CCF)和CCF多媒体技术专委会的历史和发展,以及CCF举办此次活动的目的和意义。

随后,中科学院自动化研究所张兆翔研究员做了题为“生物启发的神经网络建模与学习”的报告。报告重点分析了以深度学习为代表的模式识别方法在多种视觉应用中取得了显著成功,甚至媲美人的性能,但是与生物模式识别系统相比,现有的深度学习方法在自适应性、可泛化性和多任务协作方面依旧存在明显缺陷。从脑的神经信息处理机制、认知方法和行为特性上寻求启发有望指导更好的神经网络建模,实现更为鲁棒的类人学习,具有重要研究意义与应用前景。报告在现有深度学习方法概述基础上,对张研究员组内近期开展的脑启发的神经网络建模与学习方法开展研究,具体报告内容包括神经网络的结构建模、面向多任务的神经网络架构学习、视听模态分析与整合、知识蒸馏和多智能体协同等。

北京大学马思伟教授做了题为“从波形编码到智能编码”的报告。传统视频编码的压缩对象主要是影视节目,目标是以较低的存储空间或传输带宽为人们提供较好的观看质量。而随着视频应用的普遍展开,如视频监控、无人驾驶等生成大量非以观看为目的的视频内容,更注重的是在前端采集时能够对视频内容进行即时的分析理解,后期还能对海量的视频内容进行更高效的检索管理等,传统编码方法的不足突显出来。在此背景下出现了视觉特征编码等技术,用以辅助满足视频分析需求。同时随着前端采集技术的进步,如深度、点云等视觉数据类型的采集支持,智能编码正在逐渐成为可能。报告简单介绍下一代高效视频编码技术要解决的问题和近期进展。并结合计算机视觉、人工智能等学科的进展,介绍神经网络在视频编码中的应用。

清华大学孙立峰教授做了题为“数据驱动的媒体计算和内容分发”的报告。随着网络和视频采集设备快速普及,视频数据迅猛增加,视频已成为信息存储、传播和表现的重要载体,其应用已渗透到社会生活的各个领域。当前,网络多媒体应用与服务从视频内容、用户体验、到基础设施都孕育着新的变革和机遇。融合媒体内容(Content)、群智(Crowd)、用户上下文(Context)和云计算(Cloud)的智能媒体处理与内容分发已成为当前媒体计算与服务的重要趋势。如何利用云中聚合的海量媒体数据、社交媒体交互数据、用户服务日志数据等媒体大数据,学习挖掘相关规律和模式,实现智能化、个性化的媒体服务,是当前的研究热点。报告结合本领域的前沿技术趋势和演讲者所在研究团队的最新研究成果,介绍数据驱动的媒体计算与内容分发,包括网络多媒体服务用户体验模型、基于社交传播的媒体内容分发、多媒体云计算与内容推荐等内容。

报告中,三位学者以幽默的语言和深入浅出的方式为师生们介绍了各自在自己方向上做的最新研究,与会者受益颇深。演讲后,同学和老师积极举手提问,报告会在一片热烈的讨论中结束。