CNCC 2024 | 多媒体内容理解与生成论坛成功举办

CNCC 2024 | 多媒体内容理解与生成论坛成功举办

CCF多媒体专委会 20241106日 09:00 北京

多媒体内容理解与生成论坛













20241024日,在中国计算机大会(CNCC)上,由中国计算机学会(CCF)多媒体专委组织的多媒体内容理解与生成论坛在热烈的学术氛围中成功举办。本次论坛由山东省人工智能研究院高赞研究员和山东建筑大学刘萌教授共同担任论坛主席。论坛汇聚了我国多媒体领域的众多专家学者,特邀来自电子科技大学、复旦大学、上海交通大学、哈尔滨工业大学(深圳)及中国科学技术大学的专家进行主题报告。CCF多媒体专委主任黄庆明教授主持了圆桌讨论,来自北京大学、浙江大学、天津大学、中国科学技术大学、哈尔滨工业大学(深圳)、浙江工商大学和哈尔滨工业大学(威海)的特邀嘉宾分享了各自观点。论坛吸引了100余名CNCC会议代表参与,大家围绕大模型时代多媒体技术发展的挑战与未来、学术研究成果落地等多个角度展开了深入讨论。







论坛亮点回顾





CCF多媒体专委主任黄庆明在开场致辞中欢迎了参会嘉宾和学者,指出本论坛特别邀请了知名专家进行讨论,旨在共同探讨多媒体内容理解与生成的未来发展。

CCF多媒体专委主任黄庆明做特邀致辞



电子科技大学李宏亮教授带来了题为“知识引导的连续学习方法”的精彩报告。他首先介绍了视觉任务连续学习的研究背景,随后详细讲解了基于模式连通性优化的连续学习、基于多教师蒸馏的连续学习方法,以及基于双一致性模型反演的非示例类增量学习,最后对视觉任务连续学习中的问题和思考进行了展望。

电子科技大学李宏亮教授做特邀报告



复旦大学颜波教授的报告题为“生成式AI及其多学科交叉融合应用”。他介绍了AI生成内容(AIGC)的三大要素,以及AIGC技术演化出的三大前沿能力:孪生能力、编辑能力和创作能力,并分享了相关成果。在“AIGC+物质科学”和“AIGC+医疗”两个领域,颜教授展示了AIGC技术赋能的最新进展,展望了AIGC大模型对科学研究的新支持。

复旦大学颜波教授做特邀报告




上海交通大学邹君妮教授带来了题为“多媒体生成:从平面到流形”的精彩报告。她深入讲解了黎曼流形的扩散模型,包括欧式空间扩散、非欧空间扩散、黎曼流匹配等。随后,她分享了基于热方程的生成建模和基于Ricci流的生成建模,包括几何代数神经网络、SDE上定义的一般扩散模型、Ricci曲率和Ricci流等。

上海交通大学邹君妮教授做特邀报告



哈尔滨工业大学(深圳)俞俊教授在题为“探索大模型背景下的医工交叉多模态AI技术”的报告中,首先介绍了医学大模型发展现状与挑战。随后,围绕多模态医学基础模型数据工程、多模态医工交叉探索全新的医学多模态模型架构和多模态医工交叉利用临床反馈对齐人类偏好方面展开讨论,最后展望了医学多模态交叉的未来发展道路。

哈尔滨工业大学(深圳)俞俊教授做特邀报告



中国科学技术大学常晓军教授带来了题为“视频内容理解的多维探索”的精彩报告,探讨了视频内容理解的关键技术和应用场景,重点关注视频目标检测/分割、动作识别、长视频理解等领域的最新进展,通过对这些任务的系统性分析,讲解了多模态数据融合、时空特征建模、基于大模型的预训练策略等创新方法如何提升视频内容的理解能力。

中国科学技术大学常晓军教授做特邀报告



论坛下半场的圆桌讨论将活动推向高潮。特邀专家各抒己见,讨论了大模型时代多媒体内容理解与生成的挑战、学术界在有限算力下研究工作的开展和AIGC落地的实现等话题。听众积极提问,与讲者进行了互动,在黄庆明主任的引导下,讨论深入而富有建设性,大家对多媒体内容理解与生成的未来充满期待。

圆桌讨论



我们对所有参与本次论坛的专家、会议代表以及主办方表示衷心感谢,并期待在未来的CNCC论坛上,继续探讨更多前沿科技话题,共同见证科技的进步与发展!

部分参会代表合影留念




CNCC 2024多媒体内容理解与生成论坛,再见,期待明年再会!