多媒体内容理解与生成 | CNCC 2024

多媒体内容理解与生成 | CNCC 2024

CCF多媒体专委会 20241014日 20:38 广东

多媒体内容理解与生成

随着移动互联网、物联网、5G等新一代信息技术的快速发展,文本、音频、图像、视频等多媒体数据呈现爆发式增长,我们已经全面步入多媒体大数据时代。如何突破跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与学习、知识演化与推理、智能描述与生成等技术,实现跨媒体知识表征、分析、挖掘、推理、演化和利用,成为多媒体领域亟待解决的难点问题。近年来,多模态基础模型、大模型智能体、以及视觉生成等新技术不断涌现,引起产业界和学术界极大关注。本技术论坛将主要围绕近年来多媒体内容理解与生成领域的热点问题和前沿技术进行探讨,以期碰撞出火花、引起更深入思考、带动技术发展和应用。

日程

时间:102413:30-17:30

地点:秋苑-教室区(西2

时间

议程

主持人/

演讲嘉宾

13:30    - 13:35

论坛开幕致辞

高       赞

13:35    - 13:40

特邀嘉宾致辞

黄庆明

13:40    - 14:05

知识引导的

连续学习方法

李宏亮

14:05    - 14:30

激光雷达视觉全球定位

王       程

14:30    - 14:55

探索大模型背景下的

医工交叉多模态AI技术

俞       俊

14:55    - 15:20

生成式人工智能及其

多学科交叉融合应用

颜       波

15:45    - 16:10

基于几何深度学习的

黎曼流形生成

邹君妮

16:15 -17:30

Panel

刘萌、黄铁军、陶建华、王勋、周杰、张艳宁、聂礼强等

主席

个人简介:高赞,山东省人工智能研究院教授,国家级青年人才。主要从事计算机视觉、智能媒体分析和多媒体内容安全等领域研究,在国际会议和期刊上发表论文100余篇,主持或参与省部级以上项目20余项。获山东省科技进步一等奖、山东省技术发明一等奖。

报告题目:论坛开幕致辞



嘉宾

个人简介:黄庆明,中国科学院大学教授,国家杰出青年科学基金获得者。主要研究方向为多媒体计算、计算机视觉等,已在国内外权威期刊和会议发表论文600余篇,主持国家和省部级项目多项。获教育部科技进步一等奖等多项国家学会和省部级奖励。

报告题目:特邀嘉宾致辞



个人简介:李宏亮,电子科技大学教授、国家杰出青年科学基金获得者。研究领域包括多媒体理解与分析,视觉感知模型及机器学习等,已发表IEEE汇刊论文70余篇。主持科技创新2030新一代人工智能重大项目、国家自然科学基金重点以及联合重点项目等。

报告题目:知识引导的连续学习方法

报告摘要:如何学习新知识同时减少对旧知识的灾难性遗忘是目前连续学习面临的重要挑战。本次报告将围绕视觉任务中的连续学习问题,从多教师连续学习机制到具体视觉任务中的连续学习模型的实现,介绍最近的相关工作。最后针对视觉任务连续学习的若干问题进行简要讨论。



个人简介:王程,厦门大学教授,国家级人才计划基金获得者。研究领域包括计算机三维视觉,激光雷达数据处理等,在顶级期刊和会议发表论文300余篇,引用1万余次,获省部级科技进步一等奖等奖励5项。担任多个学术期刊副主编和客座编辑。

报告题目:激光雷达视觉全球定位

报告摘要:全球定位在数字经济中占核心地位,但城市复杂环境限制了卫星定位应用。三维激光扫描技术凭借精确的三维感知能力,正成为城市定位的新曙光。报告将介绍厦门大学ASC实验室在激光雷达视觉全球定位方面研究进展。首先,解释基于隐式表达的激光雷达视觉定位基本原理。接着,介绍从深度回归到几何编码的高效定位方法,并展示国际首个达到亚米级定位精度的大范围激光雷达全球定位成果。最后,总结并展望未来发展趋势。



个人简介:俞俊,哈尔滨工业大学(深圳)教授,国家杰出青年基金获得者。致力于图像处理与分析、多模态内容理解研究,发表IEEE/ACM汇刊及CCF A类论文百余篇。主持基金委重点、科技部重点研发等多项项目。第一完成人获省自然科学一等奖。

报告题目:探索大模型背景下的医工交叉多模态AI技术

个人简介:颜波,复旦大学教授、教育部长江学者。究领域包括:计算机视觉、智慧医疗和科学智能等,以第一/通讯作者在国际期刊和CCF A类会议发表论文70余篇。主持多项省部级和企业合作项目。获教育部自然科学二等奖、CSIG科学技术二等奖。

报告题目:生成式人工智能及其多学科交叉融合应用

报告摘要:随着大模型技术的持续突破,生成式人工智能展现了强大的生成能力。本报告将主要介绍团队在生成式人工智能方向上的持续探索成果,并在智能终端和智慧安防等多场景下所取得的若干研究成果;同时和物质科学深度融合,辅助合成新材料,为生成式AI提供新数据,从而实现人机协同研究,加速科研裂变;最后将相关成果应用于智慧医疗场景,为各科室的智能诊疗提供强力支撑。



个人简介:邹君妮,上海交通大学教授,国家杰出青年科学基金获得者。研究领域包括多媒体通信、几何深度学习等,发表SCIEI收录论文150余篇,主持国家自然科学基金重点等项目8项。获上海市科技奖励一等奖、中国电子学会科技奖励二等奖等多项。

报告题目:基于几何深度学习的黎曼流形生成

报告摘要:近些年,扩散模型在生成式建模任务中取得了巨大成功。在基于二维图像的扩散模型启发下,许多研究开始关注高维流形结构的扩散模型。流形信号位于非欧式空间,为了实现精准生成与重建,需要同时考虑原始数据的概率分布以及流形信号的几何特征与拓扑结构。本报告将从几何学和深度学习的角度,介绍流形信号生成的最新进展,并进一步探讨在扩散模型中引入Ricci曲率流,学习流形信号内蕴几何特征的可能性。



Panel嘉宾

个人简介:黄铁军,北京大学教授,国家杰出青年科学基金获得者。从事智能视觉信息处理技术研究30多年,发表学术论文300多篇。获得国家科技进步二等奖、国家技术发明二等奖。担任科技创新2030新一代人工智能重大科技项目专家组副组长等职。

个人简介:陶建华,清华大学教授,国家杰出青年科学基金获得者。主要研究包括语音合成与识别、多媒体信息处理和模式识别等,在国内外学术期刊和会议发表论文240余篇。负责国家重点研发计划等项目20余项,多次在国内外重要学术会议获奖。



个人简介:王勋,浙江工商大学教授,入选国家百千万人才工程。研究领域包括移动图形计算、计算机视觉等,在国内外重要期刊和会议发表论文150余篇,主持省部以上重大重点项目20余项。第一完成人获国家教学成果二等奖、省部级一、二等奖6项。



个人简介:周杰,清华大学教授,国家杰出青年科学基金获得者,国家基金委创新研究群体学术带头人,IAPR Fellow。长期从事模式识别与计算机视觉研究,发表IEEE期刊论文100多篇。第一完成人获国家技术发明二等奖、中国电子学会一等奖等奖励。



个人简介:张艳宁,西北工业大学教授,国家级人才,国防973项目首席。研究领域包括模式识别、计算机视觉与智能信息处理等,在国内外权威期刊和会议发表论文百余篇,承担国家级项目40余项。获国家教学成果二等奖1项、省部级科技进步奖3项。



个人简介:聂礼强,哈尔滨工业大学(深圳)教授,国家级人才计划入选者,IAPR Fellow。致力于多媒体内容分析与搜索研究,发表CCF A类论文百余篇,出版专著5部。主持两项基金委重点项目、1*3基础加强项目、科技部重点研发课题、省杰青、两项千万级横向项目等。



个人简介:刘萌,山东建筑大学教授,论坛联合主席,山东省智能媒体分析与检索创新团队负责人。研究方向为多媒体内容分析、跨媒体分析与推理等,发表CCF A类会议、IEEE/ACM汇刊论文70余篇,出版英文专著1部。主持国家重点项目课题、面上和青年等多个项目。