ChinaMM 2025 开幕日精彩回顾!!!
ChinaMM 2025 开幕日精彩回顾!!!
2025年8月23日 23:56 山东
精彩回顾
· 会议开幕式
· 大会主旨报告 1:多媒体自主智能
· 大会主旨报告 2:From Algorithms to Systems and Beyond: A Reflection of My Career in Multimedia Computing
· 大会主旨报告 3:容器化的GPU 云服务PaaS 平台——英博云
· 高峰论坛:大模型时代智能媒体计算
· 人才发展论坛
· 期刊主编论坛
· 女性菁英论坛
· 英博云专场:智算普惠赋能多模态-学术创新的破界与重构
· 专题论坛:多智能体驱动的社会模拟器
· 专题论坛:多模态大模型的端侧应用技术
· 专题论坛:空天智能感知与控制
· 专题论坛:具身多模态感知与推理
· 专题论坛:女性创新视角下的多源异构媒体计算
· 专题论坛:视觉编码与处理
· 专题论坛:多模态大模型进展与评测
· 专题论坛:高效影像增强与内容表示
· 专题论坛:视觉数据生成与应用
· 专题论坛:跨域沉浸式视觉感知与生成
· 专题论坛:资源受限条件下的多模态学习
· 专题论坛:软件学报-多媒体智能理解与生成专题
01 会议开幕式
大会开幕式由CSIG多媒体专业委员会主任、北京师范大学黄华教授主持,威海市政府副市长张善东、哈尔滨工业大学(威海) 副校长张华强、中国工程院院士高文、CCF多媒体专委会主任黄庆明热情致辞。张善东副市长在致辞中表示中国多媒体大会是国内多媒体领域的盛会,为学术界和产业界提供了前沿的技术发展动态以及丰富多样的学术交流活动。张华强副校长欢迎各位专家来到山东威海,共同推动多媒体技术服务地方社会经济发展。高文院士指出大会对促进技术创新、产业升级和人才培养的积极作用。黄庆明主任倡导学术界与产业界加强协同,共同突破关键核心技术。之后,闵巍庆秘书长对大会日程安排进行了详细介绍。
黄华教授主持开幕式
张善东副市长致辞
张华强副校长致辞
高文院士致辞
黄庆明主任致辞
闵巍庆秘书长介绍大会日程安排
02 主旨报告
开幕式后,大会非常荣幸地邀请到了朱文武教授、陈长汶讲席教授作大会主旨报告,英博数科CTO李少鹏作企业特邀报告。他们分享了最新的前沿技术与产业热点,多角度、多层次的为参会者提供了丰富的学术盛宴。具体内容如下:
大会主旨报告:《多媒体自主智能》
清华大学计算机系教授、信息科学与技术国家研究中心副主任朱文武作大会特邀报告,系统阐述了多媒体自主智能的理论框架与发展路径。报告首先指出传统机器学习在多媒体任务中依赖静态封闭同分布假设的局限性,难以适应真实的动态开放环境;接着针对感知环境动态复杂性与机器认知复杂性两大挑战,提出以数据-任务-模型自主优化机理和环境感知与机器认知动态演化机理为核心的自主机器学习理论体系;然后详细介绍通过主动探索感知动态环境变化、实现自适应学习与自主演化的方法路径;最后创新性提出"多媒体自主智能"概念,系统阐述支撑动态开放环境下机器智能行为的新方法,推动多媒体智能从被动感知生成向自主演化范式转变。朱文武教授的报告为构建适应复杂环境的多媒体自主智能系统提供了新的思路和建议,给在场的嘉宾与师生留下了深刻印象。
大会主旨报告:《From Algorithms to Systems and Beyond: A Reflection of My Career in Multimedia Computing》
欧洲科学院外籍院士、香港理工大学讲席教授陈长汶作大会特邀报告,系统回顾了视觉计算领域四十年的范式演进。报告首先阐述了视觉计算从纯算法开发到整体系统设计的范式转变历程:1980-1990年代聚焦单模态视觉数据处理算法开发;2000年代转向算法与系统集成设计,开创无线视频联合信源信道编码及大规模无线传感器网络研究;2010年代致力于人本移动视觉计算系统,在系统层面平衡移动设备约束与人类感知原理以保障大众用户体验;近年来拓展至多模态人工智能系统,包括视频物联网(IoVT)和基于大语言模型的视觉-语言融合6G语义通信。陈长汶教授的报告通过四十年学术生涯的深度反思,系统呈现了视觉计算从算法到系统的演进脉络,为构建下一代多模态智能系统提供了重要历史参照与发展方向启示,激发了与会者之间的深度对话。
大会主旨报告:《容器化的GPU 云服务PaaS 平台——英博云》
英博数科CTO李少鹏作大会特邀报告,系统介绍了容器化GPU云服务PaaS平台——英博云的整体架构与服务能力。报告首先阐述了平台支持的四种算力使用方式和三种存储方案;接着详细说明了两类账号管理体系及其管理机制;然后重点介绍了平台支持的多项AI任务类型,包括大规模预训练、后训练和微调等训练任务,以及离线推理和在线推理等应用场景;最后强调了平台为高校团队科研和实验教学提供的高灵活、高可靠、低成本算力解决方案。李少鹏的报告全面展示了英博云平台的技术优势与服务特色,为高校AI科研创新和教育实训提供了重要的基础设施支撑,其详实的技术方案和创新的服务模式给在场的嘉宾与师生留下了深刻印象。
高峰论坛:大模型时代智能媒体计算
大模型时代智能媒体计算由浙江大学吴飞教授和合肥工业大学洪日昌教授组织。本场活动邀请了吴飞、田永鸿、崔鹏、徐常胜4名专家,围绕大模型技术在智能媒体计算领域的前沿进展与挑战展开深入探讨。浙江大学吴飞教授就多媒体特征表达从手工设计到"all-in-one"模式的演进历程及生成式AI发展趋势进行了详细介绍。北京大学田永鸿教授就Science for AI与AI for Science的双向赋能关系及高校在AI创新体系中的角色定位进行了详细介绍。清华大学崔鹏副教授就结构化数据通用大模型的前沿进展及其在工业风险敏感领域的应用前景进行了详细介绍。中国科学院自动化研究所徐常胜研究员就开放世界多模态大模型的挑战,跨模态关联建模与泛化性保持及解耦视觉系统解决方案Libra进行了详细介绍。本高峰论坛系统梳理了大模型时代智能媒体计算的技术演进路径与应用创新范式,为推动信息处理方式、内容生产方式及人机交互模式的全面革新提供了发展方向指引。
左右滑动查看更多
人才发展论坛
人才发展论坛由北京交通大学赵耀教授、复旦大学姜育刚教授和南京理工大学李泽超教授组织。本场活动邀请了杨士强、查红彬、李厚强、沈超4名专家,围绕青年科技人才成长路径与发展机制展开深入探讨。清华大学杨士强教授就教育-科技-人才体制机制一体改革为青年科技人才带来的发展机遇进行了系统阐述。北京大学查红彬教授结合数十年科研经验,就青年科研人员如何追求特色、聚焦目标并在实践中成长提出了指导性建议。中国科学技术大学李厚强教授就"外引内育"双轮驱动的人才队伍建设探索与实践进行了详细介绍。西安交通大学沈超教授围绕青年教师成长路径与"四心四才"人才举措分享了实践体会。本论坛通过资深专家的经验分享与政策解读,为青年科技工作者明确了发展方向,提供了成长路径指导,对促进青年人才队伍建设具有重要意义。
左右滑动查看更多
期刊主编论坛
期刊主编论坛由哈尔滨工业大学(深圳)俞俊教授、北京大学张史梁教授、中国科学院计算技术研究所王树徽研究员及香港理工大学陈长汶讲席教授联合组织。本场活动邀请了陈长汶、彭宇新、徐常胜3名专家进行专题报告并开展圆桌讨论。本论坛通过学术领袖的深度对话,系统梳理了多媒体领域的研究热点与发展方向,为学术界与产业界的协同创新提供了有益参考,与会者表示论坛内容可能为相关领域的科研布局与期刊建设带来启发。
左右滑动查看更多
女性菁英论坛
女性菁英论坛由哈尔滨工业大学姚鸿勋教授、南京邮电大学鲍秉坤教授、北京大学刘家瑛教授和华中科技大学杨欣教授共同组织。本场活动邀请了刘秀玲、曾丹、许倩倩、陈静静、易冉5位女性专家,围绕多媒体领域的前沿技术与应用展开深入交流。河北大学刘秀玲教授(熊鹏代讲)就心脑神经交互模型研究及心脑血管疾病辅助诊断技术进行了详细介绍。上海大学曾丹教授就非线性运动场景下基于解耦扩散模型的实时多目标跟踪器DiffMOT进行了详细介绍。中国科学院计算技术研究所许倩倩研究员就网络空间内容安全的异构媒体表征与泛化学习框架进行了详细介绍。复旦大学陈静静副教授就生成式视觉内容鉴别与溯源技术进行了详细介绍。上海交通大学易冉副教授就基于3D Gaussian Splatting的高效可控可视媒体智能生成技术进行了详细介绍。本论坛通过优秀女性学者的研究成果分享,为多媒体领域女性科研工作者树立了学术榜样,促进了领域内女性的交流合作,激发了女性科研工作者的研究热情,为推动女性科技人才在多媒体领域的创新发展提供了重要平台。
左右滑动查看更多
英博云专场:智算普惠赋能多模态-学术创新的破界与重构
智算普惠赋能多模态-学术创新的破界与重构由英博数科组织。本场活动邀请了李良斌、韦星星、庄辉平、冯尊磊、刘沛羽5名专家,围绕智算资源普惠化与多模态能力融合创新的前沿方向展开深入探讨。英博数科技术专家李良斌就基于K8S Native Cloud的GPU算力服务解决方案进行了详细介绍。北京航空航天大学韦星星教授就多模态大模型可信度评估框架,MultiTrust五维评估体系及基于特征一致性的增强方法进行了详细介绍。华南理工大学庄辉平副教授就解析持续学习新方法,基于等价递归闭式解的无梯度优化方案进行了详细介绍。浙江大学冯尊磊副教授就多模态大模型赋能病理诊疗分析,诊断与预后大模型临床应用进行了详细介绍。对外经济贸易大学刘沛羽助理教授就大语言模型高效化路径进行了详细介绍。本专场通过产学研深度融合的视角,系统探讨了智算普惠与多模态技术融合创新的前沿路径,为破解技术瓶颈、重构学术创新范式提供了实践参考,推动了智算资源与多模态技术在理论研究和产业应用中的协同发展。
左右滑动查看更多
专题论坛:多智能体驱动的社会模拟器
多智能体驱动的社会模拟器由中国科学技术大学刘武教授、天津大学刘安安教授、中国科学技术大学姚涵涛研究员及天津大学徐宁副教授联合组织。本场活动邀请了魏忠钰、陈旭、何向南、吴侃、邵婧、李勇、王岚君7名专家,聚焦多智能体系统赋能社会模拟器的前沿研究与应用。复旦大学魏忠钰副教授就大模型社会模拟框架“众生SocioVerse”进行了详细介绍。中国人民大学陈旭副教授就基于大语言模型智能体的社会模拟精度提升路径与挑战进行了详细介绍。中国科学技术大学何向南教授就推荐智能体驱动的用户行为建模进行了详细介绍。微博吴侃总经理就多模态AI技术驱动企业数智化转型的实践案例与成本收益平衡策略进行了详细介绍。上海人工智能实验室邵婧研究员就大模型与智能体内生安全机制及风险预判进行了详细介绍。清华大学李勇教授(高宸代讲)就基于大模型智能体的城市社会经济系统模拟,微观个体行为复现与宏观态势仿真进行了详细介绍。天津大学王岚君教授就群体认知计算框架,多智能体协同演化模型与认知要素编码进行了详细介绍。本论坛通过多学科交叉视角推动了智能化社会治理从数据驱动向认知增强的范式升级,听众纷纷表示论坛不仅拓宽了学术视野,更为解决社会模拟实践难题提供了创新思路。
左右滑动查看更多
专题论坛:多模态大模型的端侧应用技术
多模态大模型的端侧应用技术由北京航空航天大学李波教授和浙江大学赵洲教授组织。本场活动邀请了丁贵广、兰旭光、殷绪成、纪荣嵘、王奕森5名专家,聚焦多模态大模型端侧计算的技术突破与产业应用。清华大学丁贵广教授就多模态大模型推理优化技术展开论述,重点介绍结构重参数化设计及端侧部署模型Repvit与YOLOv10的实现路径。西安交通大学兰旭光教授系统阐述具身智能的物理世界模型构建与因果推理框架,提出感知学习想象执行反馈一体化新范式。北京科技大学殷绪成教授(祝晓斌代讲)深入分析面向钢铁智能制造的工业感知大模型技术体系与应用前景。厦门大学纪荣嵘教授详细解析多模态大模型高效训练与压缩技术,涵盖动态稀疏化、AffineQuant量化及FitPrune剪枝等创新方案。北京大学王奕森助理教授揭示大模型高效推理机制,提出思维链倒U型效应理论及可验证奖励强化学习优化方法。本专题论坛通过各位专家的精彩报告和讨论,不仅让听众了解了多模态大模型端侧计算最新研究进展和应用案例,也为他们提供了许多创新思路和实践经验。
左右滑动查看更多
专题论坛:空天智能感知与控制
空天智能感知与控制由北京交通大学白慧慧教授、山东大学丛润民教授及合肥工业大学李锋副教授联合组织。本场活动邀请了王密、吴启晖、严怀成、刘瑜、高飞、李成龙6名专家,聚焦空天智能技术的前沿突破与应用实践。武汉大学王密教授(肖寒代讲)就低轨遥感星群信息实时智能服务的发展挑战与研究成果进行了系统阐述。南京航空航天大学吴启晖教授围绕电力认知物联体系构建,提出感传算控闭环模型并介绍低空电力巡检应用案例。华东理工大学严怀成教授探讨复杂环境下无人集群自主决策与安全协同机制,涵盖非合作目标编队跟踪及安全引导技术。清华大学刘瑜教授分析空天遥感多源数据处理难题,介绍SAR与多模态数据集建设及融合关键技术。浙江大学高飞副教授阐述飞行机器人从物理智能到具身智能的演进路径,展示高动态场景自主导航算法验证成果。安徽大学李成龙教授针对无人机多模态视觉感知的均衡性、完整性挑战,提出不均衡感知与引导式增强解决方案。本论坛通过多维度技术研讨,深化了听众对空天智能感知体系的认识。
左右滑动查看更多
专题论坛:具身多模态感知与推理
具身多模态感知与推理由四川大学胡鹏教授和同济大学朱磊研究员组织。本场活动邀请了蒋树强、徐凯、仉尚航、刘阳、严明、傅建龙6名专家,聚焦具身智能系统中感知、决策与交互的前沿技术突破。中国科学院大学蒋树强特聘教授就开放环境下的视觉导航与重整理技术进行了系统阐述。国防科技大学徐凯教授深入探讨世界模型驱动的具身操作学习范式,提出通用世界模型适配与专用模型构建双路径解决方案。北京大学仉尚航研究员介绍开放世界具身多模态基础模型研究进展,涵盖智能大脑大模型架构与数据集构建。中山大学刘阳副教授阐述人机物高效融合协同框架,强调物理规则嵌入的世界模型与虚实迁移机制创新。阿里巴巴通义实验室严明高级算法专家详细解析多模态多端智能体Mobile-Agent技术体系及跨场景应用实践。微软亚洲研究院傅建龙首席研究经理提出GenRobot通用机器人发展路径,重点介绍视觉-动作联合嵌入的HALO模型及Robot GPT可扩展框架。与会者反馈论坛内容既拓展了学术视野,也为解决实际交互难题带来有益启发。
左右滑动查看更多
专题论坛:女性创新视角下的多源异构媒体计算
女性创新视角下的多源异构媒体计算由中国科学院大学姜阳邦彦讲师、北京科技大学徐婧林副教授、电子科技大学邱荷茜副教授、中国科学院计算技术研究所许倩倩研究员及中国科学院自动化研究所董晶研究员联合组织。本场活动邀请了冯婕、董燕妮、邓欣、曹聪琦、刘雨帆5名专家,聚焦多源异构媒体计算的前沿挑战与创新解决方案。西安电子科技大学冯婕教授系统阐述空天多源异构遥感数据的跨源表征学习与目标精细解译技术,提出元强化学习对齐与空谱解耦泛化学习范式。武汉大学董燕妮教授深入分析多源遥感图像智能解译的技术瓶颈与最新研究进展。北京航空航天大学邓欣副教授围绕大容量图像隐写与隐写域安全处理,提出基于可逆神经网络的动态分级隐写框架及端到端安全增强网络。西北工业大学曹聪琦副教授探讨开放世界智能视频理解的时空协同建模与分布外泛化去偏机制,揭示多模态大模型在动态场景中的协同理解潜力。中国科学院自动化研究所刘雨帆助理研究员聚焦可信AI构建路径,涵盖高效模型压缩方法与安全评估体系的双重保障机制。本论坛通过女性学者的创新研究成果展示,深化了多源异构数据融合与智能分析的技术认知,也启发了对女性科研工作者独特视角与创新思维的深入思考。
左右滑动查看更多
专题论坛:视觉编码与处理
视觉编码与处理由山东大学元辉教授和杭州师范大学丁丹丹副教授组织。本场活动邀请了许长桥、纪雯、安平、马展、查志远5名专家,聚焦生成式AI驱动下的视觉编码前沿挑战与技术突破。北京邮电大学许长桥教授(肖寒代讲)系统阐述媒体与网络协同演进的双向适应机制,涵盖媒体侧动态感知优化与网络侧智能调控策略。中国科学院计算技术研究所纪雯研究员深入解析机器视觉编码技术体系,提出“码率-任务质量-可计算性”三维优化架构及多模态融合压缩路径。上海大学安平教授探讨人机视觉协同特征压缩与增强范式,分析面向人眼、机器及人机协同的差异化编码方法。南京大学马展教授基于人类视觉系统分层处理机制,提出神经视频编解码器设计框架,实现压缩域多任务协同处理。吉林大学查志远教授介绍基于低秩张量建模的结构化高维图像复原方法,分别针对高光谱图像与地震图像提出非局部低秩残差模型及三重拉普拉斯混合去噪模型。本论坛通过多维度技术研讨,深化了听众对智能编码、跨模态优化及重建评估等核心议题的认知。
左右滑动查看更多
专题论坛:多模态大模型进展与评测
多模态大模型进展与评测由上海交通大学翟广涛教授、西安电子科技大学李雷达教授、上海交通大学闵雄阔副教授及中国矿业大学周玉副教授联合组织。本场活动邀请了陈志波、李兵、王利民、马柯德、刘笑宏5名专家,聚焦多模态大模型的技术突破与评估体系前沿。中国科学技术大学陈志波教授系统阐述基于大模型的视觉信号质量评价与增强方法,提出内容安全-功能安全双层评估架构。中国科学院自动化研究所李兵研究员详细介绍多领域多场景多维度大模型安全评估体系M3-SafetyBench,涵盖17万条测试数据与红队攻击验证。南京大学王利民教授全面解析InternVideo系列视频理解大模型的演进路径,重点介绍2.5版本的长视频精准检索与细粒度理解突破。香港城市大学马柯德副教授(曹佩蓓)探讨大模型时代的图像质量评估技术,分析多模态融合、可解释性与泛化能力的发展挑战。上海交通大学刘笑宏副教授阐述多模态图像生成与质量评价的协同演进机制,揭示生成模型优化与评价体系的双向驱动关系。本论坛讨论了多模态大模型在稳定性、安全性及资源效率方面的技术瓶颈与解决方案,推动了该领域的创新发展。
左右滑动查看更多
专题论坛:高效影像增强与内容表示
高效影像增强与内容表示由福州大学赵铁松教授和陈炜玲教授组织。本场活动邀请了马思伟、吴金建、马柯德、查正军、闵雄阔5名专家,聚焦生成式技术驱动的影像处理前沿突破。北京大学马思伟教授系统阐述生成式智能视频编码技术路径,探讨多模态大模型重构媒体表示与传输方式的挑战。西安电子科技大学吴金建教授提出小样本学习视角下的图像质量评价新范式,通过无监督域适应方法提升模型泛化能力。香港城市大学马柯德助理教授(曹佩蓓)深入分析高动态范围影像的感知评估与优化技术,介绍基于NLPD与Q-Star的感知驱动处理方法。中国科学技术大学查正军教授探讨真实场景下的视觉增强与分析技术,针对复杂退化现象提出质量增强与内容分析解决方案。上海交通大学闵雄阔副教授解析基于大模型的多媒体质量评价体系,涵盖多模态大模型评测与质量评价双向赋能机制。本论坛通过产学研深度融合视角,系统探讨了影像增强、内容压缩与质量评估的协同创新路径,有助于推动该技术在实际应用中的广泛普及和深化发展。
左右滑动查看更多
专题论坛:视觉数据生成与应用
视觉数据生成与应用由北京大学刘家瑛教授和北京航空航天大学张永飞教授组织。本场活动邀请了刘祥龙、张幸幸、杨文瀚、张珂华、杨帅5名专家,聚焦生成式人工智能驱动的视觉数据技术创新与行业应用。北京航空航天大学刘祥龙教授(王嘉凯代讲)系统阐述无人驾驶系统的智能安全攻防体系,涵盖对抗样本防御、安全评测及视觉仿真环境生成技术。清华大学张幸幸副研究员探讨视觉生成增强下的持续学习机制,提出基于高保真仿真平台的多任务并行训练及具身智能部署方案。鹏城国家实验室杨文瀚副研究员分析协同智能中的隐私风险与泛化机遇,提出条件熵最大化隐私保护机制及物理建模数据合成方法。华北电力大学张珂华教授介绍电力视觉场景下的输变电缺陷图像生成技术,探索生成模型在设备智能巡检中的应用潜力。北京大学杨帅助理教授解析艺术文字与古迹纹样的生成设计方法,提出基于统计的字效迁移框架与扩散模型驱动的纹样交互设计路径。本论坛通过跨领域案例剖析,促进了听众对视觉数据技术进展的了解。
左右滑动查看更多
专题论坛:跨域沉浸式视觉感知与生成
跨域沉浸式视觉感知与生成由北京邮电大学明悦教授和中山大学金枝教授组织。本场活动邀请了徐昕、刘安安、李成林、高林、金枝5名专家,围绕虚拟现实与人工智能融合技术的前沿发展展开深入探讨。国防科技大学徐昕教授系统阐述具身智能系统的鲁棒自适应感知技术,重点介绍三维环境下的智能车辆感知与弱监督学习方法。天津大学刘安安教授(徐宁代讲)探讨群体智能驱动的多模态认知计算框架,提出基于社会模拟器的数字社会治理新范式。上海交通大学李成林教授深入分析沉浸式全景视频信号的表示学习理论,解决非欧式空间球面信号处理的技术难题。中国科学院计算技术研究所高林研究员介绍基于高斯泼溅和视频生成模型的虚拟内容创作方法,涵盖数字人实时重光照与大视角视频编辑技术。中山大学金枝教授分享多学科交叉融合的虚拟与增强现实课程教学改革实践经验。本论坛通过多领域技术交叉融合视角,系统呈现了沉浸式视觉技术在感知建模、内容生成与产业应用的进展,为未来的科研与实践奠定了坚实的基础。
左右滑动查看更多
专题论坛:资源受限条件下的多模态学习
资源受限条件下的多模态学习由中国科学技术大学杨勋教授、杭州电子科技大学余宙教授、厦门大学周奕毅副教授及浙江工商大学董建锋研究员联合组织。本场活动邀请了王鹏、刘静、宋井宽、张天柱、赵娜、傅朝友6名专家,聚焦资源受限条件下的多模态学习前沿技术。西北工业大学王鹏教授(吴鹏代讲)探讨计算、数据与知识三重约束下的多模态大模型优化路径,分析资源占用与性能平衡的关键技术。中国科学院自动化研究所刘静研究员系统阐述多模态大模型高效训练与推理方法,涵盖轻量化架构设计、模态信息压缩及推理加速机制等创新方案。同济大学宋井宽教授梳理从多模态大模型到具身智能的发展脉络,提出面向物理世界交互的智能系统构建思路。中国科学技术大学张天柱教授深入分析深空无人探测系统的智能感知技术,介绍自主任务规划与导航定位的研究进展。新加坡科技设计大学赵娜助理教授探讨复杂环境下的三维理解与多模态推理,提出语言引导的三维视觉定位新范式。南京大学傅朝友研究员展望多模态大语言模型的发展方向,围绕数据、评测、架构等维度提出未来研究建议。本论坛通过产学研深度融合视角,系统探讨了资源受限场景下多模态智能技术的创新路径,同时进一步推动了多模态技术的研究进展和实践应用。
左右滑动查看更多
专题论坛:软件学报-多媒体智能理解与生成专题
《软件学报》多媒体智能理解与生成专题由清华大学孙立峰教授、中国科学院大学蒋树强教授和中国科学院计算技术研究所闵巍庆副研究员共同组织。本场活动邀请了李玘芮、李信金、方承炀、赖培源、陈董、韦舒羽、黄恒焱、陆正昀、彭越涵9位专家,围绕多媒体智能技术的前沿进展展开研讨。浙江大学李玘芮系统综述姿态控制人物生成技术的发展现状与技术路线。中国科学院软件研究所李信金介绍基于视听协同的交互式步态干预训练方法创新。江西财经大学方承炀阐述基于双重自适应冗余消除的免训练视频问答方法。广东技术师范大学赖培源(卢伊虹代讲)探讨基于多模态异质图表征的专利推荐算法设计。郑州大学陈董分析大小模型协同驱动的学科结构优化方法。北京交通大学韦舒羽提出基于音频-语言模型的端到端说话人日志系统。中国传媒大学黄恒焱介绍融合音乐知识结构化表征的高精度符号音乐理解技术。南京理工大学陆正昀分享基于CLIP引导标签优化的弱监督图像哈希方法。西安交通大学彭越涵展示基于双阶反馈的交通场景多模态三维目标检测技术。本专题通过多维度技术报告,系统呈现了多媒体智能理解与生成领域的研究进展,为相关技术发展提供了有益参考。
左右滑动查看更多
往期推荐
【重磅】朱文武教授将在ChinaMM 2025作特邀报告!!!
【重磅】英博数科CTO李少鹏将在ChinaMM 2025作企业特邀报告!!!
【重磅】Chang Wen Chen教授将在ChinaMM 2025作特邀报告!!!
【重磅】王振常院士将在ChinaMM 2025作特邀报告!!!
【重磅】王大轶研究员将在ChinaMM 2025作特邀报告!!!





















































































