【预告】CCF-MM走进高校@走进浙江师范大学
【预告】CCF-MM走进高校@走进浙江师范大学
CCF多媒体专委会 2025年01月10日 09:00 北京
CCF-MM走进高校系列活动
CCF@U:
CCF-MM走进浙江师范大学
时间:2025年1月11日13:00-17:00
地点:浙江省金华市浙江师范大学计算机学院
组织单位:
主办: 中国计算机学会
承办: 浙江师师范大学计算机科学与技术学院
中国计算机学会多媒体专业委员会
时间 |
活动安排 |
主持人 |
|
13:30-13:40 |
浙江师范大学领导致辞 |
郑忠龙 |
|
13:40-14:10 |
专委会领导致辞 |
||
14:10-14:40 |
特邀讲者:李泽超,南京理工大学教授 报告题目:面向视觉-语义关联学习的多模态预训练模型知识增强 |
||
14:40-15:10 |
特邀讲者:徐凯,国防科技大学教授 报告题目:从具身感知到具身认知——多模态大模型驱动的具身智能演进 |
||
15:10-15:40 |
特邀讲者:刘伟,上海交通大学副教授 报告题目:快速和鲁棒图像滤波方法及应用 |
||
15:40-16:10 |
特邀讲者:谭鑫,华东师范大学副研究员 报告题目:基于视觉基础模型的场景感知与构建 |
||
交流讨论 |
|
主持人信息
郑忠龙 教授(浙江师范大学)
个人简介:郑忠龙,博士,教授,博导。浙江师范大学计算机科学与技术学院院长。2005年博士毕业于上海交通大学,加州大学、浙江大学访问学者。研究兴趣为机器学习、模式识别、图像/视频处理等领域,主持了国家自然科学基金项目5项及多项省部级项目,在IEEE/ACM Transactions on Networking、IEEE Transactions on MultiMedia、ICML、AAAI、ICDE、ACM MM、INFOCOM等期刊与会议上发表论文80余篇。
讲者/报告信息
李泽超 教授(南京理工大学)
报告题目:面向视觉-语义关联学习的多模态预训练模型知识增强
报告摘要:近年来,在探索通用人工智能的可能发展方向中,多模态大模型已成为当前备受关注的重要方向,受到了学术界和工业界的广泛关注。多模态大模型的研究任务涵盖多模态问答和推理、图文生成、图像理解与推理等各个多个方面的内容。本报告着重介绍了研究团队在面向视觉-语义关联学习的多模态预训练模型知识增强方面的研究工作,围绕外部知识和内部知识两个方面开展了多模态预训练大模型与下游视觉-语义关联学习任务的适配问题研究,重点介绍基于多模态预训练大模型的小样本识别、图像理解、视觉问答、语义分割、图像检索、视觉定位等下游任务的适配工作,最后介绍在实际业务上的应用情况。
讲者简介:李泽超,南京理工大学计算机科学与工程学院/人工智能学院/软件学院教授、副院长,研究兴趣主要是多模态智能分析、计算机视觉等,主持国家杰出青年科学基金,新一代人工智能国家科技重大专项课题、国家自然科学基金联合基金重点项目、江苏省攀登项目、江苏省杰青项目等;入选国家“万人计划”青年拔尖人才;发表CCF A类期刊和会议论文70余篇;获得江苏省科学技术一等奖2项、中国电子学会自然科学一等奖1项;获得ACM MM Asia 2020和2024两年度最佳论文奖等;担任IEEE TPAMI, TNNLS, TCSVT等期刊编委。
徐凯 教授(国防科技大学)
报告题目:
报告摘要:-语言-动作模型驱动的交互认知过程建模等。面向高层次任务,有望实现主动、持续、长程的感知与认知,进而实现具身智能的持续学习和演进。本次报告汇报我们在相关方面的研究进展,包括多模态大模型驱动的开放词汇在线语义分割和主动场景图构建、基于认知过程建模的物体目标导航、基于环境认知推理的室内物品整理等。
讲者简介:TOG/TPAMI/TVCG等A类论文100余篇。担任图形领域顶级国际期刊ACM Transactions on Graphics、IEEE Transactions on Visualization and Computer Graphics的编委, Computational Visual Media的领域执行编委。多次担任领域内重要国际国内会议的大会主席和程序主席。担任中国图象图形学会三维视觉专委会副主任、中国工业与应用数学学会几何设计与计算专委会副主任。曾获湖南省自然科学一等奖2项(排名1和3)、中国计算机学会自然科学一等奖2项(排名1和3)、军队科技进步二等奖、军队教学成果二等奖、中国电子学会青年科学家奖。
刘伟 副教授(上海交通大学)
报告题目:
报告摘要:GPU加速实现对1080p图像近50fps的处理速度,该算法也是当前最快的全局算法之一。在鲁棒图像滤波方面,我将介绍所提出的泛化图像滤波模型,该算法可实现各类滤波特性,并在多种任务中实现当前最好的滤波性能。
讲者简介:ExploreX人才项目等企业横向项目,并发表四十余篇学术论文,其中以第一作者发表TPAMI、IJCV、TOG、TIP、ICCV、AAAI等多篇领域内顶级期刊和会议论文。
谭鑫 副研究员(华东师范大学)
报告题目:
报告摘要:2D、3D和4D场景理解的演进过程,以及多模态数据在通用场景理解中的应用。最后,本报告将展望4D场景构建与感知技术在实际应用中的广阔前景。
讲者简介:CCF-腾讯犀牛鸟基金等。他以第一作者/通讯作者发表CCF-A类/SCI一区论文20余篇。他还担任多个知名期刊(Pattern Recognition, The Visual Computer等)的编委和国际多个顶级期刊和会议的审稿人等。他曾获CCF-腾讯犀牛鸟基金优秀项目、世界互联网大会领先科技奖,入选了上海市扬帆计划、晨光计划、中国图象图形学会博士学位论文激励计划。