【预告】CCF-MM走进高校@走进南开大学

【预告】CCF-MM走进高校@走进南开大学

CCF多媒体专委会 2023-10-19 14:11 发表于山东

CCF-MM走进高校系列活动

CCF@U:

CCF-MM走进南开大学

时间20231021

地点:南开大学津南校区计算机学院523会议室

时间

活动安排

09:00-09:40

特邀讲者:徐常胜    研究员,中国科学院自动化研究所

演讲题目:视频理解中的关系学习研究

09:40-10:20

特邀讲者:蒋树强    研究员,中国科学院计算技术研究所

演讲题目:知识增强的视觉语言导航

10:20-11:00

特邀讲者:杨易    教授,浙江大学

演讲题目:先验和知识引导的多模态内容生成技术

11:00-11:40

特邀讲者:范晓鹏    教授,哈尔滨工业大学

演讲题目:信源信道联合编码——从图像到任务

14:30-15:10

特邀讲者:何良华    教授,同济大学

演讲题目:脑机接口在康复医学中的应用探索

15:10-15:50

特邀讲者:王鹏    教授,西北工业大学

演讲题目:无人移动平台自主进化学习方法与应用

15:50-16:30

特邀讲者:李泽超    教授,南京理工大学

演讲题目:标注数据受限条件下的多媒体内容理解

讲者/报告信息

特邀讲者:徐常胜

报告题目:视频理解中的关系学习研究

报告摘要:随着便携式数码设备的普及和移动互联网的发展,海量的视频大数据亟需智能的视频理解技术。视频理解是一个融合视频底层特征信息和高层语义信息的过程,并服务于用户的不同需求。高效的视频理解技术可以使计算机智能地完成各种视频相关的任务,如视频监控、视频娱乐等。视频大数据具有(1)时空复杂,(2)底层特征与高层语义之间存在“语义鸿沟”,(3)类别丰富,(4)多模态,(5)个性化需求多样等特点。这些特点在视频数据中表现为纷繁复杂的关系信息,因此为视频的智能理解带来了巨大的挑战。事实上,针对视频中复杂而多样的关系模式进行学习对深入地理解视频内容是至关重要的。本报告围绕如何设计有效的关系学习方法来进行视频理解展开,自底向上地重点研究了视频中的三种关系结构信息:首先针对视频中的物体层面,研究了物体表观中的结构化关系建模;接着以物体为纽带,深入挖掘了视频中的物体-语义关系信息,从而实现了视频高层语义的自动提取;最后,探索了视频语义-用户兴趣之间的关系,完成了视频的个性化服务。

讲者简介:徐常胜,中国科学院自动化所研究员,国家杰出青年基金获得者,国家万人计划领军人才,入选国家百千万人才工程和首都科技领军人才工程科技部重点领域创新团队负责人,国家重点研发计划项目首席科学家,中国科学院王宽诚率先人才计划卢嘉锡国际团队负责人。国际电子电气工程师学会会士(IEEE Fellow),国际模式识别学会会士(IAPR Fellow),国际计算机学会杰出科学家(ACM Distinguished Scientist)。担任国际计算机学会多媒体专委会中国区(ACM SIGMM China Chapter)主席和中国计算机学会多媒体专委会副主任。担任国际期刊Multimedia Systems主编,担任过国际期刊“IEEE Transactions on Multimedia”和“ACM Transactions on Multimedia Computing, Communication and Applications”编委以及国际顶级多媒体会议“ACM Multimedia Conference”程序委员会主席。在多媒体分析,计算机视觉,模式识别,图像处理等领域发表论文400多篇,其中IEEEACM汇刊论文120余篇,国际顶级会议论文80余篇。在多媒体国际顶级会议和期刊上获得最佳论文奖10余次。获得2018年中国电子学会自然科学一等奖,2009年中国计算机学会青年科学家奖,7次获得中国科学院优秀导师奖。


特邀讲者:蒋树强

报告题目:知识增强的视觉语言导航

报告摘要:具身智能是真实物理场景下人工智能的重要表现形态,在动态开放环境的无人系统与人机协同系统中有潜在重大应用价值。视觉语言导航是具身智能的一项重要任务,是指智能体在开放环境中对语言指令和周围环境进行分析,动态生成一系列动作并最终导航到目标位置,这是智能系统应用在真实世界中的关键技术之一。现有的视觉语言导航技术主要依赖全局或局部视觉内容来表示可导航点内容及已探索环境,相比于只利用视觉内容,具身上下文知识可提供更多互补信息,促进未知环境中的视觉语言匹配,提升动作预测能力和泛化能力。本报告将首先介绍具身智能及视觉语言导航研究背景,并汇报知识增强的视觉语言导航研究进展,包括基于知识增强推理和动态知识网格记忆地图的视觉语言导航技术,最后介绍具身导航从虚拟到真实环境的适配并给出演示。

讲者简介:蒋树强,中国科学院计算技术研究所研究员,博士生导师,国家杰出青年科学基金获得者,期刊《计算机研究与发展》、《JCST》、《ACM ToMM》编委,CCF多媒体专委会秘书长、中国人工智能学会智能服务专委会副主任、ACM SIGMM中国分会副主席、IEEE CASS北京分会副主席。主要研究方向是图像/视频等多媒体内容分析、多模态智能技术和食品计算。主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金等项目20余项。发表论文200余篇,获授权专利18项。先后获中国计算机学会科学技术奖、中国科学院青年科学家国际合作奖、CSIG自然科学二等奖、吴文俊人工智能自然科学一等奖、北京市科技进步二等奖。


特邀讲者:杨易

报告题目:先验和知识引导的多模态内容生成技术

报告摘要:多重知识表达旨在融合多种知识表达,用于突破单一知识模式的局限,建立具有知识协同、领域外推的人工智能模型。人类先验知识和数据结合是实现多重知识表达的一种有效方式。首先,本报告将探讨多模态内容生成技术中面临的挑战和问题,并分析多重知识表达的优势和特点。随后,本报告将讨论多模态内容生成的研究进展,重点关注融合大语言模型和人类先验知识的内容生成技术,并举例讨论其有效性。在数字人重建方面,本报告将探讨融合几何等先验信息的方法在数字人驱动中的应用。在跨媒体数字人生成方面,本报告将讨论从音频、文本等输入到生成数字人图像、视频等表达形式的方法和技术。本报告还将结合实际案例,讨论专用知识嵌入方法和结构化表达机制等。最后,本报告将展望先验和知识引导多模态内容生成的研究前景。

讲者简介:杨易,浙江大学求是讲席教授(二级教授)。目前担任浙江大学计算机学院副院长、微软-教育部视觉感知重点实验室主任、人工智能省部共建协同创新中心副主任。曾获教育部全国优秀博士论文,浙江省自然科学一等奖,澳大利亚科研终身成就奖,澳大利亚研究理事会青年职业奖,澳大利亚计算机学会颠覆创新金奖,谷歌学者研究奖和AWS机器学习研究奖等二十余次人工智能领域国际奖项。Google Scholar 引用59000余次,H-index 118,近五年连续入选Clarivate Analytics全球高被引学者。国际科研竞赛中累计获得40余次奖项,含20次世界冠军。担任7种重要国际期刊的副主编或领域主编,以及CVPRICCVIJCAIACM MM等重要国际学术会议的重要职务等20余次。


特邀讲者:范晓鹏

报告题目:信源信道联合编码——从图像到任务

报告摘要:图像视频已占互联网流量的90%,且仍在不断增长。随着视频编码技术进步以及标准迭代,视频压缩效率不断提升。然而经过压缩的视频对于比特错误比较敏感,如何提升无线传输条件下视频抗噪能力,是目前仍然需要解决的问题。本报告将首先回顾传统信源信道联合编码、数模混合视频通信等技术,然后介绍新兴的为视频编码带来较大效率提升的AI技术,包括基于深度学习的视频编码、基于深度学习的多任务编码等,并探讨这些技术应用于信源信道联合编码的新思路和新途径。

讲者简介:范晓鹏,哈尔滨工业大学长江学者特聘教授、博导、人工智能专业负责人、智能接口与人机交互研究中心主任、国家重点研发计划项目首席科学家。2009年于香港科技大学电子工程系获博士学位。2013年获IEEE标准杰出贡献奖。2023年获电子学会创新团队奖。目前主要研究兴趣包括数字媒体技术、人机交互技术等,发表国际期刊和会议论文170篇,获发明专利20余项,十余项技术被国际/国内标准采纳。牵头主持国家重点研发计划项目、国家自然科学基金联合基金重点项目等国家级项目5项。2017年作为程序主席主办CCF推荐会议PCM2017。担任中国计算机产业协会元宇宙专委会副会长、中国人工智能学会教育工作委员会副主任、黑龙江省计算机学会学术工作委员会主任等。


特邀讲者:何良华

报告题目:脑机接口在康复医学中的应用探索

报告摘要:脑机接口技术因其方式的自然性及实现的内隐性备受研究人员关注,已在人机交互、康复、神经计算等诸多领域崭露头角。本报告重点关注脑机接口技术在康复方面的应用挑战及最新成果。首先,概要介绍经典脑机交互实现方式的优缺点及其挑战,然后详细介绍其在脑卒中康复中的训练、评估等方面的进展,最后探讨了未来的发展趋势。

讲者简介:何良华,工学博士,同济大学电子与信息工程学院计算机科学与技术系教授,入选首届教育部“长江学者奖励计划”青年项目、2020年教育部“长江学者奖励计划”人工智能特岗项目。研究方向为医学图像分析、脑认知计算。近五年发表包括CVPRICCVIJCAIAAAIIEEE TNNLSTIPTIFS等领域期间期刊论20多篇,以第一完成人获上海市科技进步一等奖、教育部科技进步二等奖各1项,参与获得省级一等奖3项,二等奖2项。


特邀讲者王鹏

报告题目:无人移动平台自主进化学习方法与应用

报告摘要:人工智能作为一项旨在赋予机器人类智慧的技术,近年来在科技革命和产业创新中发挥核心驱动力的作用。然而,当前人工智能模型在处理无人移动平台上的复杂任务时仍面临着诸多挑战,例如连续动态变化的对象、环境、任务以及资源限制。我们从具有良好的自主进化能力得生命智能体中获得启示,提出面向无人移动平台的自主进化学习方法,包括即时性进化、长时性进化和推理链进化三个层次,有效提升了人工智能模型在无人移动平台上的泛化和适应能力,并在航天、航空等领域得到应用。

讲者简介:王鹏,西北工业大学教授、博导,长江学者特岗教授。2000-2011年在北京航空航天大学自动化科学与电气工程学院学习并获得学士和博士学位;博士毕业后于在阿德莱德大学计算机学院从事科研工作;2021年入选教育部长江学者特岗教授。目前担任空天地海一体化大数据应用技术国家工程实验室副主任,陕西省高校青年创新团队负责人。担任西北工业大学人工智能专业负责人,该专业于2021年获批陕西省“双万计划”一流专业。主持科技部新一代人工智能重大专项青年科学家项目1项。主要从事计算机视觉和机器学习领域的研究工作。发表英文专著1部,在TPAMIIJCVCVPRICCVECCVNeurIPSICMLACL等权威期刊会议发表学术论文70余篇。 担任CVPR2024领域主席、CCIG2024论坛主席、PRCV2019执行委员会主席。


特邀讲者:李泽超

报告题目:标注数据受限条件下的多媒体内容理解

报告摘要:图像视频大数据智能分析与识别在多种实际应用中具有至关重要的作用,比如无人驾驶、网络空间内容安全以及社会公共安全等。然而实际应用中多媒体内容类别粒度多样,标注数据受限。为此,我们研究了标注数据受限环境下多媒体内容分析问题,主要是小样本环境和弱监督环境下多媒体内容分析工作,提出了基于知识迁移和数据增强的小样本识别、小样本细粒度分析、弱监督语义哈希、深度协同因子分解模型、以及基于奇异值微调的小样本语义分割模型等。最后介绍一些相关的实际应用。

讲者简介:李泽超,南京理工大学计算机科学与工程学院/人工智能学院教授、副院长,“万人计划”青年拔尖人才,“社会安全信息感知与系统”工信部重点实验室副主任,分别于2008年和2013年毕业于中国科学技术大学和中国科学院自动化研究所。研究兴趣主要是媒体智能分析、计算机视觉等。发表ACM/IEEE TransactionsCCF A类会议论文70余篇;获得江苏省科学技术一等奖2项、中国电子学会自然科学一等奖1项等;获得ACM MM Asia 2020最佳论文奖和ICIMCS 2018最佳学生论文奖等;主持科技创新2030“新一代人工智能”重大项目课题、国家自然科学基金联合基金重点项目、江苏省杰出青年基金等;担任IEEE TNNLSInformation Sciences等期刊编委;CSIG多媒体专委会常务委员、CCF多媒体专委会副秘书长。

执行主席

执行主席:杨巨峰,南开大学计算机学院教授,国家级青年人才、天津杰青,担任数据与智能系统安全教育部重点实验室副主任、天津市视觉计算与智能感知重点实验室副主任、中国计算机学会计算机视觉专委会副秘书长、中国计算机视觉大会组织主席、VALSE论坛主席、CVPR领域主席。研究方向是计算机视觉、机器学习、多媒体计算,发表Proceedings of the IEEE/PAMI/CVPR等高水平学术论文60余篇。研究成果获第十届吴文俊人工智能自然科学二等奖。

执行主席:程明明,南开大学杰出教授,计算机系主任。主持承担了国家杰出青年科学基金、优秀青年科学基金项目、科技部重大项目课题等。他的主要研究方向是计算机视觉和计算机图形学,在SCI一区/CCF A类刊物上发表学术论文100余篇(含IEEE TPAMI论文30余篇),h-index77,论文谷歌引用4万余次,单篇最高引用4600余次,多次入选全球高被引科学家和中国高被引学者。技术成果被应用于华为、国家减灾中心等多个单位的旗舰产品。获得教育部自然科学一等奖2项、其他省部级科技奖2项。培养的3名博士生获得省部级优秀博士论文奖。现担任中国图象图形学学会副秘书长、天津市人工智能学会副理事长和顶级期刊IEEE TPAMI, IEEE TIP和《中国科学:信息科学》编委。


报名参会

本期CCF-MM走进高校活动的地点是南开大学津南校区计算机学院523会议室。各主要车站/机场打车至南开大学的通勤时间如下,请您提前安排好行程:

行程路线

天津滨海国际机场至南开大学津南校区:40分钟

天津站至南开大学津南校区:40分钟

天津西站至南开大学津南校区:55分钟

天津南站至南开大学津南校区:45分钟

本次会议不收取注册费,食宿差旅自理。如您有意参会,请与提前我们联系

联系人:刘夏雷 副教授

联系电话15029237962