【预告】CCF-CV视界无限系列研讨会(第十二期,智能内容创作)

阅读量:796
2021-12-29


主题:智能内容创作(AIGC)的前沿进展与未来趋势

执行主席:丁二锐 赵晨 王井东

时间:2022年1月5日 13:00-17:30

直播地址

https://live.bilibili.com/22339632

程 序

嘉宾致辞

13:00–13:40

吴甜 百度集团副总裁

王亮 CCF-CV专委会副主任

主题报告

13:40–14:10

赫然 中科院自动化所 研究员

主题:人脸图像合成与鉴别

14:10–14:40

刘家瑛 北京大学 副教授

主题:智能艺术生成与美学计算

14:40–15:10

刘偲 北京航空航天大学 教授

主题:多模态内容生成

15:10–15:40

刘烨斌 清华大学 副教授

主题:数字人技术--交互性、沉浸性及创造性

15:40–16:10

刘永进 清华大学 教授  

主题:虚拟人智能体的人机共情研究

16:10–16:40

杨蛟龙 微软亚洲研究院 主管研究员

主题:跨越维度鸿沟--三维可控的图像生成研究

深度研讨

16:40–17:40

智能内容创作(AIGC)的前沿进展与未来趋势

嘉宾:赫然、刘家瑛、刘偲、刘烨斌、刘永进、杨蛟龙

主持人:王井东

讲 者 / 报 告 信 息

赫然,中科院自动化所模式识别国家重点实验室研究员,IAPR Fellow。主要研究方向是模式识别、图像生成和生物特征识别,并应用到异质图像合成与识别、深度伪造与鉴别。担任IEEE T-IP、Patten Recognition和自动化学报等多个国内外期刊编委。在本领域国际主流期刊IEEE T-PAMI和IJCV上发表论文19篇,获IEEE信号处理协会最佳青年论文奖、ICPR最佳科学论文奖、北京青年优秀科技论文一等奖、CSIG自然科学一等奖。获国家优秀青年科学基金、北京杰出青年科学基金、国自然联合重点基金和中科院青年促进会优秀会员等项目支持。核心算法在国家重要领域的视频生成竞赛中获得第一名,已在军事、公安等国家重大任务以及华为智能手机、美团美食场景等民用领域得到大规模应用,日均为数亿人次的用户提供图像增强、图像识别等服务。

报告题目:人脸图像合成与鉴别

人脸图像合成是指使用深度学习等智能化技术对人脸图像数据进行修改、编辑和替换,进而创造出从身份内容或表观纹理上完全不同的图像。人脸图像合成及其鉴别是机器学习和计算机视觉等领域的重要研究内容之一,被广泛应用于影视媒体娱乐和人工智能安全,在国家公共安全领域具有重要研究意义。本报告结合人脸图像合成的实际应用需求,介绍“合成”与“鉴别”相辅相成、“攻击”与“防御”相互促进的对抗博弈机制;从信息理论角度探寻深度合成的信息交换本质,介绍表象最优传输和信息瓶颈解表达等生成模型,以及全脸生成、属性编辑(年龄、光谱、样式)、身份交换、人脸重演(表情、姿态)、语音驱动人脸等合成方法。

刘家瑛,博士,北京大学王选计算机研究所副教授,博士生导师,教育部青年长江学者,北京大学博雅青年学者。2010年7月,毕业于北京大学计算机应用技术专业,获理学博士并留校任教,2012年8月晋升为副教授。2015年,在微软亚洲研究院任铸星计划访问研究员。研究领域为智能媒体计算与视觉理解。累计发表IEEE/ACM 汇刊与CCF A类论文70余篇,谷歌学术引用7千余次,其中ESI高被引论文2篇,获得授权国家发明专利60余项。担任APSIPA杰出讲者,IEEE/CSIG/CCF高级会员,IEEE CASS-MSA/VSPC技术委员会委员,CSIG多媒体专委会秘书长。担任IEEE Trans. on Image Processing, IEEE Trans. on Circuit System for Video Technology等期刊编委,IEEE ICME指导委员会委员,JVCI期刊评奖委员会委员,ACM ICMR-2021/IEEE ICME-2021/VCIP-2019会议程序主席,CVPR/ICCV/ECCV/AAAI会议领域主席等多个国际会议组织工作。获教育部科技进步二等奖、CSIG石青云女科学家奖、北京大学教学卓越奖,IEEE ICME 2020最佳论文奖等。主讲的全球MOOC课程获教育部首批“国家精品在线开放课程”,教育部首批国家级一流本科课程。

报告题目:智能艺术生成与美学计算

摘要待撰写

刘偲,北航教授,博导。主持国家优秀青年科学基金。博士毕业于中科院自动化所,曾于新加坡国立大学任研究助理和博后,曾任微软亚洲研究院(MSRA)铸星计划研究员。研究方向是跨模态多媒体智能分析(跨模态包含自然语言,计算机视觉以及语音等)以及经典计算机视觉任务(目标检测、跟踪和分割)。共发表了CCF A类论文60余篇,其研究成果发表于TPAMI、IJCV和CVPR等。Google Scholar引用近8000次。2017年入选中国科协青年人才托举工程。获CCF-腾讯犀牛鸟专利奖、吴文俊人工智能优青奖、CSIG石青云女科学家奖。获ACM MM 2013,ACM MM 2021最佳论文奖,ACM MM 2012最佳技术演示奖以及IJCAI 2021最佳视频奖。指导学生获ChinaMM 2018最佳学生论文奖和PRCV 2020最佳论文提名奖。获得10项CVPR、ICCV、ACL等国际顶级竞赛冠军。主办了ECCV 2018、ICCV 2019、CVPR 2021‘Person in Context’workshop。担任中国图象图形学学会理事、副秘书长。多次担任ICCV、CVPR、ECCV、MM等顶级会议领域主席(AC)。

报告题目:多模态内容生成

摘要待撰写

刘烨斌,清华大学长聘副教授。分别于2002年和2009年在北京邮电大学、清华大学自动化系获得工学学士和工学博士学位。主要研究方向为三维视觉。发表PAMI/ SIGGRAPH/CVPR/ICCV等论文近50篇,其中CVPR/ICCV口头报告论文10篇。担任CVPR及ICCV Area Chair,SIGGRAPH Asia技术委员会委员。任中国图象图形学会三维视觉专委会副主任,人工智能学会人机融合智能专委会副秘书长。获2012年国家技术发明一等奖(排名3),2013年度清华大学学术新人奖,2015年国家自然科学基金优秀青年基金,2019年中国电子学会技术发明一等奖(排名1),2021年国家自然科学基金杰出青年基金。

报告题目:数字人技术:交互性、沉浸性及创造性

当前元宇宙和人工智能热潮下,基于神经网络的数字人重建与生成技术受到学术界和产业界的广泛关注。围绕真实人物对象的三维重建、运动捕捉和智能生成成为构建现实世界和虚拟世界间的桥梁技术。本报告围绕智能数字人的3I技术,即人的行为感知实现交互性(Interaction),人的外观重建实现沉浸性(Immersion),赋予人的思想实现创作性(Imagination)分别介绍报告人在人体运动捕捉、人体动态三维重建、人体视频高质量生成等三方面科研工作,涵盖人体、人脸、人手的相关视觉图形学前沿。报告同时对沉浸式全息通信技术、AI数字人等热点前沿进行展望和探讨。

刘永进,清华大学计算机系教授,人机交互与媒体集成研究所所长。主要研究方向为计算机图形学、情感计算和多模态媒体信息处理。主要研究工作包括:以几何结构分析为切入点,在国际上率先开展了流形网格上测地Voronoi图研究,对可视媒体流形表达的度量计算与几何结构分析等关键问题取得一些进展;从脑电信号处理、情绪识别和人机交互三个角度综合探讨基于生理信号的情绪识别与交互技术,提出了一系列情感计算高效处理新方法,拓展了以情感分析为内核的数字媒体处理与认知计算技术框架。

报告题目:虚拟人智能体的人机共情研究

共情是社会互动中个体理解他人立场、并产生与他人相似情感的心理推理形式,是人类合作行为的主要动机来源。目前虚拟形象技术研究在计算机图形学、计算机视觉和社交多媒体领域受到越来越广泛的重视,新颖的虚拟形象技术正在不断的提出。本次报告将就人能否准确理解虚拟形象的情绪,并在(1)让虚拟人智能体能够产生和人一致的情绪反应和(2)让用户能够产生和机器一致的情绪反应两个方面开展研讨。

杨蛟龙,微软亚洲研究院主管研究员。2016于澳大利亚国立大学与北京理工大学获得双授博士学位后加入微软亚研,研究方向为三维计算机视觉和图像生成。以第一作者或所指导学生为第一作者发表CCF A类论文20余篇。长期担任TPAMI/IJCV/CVPR/ICCV/ECCV等顶级计算机视觉期刊和会议审稿人并多次任CVPR/ICCV/WACV等会议领域主席。于2017年获得中国图形图像协会优秀博士论文奖(全国4篇)。

报告题目:跨越维度鸿沟:三维可控的图像生成研究

摘要待撰写

执 行 主 席

丁二锐,博士,百度视觉技术部、增强现实技术部总监,CCF/CSIG/CAAI等学会相关专委会委员。负责百度计算机视觉技术的基础研发和管理工作,领导部门先后获得40余项国际比赛冠军,开放150余项能力,支撑的计算机视觉公有云/质检云先后多次被Forrester/IDC评为市场第一,获得中国计算机视觉专利申请量和质量第一(2021)。个人已发表论文40余篇,获得50余项中国专利和10余项美国专利,曾获ICDAR 2019 最佳论文第二名奖,百度“最佳经理人”奖(2018),中国电子学会科技进步一等奖(2018),国家技术发明奖二等奖(2020),担任ICDAR2019/2021,CVPR2020/2021等多个学术研讨会和竞赛的组织者。

赵晨,百度资深工程师,增强现实技术部技术负责人,专注于计算机视觉技术在短视频、虚拟人及导航导览等方面的融合性突破及落地应用探索,参与并主导Dumix AR平台、虚拟形象解决方案、大场景视觉定位系统、特效视频SDK等多项技术产品研发,申报相关专利达60+项,并已落地手机百度、百度地图、全民小视频、Apollo智慧座舱等,服务上亿用户。

王井东,博士,百度视觉技术部首席架构师,负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前,曾任微软亚洲研究院视觉计算组首席研究员。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络(HRNet)、基于有监督的区域特征融合(DRFI)的显著目标检测及基于近邻图的大规模最近邻搜索(NGS,SPTAG)等。他曾担任过许多人工智能会议的领域主席,如 CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他现在是IEEE TPAMI、IJCV、和IEEE TCSVT的编委会成员,曾是IEEE TMM编委会成员。因在视觉内容理解和检索领域的杰出贡献,他被遴选为国际电气电子工程师学会和国际模式识别学会会士 (IEEE and IAPR Fellow)、国际计算机协会杰出会员。

参 加 活 动

本次“视界无限”专题研讨会欢迎国内外高校和企业界的研究者、师生、媒体朋友及其他感兴趣者参加,参会者无需缴费。您可以直接访问B站直播地址https://live.bilibili.com/22339632进入直播间。该地址是CCF计算机视觉专委会的官方账号,欢迎关注和订阅。为了能在直播中参与弹幕互动,请您提前注册好平台账号,并在观看直播时登录账号。