CCF CAD&CG @U第十二期 雷娜、方玉明、张举勇、周元峰走进中南大学

zoujinzhongnan

CCF CAD&CG @U第十二期

雷娜、方玉明、张举勇、周元峰走进中南大学

智能媒体:几何与图像的观点



主办:中国计算机学会计算机辅助设计与图形学专业委员会

承办:中南大学计算机学院

时间:2022年6月7日(星期二)  14:30-17:10

线上参与:腾讯会议号:680-562-820

人工智能与数字媒体是元宇宙的核心技术。本期活动,我们邀请了大连理工大学雷娜教授、江西财经大学方玉明教授、中国科学技术大学张举勇教授、山东大学周元峰教授四位专家从几何和图像两个角度对智能媒体进行阐述。内容包括深度学习的几何观点、图像质量评价、数字人建模与驱动、和牙齿三维智能处理,并就本专题进行30分钟的圆桌讨论。


特邀报告1

leina

报告人:雷娜

题目:An Optimal Transport View of Deep Learning

个人简介:雷娜,大连理工大学国际信息与软件学院党总支书记,教授,博士生导师,研究方向为:应用现代微分几何和代数几何的理论与方法解决工程及医学领域的问题,主要聚焦于计算共形几何、计算拓扑、计算机数学及其在人工智能、计算机图形学、计算机视觉、几何建模和医学图像中的应用。多次受邀在国际国内重要会议上做大会邀请报告和会前短课程。主持国家重点研发计划项目课题、国家自然科学基金重点项目、面上项目以及中央部委创新项目等10 余项,主持项目总经费一千余万元。学术成果多次被菲尔兹奖获得者或美国科学院院士等在国际会议上介绍;获得的知识产权在工业界进行成果转化,获得应用单位的好评。担任网格生成领域国际顶会IMR 唯一亚洲committee member。获得世界华人数学家大会最佳论文奖。

报告摘要:

In this talk we first introduce an optimal transportation (OT) view of deep learning. Natural datasets have intrinsic patterns, which can be summarized as the manifold distribution principle: the distribution of a class of data is close to a low-dimensional manifold. Deep learning mainly accomplish two tasks: manifold learning and probability distribution transformation. The latter can be carried out using the classical OT method. From the OT perspective, the generator of GAN model computes the OT map, while the discriminator computes the Wasserstein distance between the generated data distribution and the real data distribution; both can be reduced to a convex geometric optimization process. Furthermore, OT theory discovers the intrinsic collaborative—instead of competitive—relation between the generator and the discriminator.  Then we give an explanation to mode collapse. By the  regularity theory of Monge-Ampere equation the OT map is discontinued if the support of the target distribution is non-convex. But the neural network always represents continue map. This is the reason of mode collapse. Finally based on the above theory we propose three novel models, including generative model AE-OT, super resolutin model OTSR and point cloud upsampling model PU-CycGAN.


特邀报告2

fangyuming

报告人:方玉明

题目:图像质量评价理论与方法

个人简介:方玉明,江西财经大学信息管理学院院长,教授,博导,长期从事多媒体信息处理,计算机视觉等方面研究,国家自然科学基金委“优秀青年科学基金”项目获得者(国家优青),获2020年江西省自然科学奖一等奖(排名第一),主持国家自科基金重点项目、优青项目和面上项目、科技部新一代人工智能重大项目课题等项目/课题10余项,发表中国计算机学会推荐A类期刊/会议和IEEE汇刊高水平论文60余篇,学术成果被谷歌学术引用5600余次,担任多媒体处理领域顶级期刊IEEE Transactions on Multimedia等多个国际学术期刊编委,入选2020和2021年爱思唯尔中国高被引学者。

报告摘要:介绍图像质量评价概念和分类,概述最近几年来的相关进展,进一步,介绍本团队近年来在该领域的一些研究工作以及未来的发展趋势。


特邀报告3

zhangjuyong

报告人:张举勇

题目:便捷、高效、高保真数字人建模与驱动

个人简介:张举勇,中国科学技术大学数学科学学院特任教授,博士生导师,国家基金委优秀青年基金获得者。2011年博士毕业于新加坡南洋理工大学,2011年至2012年于瑞士联邦理工学院洛桑分校从事博士后研究。研究领域为三维视觉与计算机图形学,具体研究内容为对真实物理世界的高效高保真三维数字化、高真实感虚拟世界的创建生成。

报告摘要:对物理世界中物体、场景、人的高效高保真三维数字化是计算机图形学、三维视觉等领域的核心研究问题。传统的建模与驱动方法依赖于昂贵的采集设备、复杂的制作流程、并需要专业人士的大量手工交互,这极大地限制了应用群体与应用范围。相比于传统基于光场相机的数字人建模,最新的数字人建模算法已可只需少数几个视角的视频作为输入。然而,对于普通用户来说,仍然难以采集同步的稀疏视角数据,从而限制了这些算法的大范围应用。中科大3DV课题组在基于单目视频的高保真数字人建模与驱动方面开展了多方面的研究,包括基于单目视频的完整头部建模与说话数字人生成,穿衣人体建模与驱动,以实现数字化每个人的愿景。


特邀报告4

zhouyuanfeng

报告人:周元峰

题目:面向口腔精准正畸的牙齿三维数据智能处理与分析

个人简介:周元峰,山东大学软件学院教授,博士生导师,副院长。从事智能图形图像处理、几何设计与计算、计算医学等领域的研究工作。近五年在计算机图形学、图像处理领域主要期刊与会议发表学术论文50余篇。获教育部科技进步一等奖1项,山东省科技进步二等奖1项,山东高等学校优秀科研成果奖一等奖1项,获得国家发明专利授权7项,计算机软件著作权3项。主持国家重点研发计划战略性科技创新合作项目1项、国家自然科学基金面上基金3项,国家自然科学基金重点项目课题1项,山东省重点研发计划1项。2020年获泉城产业领军人才,陆增镛CAD&CG高科技奖二等奖。

报告摘要:随着现代社会不断进步,人们对于牙齿健康的重视程度越来越高,除了美观因素,很多疾病的发生与人类的口腔健康都有关系。目前的数字化正畸与修复平台非常依赖医生人工操作,正畸医生须在治疗过程开始前就仔细地制定治疗计划,制定计划的过程复杂且需要丰富的经验支持。报告主要围绕面向口腔精准正畸中牙齿三维数据智能处理与诊断分析中的几个问题展开讨论,通过计算机图形学与人工智能技术相结合,切实提升数字化正畸平台的智能化水平,为数字正畸提供面向人工智能的高端软件与行业示范应用支持。