第二期CCF-CV“视界无限”系列研讨会于浙江大学圆满结束

阅读量:1409
2019-03-31


    2019年3月31日,由中国计算机学会计算机视觉专委会主办、浙江大学CAD&CG国家重点实验室承办的第2期CCF-CV“视界无限”系列活动——“同时定位与地图构建(SLAM)的前沿进展与未来趋势”研讨会在杭州启真酒店成功举行。本期研讨会由计算机视觉专委会委员、浙江大学章国锋教授组织和主持。研讨会邀请了北京大学査红彬教授、中科院自动化所吴毅红研究员、上海交通大学邹丹平副教授、西蒙弗雷泽大学谭平副教授做主题报告,浙江大学鲍虎军教授刘勇教授、阿里巴巴李名杨研究员参加了深度研讨环节。本次活动报名非常火爆,收到了200余份参会申请,经过认真遴选,来自全国各高校和企业的80名参会者汇聚杭城,就SLAM的理论与应用进行了热烈的交流和深入细致的探讨。


会议议程依次包括引导发言、主题报告、海报/系统展示、深度研讨四部分。首先,浙江大学鲍虎军教授代表研讨会承办单位欢迎大家来到杭州参加“视界无限”活动。鲍老师指出,这种小规模的深入讨论对SLAM的发展有很大的推动作用,期待听到专家的精彩报告,并祝愿研讨会圆满成功。


    章国锋教授的引导发言题目是“面向增强现实的单目视觉惯性SLAM算法评测”。章国锋教授指出,尽管视觉惯性SLAM已经取得了很大的成功,但由于缺乏合适的基准,目前还比较难从增强现实的角度来定量地评估各种SLAM系统的定位结果。现有SLAM数据集/基准一般只提供相机位姿的精度估计,而且相机运动类型比较简单,与移动增强现实中的常见运动情况并不吻合。为了解决这一问题,构建了一个新的视觉惯性数据集及相应的面向增强现实的评测标准,对现有的单目VSLAM/VISLAM方法进行了细致的分析和比较,并从中选出几个代表性的方法/系统在新基准上进行定量评估。


    査红彬教授的引导发言题目是“基于数据流处理的SLAM技术”。传统的SLAM技术在实际应用中,仍存在重建误差积累严重、计算成本高昂等问题,影响了机器系统的在线响应速度以及对复杂环境的自适应能力。针对这些问题,应该最大限度地利用传感数据的时空一致性与三维地图的几何不变性,在现有多视点几何计算的基础上,强化SLAM算法的系统性与泛化能力,进一步改善其基本性能。


    在主题报告环节,吴毅红研究员的报告题目是“Marker SLAM及FMD SLAM”。首先给出了目前marker SLAM存在的问题:几乎所有的marker SLAM都需要与空间点进行对应,然后采用PnP与RANSAC进行定位。在运动模糊、较远距离、较大噪声情况下都容易失败。由于点个数较少,即使采用RANSAC也难以剔除误匹配。为此提出了一种新的基于圆形的marker SLAM。接下来,吴毅红研究员介绍了自然场景下的FMD SLAM,其中将特征法与直接法进行融合,在前端采用直接法进行跟踪,在后端采用特征法对地图进行优化和更新,达到了速度与精度都可以兼顾的目的。


    邹丹平副教授的报告题目是“无人系统中的视觉SLAM-融合环境与载体信息的方法”,首先回顾了环境结构特性的描述方法与观测模型,以及移动机器人与旋翼无人机两种典型载体的运动特性,在此基础上介绍了针对应用场景深度订制的视觉SLAM思路。该思路从环境结构特性与载体运动特性两方面入手,并将两者融入到视觉SLAM系统中以提升实际应用中的精度与可靠性。


    谭平副教授的报告题目是“A Novel Approach Toward Dense Monocular SLAM”。视觉SLAM已有多年的研究历史,且有ORB-SLAM和DSO等成功的应用。这些方法通常只重构场景的稀疏图,即,用一组稀疏点云描绘场景结构。然而在AR/VR情境下,很多应用需要稠密的3D点云以实现避障或用户交互。Dense SLAM旨在追踪相机运动轨迹的同时建立稠密3D图,其中单目Dense SLAM仍是一个亟待解决的问题。谭平副教授介绍了两种最新的解决方案:利用偏振相机实现立体重建或使用深度神经网络学习形状先验信息以实现立体重建。


    本次研讨会新增了海报/系统展示环节,共有来自企业和高校的14篇论文海报和4个系统进行了演示,为与会者提供了更多细致交流和深入探讨问题的机会。


    在Panel环节,与会嘉宾与现场师生就“SLAM的未来发展之路在哪里?”、“SLAM的killer app是什么?”、“SLAM的产学研如何做?”、“怎么看Event Camera SLAM?”等问题展开热烈讨论,参会者也就自己关心的问题与嘉宾交换了观点。


最后,计算机视觉专委会副主任査红彬教授总结了本次会议取得的成果并对承办方浙江大学CAD&CG国家重点实验室的师生表示了感谢,第2期“视界无限”研讨会在热烈的掌声中圆满结束。

观 点 分 享

 为了惠及广大的研究者,每期“视界无限”精选嘉宾观点以快问快答的形式进行分享。

Q1: SLAM的未来发展之路在哪里?

 A1: 有两条出路可以探索。1.借助新型的硬件、特殊的传感器,如IMU;借助新的感知技术、与深度学习进行融合,形成更好的SLAM系统。2.结合具体的应用场景,引入特殊的先验约束,研制定制的SLAM系统。(鲍虎军)

 A2: 标准化的软件模块、框架可以更快地推动SLAM行业发展。比如现在有了Eigen、Ceres等数值优化库,以及一些开源的通用SLAM框架,这些都很有用。之后SLAM可以针对不同的应用场景与设备采用不同的算法。不同的应用环境需求有所不同,如VR头戴设备需要低延迟,而一些机器人的应用可以忍受较大延迟。(李名扬)

 A3: SLAM技术中关于测量、几何的方法已经比较成熟,但仍存在一些几何无法解决的问题。SLAM技术需要引入类似人对环境的感知能力,这可能是未来的趋势。(刘勇)

 A4: SLAM技术不会只局限于移动传感器。认知科学认为除了人的感知能力,也应注意人的定位能力,这正是SLAM要解决的东西,所以以后的计算机视觉中SLAM可能是一个非常核心的技术。人使用三种信息定位:1.感知器官。2.平衡器官。3.大脑对人体运动的预先处理。前二者已经被加入SLAM系统中,但第三点没有被使用。人在晃头的时候并不觉得场景在晃,这是因为人将大脑的控制信号作为先验。所以我认为无人车驾驶时的控制指令也可以作为SLAM系统的先验。(查红彬)

 A5: 传统方法已经面临瓶颈,现在SLAM技术若想发展,需要结合多传感器和新的方法。SLAM现在要想更长远的问题,不应局限于静态场景、传统相机的工作,可以尝试更广的工作。(谭平)

 A6: 1.SLAM是一门应用的技术,其目标是落地,并且SLAM有很大的落地潜力。这个和深度学习就有区别,深度学习是工具,而SLAM是应用的关键技术,并且很有推广价值。2. SLAM可以与认知科学结合,去研究人基于视觉的定位能力是怎么做的,将其推广到SLAM系统中。 3. SLAM技术应与场景中的任务结合,比如和识别结合;SLAM和有人的场景结合,比如人机共融。(吴毅红)

 A7: 当前的视觉SLAM系统中,定位问题解决得还可以,但mapping这块还存在在很多问题。研究的重心可以更多地向mapping倾斜,结合语义等信息,增强机器人与环境的交互。(邹丹平)

Q2: SLAM的Killer App是什么?

 A1: SLAM技术可以与自动驾驶领域结合。现在宁波在建设这样的无人驾驶车道,车道使用传感器全覆盖。传感器将信息上传到云计算平台,计算后将路况向车辆广播,这样的道路十分昂贵。可以尝试使用预先的高精度地图,结合SLAM技术进行汽车主动mapping与地图的动态更新。使用除了视觉信号外的信号进行定位的技术也存在,视觉SLAM技术可以与之结合。(鲍虎军)

 A2: 机器人领域。对于不同应用,SLAM可以做成不同的形态。无人驾驶汽车可以看作是一种特别的机器人。(谭平)

 A3: 目前的两大应用场景是AR/VR与机器人。现在能赚钱的两种机器人,扫地机器人、工业物流机器人,如AGV,都使用了SLAM技术。机器人的移动问题,离不开SLAM技术。(刘勇)

 A4: 如果SLAM能在消费级电子产品上应用,将产生非常大的价值。(李名扬)

Q3: 怎么看待Event Camera SLAM? Event Camera处理高速运动的情况效果很好,并且能耗低。帧率可以达到上万帧,在SLAM上是否存在应用场景?

 A1: 虽然帧率上去了,但系统接受的信息总量是不变的。Event Camera删减了对很多信息的获取,从而提升了帧率。但是在特定场景中一定能有其应用。(刘勇)

 A2: Event Camera在机制上是仿生学的应用。其只响应动态变化的信息。可以结合类脑智能里新的网络框架,如脉冲神经网络做一些结合研究。(观众)

Q4: SLAM的产学研怎么做?

 A1: 我举一个例子,SLAM可以促进传感器的发展,比如广角相机能有效提升SLAM的稳定性。在SLAM火热的现在,SLAM对广角相机的使用反过来促进了广角相机的标准化。SLAM推动了很多产业的变化。同时企业的介入也推进了研发的进展,很多企业看重SLAM的潜力,对学校的SLAM研究投入非常大。(李名扬)

 A2: SLAM的应用广受企业关注。企业面临着光靠自己的技术力量无法很好地完成SLAM技术消化的问题。企业独立研究SLAM需要很大的知识成本。为了降低知识成本,企业需要一些标准化的工具,也需要大学、研究所的援助。学校可以与企业合作建立一个公共平台,开发好的SLAM工具,并将企业间的竞争转化为企业间的合作,促进SLAM的发展。(查红彬)

 A3: 1.公司侧重于做出一款成功的产品,根据应用的不同,最炫酷的技术不一定是最合适的。学校侧重于研究本身,需要瞄准对领域有长远影响的问题。两者的思维方式是不同的。2.三维视觉在国内是小众圈子,研究者不多,学生也少。大家需要互相支持,用更开放的心态去做事情,比如多开源代码,让更多人能够进来做这个方向的工作,促进领域的发展。3.可以多组织一些CCF-CV视界无限这样的小型会议,技术上的互相讨论可以更深入,让大家了解彼此的工作,促进良性循环。(谭平)

 A4: 产学研问题是目前的技术落地的痛点。哪怕出现了一篇很好的技术论文,大部分企业的技术团队还是很难完全复现。也就是说,实现别人的工作是有很高门槛的。另一方面,学术论文一般验证新的思想、新的原理和新的实现方式,大部分离实际应用尚有差距,需要进一步完善。我建议,高校和科研院继续花时间将技术打磨一下,往应用方向推一步,企业则可以派研发团队,在技术发明团队的指导和合作下,共同完成技术转移。建立联合实验室或研究机构,形成联合研发团队,是一种非常好的技术转移办法。(鲍虎军)

 A5: 一般来说,高校的研究团队并不适合直接做产品。高校和企业应该做各自擅长的事情,并进行紧密合作(比如共建联合实验室),联合研发:高校的研究团队主要做偏前沿探索性的研究和提供技术指导,公司的研发团队主要负责工程和产品化,两边能够经常一起交流讨论,甚至一起工作。产品要落地其实很不容易,仅靠学校的研究团队是不现实的。高校和企业的紧密合作和联合研发,可以实现技术的快速落地。建设开放平台也是一个很好的思路,特别是对于一些中小企业来说很有意义,但这可能需要很多家单位一起共同努力才行。(章国锋)

视界无限”活动介绍

视界无限”是由中国计算机学会计算机视觉专委会(CCF-CV)新启动的品牌学术活动。每季度举办一次,全年四次。每次活动由1-2位计算机视觉专委委员负责召集和组织,围绕计算机视觉领域某一主题,组织资深的研究者与优秀青年学者进行全方位的深入研讨,总结该主题前沿进展与未来趋势。

活动面向计算机视觉领域研究者开放申请,如您有意申请并组织“视界无限”活动,请与计算机视觉专委会秘书处联系。

联系人:杨巨峰,yangjufeng@nankai.edu.cn,

18622233366

  马占宇,mazhanyu@bupt.edu.cn,

13466323341



<<< 下一篇 无