第六期CCF-CV“视界无限”系列研讨会于线上成功举办
2020年7月12日,由中国计算机学会计算机视觉专委会主办的第6期CCF-CV“视界无限”系列活动特别专题——“新冠肺炎影像诊断的前沿进展与深度思考”研讨会在线上成功举行。本期研讨会由计算机视觉专委会副秘书长、南开大学杨巨峰教授组织,西北工业大学夏勇教授担任执行主席。研讨会邀请了计算机视觉专委会主任、北京大学查红彬教授致辞,南开大学程明明教授、华中科技大学王兴刚副教授、上海交通大学王乾副教授、天津大学张长青副教授、阿联酋起源人工智能研究院付华柱研究员做主题报告并参与圆桌讨论。计算机视觉专委会B站公众号对会议进行了全程直播,直播人气峰值达到3648。
首先,查红彬教授代表计算机视觉专委会致辞。查老师指出了本次活动的两个重要意义:其一,自新冠疫情爆发以来,计算机视觉领域众多专家学者积极投身抗疫一线,在新冠肺炎影像诊断方面开展了卓有成效的研究工作,为疫情防控贡献了AI的力量,借此机会全面总结相关领域的研究成果和最新进展恰逢其时。其二,计算机视觉专委会主办的“视界无限”系列活动定位于就计算机视觉领域的某一具体问题进行深入细致的研讨,本次活动在总结经验之余也对计算机视觉社区如何在未来助力应对公共卫生事件进行深入的思考和交流,其成果有望产生长远和深刻的影响。希望线上研讨这种新形式吸引更多同行参与到活动中来,帮助大家更好地理解知识、激发创意;祝愿研讨会圆满成功。
程明明教授的报告题目是“基于医学影像的疾病筛查”。他结合抗疫实践,介绍了医学影像在疾病筛查中的作用和意义,以及相关识别检测技术,包括基于CT影像的新冠肺炎检测与分割技术,以及基于X光图像的肺结核检测技术。程老师在报告最后对医学影像人工智能筛查,特别是新冠肺炎CT影像的AI筛查,做了一些总结和反思,重新整理了下一步探索的思路。
王兴刚副教授以“胸部CT影像中的弱监督COVID-19分类与病灶定位”为题,深入浅出地介绍了他们团队在疫情爆发早期数据资源和计算资源同时受限的困难情况下,开发的一套诊断算法。该算法使用普通的GPU设备,仅用1.93秒即可处理单个患者的CT数据。在训练过程中无需注释病变,采用弱监督深度学习模型可以准确地预测COVID-19的感染可能性,并发现胸部CT的病变区域。这种易于训练的高性能深度学习算法提供了一种识别COVID-19患者的快速方法,在新冠疫情的防控中具有良好的应用价值。
王乾副教授的报告题目是“Dual-sampling Attention Network for Diagnosis of COVID-19 from Community Acquired Pneumonia”。王老师指出新冠肺炎的早期诊断对治疗病人和防控疫情扩散均有重要意义,他们提出了一种基于胸部CT影像的双采样注意力网络解决此问题。具体地,他们在3D卷积神经网络基础上设计了一种新型的在线注意力模块以快速定位和识别肺部感染区域。在目前已知的最大规模数据集上取得了最优结果,并对数据的不平衡性有较好的适应能力。
张长青副教授的报告题目是“基于多视图学习的新冠肺炎诊断”,为相关研究提供了一种新的思路。针对早期的新冠患者的CT影像与普通肺炎具有很大的相似性的问题,研究可以较好区分两者的方法。张老师就其团队如何利用CT影像的多种特征准确、快速、稳定地对新冠肺炎患者进行鉴别诊断进行了详细介绍。
付华柱研究员的报告题目是“Inf-Net: Automatic COVID-19 Lung Infection Segmentation from CT Images”,重点介绍了近期提出的肺部感染区域分割神经网络Inf-Net。针对在有限时间内快速开发该系统面临的数据饥渴难题,进一步提出了半监督的分割框架,在少量标注数据和大量未标注数据上学习能力和分割性能都得到了验证。
在Panel环节,与会嘉宾就“核酸检测假阴性比较多,影像诊断是不是也有这样的问题?影像诊断的优势是什么?”、“目前新冠肺炎的AI影像诊断是否能够应用于临床?不足主要在哪里?”、“新冠肺炎的AI影像诊断研究中,如何更好地利用数据?”、“最近有医生表示,‘疫情在中国能控制下来,核心还是靠传统人工办法和智慧来实现的,人工智能没有深度参与’。在后新冠时代,面对可能出现的类似公卫危机,人工智能和计算机视觉能做什么?”等问题展开热烈讨论,网络参会者也在直播平台就自己关心的问题与嘉宾交换了观点。
最后,第6期“视界无限”研讨会在下午5点15分圆满结束。
Panel 实 录
为了惠及广大的研究者,每期“视界无限”精选嘉宾观点进行分享,以下为本期研讨会Panel实录。
夏勇:大家在介绍背景的时候都提到了核酸检测的阴性比较多,那么如果我们用影像诊断是不是有这样的问题,我记得刚才几位老师的结果展示是正好有相反的情况,所以可能会跟核酸检测有一些互补性,那么这就让我们觉得说影像诊断是不是针对核酸检测来说会有一些特殊的优势,那么它的优势是什么呢?这个问题我想首先请教一下程明明老师。
程明明:好的,我来介绍一下。我个人理解,就是说这个影像检测和这种核酸检测,其实是两种完全独立的检测方案,影像的检测有自己的一些优势,比如说把一些可能核酸检测里边没有发现的一些情况,它能够发现出来。当然也有一些情况,它会不如核酸检测。我个人觉得特别是在这种疫情比较紧张的一些时期去把所有可能的这样一些病人都给发现出来,对控制形势是非常重要的。因此我个人会更看重这种互补性,而不是说谁比谁更优。其实很多情况下,像这种在武汉最严重的时期,其中有一版的国卫健委发布的指南里边就说了,相当于说影像和核酸都可以确认,核酸有时候检测是阴性的时候,很难排除它就不是阳性。这时候通过一些这种CT再进一步的去看,如果说核酸检测说是阴性,然后CT说阳性的这种情况下,也是得需要密切去注意的,然后该治疗该隔离的话都得去做一些相应的这些措施。因此我其实觉得这个事情更多的是一些互补的,而不是一个相互替代的一件事情。好,谢谢。
夏勇:好,谢谢程老师,那么其他老师对这个问题有没有什么意见要发表一下?
付华柱:我来说两句,我刚才实际上也提到了。刚才程老师说的特别好,这两个是一个互补关系,并没有谁优谁劣,当然换句话说就是说他们更侧重于不同的方向。核酸可以用于诊断他有还是没有,但是影像可以用来观测它的分布,它的区域,对吧?所以从这个角度来说,核酸的话,实际上可以作为包括我们现在我在阿联酋这边也是大家都在进行核酸检测,那么当你发现你有病或者说是高危人群的话,会进一步进行用影像的诊断来判断你的病灶的部分或者是在哪里分布。然后同时影像还有一个好处,它可以进行一个后续的病灶的发展的观测,来进行进一步的评估,它是变大了,变恶劣了,还是扩大了,或者是好转了等等。这些部分是核酸没办法取代的,所以大家是一个互补性的关系。我们这边因为大家都是以计算机视觉为主,所以我们的工作大部分是基于影像的。而且除了影像和核酸以外,刚才张长青老师也说了,还有一些其他的一些评测,对吧?可以也把其他的一些评测指标结合在一起来做一个整个的估计,因为临床的诊断实际上是比较复杂的,并不是单纯依靠影像或者某一两个手段就可以诊断出来。对于临床医生来说,他也是多种手段统一起来,结合所有的信息来进行一个最终的诊断,所以我们也是希望能够把所有的信息结合起来,做一个多信息的融合,来进行一个更好的评测,获得评测效果。
夏勇:好好,谢谢付老师。张老师你有什么要补充的吗?
张长青:好,夏老师你好,前面程明明老师和付华柱老师说的我都非常赞同,它们的互补性是非常强的,但是这个互补性怎么用其实还是比较复杂的。我们在用的时候往往会针对具体情况进行算法设计。医生在进行诊断的时候,在前期比如说通过核酸检测是阴性的,但是临床上的通过影像,当然还有一些别的一些数据,比如说尿检等等一些信息反映出来它跟临床的新冠肺炎症状可能非常像,这时候可能作为新冠肺炎进行隔离和治疗更为合适。后期实际上通过调查,又发现确实在这些病人里面发现了抗体。也就是说它是一个动态的,这两个信息怎么用,我觉得还是比较复杂的,因为在不同的情况下他们是有动态变化的,有时候是比如说用核酸检测的比较准确一些,有时候CT它表现的比较明显一些,对于不同的病人可能也会有一些动态性。那么我们的算法怎么样去考虑,或者是去平衡这两个东西,或者适应它的这种动态变化,可能也是我们未来需要考虑的,这样的话可能医生才更能放心的去用这个方法。好,谢谢。
夏勇:好的,谢谢张老师。我们进入到下一个问题,刚才几位老师介绍了非常好的几个方法,然后在数据集上评测的效果也非常不错,但是这个问题就有点尖锐。我们目前的新冠肺炎的AI影像诊断技术是否能够用于临床?如果不能的话,不足的地方或者可以继续提高改进的地方有哪些?我想这一次首先请王兴刚老师来谈一下您的观点。
王兴刚:好的。关于应用层面上我就直接说一下我的故事,我觉得我们做这个事情,当然我了解的信息有限,然后我接触医学图像的深度也不够,我就说一下我们这边的情况,我们当时做这个事情其实还是希望能够在对应的医院去使用,但是最后我们并没有成功的部署到医院里面去,一方面就是说当时运行期间,部署的话,你要人去弄,其实挺麻烦的。另外一个就是说我们部署的时候,对于它原来这个系统万一有一个什么影响,这样的一个责任就特别大,所以当时其实医院很谨慎,这并没有去直接部署,当然我们只是拿了导出的一些例子,然后去看,所以它其实并没有很好的去用于到实战里面去。然后我看过刚才明明讲的推想,然后包括联影,其实我看到这样一些系统其实都在实战里面用的,我看到就是说利用这种公司的大量数据做,我觉得这个其实非常有意义的。虽然我觉得不一定能够直接去给一个百分之百准确的这样一个诊断结果,但是对于辅助的作用其实是非常好的,能够去减轻医生的一些压力。另外刚才那个问题,如果说这里面核酸它有一些对应的缺陷,容易把一些给漏掉,我觉得影像这一块能够去把我们决策的概率阈值调低一点。我们可以获取更高的recall,我觉得这些东西都是能够去做到很好的辅助作用。当然我觉得还有一个我也听我们合作医生讲,肺炎只是一种症状,但是如果不是肺炎,我觉得可能我们暂时做肺炎的这样的一些影像其实起不到作用的,这可能还要去利用其他的一些AI分析的数据。当然我更说多一点,我们学校其他的一些老师也做过相关的一些AI跟新冠相关的研究,他们还做了一些死亡率的预测,分期的预测。当然这里不一定用的是影像数据,它可能用一些其他的医院里面的这些医疗数据,我觉得都做得很好,也有一些好文章发出来,我觉得都是很有意义的。这样的一些内容总的来说不是特别有条理,但我总觉得就是说他是一个很有希望的这样的一个方向。
夏勇:好的,谢谢王老师。那么刚才王老师也提到了两个成功应用的案例,我们请王乾老师来分享一下。
王乾:好,谢谢夏老师。我个人的感觉这个问题是说在临床里面怎么去用,那么其实一个很重要的是什么东西是临床,因为临床是一个很大的概念,它覆盖了整个疾病管理的非常长的链条,我感觉在这个链条里面有很多的小的模块,我们也许很难找到一个通用的人工智能,能够把这个链条全部自动化,目前阶段可能还比较难做到,但是这不妨碍我们对链条里面的某些地方,我们是可以有办法用人工智能来做到提高效率,提高准确性,提高对病人的一个服务质量,我相信这是我们可以尝试的。我举一个例子的话,比如说这个成像端,我们现在计算机视觉中通用视觉技术不一定要和媒体和图像有关的,就是一个摄像头,你就识别人体的运动,然后你去把人的位置摆正了,去自动的调整CT机里面床的位置,你就可以把医护人员和病人隔离开来,也就是说你不需要一个技师站在边上去给病人摆位等等。但这些技术实际上是可能超出了传统的我们讲计算机视觉的范畴,但是实际上是在整个的通用视觉技术里面,我觉得它是有很大的应用价值。另外就是说我们有一些工具,比如说图像分割的工具去对感染的区域就做一个把边缘给描出来,然后医生就可以去对感染的情况去做一个量化的分析。在传统的影像的诊断里面,或者所谓的一体化的诊疗里面,是没有什么用的,因为以前医生拿一个片子,我眼睛看一下这个人,描述一下这个人有个什么结节,这个人有个什么毛玻璃,有一个什么病变,仅此而已。但是如果你有了这样子的工具之后,实际上医生可以走的比以往更远,它可以从以前定性的一些描述变成一种定量的描述,也就是我们现有的这样的工具,他才有可能去做这样子的一个尝试。我觉得这也是非常重要的。最后一个点我觉得我们人工智能的话,也可能是我们目前的一个弱势,这些病人或者说在整个新冠的疫情里面,真正的一些高危的病人通常都是有一些基础性疾病的,也就是说他的状态并不是由新冠肺炎一个东西导致的,还可能是新冠肺炎压垮最后一根稻草,怎么样把这些复杂的因素给考虑起来?很多时候这个因素很复杂,超出了我们某一个专科医生他所曾经接受过的培训,或者他有知道的这些知识的合集,但是可能仍然是在我们某一个医学的一个所谓的领域知识的范围内,怎么样把这些东西结合起来,然后利用这些东西能够帮助我们个体的某一个医生有一个更好的决策,就可以在诊断或者治疗方面有更好的效果,我觉得这也是我们可以去想办法去解决的问题,我觉得目前这一点上面还相对是比较弱的一点,可能是值得我们去花更大的功夫去研究。
夏勇:好的,谢谢王老师,我们下面再请程明明老师也谈一下新冠诊断技术的临床应用,另外除了已经给大家分享了非常精彩的工作以外,如果我们屏幕前边的老师和同学也想做这个课题,那么还有哪些我们可以研究的。
程明明:好的,谢谢,刚才其实我在报告的过程中,我反复提到了一件事情就是说,其实新冠肺炎的这样一些系统,它其实是一种工具,我们是期望这种工具来辅助医生在他的这种决策,包括诊断,包括这些过程中,然后去给他提供一定的这种辅助,然后能够帮助他的工作。当然帮助从两个方面来讲,第一个就是说我们通过这样一个系统去分析,自动的去分析这些数据,可以极大的减轻对医生的压力,他不用每天看那么多的片子,然后去做这样一些角色,他工作压力会降低。当然了你想工作强度过高之后,人不可避免就很容易出错,很容易疲劳就很容易出错,这是第一个作用。第二个作用刚才付老师也提到过,其实也能够去把它去做一些像王乾老师这种,刚才也能做一些定量的这种分析,就是说你可能这样的一个系统,不光是像核酸一样,告诉你说这个人有没有病,或者说是一种什么病,有没有抗体,有没有疾病,有没有这样一些感染,更多的也能够去帮助我们去分析,病程是说两天以前是什么样的,现在是什么样的,各个肺叶的区域,它有百分之多少的区域被感染了,它整个的疾病的一个状态。这些所有的信息都会给医生提供一个非常好的辅助,就跟我们现在去看病一样,一般来说都会普通的一些感冒什么经常也会做一些化验抽血之类的,这些东西都会给我们提供一些非常重要的有用的指针。至于说它有没有用,临床上能不能用,这个事情显然已经在用了,其实很多地方都已经在用了。当然应用的时候可能不像说我们有的老师可能受限于说拿到数据拿到的比较晚,可能用起来会比较麻烦。我们这边相对比较幸运一点,是因为我们之前就跟企业在合作做这种医学影像的。去年事实上我们做过两个项目,一个是做这种肺结核的是用X光的影像,另外一个是做肺结节的,那就是用的CT的影像,然后因此我们其实这个系统之前,就是各种医学影像的分析,其实已经在300多家医院部署了,因此整个系统本来就在医院在用,所以我们就相当于比较幸运,我们拿到了数据,然后武汉,虽然那阵医生比较不大可能标数据,但是别的地方的医生,北京的医生或者别的地方也可能联系到做一些比较精细标注的这种资源。然后因此其实我们那块把这个系统去用起来,这个事情我们这边还相对比较幸运,可能更多的是从数据这方面,我们相对于其他的很多的课题组相对比较幸运,所以说很快的把这个事情给用起来了。刚才我也看到有老师在问,在B站里边也有人问说最开始的时候数据量没那么大或者怎么样,其实我觉得这个事情是这样,最开始我们数据量也不是特别大,这个数据量不是特别大的时候,更需要不是监督的信息要更强一些,可能对这个数据量不是很大的时候会比较有帮助,比如说刚开始当你数据量不是很大的时候,最好不要只是用一些图像级别的那种标签,本来样本量就不是很大,你只要一些图像级别的这种标签做分类,然后有时候给一些这种在训练集的表现好,其实你也不知道他是不是过拟合的这些东西的,但是你把这些东西跟一些更加什么一点的任务,困难一点的任务,比如说分割这类的任务给它结合起来,有时候数据量比较小,也可以做得非常不错。其实你从这种我们传统的计算机视觉里面的一些任务,比如说分割类的任务,我们以前用这种PASCAL VOC其实一般就几千个图像,然后就能训练一个非常好的分割类,但是你要是说想做分类,你靠几千个图像去训练一个很好的分类模型几乎是不可能的,或者说是很难,其实所以说我觉得刚开始的时候,当然数据量不是特别多的时候,反而其实我个人的经验是说更好的一些标注的信息,特别是这种分割图像素的这种标注的信息,其实还是非常有用的。这个事情像我们当时合作的系统,事实上是个在线的这种网页的demo,我刚才说了一个链接,通过网页点进去之后,部署起来特别容易,其实本质上你打开一个网址的链接,把数据传上去就能够弄了。然后你要为了提高速度,你可以在医院本地装一些服务器,这样的话本地网速更快一点,其实也就主要还是降低网络的延时。所以说我们当时系统用起来相对来说不大,可能会对以前的系统没什么负面的影响,因为它本身就是一个网页,你打开网页传的数据,它能够给你一些很好的这种判断。还有一个事情我觉得很重要的一点就是当这种疫情突然爆发的时候,特别有经验的医生是非常稀缺的,这种稀缺性导致这种医生不太可能去盯着一个,其实你还不知道有没有病,很有可能没有病的这些人的这种片子,让他去长时间盯着看,那个是不现实的,这时候更是需要有一个AI的系统帮他去看,帮他去筛查,可能10个人你去正常筛查的话,你100个人里面筛查出1个其实就已经比例很高了,然后这种情况下,你不要让很有经验的医生去看,让AI先去大概看一下,然后真正AI发现疑似了,再让这些有经验的医生去看也来得及,这时候让医生结合其他的一些东西去做更加专业的判断也很好,这个时候我们其实AI一个更重要的一点,我个人一直觉得它是轻量级的一种手段,不需要那么专业的人去操作,我觉得这点也是很重要的。好,我分享就到这,谢谢。
夏勇:好,谢谢程老师。其实程老师刚才讲到了一点非常重要,就是在疫情初期的时候,恐怕我们的数据不够多,那么其实对于新冠诊断来说,很多的数据并没有得到很好的应用,到即使在总的发病量到达一定数量之后,其实在真正的研究中也很难把这么多的数据汇集起来。当然我知道王乾老师的数据非常多,我们都很羡慕,但是恐怕要收集到这种几千上万的CT数据恐怕不是那么容易。那么当然这个数据不是很好,获得和使用的时候应该怎么做,其实刚才程老师也分享了一些,其他老师刚才在报告中也讲到了一些,我想下面请付华柱老师也跟我们分享一下。其实付老师刚才已经分享了一个半监督的想法,那么我想付老师能不能再给我们提一些思路,这也是给我们其他想做相关研究的老师和同学一些启发。当数据不够的时候我们应该怎么办?
付华柱:其实如果大家做医疗数据的话,就做医疗图像的处理的话,数据是个普遍问题,不仅是针对新冠的问题,其实数据的问题我们自己研究的话是包含了三个层次,第一本身数据量就少,第二数据分布不平衡,比如说这次新冠,刚才看到很多老师他搜集了很多数据,但真正的阳性样本实际上只有一部分,然后正常的这种阴性的用户样本会有很多,对吧?还有第三种就是说不仅是数据少,人的标注也是很少的,对吧?那么这个相当于是在整个医疗方面的一个常见的问题,就不仅仅是针对新冠。那么通常来说有一些个可能会比较好的解决思路,第一种思路就像我刚才介绍的工作,就是半监督这种形式,包括王兴刚老师那边介绍的弱监督训练,他可以在极少的标注量下完成一个整体的工作,就是说如何高效的利用少量的标注,这是一个方面。然后第二个方面实际上还有一个方面就是说新冠病毒就像我刚才说的病灶区域一样,实际上也是其他肺炎常见的区域,他们在某些地方是有一个共通性的,比如说新冠和之前的其他的肺结节或者是肺炎,甚至说其他的之前包括SARS病毒,他们都是有一个共通性的,那么我们是不是可以用以前积累出来的病症或者是模型来迁移过来应用到这种新的或者是突发的病情上来进行解决。那么这也是一个大家常用的思路。当然还有第三个思路,就是最近几年比较火爆的像GAN网络来生成更多的数据,当然生成的数据是否可靠,那么要由大家自己的算法来去设计了。但是用一部分真实数据和一部分生成数据来结合起来,来弥补一些数据不足或者是数据分布不平衡的问题,这个也是一个比较好的解决方案。
夏勇:好的,谢谢付老师的分享。那么刚才王兴刚老师在报告中提到了弱监督的方法,弱监督的相关研究,我们下面请王老师也就这个问题发表一下。
王兴刚:弱监督,因为我个人在视觉这一块,我也做了很多弱监督的这样的一个研究,所以我一直也是比较感兴趣弱监督的这样一个方法。首先我觉得就是说它肯定存在一些首先说局限性,就是说它的弱监督做出来的东西,它的可解释性其实并不是特别好,但是我一直就是说在想我们在跟医院合作的时候,我一直在想如果数据量大的时候,如果说我们有一个客观的这样一个评判标准,我们的评判标准是一个很客观的,我通过大量的数据进行弱监督的学习,如果最后能够得到一个比较精确的结果,我觉得从技术层面来讲,它其实是有意义的。OK,接着就从技术层面上来讲,我也是回到我刚才PPT里面,最后一页我没有讲完的一个事情,就是说在弱监督的这样一些算法的研究上面,我觉得是不像传统的图像处理,自然图像里面弱监督一样,缺少一些基本的工具,我感觉。第一个就是说你像传统的这样一个自然图像里面的弱监督里面,我们有很多的基本的工具,像程明明老师这个Bing这样一些基本工具,可以把这样一些物体对应的病灶它能够提取出来。这个东西我觉得医学图像里面其实是缺少一个很好的方法的。另外一个就是说它虽然是3D的,但它也不同于视频,它这里面很多的这样一个信息,它并不是像视频这样的一个形式存在的,所以怎么去3D的,像CT数据里面去学,其实也是比较困难的。然后再者来讲就是说还是它的可解释性问题,也就是说你弱监督学出来的东西能不能跟医生所需要的这样的一些可解释的东西能够吻合,我觉得这个也是比较重要的。进而来讲我还拓展到就是说如果说从标注的层面上,刚才付老师讲利用部分无标签的数据去做,这就是可以跟最近比较火的像 自监督学习里面去做,我觉得这其实倒是一个很有意思的方向。因为医学的数据其实很多的,如果利用其中的一些约束,比如多视角的一些约束,能够自监督地去学一些特征,把这些特征选好了之后,我觉得再基于少样本或者是弱标记的这样一些数据去学,我觉得可能会做到一个更好的效果。所以我这里也提了一些自己的疑问,也有一些自己的想法,我觉得期待得到大家的指导,谢谢。
夏勇:谢谢王老师。那么我记得刚才张长青张老师的工作非常有意思,用的一些这种组学的特征,还有手工特征,如果用这样的特征,是不是对这个数据量的要求就比较低一些?
张长青:是这样,我觉得前面几位老师说的已经非常全面了,大概可能我们也都比较公认的,就是说数据不够的时候,需要通过模型来补充,也就是说不能完全靠数据驱动,数据不够的时候,可能要通过模型设计,来增强它的数据的利用率,还有泛化性能。比如说前面几位老师提到的弱监督、迁移学习,这都是增强模泛化能力的手段。而多视图学习除了模型之外,往往可能会提取多种信息,这个时候既涉及到信息的扩展,或者是充分利用的问题,又涉及到模型的设计,或者说增强泛化能力的一个问题。多视图学习,主要目标也是通过收集、利用多源信息增强模型的精度和泛化性。
王乾:我觉得就是说可能我们有一些就像刚刚前面老师讲的样子的话,当我们数据可能存在的某些量上不足的时候,我们要么就是在模型上面补,另外一点,我觉得就是说还是要跟我们现在的比如说就要去反思我们的医生专家他们是怎么样去做出某一个判断的。也就是说做东西的推理过程是什么样子,我觉得比如说我们去看了一个片子去做一个诊断,实际我们现在可能在视觉或者在图像处理角度讲的话,就是拿一个网络在上去一阵一阵扫描,当然可以用很多的机制来保证我们扫描覆盖的区域,可能是跟医生的所谓他感兴趣的区域能够尽可能的吻合,但仍然我感觉就是说这个过程并没有非常好的去反映人去做推理的一个过程,我们更多的仍然是一种追问的方式。当然这个是一件好事,但是并不代表说这个过程中我们就可以抛弃掉很多原先有的那些 step by step的这样子的一个过程,我觉得在怎么样把这样子的一些有价值的东西能够有效的利用起来,也可能是我们可以去想办法怎么样做一些更好的主意出来,能够也许会有更好的效果。
夏勇:好,谢谢王老师。其实前一段我们也做了一个小的工作,就是我们把分割和分类放到一个框架底下去做,那么这样分割的结果可以辅助分类比较自然,就是好歹分割结果会给一个还不差的注意力区域,那么同时分类也可以辅助分割,因为分类如果做得好,注意力图会学得比较好,他也会大概给出这个目标的先验的位置。所以在这样的情况下,对于分割来说,因为分割的标注比较困难,这样就可以用一些有像素级密级标注的数据,还有一部分它只有图像级标注的数据,一起来训练一个分割网络,这样我们可以降低这种像素级标注的需求。所以这个也是今年初发表的需要完善的一个工作,但是做的比较简单,我们是用二维的皮肤的图像来做的一个验证,我想后续我也想让学生在咱们三维的新冠数据上试一下,因为今天有老师讲分割,也有老师讲鉴别诊断,我想是不是可以把这两个放在一起来做一下,也有点弱监督的意思。好,下面一个问题就没有那么具体,在习惯上面可能是我们很多做医学影像分析的老师同学都有的一个问题就是说,因为我们知道我们用了很多技术,其实是来自于机器视觉领域,机器视觉领域和医学影像分析之间有什么关系?那么哪些地方是可以借鉴的?这个问题我想请问程明明老师因为程老师在这两个领域做得都非常好,我想请他先给我们分享一下他的经验。
程明明:好,谢谢。机器视觉和这种医学影像分析之间的关系,我是觉得这两个其实咱们说的简单一点,就是医学影像也好,机器视觉也好,它其实都是这种图像的输入的数据,他都需要从图像里边去自动的去发现一些特征,然后去针对自己去学习一些特征,特别是一些多尺度的特征的学习,我们需要对这样一些尺度上的各种各样的可能有用的这些特征做一些特征的学习,包括特征的选择。所以说里面的很多的方法,就像我们今天所用到的这样一些方法一样,很多的老师都在用这种分类分割结合起来的这样一些策略,然后不论包括像王兴刚老师用的这种弱监督的分割的策略,其实也是因为之前我知道王老师在弱监督的语义分割,还包括这种普通的全监督的这种语义分割,他也做了很多的工作。其实从方法上来讲很多是相互通的,当然医学影像也会有一些它自己特殊的地方,比如说医学影像里边,它可能这种数据的分布和自然图像会不一样,包括医学影像可能不像传统的我们去做自然图像的时候,可能更多的是一个二维的图像,医学影像可能更多变成一个volume的数据。另外一个就是说我们传统的一些目标的这种检测,语义的分割,我们的目标其实在图像的任意位置可能都能出现,但是在医学影像里边,比如说肺炎只能在肺的地方出现,你不可能跑到其他的地方去,它有很多的这样一些特殊性在里边,但是大体的方法,平台还是比较通用的。那只是说我们再把大的这些通用的这种视觉方法应用在医学问题的时候,我们需要注意到医学问题它本身的这种特殊性能够尽量多的去利用这种特殊性的约束,然后去减少我们的搜索的空间,就减少我们可能会出问题的这样一些可能性,就是说把它约束的好一些,让他可能对这种数据的依赖相对减少一些,然后能够做更准确的一些判断,这是我的一些经验,好,谢谢。
夏勇:好,谢谢程老师。我知道王兴刚老师也是CV和MICCAI的跨界专家,好,下面我请王老师也分享一下这两个领域有哪些可以借鉴的地方。
王兴刚:谢谢夏老师。说实话我对于视觉和医学影像两方面都不是专家,我都很肤浅。首先我觉得先说一下medical对vision的角度来看,我觉得其实medical里面由于数据特殊性,它其实对vision的贡献其实很大。比如说我们知道在视觉里面,用的非常多的UNet,最开始也是在MICCAI里面发的,还是在medical里面出来的。另外一点,我觉得computer vision研究,一方面我们在探索computer vision的科学机制,我们怎么去理解这个世界?另外一点其实我们也在找vision的应用,我觉得这个medical其实是vision的落地应用,造福社会的一个非常重要的领域,所以我觉得这个研究其实非常有意义的。再从 vision对medical的角度来讲,就是说这里面可能vision的很多方法,对medical都有一些可以借鉴的地方,那么medical它本身如果说要使用computer vision的一些方法去解决,我觉得数据其实是一个很大的问题,因为computer vision来讲,我们几个public dataset,我们就可以搞定所有的事情了,这个就可以把所有问题都拿过来研究,但是medical,我们的疾病有各种各样的,然后每个疾病它有各种各样不同的数据,每个数据可能又涉及到不同设备采出来的不同中心采出来的数据的共享标注,我知道有一些数据其实标注都是错的,所以这个数据其实是一个很大的这样的一个阻碍vision方法在 medical里面去很好的去研究的这样的一个地方。这是我的一个粗浅的想法。
夏勇:王老师太客气了,谢谢王老师,那么对这个问题就是CV和MICCAI相互借鉴这个问题。付老师您还有什么建议吗?
付华柱:好,实际上大家都说医学图像处理,但是大家光只关注了医学,往后面4个字叫图像处理,所以医学图像处理本身实质上还是属于图像的范围内,只不过我觉得计算机视觉或者我们所谓的图像处理是更加基础的。再换句话说,现在大家CV方面都是用deep learning,你说deep learning是不是从machine learning那里过来的?那么machine learning和computer vision之间的区别是什么?是吧?所以说我觉得从底层上来说它们是通的,但是不同在于医学图像你要和医学的相关问题结合起来。如果你直接拿computer vision,比如说大家都说了UNet很好,好,如果你直接拿UNet做一些分割工作,他可能达到的效果并不是特别的理想,因为它有很多局限,包括图像的domain不同,包括数据量的问题,那么并不能达到一个理想的效果。我举一个比较简单的例子,像血管分割,大家都知道在图像中一个血管是一条线,实际上大家很多人都觉得血管分割跟图像里的边缘分割是一样的,但实际上是不一样的,因为你边缘分割的时候,比如说图片抠图边缘一边是背景一边是人,但是血管的话它就一条线,那么它的左右两边都是背景,只有中间的几个pixel的宽度。所以就是说如果你拿CV方面的东西直接套用,那肯定是不work的,一定要和临床的先验知识来进行结合,这就是为什么我们做医学图像的人经常要和医生不停的沟通,要挖掘医生的,从他们的角度是如何看待问题,如何去定义问题,以及是否可以把他们这些个医疗的或者是医学的这些先验知识转换成一种约束,约束到已有的框架基础上来进行一个改进。换句话说,说的更通俗一些的话,相当于我买了一套房子是毛坯房,但是medical image的话,相当于我是如何去精装修,如何去用它,怎么样把它符合我们自己的需求。有的人喜欢欧美风格,有的人喜欢复古的中式风格,那么取决于你的应用不同,对吧?所以说就是这样一个差别,好,谢谢大家。
夏勇:好,谢谢付老师。时间关系我们必须进入到下一个题目了,这个题目也是有一点挑战的,我们今天探讨的都是新冠相关的医学影像分析,那么和其他的一些影像分析有哪些可以借鉴的,或者是不同的,因为我们今天屏幕前肯定很多老师同学都是在做医学影像分析的,那么如果他们来做新冠影像诊断这样一个课题的话,有哪些建议给大家?我想王乾老师刚才在讲的时候,用了大量的社区普通肺炎的病例,然后想请王老师先分享一下。
王乾:我先确认一下你的问题是如果其他同学也想做这个方向,他们要做什么准备还是什么?
夏勇:就是说新冠的影像分析与一般的其他这些医学影像分析问题有哪些相同点不同点或者它的特殊性。
王乾:OK。因为我们组可能算是做的比较早,可能王兴刚老师比我们开始的更早,我们应该是春节之后开始做这方面的一些工作。我觉得以前的话做research的研究,做这种研究的话,那是没有什么有时间压力,时间压力来自于deadline,比如说我要投稿的,3月1号投稿,我必须3月1号把稿子写出来,新冠肺炎这些工作的话,他是没有这样的deadline,但是你会觉得我如果早一点做出来,是不是会有实用价值一点?这让我想到了一个问题,我们以前可能很少考虑到一个场景,当你面对一个突发情况的时候,你要在很短的时间内,针对新的一个问题,新的场景在原有的方法上面做一些改动,你可能数据状况不是很齐备,方法的状况也不是很齐备,但是你要用各种的手段把现有的资源能够调动起来,在非常有限的时间非常有限的人力非常有限的的GPU的资源下面,你要能够交付一些东西,我觉得可能是这个状态的话,至少对我个人而言,我是第一次经历这样的一个情况,但是我觉得也许今后会有类似的这种事情在发生。
夏勇:好的,谢谢王老师,程明明老师刚才也提到,其实在去年的时候就做一些跟肺炎相关的研究,然后到今年进入到新冠肺炎里面,我想请程老师分享一下,从您的角度来看新冠肺炎的一些特殊性或者是一些共性也可以。
程明明:好,谢谢。关于新冠肺炎的这种CT影像的研究,其实从方法层面上来讲的话,特别是说我们最终用的比较广的方法上来讲的话,其实它跟一些其他的肺部疾病,比如肺结节这样的一些分析技术,因为毕竟都是针对CT影像的,也都是针对一些肺部疾病的分析的,其实从方法上来讲的话都还是相通性更多一些。这也是为什么说我们当时弄的比较快的一个原因,是因为我们之前正在做这个事情,然后只是拿到不是这个数据。反之说它的特殊性在于什么地方,我觉得它主要的特征就在于每个人,我当时在具体的时间点,我能拿到什么样的一些资源,每个人可能由于历史的原因,由于各种各样的原因拿到资源可能不一样,可能更多的像王兴刚老师说的那些问题,像比如说刚开始数据特别少,然后没有标注,然后GPU只有一块,这些事情我们都不存在,然后我们可能也没有那么多的那种什么数据制约,我们当时也算比较幸运。其实这时候我们要面临的一个问题就是说,我们怎么样尽快的让医生拿到一个他觉得对他有帮助,而不是一个有负担的系统,对我们初始化是很有帮助的,如果说我们能够给医生一个系统,然后我们系统升级了,我们服务器端升级了,升级之后发现数据一上传之后对他的工作是一个助力,而不是一个负担的话,医生就愿意用,医生只要愿意用,然后我们数据就会更多,然后这样的话我们就进入一个良性循环了。这个可能是我们最开始考虑这个问题的时候,我们的一些特殊性,基于我们的特殊性,我们就更加要考虑到我们怎么样利用到已有的哪怕是不是特别多的,可能刚开始就只有几十上百个这样的一个样例,然后比如说只有几十个这种阳性的样例,然后我们怎么把这样的一些数据用的充分一点,让医生觉得说他能够很好的把这个东西在他的这种工作里边对他有所帮助。这时候我们就希望把我们以前的跟疾病有关的一些东西,然后比如说包括这种肺结节检测的其他的一些东西,包括一些方法给他想办法能迁移过来。另外就是说我们刚开始就会标注很多那种像素级的这种标注,是因为我们想提高这种数据的利用率,这个的话就是我们这边碰到的一些特殊性,当然了王兴刚老师他们那边有他们的特殊性,比如说刚开始学生来不了,学生没法去,那时候你不能要求学生回武汉对吧?也不能说是那时候可能确实是显卡各方面资源可能也会受到一些限制,虽然每个人可能会根据自己的实际的情况,然后可能接触到的资源拿到的东西可能不一样,然后我觉得这些东西可能都会让原来我们在传统的一些图像分析的理论那些技术,我们会从我们不同的角度去弄这件事情。所以我觉得特殊性主要还是在于我们出发的角度,我们当时要解决一个急迫的问题的特殊性所决定的。从基本的方法来讲,我感觉应该是跟以前的一些医学影像的分析的方法还是相通性更多。另外一个就是关于我们新冠肺炎,其实今天我看B站上有很多人在问,说这个数据集怎么回事,这个数据集现在有一个比较尴尬的事情,这个数据集我们手里有,好多老师手里现在都有数据集,其实是不允许我们把这个数据集给放出去的。所以我建议就是说有一些同学老师可能是想研究医学影像,然后可能手头上没有新冠肺炎数据,其实也不见得非要这个点就要研究这个事情,你也可以去研究一些别的事情,比如说我刚才讲肺结节,那个数据我们已经发布出来了,比之前数据大了好几十倍。然后你可以研究那个数据,其实搜集了好多年了,然后也搜集的比较完善,标注的也比较完善,我觉得刚开始去接触这个领域的话,也可以从其他的问题入手,不见得非要去凑热闹。好,谢谢。
夏勇:好,谢谢程老师。王兴刚老师遇到这个困难还好,我们是做计算机研究的,我认识一些做生物医学相关研究,需要做动物实验的老师上半年都哭了,他们遇到的困难更大一些。然后就刚才新冠的特殊性或者和其他问题的共同性,张长青老师有没有什么补充的?
张长青:好,谢谢夏老师。刚才几位老师主要谈了一下遇到的一些问题,还有程明明老师说相通性更多一些,因为它本身都是图像,而且都是医学图像的话,它的互通性就更多,可能在技术层面的话会有一些小的区别。但是我想谈一谈他们不同的地方,我觉得新冠肺炎的诊断结合当前爆发的现状,和以往的疾病的诊断,还有一个非常明显的不同,它是一种极度代价敏感的任务,对可靠性要求我觉得会更高。我们不能说简单的分两类(阴性/阳性)就结束了,可能往往要知道我们分完类之后,它不是新冠的话,我们要问一问你有多大的把握对吧?这个可能要非常小心,而且我们的方法虽然能达到90%多,其实还达不到百分之百,这就存在风险,我们如果完全用这种算法进行诊断的话,那么我们要问一个问题,如果我们能达到99%,那么有1%的有可能会有误诊,这个时候,我们能不能通过一种最小的代价,比如说只有一个人我们误诊了,在我们的模型里面把它认为是非新冠,但是他是新冠。我们能不能通过一种非常安全而且代价最小的方式把这个人找到,我们挑选5个人可能损失一些医疗资源,但就可以保证我们的传播风险降到最小,这可能在我们的模型里面也需要考虑,和传染病相关的一些诊断,跟普通的疾病诊断有所不同的。还有我想再多说一点,就是我们医学诊断跟CV相比的话,CV也在提这种可解释性,包括前面也听CV的专家们在讨论这方面的,他们也提到了医学影像或者说医学诊断里面,对可解释性的要求更高,但是更明确一些。实际上在图像分类很多方面,这种可解释性定义的比较模糊,大家不不太清楚具体要解释什么,但是医学里面可能结合医生的这种具体需求,我觉得可解释性会更明确一些。然后还有一个我们的模型可能要给出额外的信息,包括刚才说的这种进行诊断之后,能不能给出一个准确的不确定性估计,这样对我们的诊断的安全性是会非常有帮助。甚至说为什么最近有医生表示说疫情是吧,在中国控制下来主要靠这种传统的方法,人工智能为什么没有更加深入的参与进去,我觉得大家对人可能更放心一些,是因为人可以做出各种各样的解释,甚至可以交流,那么我们的模型能不能进行交流呢?在诊断的时候,医生能不能问我们的模型一些问题?我们的模型能不能很好的回答?这个可能是我们也需要考虑的。
夏勇:谢谢张老师,其实张老师刚才提到两点,我觉得可以概括为可信赖的人工智能。然后刚才王乾老师也提到推理,我觉得这个点也非常重要,推理和可信赖这两个,我想不只在整个CV里面,现在是研究的热点和难点,对于我们医学影像的研究来说,恐怕也是非常关键的,也许比其他一些CV问题更加关键。刚才张老师也提到了,正好是我们下面一个问题,有医生表示说疫情在中国能控制下来,核心靠的还是传统方法和智慧来实现的。人工智能没有深度参与,那么我们知道至少在国内疫情已经基本控制下来了。在后新冠时代,我们还可能会面临类似的公卫危机,也许是新冠会卷土重来,或者是另一种什么冠会出现。那么面临这样类似的公卫危机的时候,我们人工智能和计算机视觉可以做些什么?我想这个问题我们请5位老师分别简要的回答一下,这次我们从付华柱老师开始。付老师请您分享一下。
付华柱:好,刚才说的新冠其实我就补充一点,新冠这个东西大家现在都在集中精力去做它,实际上刚才那个问题是挺好,新冠和其他疾病有什么区别,实际上也可以应用到现在这个问题上,就是新冠和其他疾病最大的一个区别就是突发性。那么现在为什么说我们这次疫情控制住,并没有涉及到很多的人工智能,那就是因为在这个疾病之前,人工智能并没有得到一个普及。包括举个例子,包括现在大家都用视频软件,包括现在的腾讯会议,包括zoom在新冠之前大家并没有运用到,但是新冠实际上是对于这种网上的通讯或者会议进行了一次推广。同样的这次疫情也实际上是对于影像AI这方面进行了一次推广。所以我相信这次疫情之后下次再出现疫情,那么AI技术会在第一时间更快的更及时的来得到一个解决或者应用,这是第一点。第二点就是说新冠从长期上的角度来说,新冠肯定会解决,现在已经基本上国内控制住了。刚才有一些人说要现在开始介入新冠的话,我也会建议他,因为我觉得你不能针对新冠一种病来去设计你所有的职业道路,或者是你的精力放在上面,因为新冠它毕竟属于肺炎的一种。那么其实我们这边做医学经常遇到一个问题,跟医生说的是,医生说你除了一个病以外,还能不能做其他的病?那么这个问题你怎么解决?就是说现在大家习惯这个问题,包括现在已有的国内的一些公司,包括做眼底图像,包括做肺结节,你只针对的一种疾病。那么一是病人如果去医院,我做一个CT扫描,他是希望把CT所有相关的疾病都检测到,那么我觉得这个方面就是说它的普遍性或者是多类的疾病检测,是现在AI的一个短板,当然也有可能是因为是数据方面的局限,也有可能是技术方面或者是不够深入,不够广泛,但是现在大家的算法都是集中在1~2个病,而并不是针对一种成像的所有疾病进行一个筛查。我觉得这个方面才是限制现在的AI系统,真正大范围的部署到医院或者使用的话的一个点。
夏勇:好,谢谢付老师。那么下面我们就这个问题请张长青老师再发表一下意见。
张长青:刚才我说的那两点其实有点相关,我再补充一点就是我非常赞成王乾老师刚才说的,我觉得我们如果真正要想把我们的东西能用得上,可能要从医生的角度,我们做人工智能的怎么样跟医生更好的去结合,但是这个结合其实是非常困难的。医生一般又都非常忙。但是这个确实是非常重要的,无论是cv也好,medical image也好,它都是要面向具体应用的。所以说最终还是医生用,到底有什么样的问题需要解决,我们可能还是要听医生的。
夏勇:好,谢谢张老师,那么下一个王乾老师。
王乾:我觉得其实这次疫情应该是把大家都打了个措手不及,我们其实人一开始也没反应过来,更加别说人工智能了,但是好在我感觉人还是比人工智能强一点的地方,就是人的第二反应马上就上来了,然后人可以采取很多的措施。所以我觉得这里面有一个很重要的事情就是说,我们人工智能在短时间内的这种轻量化的再开发的能力,其实我刚刚前面也提到这一点,就是我们怎么样应对一个突发的情况,用非常有限的资源能够在一个极短的时间内完成一个二次开发,然后重新部署这样的系统。我觉得这个问题可能是以前我们都忽视了,因为我们几乎所有的竞赛都是在无限制的在刷榜,在追求我们的accuracy。除了accuracy之外,我觉得这个东西的实用性也许是值得我们在讨论的一个问题。那么另外一点就是怎么样去跟医生配合,其实我们学校是有非常好的医学院,所以我平时除了跟医生接触以外,还会跟很多的医学院的小年轻的学生、未来的医生去接触。去年我们这里尝试性的给医学院的本科生开了一个人工智能,就是给他们去讲课,讲人工智能讲这些东西,我也就讲了一下,我的总体感受,医生们都异口同声的认为人工智能是个好东西,好的不得了,因为他们天天在医院里面的话,他们的主任都跟他们说人工智能好,我们要写人工智能的paper,你们全搞人工智能去。但是我觉得现在可能医学院的学生对人工智能充满了幻想,有一些不切实际的幻想,我觉得我们也许是要呼吁应该做一些这种人工智能的普及式的教育,不仅仅是对计算机专业的,比如说我是生物医学工程的,在我们生物医学工程做同样的学生会去学人工智能,计算机类的,电力的专业的学生肯定都会学人工智能,这个没错,但有一些比如说医学院的学生,他们也需要接触一些了解一些这方面的背景知识,对我们对这种技术有很高的期待,但是不能有这个不切实际的幻想,我觉得是非常重要的一点。
夏勇:好,谢谢王老师。那么下面请王兴刚老师谈一下您的看法。
王兴刚:对,我觉得上面那个问题新冠不同点,我觉得王乾老师说的跟我的想法其实是一样的。它突发的,它来的很突然,所以关于未来人工智能这样的一个发展,其实我觉得我对王乾老师的刚才那个想法,我提一下我的一个设想,我跟其他的一些医生打过交道,也有像付老师说的,张老师说的那样就很忙。很忙,对,但是他们其实很感兴趣的。所以我报告里面的工作其实是解决王乾老师说的问题,也就是说我们希望能够有一个快速部署,能够快速学习的这样一个高性能的系统。所以我最后在报告里面也讲到自动化机器学习,我在想就是说我们是不是能够给医生做一个机器人AI系统。这个东西可以有一些弱监督的性能,它只需要一些各种各样的标签,他都可以去拿过去学。它有一些基本的组件。另外一个就是说它能够自动去调参,他可以做自动化机器学习,而且它能够适应不同病,反正你把数据传上去就可以了。然后再这样的话,一方面避免的就是,比如说我个人来讲,其实我很多时间都花在纯计算机视觉上面,我可能没有那么多时间去跟医生去聊,当然医生也没时间跟我去聊是吧?所以我们能不能有这么样一个机器一个自动化系统,然后供医生去玩,这个东西他能够玩了之后,他就知道他自己的真实的这样一个预期,真实的想法。当然这个系统可以不断去优化不断部署。最后随着大量的数据来了,甚至数据之间可以互相去借鉴,其实是share这样的一些 feature是吧?是不是能够达到一个终极的这样一个作用,就是他能够去真的自我去训练得到一些比较好的结果。同时它也解决了一些问题,比如说像数据共享的问题,当然据我所知公司跟这些医院合作,其实中间也有很多这样的一些要协议的问题,所以我们是不是能够做一些自主的一些AI的系统给医生去用,我觉得这是不是一个可行的方向,当然我也想听一下各位专家的意见想法。
夏勇:谢谢王老师,王老师的想法非常好,但是听得我冒汗,前几天有一个新闻就是说在化学领域做出了做实验的机器人,然后我在微博上看到有好多同学在讨论这个问题,大家都吓得不得了是吧?有了做实验的机器人同学们怎么办?你知道吧?然后王老师这个想法很好,但是也给我们提出了更高的挑战,我们最后请程明明老师就这个问题发表一下你的态度。
程明明:其实我主要是谈两个,因为刚才各位老师其实说的已经很全面了,主要是谈两个事情,第一个事情,刚才兴刚老师还有夏老师说自动化,这个自动化其实我觉得我们是最不需要担心自动化的一些人。我们人工智能能取代的,或者包括我们做这些系统能够取代的,更多的是一些相对比较重复性的,相对价值不是那么大的工作。我们为什么要那么看重说这些价值不是很大的一些工作的这种取代,既然能够很好地被取代,说明这个东西其实某种意义上来讲,它价值已经不是很大了,除非说我们取代的效果不好,这时候你去做一些更有价值的事情不更好吗?这是第一个事情,我说一下自己的看法。第二个事情我就特别赞同刚才付老师说的一件事情,就是付华柱老师说一个事情,这一次AI系统虽然说也用了,其实更多的还是传统的一些技术传统的方法,然后起的作用更大一些。我觉得这个过程其实并不能说不好或者说怎么着了,更多的原因是说我们之前的AI的普及率并不高,普及率之前太低了,应该有它的优势,但是你不普及它的优势是展现不出来的。特别是这种筛查,其实你说这种疾病的筛查,既然做了一个CT影像,后面到底是能筛查几种疾病?这个主要还是跟后面的系统的建设的程度以及积累的程度有关系,跟你具体的这种筛查的流程是没有关系的。只要接下来的一些筛查系统,它普及率足够高,然后采集到足够多的数据,相对来说我相信中国这么大的市场真的大规模铺开之后,它积累数据的速度还是非常快的。这个非常快之后,可能原来你就只想查个肺结节,上次就只查了一个,结果这个公司系统一升级发现因为你有早期的肺癌,或者说早期的一个什么别的一些胸部的CT能体现出来的癌症,它可能自动发现了,这系统可能就告诉你了,这个不用你再去医院跑一趟。所以我个人觉得就是说人工智能的这些系统在医学影像里边的前景还是非常广阔的,然后你不能因为说现在刚开始用,然后有这样那样的问题,或者说它的作用不是那么明显,你就开始否定它。其实我不知道大家有听过一个故事吗?当年英国人发明汽车的时候,刚开始发明汽车的时候,汽车是怎么开的?后面有个汽车,然后有个司机在那开着,前面有个人骑着马,然后摇个铃铛大家让开,因为很多人没见过汽车,他也不知道该去躲汽车,汽车当时走的速度也很慢,那不是说汽车就没有用了,你看它还不如马快了是吧?前面起码那个人就限制了速度,然后还冒着黑烟,好像没有什么太好的一些东西,但是它是一个新生的事物,当这种新生事物发展到一定的程度,它很有可能会对我们以前的一些工作的模式,工作的效率产生重大的变化,特别是我们现在这些医生们虽然说是很忙,但是他在一天之中的大部分的时间,其实反复的在做一些重复性,他自己也觉得不是很有挑战的工作,他真正去做自己觉得有挑战工作时间其实很有限的,他自己觉得很有意义的时间很有限。然后有了原来的系统,他可能会极大的提升他这种工作的有效性。好,我的分享就到这。
夏勇:好的,谢谢程老师。那么也谢谢各位老师的分享,我们今天的论坛讲的是新冠肺炎的影像诊断,其实这只是医学影像智能分析的很小的一部分一个课题。那么整个医学影像AI的研究现在进展得非常快,也如火如荼。我整体概括各位老师的观点,它的整体研究可能跟其他一些AI的研究相比,有它自己的一些特色,比方说它的信息是有这种uncertainty就是不确定性,因为我们标注的时候不可能做到百分之百,因为标注是极度的依赖于医生的经验,医生的知识,医生的专注,另外也有一些不完美的信息,有些信息我们是没有的,或者是各种原因缺失的。还有一个特点就是它的动态性,像有老师提到的,我们即使拿新冠来说,病人恐怕有一些基础的状况,而且病情发展的过程中,我们也没有办法让所有的人在同一个baseline来做这个检测,所以我们拿到的数据可能每个人的情况是不一样的,而且病情也是在快速的发展变化中的。还有一个特点就是multi-task,我们也许今天研究的只是新冠这一种,可是真正当它走向临床应用的时候,恐怕要能够处理很多不同的疾病。那么同时这也是一个开放领域的问题。因为就像刚才说的,也许有一天一个某冠又会出现,这个是我们之前所没有见到过的,那么最后我们需要非常敏捷的开发,敏捷的部署,要在最短的时间内提出我们的AI的解决方案,因为在像这样的公共卫生危机在初期的时候进行有效的检测追踪和隔离是非常关键的。好的,非常感谢5位老师的精彩分享,也非常感谢屏幕前的各位老师和同学,我们稍微超了一点时间,谢谢大家,依然有耐心跟我们一起做了一些新冠诊断的这种深度的思考。那么大家后续有什么问题也可以继续留下你的问题,然后继续跟我们各位老师一起来探讨。
在正式结束今天的活动之前,我想特别感谢专委会秘书处为这次研讨会的成功举办做了非常多辛苦的准备工作,付出了非常多的努力,也谢谢5位嘉宾,屏幕前的各位听众和观众,谢谢大家,今天我们的论坛到此结束。
推荐内容
More >>>- · 第八十三期CCF-CV走进高校系列报告会于悉尼大学圆满结束
- · 第八十四期CCF-CV走进高校系列报告会于广东石油化工学院圆满结束
- · 第七十三期CCF-CV走进高校系列报告会于苏州科技大学圆满结束
- · 第七十四期CCF-CV走进高校系列报告会于河北大学圆满结束
- · 第七十期CCF-CV走进高校系列报告会于太原理工大学圆满结束
- · 第六十八期CCF-CV走进高校系列报告会于北京信息科技大学圆满结束
- · 第三届计算机视觉及应用创新论坛在广州举办
- · 第一届中国模式识别与计算机视觉大会在广州召开
- · CCF-CV专委会2018年度全体委员会议在广州成功举办
- · 【预告】CCF-CV走进高校系列报告会(第五十八期,广西师范学院)