- ·上一篇文章:哒哒英语发布全新品牌形象 绘制技术与公益合作版图
- ·下一篇文章:讯首次披露QQ看点用户数据,日活超8000万
CVPR 2018中国论文分享会 | 计算机视觉产业界和学术界的对话
觉到,如果有一年时间你不了解这些最新论文就会落后。从另外的角度来说,把论文上面的一些方法拿过来用到实际当中是不是就能解决问题?其实还不是这样的。现在应用发展得非常快,但是在学术领域,对问题的探索很多时候并没有跟上应用的发展。而且,学术论文追求的目标和实际应用的导向还是有差别的。但是,大家通过发表论文、写论文,对整个领域有了全面的理解,等再进入到工业当中,处理各种问题就会游刃有余。何旭明:CVPR我觉得更多的是培养学生如何去做研究,如何去探索一个新的问题,更多的是为研究生或者博士生创造一个环境,大家可以相互交流,尝试各种不同的想法,这是一个培养人才的途径。陈光:其实我们希望培养出的人才具有两种特性,我们希望搞工程、搞应用的人具有学术思维和学术视野,他知道算法能实现什么、不能实现什么,这个时候他根据自己所擅长的专业领域拿着问题去找技术,这样有助于技术可以快速落地。另外我们希望搞研究的人有应用思维,他需要以合理的、正确的方式看待他所掌握的技术和方法,而不是像咱们经常说的拿着锤子找钉子,要从一个需求和应用的视野去看待这些技术和方法。问题六:计算机视觉领域通常会在一个benchmark上刷榜。比如最开始的VOC到ImageNet、COCO或者今年Google Open Images,想请问一下各位老师怎样看待竞赛对学术研究的推动作用?陈光:我觉得从两个方面来看,一个是积极的角度,一个消极的角度。积极的方面是显而易见的,它提供了一个统一的任务,一个大批量的数据,这在以前看是不可想象的,在别的地方可能根本获取不了这么多数据。这个时候,所有的科研单位和所有做研究的人可以站在同一个起跑线上,用同一个任务去PK,这是一件好事。但是反过来看,它也带来了一些消极的因素,这些任务有时候定义得过于狭窄。当任务和评价已经确定的情况下,大家的想象力就会受到限制。现在这种评测大家在刷榜的时候可能更多的是做工程性的优化。当大家在用更多工程上的工作去拟合这样一些确定任务的时候,其实已经限制了我们在更广泛的、更大的领域里面做更有通用性的工作的想象力。所以我在这里呼吁,设计这些任务和题目的人能够更多地去考虑模型可解释性等、效率、实用和通用泛化等问题。王晓刚:我补充一点对于审论文的影响。有benchmark和datasets可能让评审工作变得比较容易。对于一些好的、有创新性的想法,或者是一些新的问题,如果没有benchmark可以衡量,这些论文不容易被注意到。有了benchmark,这个领域会迅速产生大量的论文。并不是说这个领域的问题一定很重要,或者这个领域已经取得了很大进展,是因为有了benchmark,大家比较容易发论文,比较容易做评审。当然,这也是后面需要去纠正的一个问题。王井东:Benchmark对计算机视觉近几年的发展起了很大的作用。为什么深度学习今天有这么多人关注?很大程度上是由于当年的ImageNet数据集以及深度学习和GPU的发展,促进了这个领域的发展,带动了很多计算机视觉初创公司的发展。从这个意义上来讲,benchmark对计算机视觉的积极意义是非常大的。但是从另外一个角度来讲,你必须要在benchmark,例如ImageNet等数据集上做出一些结果出来,你的研究才有可能会被认可。从这种意义上来说对计算机视觉还是有一点负作用,这个其实可能影响了整个领域的大的发展,埋没了一些好的东西。因此,不能完全依靠benchmark来评价一个方法或者算法的好坏。问题七:很多高校的计算能力可能无法跟大公司相比,很难在ImageNet或者是其它数据集上做出一个好的结果。面对相对有限的计算能力,高校应该怎么办?王晓刚:现在有一种趋势,学校和工业界的结合越来越紧密,企业会开放更多的资源给到老师们。另外,学校不应该单纯地以拼计算资源来取胜,或者说整个社区不应该以计算资源为导向。如果只是关注在benchmark上的排名,我们还需不需要reviewer了?将来是不是机器来评判就可以了呢?陈光:我觉得这个问题是一个挺有意义的问题,关系到我们怎么思考未来技术的发展的。从算力的角度来说,学校肯定是拼不过公司的。那怎么样做突破呢?其实在迁移学习,包括强化学习的方向,学校是可以做更多思考的。我想将来一定会有一些相对通用的模型或者泛化能力比较好的模型能够通过迁移解决一个跨领域的问题,通过迁移学习会减少很多算力和成本的消耗,所以我期待在高校里面能够把迁移学习发扬光大。童欣:我觉得做研究其实解决的是两个问题:第一个问题是how,就是到底怎么解决这个问题?另一个问题是why,我觉得这是最根本的问题。很多时候学生会跟我说,“老师,我们的模型又提高了2个点,咱们快点写文章吧。”不是说提高了2个点就要写文章,我们要解决的是why——这个模型为什么提高了2个点?我用别的方法行不行?短期内大家还在关注how,能够靠算力提高了2点,大家就会觉得很了不起。但是我觉得很快大家就会到饱和的程度,最后大家做研究还是要回到why的问题,这个东西不仅仅是靠大量的算力能解决的问题,还得靠智力。我觉得这个可能是学校可以更多地发力和好好研究的地方。问题八:下一个阶段计算机视觉的研究热点是什么?凌海滨:从特定角度来讲,计算机视觉现在就是两个方向——深度学习和非深度学习。深度学习方向我有一点担心,我的担心倒不是这个方向做不好,而是如果这个方向继续走下去,到底计算机视觉这个领域是深度学习的一个应用,还是一个单独的领域?当然这个并不一定是坏事。目前我感觉深度学习在计算机视觉这边发力还不太够的地方就是偏几何理解的这分,比如说三维重建这方面,好像目前并没有产生特别好的结果。纯计算机视觉的研究热点,我觉得还是在几何这方面的研究。大的算法框架最近几年没有看到很大的进展。我觉得这个是视觉比较基础的问题,是比较值得研究的。跟深度学习有关的研究,我个人比较关心的一个问题是时序上的建模。大家可以看到现在深度学习在视频上做得还没有那么强。目前我没有看到类似于RNN网络的架构来很好地对视频自然地end-to-end建模的,网络模型更多的是对中间的特征进行一些建模(即特征提取)。另外一个我关心的是多模态融合的问题。因为随着计算机视觉越来越成熟之后,有一些计算机视觉解决不了的问题慢慢就会更多地依赖于多个传感器之间的相互保护和融合,比如说拿手机做三维重建,以前视觉做视觉的,IMU的做IMU的,但是现在大家说这两个各有优缺点,怎么样把它们深度的融合起来会比较好。这方面已经有不少很好的工作。我觉得这个可能也是计算机视觉后面需要更多研究的方向。了解更多CVPR 2018论文分享会的精彩内容,请点击【阅读原文】或访问以下网址:http://shangzhibo.tv/watch/5833145
CVPR 2018中国论文分享会 | 计算机视觉产业界和学术界的对话