信通学院本科生在全球计算机视觉顶会CVPR上发表研究成果

2021-09-03 15:17:57

2020 IEEE国际计算机视觉与模式识别会议（IEEE Conference on Computer Vision and Pattern Recognition，简称CVPR）官方公布论文收录结果。我校信息与通信工程学院本科2016级学生王谭在新加坡南洋理工大学Prof. Hanwang Zhang指导和阿里巴巴达摩院的资助下，以*一作者撰写的论文"Visual Commonsense R-CNN"（视觉常识 R-CNN）被CVPR2020接收。这是我校*一位以*一作者在CVPR上发文的本科生。

CVPR是计算机视觉领域的三大世界顶*会议之一。本届CVPR投稿ID破万，zui终收到来自世界各地的有效投稿6656篇，接收1470篇，录取率为22%，为近十年来zui低。会议将于6月16-19日在美国华盛顿召开

王谭同学的论文"Visual Commonsense R-CNN"针对现有的Vision & Language任务所用Up-Down特征存在的bias较大、缺少构建物体与物体之间关系等问题，从因果推断（Causal Inference）的角度出发，利用Judea Pearl等人在2009年提出的"Do"算子和后门调整算法，结合现有的目标检测框架对现实场景中的物体进行干预（Intervention）。其本质可以简单的理解为"Borrow & Put"。

其研究和传统的贝叶斯条件概率对比，通过构建一个字典来把广泛存在于其他图片中的物体"borrow"到当前图片中。然后把借来的物体"put"到X、Y周围和X、Y对比，例如上图中的把 sink、handbag、chair等等移到toilet和person周围，然后通过后门调整公式计算干预后的值。zui后通过一种自监督学习的方式学习到图片局部物体的更好的表征——我们称之为视觉常识特征。

作者在三个zui主要的Vision & Language下游任务中对学习到的特征进行验证，都取得了目前**结果。其中图片描述任务（Image Captioning）更是在Cider上比原先增长了近2个百分点。（提取框架图见图2，详细计算过程可参考文末链接文章）

因果理论是近一年来开始被计算机视觉学术界关注的全新方向和思路。这项研究除了是因果理论在计算机视觉学术界的推广，同时也和当下被广泛关注的自监督学习联系非常紧密。通过自监督学习可以有效地挖掘数据集中的特征信息，为广泛的计算机视觉下游任务提供便利，但是自监督学习缺乏直接的评价指标，需要耗费大量的实验和时间来验证算法的有效性。王谭希望花费了大量精力完成的这项成果能给学术界带来价值。

王谭，在校期间先后荣获国家奖学金、唐立新奖学金。加权平均分92.8，GPA3.99，前两年专业排名综合排名均位列1/450，所修67门课程中有62门90分以上，获得四川省优毕业生称号。于2019年7月前往新加坡南洋理工大学实习。2019年11月，他以*一作者撰写的论文"Matching Images and Text with Multi-modal Tensor Fusion and Re-ranking"（基于多模态张量融合和重排序的图像文本检索）被第27届国际多媒体会议（The 27th ACM International Conference on Multimedia）接收为Oral（大会演讲）论文。2020年1月，他以共同*一作者完成的论文"Cross-Modal Attention with Semantic Consistence for Image-Text Matching"被人工智能1区期刊TNNLS（IEEE Transactions on Neural Networks and Learning Systems）接收。

计算机

(内容来源于网络，由成都海文考研收集整理，具体情况以学校官网为准，侵权必删！)

英语

数学

政治

联报课程

专业硕士

统考专业课

复试调剂

非统考专业课

199管理类联考

396经济类联考

法律硕士

临床医学

翻译硕士

热门推荐

全科钻石卡

公共课钻石卡

线上钻石卡

专业课钻石卡

1对1

热门推荐

集训营

VIP集训营

一对一特训

复试营

体验营

考研数学

联报课程

在职钻石卡

线上钻石卡

信通学院本科生在全球计算机视觉顶会CVPR上发表研究成果

2021-09-03 15:17:57

全网搜索

推荐内容

最近更新

热门关注

相关推荐