我院纪荣嵘教授课题组于国际计算机视觉期刊发表在线哈希学习新方法
发布时间:2020-05-10 点击:

Springer出版集团旗下International Journal of Computer Vision期刊,近日发表我院人工智能系纪荣嵘教授课组的论文《Hadamard Matrix Guided Online Hashing》。

视觉相似度检索,不仅是计算机视觉领域的基础研究难题,也在人工智能爆发下在信息社会中有广泛的应用场景,比如交通系统中车辆的定位、网购中的相似性商品查找、公安系统中的嫌疑人搜索等。近年来人工智能领域中的视觉哈希编码技术是实现相似性检索的有效途径,然而以微信为代表的社交平台,每天都会产生十几亿甚至上百亿的流数据网络图片;以抖音为代表的短视频平台,每天上传网络的视频片段可达几百万,互联网的兴起为相似图片/视频等的检索学习带来了巨大挑战。

 

图:网络数据流源源不断地产生使得数据库急剧增长,在线哈希学习成为减少视觉哈希编码复杂度不可或缺的技术途径。

 

纪荣嵘课题组研究发现,视觉哈希编码的检索问题在训练阶段可以转化为图像/视频等的分类问题,并提出了一套解决大规模流数据问题的在线哈希编码方案,不同于传统的方法,该方案进行哈希编码的时候仅仅只需要利用当前阶段的流数据,因此学习效率在每一阶段都是恒等的。为此,我们把具有正交性质的哈达玛矩阵作为同一类流数据的目标编码,目标编码进一步作为感知机的虚拟类别来学习分类器。由于目标编码是已知的,我们不需要去设计很复杂的约束性条件。相比于目前已有的最佳方法,所题方案以更少的训练时间,在不同的数据集下获得10%30%的精度增长,该技术可应用于大规模城市视觉目标布控、特定网络产品查找等。

International Journal of Computer Vision (IJCV),即《国际计算机视觉杂志》,是人工智能领域最重要的顶级学术期刊之一,每年出版的文章数量很少同时拥有较高的影响因子(5年影响因子为12.389)。

以上研究工作得到国家自然科学基金和国家重点研发计划等的长期支持。

论文链接:https://doi.org/10.1007/s11263-020-01332-z,相关代码已开源:https://github.com/lmbxmu/mycode