近日,人工智能领域顶级学术刊物International Journal of Computer Vision (即IJCV,  5年影响因子12.389)接收了厦门大学媒体分析与计算实验室的最新研究成果“Hadamard Matrix Guided Online Hashing”。

IJCV,即《国际计算机视觉杂志》,是人工智能、计算机视觉领域最重要的顶级学术期刊之一,每年出版的文章很少同时拥有较高的影响因子(5年影响因子12.389)。

纪荣嵘教授团队的论文提出了一种基于哈达玛矩阵的在线哈希学习技术,可应用于大规模流数据图像的检索任务中。其目标在于不对哈希优化函数添加任何强约束的条件,高效训练流数据环境下的哈希函数,同时学习具有判别性的二值化特征编码。为此,该方法提出的在线哈希更新中,使用哈达玛矩阵作为目标二值化特征编码,哈达玛满足二值化编码所需的正交性、信息最大化等特征。为了解决哈达玛与目标哈希比特位不一致的问题,我们使用LSH(局部敏感哈希)进行哈达玛矩阵的随机投影,并从理论上证明了投影后的编码依然能保持哈达玛的主要特征。接着引入核感知机用于哈希函数单个数据流的更新,实现哈希函数对目标编码的拟合和测试数据的编码预测。最后,我们发现,在流数据的环境中,集承每一轮更新的哈希权重能够更好地保留过去的数据信息,同时学习新数据的特性。该算法在多个图像检索数据集以更低的训练时间开销实现大幅度性能领先于已有的同类算法。相关代码已开源在https://github.com/lmbxmu/mycode.

           

图1 所提的在线哈希学习框架。引入哈达玛矩阵作为目标二值化编码,同时使用核感知机实现单个流数据对哈希函数的更新来拟合哈达玛编码。

             

图2 在流数据环境中,集成学习能更好得让感知机最大化得保留过去的数据信息,同时学习新数据的特性。

该论文由厦门大学媒体分析与计算实验室2018级硕博连读生生林明宝、纪荣嵘教授(通讯作者)、2016级博士生刘弘、孙晓帅副教授、2018级硕士生陈燊和华为诺亚方舟计算机视觉首席科学家田奇等合作完成。本项研究得到了厦门大学“人工智能分析引擎”双一流重大专项的支持、也得到了国家重点研发专项和联合基金重点支持项目的支持。