近日,人工智能领域顶级学术刊物IEEE Transactions on Pattern Analysis and Machine Intelligence(即IEEE TPAMI,影响因子17.730)接收了厦门大学媒体分析与计算实验室的最新研究成果“Plenty is Plague: Fine-Grained Learning for Visual Question Answering”。 >
IEEE TPAMI,即《IEEE模式分析与机器智能汇刊》,是人工智能、模式识别、计算机视觉及机器学习领域最重要的学术期刊之一,也是目前计算机类别中影响因子最高的期刊(17.730)。在2018年所发布的谷歌学术影响因子中,H5指数为118,H5中位数210,位列所有计算机及人工智能相关期刊首位。
纪荣嵘教授团队的论文提出了一种基于强化学习的细粒度学习策略FG-A1C,旨在通过分析视觉问答任务中的样本多样性及标签的冗余性问题来针对性地挑选训练样本以提高模型的训练效率及减少标记支出。在该方法所提出的细粒度学习框架中,FG-A1C使用一个强化学习代理来自适应地评估模型训练状态、选择对应的训练样本类型,并使用基于主动学习或课程表学习的采样策略对该类型下的样本进行评估,以选择对模型训练帮助最为有效的训练样本。该算法在多个视觉问答数据集上获得优秀的训练效果,能够显著地降低模型训练成本以及标签成本。
图1. 所提出的细粒度学习框架。在训练过程中使用强化学习网络来评估模型状态并进行针对性的样本扩充和选择,以降低模型的训练及标记成本。
该论文由厦门大学媒体分析与计算实验室的周奕毅博士后助理研究员、纪荣嵘教授(通信作者)、孙晓帅副教授、苏劲松副教授,以及西安交通大学孟德宇教授、清华大学高跃副教授和澳大利亚阿德莱德大学沈春华教授等合作完成。该论文也是纪荣嵘教授团队两年内第四篇TPAMI文章,系列研究成果的发布标志着我校在信息学科人工智能研究领域的影响力的逐步提升。本项研究得到了厦门大学“人工智能分析引擎”双一流重大专项的支持、也得到了国家重点研发专项和联合基金重点支持项目的支持。
此外,纪荣嵘教授团队近期还有三篇论文工作被人工智能顶级会议 NIPS (Conference and Workshop on Neural Information Processing Systems) 录取,实现了我校在NIPS国际顶级会议上零的突破。NIPS是深度学习及人工智能领域的顶级会议,CCF推荐A类会议,在2018年谷歌所发布的全学科学术影响因子中排名第54,h5指数为134,h5中位数为221,在人工智能类目下排名第一。