首页-厦门大学媒体分析与计算组 MAC-Media Analytics and Computing

研究方向为多媒体大数据分析与挖掘、深度学习对抗攻防。发表IEEE TPAMI、TIP、TMM、ICCV、CVPR等中国计算机学会A类及JCR一区论文百余篇，谷歌学术引用1万+次，H因子50。主持国家重点研发课题、国家自然科学基金联合基金重点/面上/青年项目、福建省杰出青年科学基金、腾讯/百度/网易/快手等企业合作项目。曾获2011年微软学者奖、2020年度福建省科技进步一等奖（第二完成人）、2020年度厦门市科技进步一等奖（第六完成人）、2024年度厦门市科技进步一等奖（第一完成人），入选国家级青年人才（2022年度）及福建省科技创新领军人才（2025年度）。

2014年毕业于哈尔滨工业大学计算机应用技术专业，获工学博士学位。2015年9月至2016年12月，在澳大利亚昆士兰大学信息技术与电气工程学院，任博士后研究员。2016年9月至2019年5月在哈尔滨工业大学计算机科学与技术学院任讲师，2019年6月加盟厦门大学信息学院，现任人工智能系教授、系主任。

Yiwei Ma, Jiayi Ji, Zhipeng Qian, Xiaoshuai Sun(通讯作者), Rongrong Ji.
CoP: Chain of Perception for Referring 3D Instance Segmentation.
International Journal of Computer Vision, In Press. (IJCV), 中国计算机学会A类
Haowei Wang, Jiayi Ji, Tianyu Guo, Yilong Yang, Xiaoshuai Sun(通讯作者), Rongrong Ji
NICE: Improving Panoptic Narrative Detection and Segmentation with Cascading Collaborative Learning
IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 47(10), 8990 - 9004, 2025 中国计算机学会A类
Jiayi Ji, Haowei Wang, Changli Wu, Yiwei Ma, Xiaoshuai Sun(通讯作者), Rongrong Ji.
JM3D & JM3D-LLM: Elevating 3D Representation With Joint Multi-Modal Cues.
IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 47(4), 2475 - 2492, 2025 中国计算机学会A类
Ke Sun, Shen Chen, Taiping Yao, Ziyin Zhou, Jiayi Ji, Xiaoshuai Sun(通讯作者), Chia-Wen Lin, Rongrong Ji.
Towards General Visual-Linguistic Face Forgery Detection.
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025, 中国计算机学会A类
Yiwei Ma, Jiayi Ji, Ke Ye, Weihuang Lin, Zhibin Wang, Yonghan Zheng, Qiang Zhou, Xiaoshuai Sun(通讯作者), Rongrong Ji.
I2EBench: A Comprehensive Benchmark for Instruction-based Image Editing.
Advances in Neural Information Processing Systems (NeurIPS), 2024, 中国计算机学会A类
Danni Yang, Jiayi Ji, Yiwei Ma, Tianyu Guo, Haowei Wang, Xiaoshuai Sun(通讯作者), Rongrong Ji.
SAM as the Guide: Mastering Pseudo-Label Refinement in Semi-Supervised Referring Expression Segmentation.
International Conference on Machine Learning (ICML), 2024, Oral, 中国计算机学会A类
Yiwei Ma, Haowei Wang, Xiaoqing Zhang, Guannan Jiang, Xiaoshuai Sun(通讯作者), Weilin Zhuang, Jiayi Ji, Rongrong Ji.
X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance.
IEEE/CVF International Conference on Computer Vision (ICCV), 2023, 中国计算机学会A类
Jingjia Huang, Yinan Li, Jiashi Feng, Xinglong Wu, Xiaoshuai Sun(通讯作者), Rongrong Ji.
Clover: Towards A Unified Video-Language Alignment and Fusion Model.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023, 中国计算机学会A类
Lei Jin, Gen Luo, Yiyi Zhou, Xiaoshuai Sun(通讯作者) , Guannan Jiang , Annan Shu , Rongrong Ji.
RefCLIP: A Universal Teacher for Weakly Supervised Referring Expression Comprehension.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023, 中国计算机学会A类
Mingrui Wu, Jiaxin Gu, Yunhang Shen, Mingbao Lin, Chao Chen, Xiaoshuai Sun(通讯作者).
End-to-End Zero-Shot HOI Detection via Vision and Language Knowledge Distillation.
Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2023, 中国计算机学会A类
Yiwei Ma, Guohai Xu, Xiaoshuai Sun(通讯作者), Ming Yan, Ji Zhang, Rongrong Ji.
X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval.
ACM International Conference on Multimedia (ACM MM), 2022, 中国计算机学会A类
Mingrui Wu, Xuying Zhang, Xiaoshuai Sun(通讯作者), Yiyi Zhou, Chao Chen, Jiaxin Gu, Xing Sun, Rongrong Ji.
DIFNet: Boosting Visual Information Flow for Image Captioning.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2022, 中国计算机学会A类
Yiyi Zhou, Tianhe Ren, Chaoyang Zhu, Xiaoshuai Sun(通讯作者), Jianzhuang Liu, Xinghao Ding, Mingliang Xu, Rongrong Ji.
TRAR: Routing the Attention Spans in Transformer for Visual Question Answering.
International Conference on Computer Vision (ICCV), 2021, 中国计算机学会A类
Xuying Zhang, Xiaoshuai Sun(通讯作者), Yunpeng Luo, Jiayi Ji, Yiyi Zhou, Yongjian Wu, Feiyue Huang, Rongrong Ji.
RSTNet: Captioning With Adaptive Attention on Visual and Non-Visual Words.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021, 中国计算机学会A类
Yunpeng Luo, Jiayi Ji, Xiaoshuai Sun(通讯作者), Liujuan Cao, Yongjian Wu, Feiyue Huang, Chia-Wen Lin, Rongrong Ji.
Dual-Level Collaborative Transformer for Image Captioning.
Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2021, 中国计算机学会A类

国家重点研发计划(课题), 2023YFB4502804, 面向边缘智能计算的分布式存储及高效检索, 2023-12 至 2026-11, 500万元, 在研, 主持
国家自然科学基金委员会, 联合基金重点项目, U22B2051, 强干扰下跨媒体深度感知与可解释性关键技术, 2023-01-01 至 2026-12-31, 253万元, 在研, 主持
国家自然科学基金委员会, 面上项目, 62072389, 面向深度学习的对抗攻防技术研究, 2021-01-01 至 2024-12-31, 57万元, 结题, 主持
国家自然科学基金委员会, 青年科学基金项目, 61702136, 异构媒体深度分析与跨领域理解, 2018-01-01 至 2020-12-31, 25万元, 结题, 主持
福建省自然科学基金, 杰出青年科学基金项目, 2021J06003, 复杂场景跨媒体内容分析与管控, 2021-11-01 至 2024-11-01, 30万元, 结题, 主持
腾讯科技（上海）有限公司, 校企合作项目, 多模态内容理解与生成检测技术, 2024-12 至 2025-12, 50万元, 在研, 主持
腾讯科技（上海）有限公司, 校企合作项目, 多模态内容理解与分析技术, 2023-12 至 2024-12, 50万元, 结题, 主持
腾讯科技（上海）有限公司, 校企合作项目, 深度模型压缩与加速, 2022-01 至 2023-07, 60万元, 结题, 主持
腾讯科技（上海）有限公司, 校企合作项目, 深度模型对抗攻击与防御, 2020-11 至 2021-11, 40万元, 结题, 主持
中国计算机学会-快手, CCF-快手大模型探索基金, 面向电商场景的大模型驱动智能交互式搜索系统, 2026-02 至 2027-02, 25万元, 在研, 主持
中国计算机学会-网易, CCF-网易雷火基金, 面向深层多模态理解的可控文图生成研究, 2024-03 至 2025-03, 29.5万元, 在研, 主持
中国计算机学会-百度, CCF-百度松果基金, 面向小样本哈希学习方法的研究, 2020-11 至 2021-11, 15万元, 结题, 主持