厦门大学人工智能研究院
孙晓帅

厦门大学    教授,博士生导师,人工智能系系主任

媒体分析与计算实验室

地址:厦门大学翔安校区 西部片区5号楼110-2 邮编:361005

电子邮件:xssun@xmu.edu.cn


 

招生信息

  • 研究生:现招收2025年入学的硕士与博士研究生,欢迎有兴趣的同学加入MAC。
  • 本科生:长期接收对科研有兴趣的本科生加入课题组进行研究或完成毕业设计。
  • 博士后:招收博士后研究人员,福利待遇可详询。
  • 个人信息

    研究方向为多媒体大数据分析与挖掘、深度学习对抗攻防。发表IEEE TPAMI、TIP、TMM、ICCV、CVPR等中国计算机学会A类及JCR一区论文60余篇,谷歌学术引用7000余次,H因子41。主持国家重点研发课题、国家自然科学基金联合基金重点/面上/青年项目、腾讯/百度/网易等企业合作项目。曾获2011年微软学者奖、2020年度福建省科技进步一等奖(第二完成人)、2020年度厦门市科技进步一等奖(第六完成人),2021年度福建省杰出青年科学基金。

    2014年毕业于哈尔滨工业大学计算机应用技术专业,获工学博士学位。2015年9月至2016年12月,在澳大利亚昆士兰大学信息技术与电气工程学院,任博士后研究员。2016年9月至2019年5月在哈尔滨工业大学计算机科学与技术学院任讲师,2019年6月加盟厦门大学信息学院,现任人工智能系教授、系主任。

    研究方向

    代表论文

    1. Jiayi Ji, Haowei Wang, Changli Wu, Yiwei Ma, Xiaoshuai Sun(通讯作者), Rongrong Ji.
      JM3D & JM3D-LLM: Elevating 3D Representation With Joint Multi-Modal Cues.
      IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), doi: 10.1109/TPAMI.2024.3523675. JCR-1区
    2. Ke Sun, Shen Chen, Taiping Yao, Ziyin Zhou, Jiayi Ji, Xiaoshuai Sun(通讯作者), Chia-Wen Lin, Rongrong Ji.
      Towards General Visual-Linguistic Face Forgery Detection.
      IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025, 中国计算机学会A类
    3. Yiwei Ma, Jiayi Ji, Ke Ye, Weihuang Lin, Zhibin Wang, Yonghan Zheng, Qiang Zhou, Xiaoshuai Sun(通讯作者), Rongrong Ji.
      I2EBench: A Comprehensive Benchmark for Instruction-based Image Editing.
      Advances in Neural Information Processing Systems (NeurIPS), 2024, 中国计算机学会A类
    4. Danni Yang, Jiayi Ji, Yiwei Ma, Tianyu Guo, Haowei Wang, Xiaoshuai Sun(通讯作者), Rongrong Ji.
      SAM as the Guide: Mastering Pseudo-Label Refinement in Semi-Supervised Referring Expression Segmentation.
      International Conference on Machine Learning (ICML), 2024, Oral, 中国计算机学会A类
    5. Yiwei Ma, Haowei Wang, Xiaoqing Zhang, Guannan Jiang, Xiaoshuai Sun(通讯作者), Weilin Zhuang, Jiayi Ji, Rongrong Ji.
      X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance.
      IEEE/CVF International Conference on Computer Vision (ICCV), 2023, 中国计算机学会A类
    6. Jingjia Huang, Yinan Li, Jiashi Feng, Xinglong Wu, Xiaoshuai Sun(通讯作者), Rongrong Ji.
      Clover: Towards A Unified Video-Language Alignment and Fusion Model.
      IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023, 中国计算机学会A类
    7. Lei Jin, Gen Luo, Yiyi Zhou, Xiaoshuai Sun(通讯作者) , Guannan Jiang , Annan Shu , Rongrong Ji.
      RefCLIP: A Universal Teacher for Weakly Supervised Referring Expression Comprehension.
      IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023, 中国计算机学会A类
    8. Haowei Wang, Jiayi Ji, Yiyi Zhou, Yongjian Wu, Xiaoshuai Sun(通讯作者).
      Towards Real-Time Panoptic Narrative Grounding by an End-to-End Grounding Network.
      Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2023, 中国计算机学会A类
    9. Mingrui Wu, Jiaxin Gu, Yunhang Shen, Mingbao Lin, Chao Chen, Xiaoshuai Sun(通讯作者).
      End-to-End Zero-Shot HOI Detection via Vision and Language Knowledge Distillation.
      Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2023, 中国计算机学会A类
    10. Yiwei Ma, Guohai Xu, Xiaoshuai Sun(通讯作者), Ming Yan, Ji Zhang, Rongrong Ji.
      X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval.
      ACM International Conference on Multimedia (ACM MM), 2022, 中国计算机学会A类
    11. Jiayi Ji, Yiwei Ma, Xiaoshuai Sun(通讯作者), Yiyi Zhou, Yongjian Wu, Rongrong Ji.
      Knowing What to Learn: A Metric-Oriented Focal Mechanism for Image Captioning.
      IEEE Transactions on Image Processing (TIP), 2022, JCR-1区, 中国计算机学会A类
    12. Mingrui Wu, Xuying Zhang, Xiaoshuai Sun(通讯作者), Yiyi Zhou, Chao Chen, Jiaxin Gu, Xing Sun, Rongrong Ji.
      DIFNet: Boosting Visual Information Flow for Image Captioning.
      IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2022, 中国计算机学会A类
    13. Yiyi Zhou, Tianhe Ren, Chaoyang Zhu, Xiaoshuai Sun(通讯作者), Jianzhuang Liu, Xinghao Ding, Mingliang Xu, Rongrong Ji.
      TRAR: Routing the Attention Spans in Transformer for Visual Question Answering.
      International Conference on Computer Vision (ICCV), 2021, 中国计算机学会A类
    14. Xuying Zhang, Xiaoshuai Sun(通讯作者), Yunpeng Luo, Jiayi Ji, Yiyi Zhou, Yongjian Wu, Feiyue Huang, Rongrong Ji.
      RSTNet: Captioning With Adaptive Attention on Visual and Non-Visual Words.
      IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021, 中国计算机学会A类
    15. Yunpeng Luo, Jiayi Ji, Xiaoshuai Sun(通讯作者), Liujuan Cao, Yongjian Wu, Feiyue Huang, Chia-Wen Lin, Rongrong Ji.
      Dual-Level Collaborative Transformer for Image Captioning.
      Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2021, 中国计算机学会A类

    科研项目

    • 国家重点研发计划(课题), 面向边缘智能计算的分布式存储及高效检索, 2023-12 至 2026-11, 500万元, 在研, 主持
    • 国家自然科学基金委员会, 联合基金重点项目, U22B2051, 强干扰下跨媒体深度感知与可解释性关键技术, 2023-01-01 至2026-12-31, 253万元, 在研, 主持
    • 国家自然科学基金委员会, 面上项目, 62072389, 面向深度学习的对抗攻防技术研究, 2021-01-01 至2024-12-31, 57万元, 在研, 主持
    • 国家自然科学基金委员会, 青年科学基金项目, 61702136, 异构媒体深度分析与跨领域理解, 2018-01-01 至 2020-12-31, 25万元, 结题, 主持
    • 福建省自然科学基金, 杰出青年科学基金项目, 2021J06003, 复杂场景跨媒体内容分析与管控, 2021-11-01 至 2024-11-01, 30万元, 在研, 主持
    • 腾讯科技(上海)有限公司, 校企合作项目,多模态内容理解与生成检测技术, 2024-12 至 2025-12, 50万元, 在研, 主持
    • 腾讯科技(上海)有限公司, 校企合作项目,多模态内容理解与分析技术, 2023-12 至 2024-12, 50万元, 结题, 主持
    • 腾讯科技(上海)有限公司, 校企合作项目,深度模型压缩与加速, 2022-01 至 2023-07, 60万元, 结题, 主持
    • 腾讯科技(上海)有限公司, 校企合作项目,深度模型对抗攻击与防御, 2020-11 至 2021-11, 40万元, 结题, 主持
    • 中国计算机学会-网易, CCF-网易雷火基金, 面向深层多模态理解的可控文图生成研究, 2024-03 至 2025-03, 29.5万元, 在研, 主持
    • 中国计算机学会-百度, CCF-百度松果基金, 面向小样本哈希学习方法的研究, 2020-11 至 2021-11, 15万元, 结题, 主持