Xiaojiang Peng's Selected Publications

Full list in Google Scholar

[Representive Publications]

Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning, NeurIPS, 2024. [PDF]
Zebang Cheng, Zhi-Qi Cheng, Jun-Yan He, Jingdong Sun, Kai Wang, Yuxiang Lin, Zheng Lian, Xiaojiang Peng, Alexander Hauptmann
Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer, ACM Multimedia, 2024. [PDF]
Xinpeng Li, Teng Wang, Jian Zhao, Shuyi Mao, Jinbao Wang, Feng Zheng,Xiaojiang Peng, Xuelong Li
Semi-Supervised Multimodal Emotion Recognition with Expression MAE, ACM MM, 2023. [PDF]
Zebang Cheng, Yuxiang Lin, Zhaoru Chen, Xiang Li, Shuyi Mao, Fan Zhang, Daijun Ding, Bowen Zhang, Xiaojiang Peng
Suppressing Mislabeled Data via Grouping and Self-Attention. ECCV, 2020. [PDF] [CODE]
Xiaojiang Peng*, Kai Wang*, Zhaoyang Zeng*, Qing Li, Jianfei Yang, Yu Qiao.
Suppressing Uncertainties for Large-Scale Facial Expression Recognition. CVPR, 2020. [PDF] [CODE]
Kai Wang*,Xiaojiang Peng*, Jianfei Yang, Shijian LV, Yu Qiao.
Region Attention Networks for Pose and Occlusion Robust Facial Expression Recognition. IEEE Transactions on Image Processing, 2020. [PDF] [CODE]
Kai Wang*,Xiaojiang Peng*, Jianfei Yang, Debin Meng, Yu Qiao.
Mutual Component Convolutional Neural Networks for Heterogeneous Face Recognition. IEEE Transactions on Image Processing, 2019. [PDF]
Zhongying Deng*,Xiaojiang Peng*, Yu Qiao.
DF2Net: A Dense-Fine-Finer Network for Detailed 3D Face Reconstruction. ICCV, 2019. [PDF] [CODE]
Xiaoxing Zeng*,Xiaojiang Peng*, Yu Qiao.
Residual Compensation Networks for Heterogeneous Face Recognition. AAAI, 2019. [PDF] [CODE]
Zhongying Deng*,Xiaojiang Peng*, Yu Qiao.
Frankenstein: Learning Deep Face Representations using Small Data. IEEE Transactions on Image Processing, 2018. [PDF]
Guosheng Hu, Xiaojiang Peng, Yongxin Yang, Timothy Hospedales, Jakob Verbeek.
Multi-region two-stream R-CNN for action detection. ECCV, 2016. [PDF] [CODE]
Xiaojiang Peng, Cordelia Schmid.
Bag of Visual Words and Fusion Methods for Action Recognition: Comprehensive Study and Good Practice. Computer Vision and Image Understanding (CVIU), 2016. [PDF]
Xiaojiang Peng, Limin Wang, Xingxing Wang, Yu Qiao.
Action Recognition with Stacked Fisher Vectors. ECCV, 2014. [PDF]
Xiaojiang Peng, Changqing Zou, Yu Qiao, Qiang Peng.

[2025]

miMamba: EEG-Based Emotion Recognition With Multi-Scale Inverted Mamba Models, IEEE TRANSACTIONS ON AFFECTIVE COMPUTING (TAFFC), 2025. [PDF]
Xin Zhou, Dawei Huang, Xiaojiang Peng, Lijun Yin
EA-Vit: Efficient Adaptation for Elastic Vision Transformer, ICCV, 2025. [PDF]
Chen Zhu, Wangbo Zhao, Huiwen Zhang, Yuhao Zhou, Weidong Tang, Shuo Wang, Zhihang Yuan, Yuzhang Shang, Xiaojiang Peng, Kai Wang, Dawei Yang
AffectGPT: A New Dataset, Model, and Benchmark for Emotion Understanding with Multimodal Large Language Models, ICML, 2025. [PDF]
Zheng Lian, Haoyu Chen, Lan Chen, Haiyang Sun, Licai Sun, Yong Ren, Zebang Cheng, Bin Liu, Rui Liu, Xiaojiang Peng, Jiangyan Yi, Jianhua Tao
DREAM: Decoupled Discriminative Learning with Bigraph-aware Alignment for Semi-supervised 2D-3D Cross-modal Retrieval, AAAI, 2025. [PDF]
Fan Zhang, Changhu Wang, Zebang Cheng, Xiaojiang Peng, Dongjie Wang, Yijia Xiao, Chong Chen, Xian-Sheng Hua, Xiao Luo
A Closer Look at Time Steps is Worthy of Triple Speed-Up for Diffusion Model Training, CVPR, 2025. [PDF] [CODE]
Kai Wang, Mingjia Shi, Zekai Li, Yukun Zhou, Zhihang Yuan, Yuzhang Shang, Xiaojiang Peng, Hanwang Zhang, and Yang You
DeformAvatar: Point-Based Human Avatar Re-targeting and Rendering, ICASSP, 2025. [PDF]
Renyi Zhan, Zhi-Qi Cheng, Junyao Chen, and Xiaojiang Peng
UMETTS: A Unified Framework for Emotional Text-to-Speech Synthesis with Multimodal Prompts, ICASSP, 2025. [PDF] [Code]
Xiang Li, Zhi-Qi Cheng, Jun-Yan He, Junyao Chen, Xiaomao Fan, Xiaojiang Peng, and Alexander Hauptmann
Open-Vocabulary Visual Emotion Adaptation via Prompt Learning, ICASSP, 2025. [PDF]
Zhaopan Xu, Sicheng Zhao, Xiaojiang Peng and Hongxun Yao
Enhancing 6D Pose Estimation with Cross-modal Fusion Network and Density Peak Localization, ICASSP, 2025. [PDF]
Liming Zhang, Qing Li, Zhenhong Chen, Chuan Yan, and Xiaojiang Peng

[2024]

sEMG-based Joint Angle Estimation via Hierarchical Spiking Attentional Feature Decomposition Network, IEEE Robotics and Automation Letters, 2024. [PDF]
Xin Zhou, Chuang Lin, Can Wang, and Xiaojiang Peng
Facial Action Units as A Bridge of Joint Dataset Training for Facial Expression Recognition, IEEE Transactions on Multimedia, 2024. [PDF]
Shuyi Mao, Xinpeng Li, Fan Zhang, Xiaojiang Peng, and Yang Yang
A Comprehensive Exploration on Detecting Fake Images Generated by Stable Diffusion, Chinese Conference on Pattern Recognition and Computer Vision (PRCV), 2024. [PDF]
Jingyi Chen, Xiaolong Wang, Zhijian He, Xiaojiang Peng
Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning, NeurIPS, 2024. [PDF]
Zebang Cheng, Zhi-Qi Cheng, Jun-Yan He, Jingdong Sun, Kai Wang, Yuxiang Lin, Zheng Lian, Xiaojiang Peng, Alexander Hauptmann
Invisible Gas Detection: An RGB-Thermal Cross Attention Network and A New Benchmark, Computer Vision and Image Understanding (CVIU), 2024. [PDF]
Jue Wang, Yuxiang Lin, Qi Zhao, Dong Luo, Shuaibao Chen, Wei Chen, Xiaojiang Peng
Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer, ACM Multimedia, 2024. [PDF]
Xinpeng Li, Teng Wang, Jian Zhao, Shuyi Mao, Jinbao Wang, Feng Zheng,Xiaojiang Peng, Xuelong Li
SZTU-CMU at MER2024: Improving Emotion-LLaMA with Conv-Attention for Multimodal Emotion Recognition, ACM Multimedia, 2024. [PDF]
Zebang Cheng, Shuyuan Tu, Dawei Huang, Minghan Li, Xiaojiang Peng, Zhi-Qi Cheng, Alexander G Hauptmann
Graph Attentive Dual Ensemble learning for Unsupervised Domain Adaptation on point clouds, Pattern Recognition, 2024. [PDF]
Qing Li, Chuan Yan, Qi Hao, Xiaojiang Peng, Li Liu
NuwaDynamics: Discovering and Updating in Causal Spatio-Temporal Modeling, ICLR, 2024. [PDF]
Kun Wang, Hao Wu, Yifan Duan, Guibin Zhang, Kai Wang,Xiaojiang Peng, Yu Zheng, Yuxuan Liang, Yang Wang
MIPS at SemEval-2024 Task 3: Conversational Emotion-Cause Pair Analysis with Multimodal LLM, NAACL, 2024. [PDF]
Zebang Cheng, Fuqiang Niu, Yuxiang Lin, Zhi-Qi Cheng, Bowen Zhang,Xiaojiang Peng
A Challenge Dataset and Effective Models for Conversational Stance Detection, COLING, 2024. [PDF]
Fuqiang Niu, Min Yang, Ang Li, Baoquan Zhang, Xiaojiang Peng, Bowen Zhang

[2023]

Semi-Supervised Multimodal Emotion Recognition with Expression MAE, ACM MM, 2023. [PDF]
Zebang Cheng, Yuxiang Lin, Zhaoru Chen, Xiang Li, Shuyi Mao, Fan Zhang, Daijun Ding, Bowen Zhang, Xiaojiang Peng
Real-time UAV Localization and Tracking in Multi-Weather Conditions using Multispectral Image Analysis, IEEE International Conference on Real-time Computing and Robotics (RCAR), 2023. [PDF]
Yuxiang Lin, Xiaojiang Peng, Jiahe Yu, Wei Chen, Yan Wu, and Hu Liu
Cascaded Vehicle Matching and Short-Term Spatial-Temporal Network for Smoky Vehicle Detection, Appl. Sci. 2023, 13(8), 4841. [PDF]
Xiaojiang Peng, Xiaomao Fan, Qingyang Wu, Jieyan Zhao, and Pan Gao
DB-Net: Detecting Vehicle Smoke with Deep Block Networks, Appl. Sci. 2023, 13(8), 4941. [PDF]
Junyao, ChenXiaojiang Peng

[2022]

Rail Detection: An Efficient Row-based Network and A New Benchmark,2022.07,ACM Multimedia. [PDF]
Xinpeng Li,Xiaojiang Peng
Video Frame Interpolation Based on Deformable Kernel Region. IJCAI, 2022. [PDF]
Haoyue Tian, Pan Gao,Xiaojiang Peng
AU-Guided Unsupervised Domain-Adaptive Facial Expression Recognition. Applied Sciences. 2022, 12(9), 4366. [PDF]
Xiaojiang Peng, Yuxin Gu, Panpan Zhang
An Efficient Training Approach for Very Large Scale Face Recognition. CVPR, 2022. [PDF]
Kai Wang, Shuo Wang, Panpan Zhang, Zhipeng Zhou, Zheng Zhu, Xiaobo Wang, Xiaojiang Peng, Hao Li, Yang You
Unsupervised person re-identification with multi-label learning guided self-paced clustering. Pattern Recognition, 2022. (IF: 7.74) [PDF]
Qing Li, Xiaojiang Peng, Yu Qiao, Hao Qi

[2021]

A Comprehensive Study on Temporal Modeling for Online Action Detection. Complex and Intelligent System, 2021. (IF: 4.927) [PDF]
Wen Wang, Xiaojiang Peng, Yu Qiao, Jian Cheng
Sequential Interactive Biased Network for Context-Aware Emotion Recognition. IJCB, 2021. [PDF]
XinPeng Li, Xiaojiang Peng, Changxing Ding
Detecting Human-Object Interaction via Fabricated Compositional Learning. CVPR, 2021. [PDF]
Zhi Hou, Baosheng Yu, Yu Qiao, Xiaojiang Peng, Dacheng Tao
Affordance Transfer Learning for Human-Object Interaction Exploration. CVPR, 2021. [PDF]
Zhi Hou, Baosheng Yu, Yu Qiao, Xiaojiang Peng, Dacheng Tao
TTPP: Temporal Transformer with Progressive Prediction for Efficient Action Anticipation. Neurocomputing, 2021. [PDF]
Wen Wang, Xiaojiang Peng, Yanzhou Su, Yu Qiao, Jian Cheng

[2020]

Learning Category Correlations for Multi-label Image Recognition with Graph Networks. Pattern Recognition Letter, 2020. [BibTeX][PDF]
Qing Li, Xiaojiang Peng, Yu Qiao, Qiang Peng.

BibTeX:

@article{li2020learning,
  title={Learning label correlations for multi-label image recognition with graph networks},
  author={Li, Qing and Peng, Xiaojiang and Qiao, Yu and Peng, Qiang},
  journal={Pattern Recognition Letters},
  volume={138},
  pages={378--384},
  year={2020},
  publisher={Elsevier}
}

Finding Hard Faces with better Proposals and Classifier. Machine Vision Applications, 2020. [BibTeX][PDF]
Xiaoxing Zeng*, Xiaojiang Peng*,Yali Wang, Yu Qiao.

BibTeX:

@article{zeng2020finding,
  title={Finding hard faces with better proposals and classifier},
  author={Zeng, Xiaoxing and Peng, Xiaojiang and Wang, Yali and Qiao, Yu},
  journal={Machine Vision and Applications},
  volume={31},
  number={7},
  pages={1--15},
  year={2020},
  publisher={Springer}
}

Product Image Recognition with Guidance Learning and Noisy Supervision. Computer Vision and Image Understanding (CVIU), 2020. [BibTeX][PDF]
Qing Li, Xiaojiang Peng, Liangliang Cao, Wenbin Du, Hao Xing, Yu Qiao..

BibTeX:

@article{li2020product,
  title={Product image recognition with guidance learning and noisy supervision},
  author={Li, Qing and Peng, Xiaojiang and Cao, Liangliang and Du, Wenbin and Xing, Hao and Qiao, Yu and Peng, Qiang},
  journal={Computer Vision and Image Understanding},
  pages={102963},
  year={2020},
  publisher={Elsevier}
}

Cascade Multi-Head Attention Networks for Action Recognition. Computer Vision and Image Understanding (CVIU), 2020. [BibTeX][PDF]
Jiaze Wang*, Xiaojiang Peng*, Yu Qiao.

BibTeX:

@article{wang2020cascade,
  title={Cascade multi-head attention networks for action recognition},
  author={Wang, Jiaze and Peng, Xiaojiang and Qiao, Yu},
  journal={Computer Vision and Image Understanding},
  volume={192},
  pages={102898},
  year={2020},
  publisher={Elsevier}
}

Suppressing Mislabeled Data via Grouping and Self-Attention. ECCV, 2020. [PDF] [CODE]
Xiaojiang Peng*, Kai Wang*, Zhaoyang Zeng*, Qing Li, Jianfei Yang, Yu Qiao.
Attention-Driven Dynamic Graph Convolutional Network for Multi-Label Image Recognition. ECCV, 2020. [PDF]
Jin Ye*, Junjun He*, Xiaojiang Peng*, Wenhao Wu, Yu Qiao.
Visual Compositional Learning for Human Object Interaction Detection. ECCV, 2020. [PDF] [CODE]
Zhi Hou, Xiaojiang Peng*, Yu Qiao, Dacheng Tao.
Suppressing Uncertainties for Large-Scale Facial Expression Recognition. CVPR, 2020. [PDF] [CODE]
Kai Wang*,Xiaojiang Peng*, Jianfei Yang, Shijian LV, Yu Qiao.
Region Attention Networks for Pose and Occlusion Robust Facial Expression Recognition. IEEE Transactions on Image Processing, 2020. [PDF] [CODE]
Kai Wang*,Xiaojiang Peng*, Jianfei Yang, Debin Meng, Yu Qiao.
Learning Discriminative Representation for Facial Expression Recognition from Uncertainties. ICIP, 2020. [PDF]
Xingyu Fan, Zhongying Deng, Kai Wang, Xiaojiang Peng, Yu Qiao.
Multiple Transfer Learning and Multi-label Balanced Training Strategies for Facial AU Detection In the Wild. CVPRW, 2020. [BibTeX][PDF]
Sijie Ji, Kai Wang, Xiaojiang Peng, Jianfei Yang, Zhaoyang Zeng, Yu Qiao.

BibTeX:

@INPROCEEDINGS{9150797,
  author={S. {Ji} and K. {Wang} and X. {Peng} and J. {Yang} and Z. {Zeng} and Y. {Qiao}},
  booktitle={CVPRW}, 
  title={Multiple Transfer Learning and Multi-label Balanced Training Strategies for Facial AU Detection In the Wild}, 
  year={2020},
  volume={},
  number={},
  pages={1657-1661},
  doi={10.1109/CVPRW50498.2020.00215}}

[2019]

Exploring Emotion Features and Fusion Strategies for Audio-Video Emotion Recognition. International Conference on Multimodal Interaction (ICMI’19) [PDF]
Hengshun Zhou, Debin Meng, Yuanyuan Zhang, Xiaojiang Peng, Jun Du, Kai Wang, Yu Qiao
Exploring Regularizations with Face, Body and Image Cues for Group Cohesion Prediction. International Conference on Multimodal Interaction (ICMI’19) [PDF]
Da Guo, Kai Wang, Jianfei Yang, Kaipeng Zhang, Xiaojiang Peng, Yu Qiao
Bootstrap Model Ensemble and Rank Loss for Engagement Intensity Regression. International Conference on Multimodal Interaction (ICMI’19) [PDF]
Hengshun Zhou, Debin Meng, Yuanyuan Zhang, Xiaojiang Peng, Jun Du, Kai Wang, Yu Qiao
Mutual Component Convolutional Neural Networks for Heterogeneous Face Recognition. IEEE Transactions on Image Processing, 2019. [PDF]
Zhongying Deng*,Xiaojiang Peng*, Yu Qiao.
DF2Net: A Dense-Fine-Finer Network for Detailed 3D Face Reconstruction. ICCV, 2019. [PDF] [CODE]
Xiaoxing Zeng*,Xiaojiang Peng*, Yu Qiao.
Residual Compensation Networks for Heterogeneous Face Recognition. AAAI, 2019. [PDF] [CODE]
Zhongying Deng*,Xiaojiang Peng*, Yu Qiao.
AnoPCN: Video Anomaly Detection via Deep Predictive Coding Network. ACM MultiMedia, 2019. [PDF]
Muchao Ye, Xiaojiang Peng*, Weihao Gan, Wei Wu, Yu Qiao.
Frame Attention Networks for Facial Expression Recognition in Videos. ICIP, 2019. [PDF] [CODE]
Debin Meng, Xiaojiang Peng*, Kai Wang, Yu Qiao.
Visual-Textual Sentiment Analysis in Product Reviews. ICIP, 2019. [PDF]
Jin Ye, Xiaojiang Peng*, Yu Qiao, Hao Xing, Junli Li, Rongrong Ji.
Face Detection, Alignment Alignment, Quality Assessmentand Attribute Analysis with Multi-Task Hybrid Convolutional Neural Networks. ZTE COMMUNICATIONS, 2019. [PDF]
Da GUO, Qingfang ZHENG, Xiaojiang Peng, Ming LIU.
Recurrent Metric Networks and Batch Multiple Hypothesis for Multi-Object Tracking. IEEE Access, 2019. [PDF]
Longtao Chen, Xiaojiang Peng, Mingwu Ren.

[2018 and before]

Deep Recurrent Multi-instance Learning with Spatio-temporal Features for Engagement Intensity Prediction. International Conference on Multimodal Interaction (ICMI’18) [PDF]
Jianfei Yang, Kai Wang, Xiaojiang Peng, Yu Qiao
Cascade Attention Networks For Group Emotion Recognition with Face, Body and Image Cues. International Conference on Multimodal Interaction (ICMI’18) [PDF]
Kai Wang, Xiaoxing Zeng, Jianfei Yang, Debin Meng, Kaipeng Zhang, Xiaojiang Peng, Yu Qiao
Frankenstein: Learning Deep Face Representations using Small Data. IEEE Transactions on Image Processing, 2018. [PDF]
Guosheng Hu, Xiaojiang Peng, Yongxin Yang, Timothy Hospedales, Jakob Verbeek.
Multi-region two-stream R-CNN for action detection. ECCV, 2016. [PDF] [CODE]
Xiaojiang Peng, Cordelia Schmid.
Bag of Visual Words and Fusion Methods for Action Recognition: Comprehensive Study and Good Practice. Computer Vision and Image Understanding (CVIU), 2016. [PDF] [CODE]
Xiaojiang Peng, Limin Wang, Xingxing Wang, Yu Qiao.
Action Recognition with Stacked Fisher Vectors. ECCV, 2014. [PDF]
Xiaojiang Peng, Changqing Zou, Yu Qiao, Qiang Peng.
Boosting VLAD with Supervised Dictionary Learning and High-Order Statistics. ECCV, 2014. [PDF]
Xiaojiang Peng, Limin Wang, Yu Qiao, Qiang Peng.
Multi-View Super Vector for Action Recognition. CVPR, 2014. [PDF]
Zuowei Cai, Limin Wang, Xiaojiang Peng, Yu Qiao.

Xiaojiang Peng

Link

Contact