Yuankai Qi (齐元凯)

BIOGRAPHY:

I am a Lecturer at Macqurie University, and also an Adjunct Lecturer with the Australian Institute for Machine Learning (AIML) of The University of Adelaide. I am looking for highly motivated Ph.D. students and visiting students. Feel free to contact me for PhD and Master (research) supervision.

I received my Ph.D degree from Harbin Institute of Technology (HIT) in 2018, supervised by Prof Qingming Huang. My research interests span computer vision, natural language processing, and speech processing, such vision-language navigation for robots, video captioning, image generation from text, image editing, crowd counting, action recognition, visual object tracking, movie dubbing, and music generation.

See recent publications on Google Scholar: here

Email: yuankai.qi(at)mq.edu.au, qykshr(at)gmail.com

News:

One paper got accepted to ACM MM 2024 Oral (top 3.97%) !

One paper got accepted to ACM Computing Surveys (IF: 23.8) !

One paper got accepted to KBS!

One paper got accepted to PR!

One paper got accepted to ICPR 2024!

One paper got accepted to MICAAI 2024 (top 11%)!

One paper got accepted to ACL 2024!

One paper got accepted to TPAMI!

Three papers got accepted to CVPR 2024!

One paper got accepted to AAAI 2024!

I will join Macquarie University in December! Feel free to contact me for PhD supervision.

APRS ECR Award 2023 Honourable Mention!

One paper got accepted to TPAMI!

One paper got accepted to ACM International Conference on AI in Finance!

Two papers got accepted to ACM MM 2023!

Three papers got accepted to ICCV 2023!

I will serve as the Area Chair for BMVC 2023!

One paper got accepted to TCSVT!

One paper got accepted to TIP!

Two papers got accepted to CVPR 2023!

One paper got accepted to TPAMI 2023!

We are hosting the 2nd REVERIE challenge on ICCV 2021 workshop! More details see here.

Serving as SPC for IJCAI2021!

Honors and Awards:

APRS ECR Award 2023 Honourable Mention
Winner of CAAI Outstanding Doctoral Dissertations, China, 2020 (10 winners across China, link English, Simple Chinese)
Merit PhD Candidate of Heilongjiang Province, China, 2017
Winner of Supreme National Scholarship for PhD Candidates, 2016
VisDrone 2018: Runner-up in the Vision Meets Drones: Single Object Tracking Challenge! [VisDrone2018 results]
DAVIS 2017: Champion in the DAVIS Challenge on Video Object Segmentation 2017! [DAVIS2017 results]
VOT 2016: Our State-and-Scale Aware Tracker (SSAT) achieves the most accurate tracking results among totally 70 trackers on VOT 2016! [ VOT2016 results paper ]

Services:

Area Chair of IJCAI 2021, BMVC 2023
Reviewer of IEEE T-PAMI, T-IP, T-MM, and T-CSVT
Reviewer of ICLR, AAAI, ICCV, ECCV, NeurIPS, CVPR and ACM MM

Selected Publications:

Zhedong Zhang, Liang Li, Gaoxiang Cong, Haibing YIN, Yuhan Gao, Chenggang Yan, Anton van den Hengel, Yuankai Qi: From Speaker to Dubber: Movie Dubbing with Prosody and Duration Consistency Learning, ACM MM 2024, Oral, top 3.97%
Matineh Pooshideh, Amin Beheshti, Yuankai Qi, Helia Farhood, Mike Simpson, Nick Gatland, Mehdi Soltany, "Presentation Attack Detection: A Systematic Literature Review", ACM Computing Surveys (IF: 23.8), 2024.
Yunchuan Ma, Zheng Zhu, Yuankai Qi, Amin Beheshti, Ying Li, Laiyun Qing, Guorong Li: Style-aware two-stage learning framework for video captioning, Knowledge-Based Systems, 2024
Mingkai Tian, Guorong Li, Yuankai Qi, Shuhui Wang, Quan Z Sheng, Qingming Huang: Rethink video retrieval representation for video captioning, PR 2024
Zhedong Zhang, Liang Li, Jiehua Zhang, Zhenghui Hu, Hongkui Wang, Chenggang Yan, Jian Yang, and Yuankai Qi: Generating high-quality Symbolic Music Using Fine-Grined Discriminators, ICPR 2024
Minh Hieu Phan, Yutong Xie, Bowen Zhang, Yuankai Qi, Zhibin Liao, Antonios Perperidis, Son Lam Phung, Johan Verjans, Minh-Son To: Structural Attention: Rethinking Transformer for Unpaired Medical Image Synthesis, MICCAI 2024, early accept, top 11%
Gaoxiang Cong, Yuankai Qi, Liang Li, Amin Beheshti, Zhedong Zhang, Anton van den Hengel, Ming-Hsuan Yang, Chenggang Yan, Qingming Huang: StyleDubber: Towards Multi-Scale Style Learning for Movie Dubbing, ACL 2024 Findings
Xinyan Liu, Guorong Li, Yuankai Qi, Zhenjun Han, Anton van den Hengel, Nicu Sebe, Ming-Hsuan Yang, Qingming Huang: Consistency-Aware Anchor Pyramid Network for Crowd Localization, IEEE TPAMI 2024
Tao Hu, Qingsen Yan, Yuankai Qi, Yanning Zhang: Generating Content for HDR Deghosting from Frequency View. CVPR 2024
Minh Hieu Phan, Yutong Xie, Yuankai Qi, Lingqiao Liu, Liyang Liu, Bowen Zhang, Zhibin Liao, Qi Wu, Minh-Son To, Johan W. Verjans: Decomposing Disease Descriptions for Enhanced Pathology Detection: A Multi-aspect Vision-Language Pre-training Framework. CVPR 2024
Xinyan Liu, Guorong Li, Yuankai Qi, Ziheng Yan, Zhenjun Han, Anton van den Hengel, Ming-Hsuan Yang, Qingming Huang: Weakly Supervised Video Individual Counting. CVPR 2024
Bahram Mohammadi, Yicong Hong, Yuankai Qi, Qi Wu, Shirui Pan, Javen Qinfeng Shi: Augmented Commonsense Knowledge for Remote Object Grounding, AAAI 24
Guorong Li, Hanhua Ye, Yuankai Qi*, Shuhui Wang, Laiyun Qing, Qingming Huang*, Ming-Hsuan Yang: Learning Hierarchical Modular Networks for Video Captioning, IEEE TPAMI 2023, * Corresponding author
Jinan Zou, Yanxi Liu, Yuankai Qi, Haiyao Cao, Lingqiao Liu, Javen Qinfeng Shi: A Generative Approach for Comprehensive Financial Event Extraction at the Document Level, ACM ICAIF 2023
Ziheng Yan, Yuankai Qi, Guorong Li, Xinyan Liu, Weigang Zhang, Ming-Hsuan Yang, Qingming Huang: Progressive Multi-resolution Loss for Crowd Counting, IEEE TCSVT 2023
Shengqin Jiang, Qing Wang, Fengna Cheng, Yuankai Qi, Qingshan Liu: A Unified Object Counting Network with Object Occupation Prior, IEEE TCSVT 2023
Chongjian Ge, Yibing Song, Chao Ma, Yuankai Qi, Ping Luo: Rethinking Attentive Object Detection via Neural Attention Learning, IEEE TIP 2023
Gaoxiang Cong, Liang Li, Yuankai Qi, Zhengjun Zha, Qi Wu, Wenyu Wang, Bin Jiang, Ming-Hsuan Yang, Qingming Huang: Learning to Dub Movies via Hierarchical Prosody Models, CVPR 2023
Chen Zhang, Guorong Li, Yuankai Qi, Shuhui Wang, Laiyun Qing, Qingming Huang, Ming-Hsuan Yang: Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly Supervised Video Anomaly Detection, CVPR 2023
Yanyuan Qiao, Yuankai Qi, Yicong Hong, Zheng Yu, Peng Wang, Qi Wu: HOP+: History-Enhanced and Order-Aware Pre-Training for Vision-and-Language Navigation, IEEE TPAMI, 2023
Weidong Chen, Dexiang Hong, Yuankai Qi, Zhenjun Han, Shuhui Wang, Laiyun Qing, Qingming Huang, Guorong Li: Multi-Attention Network for Compressed Referring Video Object Segmentation, ACM MM, 2022
Wanrong Zhu, Yuankai Qi, Pradyumna Narayana, Kazoo Sone, Sugato Basu, Xin Eric Wang, Qi Wu, Miguel Eckstein, William Yang Wang: Diagnosing Vision-and-Language Navigation: What Really Matters, NAACL, 2022, Oral
Yanyuan Qiao, Yuankai Qi, Yicong Hong, Zheng Yu, Peng Wang, Qi Wu: HOP: History-and-Order Aware Pre-training for Vision-and-Language Navigation, CVPR, 2022, [code]
Qi Chen, Yuanqing Li, Yuankai Qi, Jiaqiu Zhou, Mingkui Tan, Qi Wu: V2C: Visual Voice Cloning, CVPR, 2022, [code]
Hanhua Ye, Guorong Li, Yuankai Qi, Shuhui Wang, Qingming Huang, Ming-Hsuan Yang: Hierarchical Modular Network for Video Captioning, CVPR, 2022, [code]
Dong An, Yuankai Qi, Yan Huang, Qi Wu, Liang Wang, Tieniu Tan: Neighbor-view Enhanced Model for Vision and Language Navigation, ACM MM, 2021, Oral
Yuankai Qi, Zizheng Pan, Yicong Hong, Ming-Hsuan Yang, Anton van den Hengel, Qi Wu: The Road to Know-Where: An Object-and-Room Informed Sequential BERT for Indoor Vision-Language Navigation, ICCV, 2021
Yicong Hong, Qi Wu, Yuankai Qi, C. R. Opazo, Stephen Gould: A Recurrent Vision-and-Language BERT for Navigation. CVPR, 2021, Oral
Yuankai Qi, Shengping Zhang, Feng Jiang, Huiyu Zhou, Dacheng Tao, Xuelong Li, Siamese Local and Global Networks for Robust Face Tracking. IEEE Trans. Image Process. 2020
Yicong Hong, C. R. Opazo, Yuankai Qi, Qi Wu, Stephen Gould, Language and Visual Entity Relationship Graph for Agent Navigation. NeurIPS 2020
Yuankai Qi, Zizheng Pan, Shengping Zhang, Anton van den Hengel, Qi Wu, Object-and-Action Aware Model for Robust Visual Language Navigation, ECCV, 2020, [Code is coming]
Yuankai Qi, Qi Wu, Peter Anderson, Xin Wang, William Yang Wang, Chunhua Shen, Anton van den Hengel, REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments, CVPR, 2020, Oral, [Code]
Yifan Yang, Guorong Li, Yuankai Qi, Qingming Huang, Release the power of online-training for robust visual tracking, AAAI, 2020
Yuankai Qi, Shengping Zhang, Weigang Zhang, Li Su, Qingming Huang, Ming-Hsuan Yang, Learning Attribute-Specific Representations for Visual Tracking, AAAI, 2019, Spotlight
Dawei Du, Yuankai Qi, Hongyang Yu, Yifan Yang, Kaiwen Duan, Guorong Li, Weigang Zhang, Qingming Huang, Qi Tian, The Unmanned Aerial Vehicle Benchmark: Object Detection and Tracking, ECCV, 2018.
Yuankai Qi, Shengping Zhang, Lei Qin, Qingming Huang, Hongxun Yao, Jongwoo Lim, Ming-Hsuan Yang, Hedging Deep Features for Visual Tracking, IEEE Trans. PAMI, 2018.
Yuankai Qi, Lei Qin, Jian Zhang, Shengping Zhang, Qingming Huang, Ming-Hsuan Yang, Structure-aware Local Sparse Coding for Visual Tracking, IEEE Trans. IP, 2018.
Yuankai Qi, Shengping Zhang, Lei Qin, Hongxun Yao, Qingming Huang, Jongwoo Lim, Ming-Hsuan Yang, Hedged Deep Tracking, IEEE CVPR, 2016, [code]
Shengping Zhang, Yuankai Qi, F Jiang, X Lan, PC Yuen, H Zhou, Point-to-Set Distance Metric Learning on Deep Representations for Visual Tracking, IEEE Trans. ITS, 2018
S Zhang, X Lan, Y Qi, P C. Yuen, Robust Visual Tracking via Basis Matching, IEEE Trans. CSVT, 2017.
Yuankai Qi, Shengping Zhang, Lei Qin, Hongxun Yao, Qingming Huang, Jongwoo Lim, Ming-Hsuan Yang, Hedged deep tracking, CVPR, 2016