Yixin Cao Homepage

I am a pre-tenured professor with Fudan University. Before that, I was an assistant professor of Singapore Management University. Also, he worked as a research assistant professor of Nanyang Technology University and a research fellow with NExT++, National University of Singapore (NUS). I received my Ph.D. in Computer Science from Tsinghua University in 2018. I have published over 60 top tier conference papers, which received over 6,000 google citations. I obtains ACL2023 best paper nomination, Frontiers of Science Award at ICBS2023, Lee Kong Chian Fellowship, Google South Asia & Southeast Asia Awards, and AI2000 most influential scholar award honorable mention. I serves ACL 2024 demo chair, WWW2024 organizing committee, area chairs for ACL2023, EMNLP2023, etc..

Research Area: Natural Language Processing, Knowledge Engineering, Multi-modal information processing.

Recent Research Interests: Auto-evaluation of LLMs, LLM reasoning ability, RAG.

I am looking for highly motivated PhD students and other type of research staff, feel free to drop me your CV.

Publications [Google Scholar] [DBLP]

2024

Automating Dataset Updates Towards Reliable and Timely Evaluation of Large Language Models. Jiahao Ying, Yixin Cao, Bo Wang, Wei Tang, Yizhe Yang, Shuicheng Yan. Arxiv.
MMLONGBENCH-DOC: Benchmarking Long-context Document Understanding with Visualizations. Yubo Ma, Yuhang Zang, Liangyu Chen, Meiqi Chen, Yizhu Jiao, Xinze Li, Xinyuan Lu, Ziyu Liu, Yan Ma, Xiaoyi Dong, Pan Zhang, Liangming Pan, Yu-Gang Jiang, Jiaqi Wang, Yixin Cao, Aixin Sun. Arxiv.
Meaningful Learning: Advancing Abstract Reasoning in Large Language Models via Generic Fact Guidance. Kai Xiong, Xiao Ding, Ting Liu, Bing Qin, Dongliang Xu, Qing Yang, Hongtao Liu, Yixin Cao. Arxiv.
LLMs-as-Instructors: Learning from Errors Toward Automating Model Improvement. Jiahao Ying, Mingbao Lin, Yixin Cao, Wei Tang, Bo Wang, Qianru Sun, Xuanjing Huang, Shuicheng Yan. Arxiv.
SciAgent: Tool-augmented Language Models for Scientific Reasoning. Yubo Ma, Zhibin Gou, Junheng Hao, Ruochen Xu, Shuohang Wang, Liangming Pan, Yujiu Yang, Yixin Cao, Aixin Sun, Hany Awadalla, Weizhu Chen. Arxiv.
LLMs Assist NLP Researchers: Critique Paper (Meta-)Reviewing. Arxiv.
Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding. Zhihan Zhang, Yixin Cao, Chenchen Ye, Yunshan Ma, Lizi Liao, Tat-Seng Chua. ACL 2024.
Intuitive or Dependent? Investigating LLMs' Behavior Style to Conflicting Prompts. Jiahao Ying, Yixin Cao, Kai Xiong, Yidong He, Long Cui, Yongbin Liu. ACL 2024.
Planning Like Human: A Dual-process Framework for Dialogue Planning. Tao He, Lizi Liao, Yixin Cao, Yuanxing Liu, Ming Liu, Zerui Chen, Bing Qin. ACL 2024.
Improving Large Language Models in Event Relation Logical Prediction. Meiqi Chen, Yubo Ma, Kaitao Song, Yixin Cao, Yan Zhang, Dongsheng Li. ACL 2024.
Complex Logical Query Answering by Calibrating Knowledge Graph Completion Models. Changyi Xiao, Yixin Cao. ACL Findings 2024.
A + B: A General Generator-Reader Framework for Optimizing LLMs to Unleash Synergy Potential. Wei Tang, Yixin Cao, Jiahao Ying, Bo Wang, Yuyue Zhao, Yong Liao, Pengyuan Zhou. ACL Findings 2024.
Finding and Editing Multi-Modal Neurons in Pre-Trained Transformers. Haowen Pan, Yixin Cao, Xiaozhi Wang, Xun Yang, Meng Wang. ACL Findings 2024.
Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model Attribution. Xinze Li, Yixin Cao, Liangming Pan, Yubo Ma, Aixin Sun. ACL findings 2024.
Recognizing Everything from All Modalities at Once: Grounded Multimodal Universal Information Extraction. Meishan Zhang, Hao Fei, Bin Wang, Shengqiong Wu, Yixin Cao, Fei Li, Min Zhang. ACL Findings 2024.
Event-level Knowledge Editing. Hao Peng, Xiaozhi Wang, Chunyang Li, Kaisheng Zeng, Jiangshan Duo, Yixin Cao, Lei Hou, Juanzi Li. Arxiv.
HoGRN: Explainable Sparse Knowledge Graph Completion via High-order Graph Reasoning Network. Weijian Chen, Yixin Cao, Fuli Feng, Xiangnan He, Yongdong Zhang. TKDE 2024.
X-eval: Generalizable multi-aspect text evaluation via augmented instruction tuning with auxiliary evaluation aspects. Minqian Liu, Ying Shen, Zhiyang Xu, Yixin Cao, Eunah Cho, Vaibhav Kumar, Reza Ghanadan, Lifu Huang. NAACL 2024.
Screening through a broad pool: Towards better diversity for lexically constrained text generation. Changsen Yuan, Heyan Huang, Yixin Cao, Qianwen Cao. Information Processing & Management.
VEM^2L: an easy but effective framework for fusing text and structure knowledge on sparse knowledge graph completion. Tao He, Ming Liu, Yixin Cao, Meng Qu, Zihao Zheng, Bing Qin. Data Mining and Knowledge Discovery.
Exploring & Exploiting High-Order Graph Structure for Sparse Knowledge Graph Completion. Tao He, Ming Liu, Yixin Cao, Zekun Wang, Zihao Zheng, Zheng Chu, Bing Qin. Frontiers of Computer Science

2023

A Comprehensive Evaluation of Large Language Models on Legal Judgment Prediction. Ruihao Shui, Yixin Cao, Xiang Wang, Tat-Seng Chua. EMNLP Findings 2023.
CoVariance-based Causal Debiasing for Entity and Relation Extraction. Lin Ren, Yongbin Liu, Yixin Cao, Chunping Ouyang. EMNLP Findings 2023.
MolCA: Molecular Graph-Language Modeling with Cross-Modal Projector and Uni-Modal Adapter. Zhiyuan Liu, Sihang Li, Yanchen Luo, Hao Fei, Yixin Cao, Kenji Kawaguchi, Xiang Wang, Tat-Seng Chua. EMNLP 2023.
Robust Prompt Optimization for Large Language Models Against Distribution Shifts. Moxin Li, Wenjie Wang, Fuli Feng, Yixin Cao, Jizhi Zhang, Tat-Seng Chua. EMNLP 2023.
Benchmarking Foundation Models with Language-Model-as-an-Examiner. Yushi Bai, Jiahao Ying, Yixin Cao, Xin Lv, Yuze He, Xiaozhi Wang, Jifan Yu, Kaisheng Zeng, Yijia Xiao, Haozhe Lyu, Jiayin Zhang, Juanzi Li, Lei Hou. NeurIPs 2023.
Examining the Inter-Consistency of Large Language Models: An In-depth Analysis via Debate. Kai Xiong, Xiao Ding, Yixin Cao*, Ting Liu, Bing Qin. EMNLP Findings 2023.
Large Language Model Is Not a Good Few-shot Information Extractor, but a Good Reranker for Hard Samples! Yubo Ma, Yixin Cao*, YongChing Hong, Aixin Sun. EMNLP Findings 2023.
FollowupQG: Towards information-seeking follow-up question generation. Yan Meng, Liangming Pan, Yixin Cao and Min-Yen Kan. AACL 2023.
Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic Role Labeling. Yu Zhao, Hao Fei, Yixin Cao, Bobo Li, Meishan Zhang, Jianguo Wei, Min Zhang, Tat-Seng Chua. ACM MM2023.
Context-aware Event Forecasting via Graph Disentanglement. Yunshan Ma, Chenchen Ye, Zijian Wu, Xiang Wang, Yixin Cao, and Tat-Seng Chua. KDD2023.
Document-level Relation Extraction via Separate Relation Representation and Logical Reasoning. Heyan Huang, Changsen Yuan, Qian Liu, and Yixin Cao. TOIS2023.
Information Screening whilst Exploiting! Multimodal Relation Extraction with Feature Denoising and Multimodal Topic Modeling. Shengqiong Wu, Hao Fei, Yixin Cao, Lidong Bing and Tat-Seng Chua. ACL2023. Best Paper nomination.
Discriminative Reasoning with Sparse Event Representation for Document-level Event-Event Relation Extraction. Changsen Yuan, Heyan Huang, Yixin Cao and Yonggang Wen. ACL2023.
CHEER: Centrality-aware High-order Event Reasoning Network for Document-level Event Causality Identification. Meiqi Chen, Yixin Cao, Yan Zhang and Zhiwei Liu. ACL2023.
Take a Break in the Middle: Investigating Subgoals towards Hierarhical Script Generation. Xinze Li, Yixin Cao*, Muhao Chen and Aixin Sun. Findings of ACL2023.
Few-shot Event Detection: An Empirical Study and a Unified View. Yubo Ma, Zehao Wang, Yixin Cao* and Aixin Sun. ACL2023.
Knowledge Graph Embedding by Normalizing Flows. Changyi Xiao, Xiangnan He, Yixin Cao. AAAI2023

2022

R2F: A General Retrieval, Reading and Fusion Framework for Document-level Natural Language Inference. Hao Wang, Yixin Cao*, Yangguang Li, Zhen Huang, Kun Wang, Jing Shao. EMNLP2022
ERGO: Event Relational Graph Transformer for Document-level Event Causality Identification. Meiqi Chen, Yixin Cao, Kunquan Deng, Mukai Li, Kun Wang, Jing Shao, Yan Zhang. COLING2022.
ICLEA: Interactive Contrastive Learning for Self-supervised Entity Alignment. Kaisheng Zeng, Zhenhao Dong, Lei Hou, Yixin Cao, Minghao Hu, Jifan Yu, Xin Lv, Juanzi Li, Ling Feng. CIKM2022.
TGDM: Target Guided Dynamic Mixup for Cross-Domain Few-Shot Learning. Linhai Zhuo, Yuqian Fu, Jingjing Chen, Yixin Cao, Yu-Gang Jiang. MM2022
DocEE: A Large-Scale and Fine-grained Benchmark for Document-level Event Extraction. Meihan Tong, Bin Xu, Shuai Wang, Meihuan Han, Yixin Cao, Jiangqi Zhu, Siyu Chen, Lei Hou, Juanzi Li. NAACL2022.
What Makes The Story Forward? Inferring Commonsense Explanations as Prompts for Future Event Generation. Lin Li, Yixin Cao*, Lifu Huang, Shu'ang Li, Lijie Wen. SIGIR2022.
MMEKG: Multi-modal Event Knowledge Graph towards Universal Representation across Modalities. Yubo Ma†, Zehao Wang†, Mukai Li†, Yixin Cao†*, Meiqi Chen, Xinze Li, Wenqi Sun, Kunquan Deng, Kun Wang, Aixin Sun, Jing Shao. ACL2022 Demo.
Do Pre-trained Models Benefit Knowledge Graph Completion? A Reliable Evaluation and a Reasonable Approach. Xin Lv, Yankai Lin, Yixin Cao, Lei Hou, Juanzi Li, Zhiyuan Liu, Peng Li, Jie Zhou. ACL2022 Finding.
Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction. Yubo Ma† , Zehao Wang† , Yixin Cao*, Mukai Li, Meiqi Chen, Kun Wang, Jing Shao. ACL2022.
Debiasing NLU Models via Causal Intervention and Counterfactual Reasoning. Bing Tian, Yixin Cao, Yong Zhang, Chunxiao Xing. AAAI2022.

2021

Missing Data Imputation for Solar Yield Prediction using Temporal Multi-Modal Variational Auto-Encoder. Meng Shen, Huaizheng Zhang, Yixin Cao, Fan Yang, Yonggang Wen. MM2021.
Is Multi-Hop Reasoning Really Explainable? Towards Benchmarking Reasoning Interpretability. Xin Lv, Yixin Cao, Lei Hou, Juanzi Li, Zhiyuan Liu, Yichi Zhang, Zelin Dai. EMNLP2021.
Learning Relation Prototype from Unlabeled Texts for Long-tail Relation Extraction. Yixin Cao, Kuang Jun, Ming Gao, Aoying Zhou, Yonggang Wen and Tat-Seng Chua. TKDE2021.
Are Missing Links Predictable? An Inferential Benchmark for Knowledge Graph Completion. Yixin Cao, Xiang Ji, Xin Lv, Juanzi Li, Yonggang Wen and Hanwang Zhang. ACL2021.
How does Knowledge Graph and Attention Help? A Qualitative Analysis into Bag-level Relation Extraction. Zikun Hu, Yixin Cao*, Lifu Huang and Tat-Seng Chua. ACL2021.
Learning from Miscellaneous Other-Class Words for Few-shot Named Entity Recognition. Meihan Tong, Shuai Wang, Bin Xu, Yixin Cao, Minghui Liu, Lei Hou and Juanzi Li. ACL2021.

2020

Tree-augmented Cross-Modal Encoding for Complex-Query Video Retrieval. Xun Yang, Jianfeng Dong, Yixin Cao, Xun Yang, Meng Wang and Tat-Seng Chua. SIGIR2020.
Exploring and Evaluating Attributes, Values, and Structure for Entity Alignment. Zhiyuan Liu, Yixin Cao*, Liangming Pan, Juanzi Li, Zhiyuan Liu and Tat-Seng Chua. EMNLP2020.
Expertise Style Transfer A New Task Towards Better Communication between Experts and Laymen. Yixin Cao, Ruihao Shui, Liangming Pan, Min-Yen Kan, Zhiyuan Liu and Tat-Seng Chua. ACL2020.
Improving Event Detection via Open-domain Event Trigger Knowledge. Mei Han Tong, Shuai Wang, Yixin Cao*, Bin Xu, Lei Hou, Juanzi Li and Jun Xie. ACL2020.
Reinforced Negative Sampling over Knowledge Graph for Recommendation. Xiang Wang, Yaokun Xu, Xiangnan He, Yixin Cao, Meng Wang and Tat-Seng Chua. WWW2020.
Image Enchanced Event Detection in News Articles. Meihan Tong, Shuai Wang, Yixin Cao, Bin Xu, Juanzi Li, Lei Hou, Tat-Seng Chua. AAAI2020.
DSEL: A Domain-specific Entity Linking System. Xinru Zhang, Huifang Xu, Yixin Cao*, Yuanpeng Tan, Lei Hou, Juanzi Li, Jiaxin Shi. JIST2020.
Improving Neural Relation Extraction with Implicit Mutual Relations. Jun Kuang, Yixin Cao, Jianbing Zheng, Xiangnan He, Ming Gao, Aoying Zhou. ICDE2020.

2019

Low-Resource Name Tagging Learned with Weakly Labeled Data. Yixin Cao, Zikun Hu, Tat-seng Chua, Zhiyuan Liu and Heng Ji. EMNLP2019.
Semi-supervised Entity Alignment via Joint Knowledge Embedding Model and Cross-graph Model. Chengjiang Li, Yixin Cao*, Lei Hou, Jiaxin Shi, Juanzi Li and Tat-Seng Chua. EMNLP2019.
Who, Where, and What to Wear? Extracting Fashion Knowledge from Social Media. Yunshan Ma, Xun Yang, Lizi Liao, Yixin Cao and Tat-seng Chua. MM2019.
Personalized Fashion Recommendation with Visual Explanations based on Multimodal Attention Network: Towards Visually Explainable Recommendation. Xu Chen, Hanxiong Chen, Hongteng Xu, Yongfeng Zhang, Yixin Cao, Zheng Qin, Hongyuan Zha. SIGIR2019.
Explainable reasoning over knowledge graphs for recommendation. Xiang Wang, Dingxian Wang, Canran Xu, Xiangnan He, Yixin Cao, Tat-Seng Chua. AAAI2019.
Multi-Channel Graph Neural Network for Entity Alignment. Yixin Cao, Zhiyuan Liu, Chengjiang Li, Juanzi Li, Tat-Seng Chua. ACL2019.
KGAT: Knowledge Graph Attention Network for Recommendation. Xiang Wang, Xiangnan He, Yixin Cao, Meng Liu, Tat-Seng Chua. KDD2019.
Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of User Preferences. Yixin Cao, Xiang Wang, Xiangnan He, Zikun Hu, Tat-Seng Chua. WWW2019.

2018

Joint Representation Learning of Cross-lingual Words and Entities via Attentive Distant Supervision. Yixin Cao, Lei Hou, Juanzi Li, Zhiyuan Liu, Chengjiang Li, Xu Chen, Tiansi Dong. EMNLP2018.
Neural collective entity linking. Yixin Cao, Lei Hou, Juanzi Li, Zhiyuan Liu. COLING2018.
Category Multi-Representation: A Unified Solution for Named Entity Recognition in Clinical Texts. Jiangtao Zhang, Juanzi Li, Shuai Wang, Yan Zhang, Yixin Cao, Lei Hou, Xiao-Li Li. PAKDD2018.
Is a Common Phrase an Entity Mention or Not? Dual Representations for Domain-Specific Named Entity Recognition. Jiangtao Zhang, Juanzi Li, Xiao-Li Li, Yixin Cao, Lei Hou, Shuai Wang. DASFAA2018.
Sequential recommendation with user memory networks. Xu Chen, Hongteng Xu, Yongfeng Zhang, Jiaxi Tang, Yixin Cao, Zheng Qin, Hongyuan Zha. WSDM2018.

2017

On Modeling Sense Relatedness in Multi-prototype Word Embedding. Yixin Cao, Jiaxin Shi, Juanzi Li, Zhiyuan Liu, Chengjiang Li. IJCNLP2017.
XLink: An unsupervised bilingual entity linking system. Jing Zhang, Yixin Cao, Lei Hou, Juanzi Li, Hai-Tao Zheng. CCL2017.
Bridge text and knowledge by learning multi-prototype entity mention embedding. Yixin Cao, Lifu Huang, Heng Ji, Xu Chen, Juanzi Li. ACL2017.

2015

Target Detection and Knowledge Learning for Domain Restricted Question Answering. Mengdi Zhang, Tao Huang, Yixin Cao, Lei Hou. NLPCC2015.
Name list only? target entity disambiguation in short texts. Yixin Cao, Juanzi Li, Xiaofei Guo, Shuanhu Bai, Heng Ji, Jie Tang. EMNLP2015.

Invited Talk

From Evaluation To Understanding: Auto-benchmarking (Multi-modal) LLMs and Beyond

The Chinese University of Hong Kong [slides]
The Web Conference (WWW) 2024

Trustworthy NLP with knowledge guidance.

Renmin University, USTC, Fudan University [slides]
WSDM 2023

Multi-modal Event Knowledge Graph [slides]

CCKS 2022 invited talk
Tsinghua University seminar

Introduction to Knowledge Graph [Slides]

MITB AI seminar

Self-guided Universal Knowledge Graph Construction. [Slides]

HIT, Oct, 2021
UIUC, Sep, 2021
SMU, Aug, 2021

Domain Specific Knowledge Graph Construction: Towards Wellness Applications

NExT++ workshop, NUS, Singapore, 2019.
6Estates, Singapore, 2018.

Professional Services

Program Chair: ACL system demo track 2024.

Senior Area Chair: AACL 2022

Area Chair: ACL 2023, AACL 2023, CCL 2023

SI Chair: Artificial Intelligence Technology.

Local Chair: WSDM 2023, WWW 2024.

Editorial Board: Frontiers in Big Data

Senior Program Committee Member of IJCAI 2021

Program Committee Member of ICLR 2022.

Program Committee Member of ICML 2021.

Program Committee Member of WWW 2021, 2022.

Program Committee Member of AAAI 2020, 2021, 2022

Program Committee Member of NeurIPs 2020, 2021

Program Committee Member of COLING 2020.

Program Committee Member of EMNLP 2019, 2020, 2021

Program Committee Member of ACL 2019, 2020, 2021

Program Committee Member of NAACL 2019. 2020, 2021

Program Committee Member of CCKS 2019, 2020, 2021

Program Committee Member of NLPCC 2020, 2021

Program Committee Member of ICKG 2019.

Program Committee Member of IJCKG 2021.

Invited Reviewer of TPAMI, TACL, TKDE, TOIS, TASLP, TKDD, IEEE Access, Neural Computing.

Education & Experience

Postdoc Research Fellow, National University of Singapore, Singapore, Jul 2018 - Present.

Advisor: Prof. Chua Tat-Seng (NExT: NUS-Tsinghua Extreme Search Center)

Visting Scholar, Rensselaer Polytechnic Institute, Troy, NY, U.S.A. Dec 2016 - Jun 2017.

Advisor: Prof. Heng Ji

PhD, Tsinghua University, Beijing, China. Sep 2013 - Jul 2018.

Advisor: Prof. Juanzi Li

Master, Beijing Institute of Technology, Beijing China. Sep 2009 - Mar 2012.

Advisor: Prof. Qinghe Wu

Bachelor, Nanchang University, Nanchang, China, Sep 2005 - Jul 2009.

News

May. 16, 2024

Four/Five papers are accepted by ACL main conference /Findings, respectively!

Oct. 10, 2023

Two/Four papers are accepted by EMNLP main conference /Findings, respectively!

May. 06, 2023

One paper is accepted by TOIS2023 about Document-level relation extraction!

May. 03, 2023

Five papers are accepted by ACL2023 about few-shot event extraction and event generation!

Nov. 21, 2022

Our paper is accepted by AAAI2023 about modeling uncertainty of Knowledge Graph!

Oct. 06, 2022

Our paper is accepted by EMNLP2022 about natural language inference!

Aug. 15, 2022

Our paper is accepted by COLING2022 about event relation extraction!

Aug. 01, 2022

Our paper is accepted by CIKM2022 about entity alignment!

Jun. 29, 2022

Our paper is accepted by MM2022 about cross-domain few-shot learning!

Apr. 07, 2022

Our paper is accepted by NAACL2022 about fine-grained event extraction!

Mar. 31, 2022

Our paper is accepted by SIGIR2022 about explainable next event generation!

Feb. 23, 2022

Three papers are accepted by ACL2022 about event extraction, event KG, and KG embedding!

Nov. 29, 2021

Our paper is accepted by AAAI2022 about debiasing NLI!

Sep. 10, 2021

Our paper is accepted by EMNLP2021 about evaluating the quality and explainability of KG reasoning!

Jul. 10, 2021

Our paper is accepted by MM2021 about missing data imputation!

Jun. 28, 2021

Our paper is accepted by TKDE2021 about Long-tail Relation Extraction!

May. 07, 2021

Three papers are accepted by ACL2021 about KG completion, Relation Extraction and Few-shot Named Entity Recognition!

Sep. 18, 2020

One paper is accepted by EMNLP2020 about Entity Alignment!

Apr 22, 2020

One paper is accepted by SIGIR2020 about Cross-Modal Retrieval!

Apr 4, 2020

Two papers are accepted by ACL2020 about Event Extraction and Expertise Style Transfer!

Jan 11, 2020

One paper is accepted by WWW2020 about Knowledge Graph based Recommendation!

Nov 11, 2019

One paper is accepted by AAAI2020 about Multi-modal Event Extraction!

Oct 28, 2019

One paper is accepted by JIST2019 about domain specific entity linking!

Oct 02, 2019

One paper is accepted by ICDE2020 about Relation Extraction!

Aug 16, 2019

Two papers are accepted by EMNLP2019 about Entity Alignment and NER!