Research Interests

Data-efficient Machine Learning Solutions (Bias, Lack of Data, etc.) for

Multimodal (Vision, Language, Audio, etc.) AI Systems!

These are the research topics that we are interested in (but not limited to):

Multimodal Learning (Vision, Language, and Audio)

Image Captioning / Dense Video Captioning
Video Text Retrieval
Visual Question Answering
Sign Language Recognition
Language to Image / Video Generation
Audio to Image Generation

Data Issues in Deep Learning

Semi- & Weakly-Supervised Learning
Zero-shot & Few-shot Learning
Data Bias
Active Learning
Domain Adaptation
Synthetic Dataset

Scene Understanding

Visual Relationship
Segmentation
Object Detection
Attribute Recognition

Deep Learning

Human Action Recognition
Human-Object Interaction Detection
Action Localization
Human Pose

Page updated

Google Sites

Report abuse