Project
๐๐ผโโ๏ธ
์๋ก์ด ๋ชจ๋ฌ๋ฆฌํฐ์ ๊ณ์ฐ ํจ์จ์ ์ธ ๋์กฐ ํ์ต ์ฐ๊ตฌย
Extending Contrastive Learning to New Data Modalities and Resource-Limited Devices
In charge of
๊น์์ฐฌ (yechankim@gm.gist.ac.kr)
Funded by
๊ณผํ๊ธฐ์ ์ ๋ณดํต์ ๋ถ, GIST
Graphical Abstract
Motivation
๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ํด์๋ ๋ง์ ์์ supervised data๊ฐ ํ์ํ๋ฉฐ, ๋ฐ๋ผ์ ์ด๋ฌํ supervised data๋ฅผ ๋ชจ์ผ๊ธฐ ์ํด์๋ ๋งค์ฐ ๋์ annotation๋น์ฉ์ด ๋ฐ์ํจย
Annotation์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ํ์ต ๋ฐฉ๋ฒ์ ์ฐ๊ตฌํ๊ธฐ ์ํ unsupervised ํ์ต ๋ฐฉ์์ด ์ธ๊ณ์ ์ผ๋ก ๊ฒฝ์์ ์ผ๋ก ์ฐ๊ตฌ๋๊ณ ์์ผ๋ฉฐ, ๊ทธ ์ค์์๋ self-supervised learning์ unsupervised ํ์ต ๋ฐฉ์์ ํจ์จ์ฑ์ผ๋ก ์ธํด ๋ง์ด ์ฐ๊ตฌ๋๊ณ ์์ย
๊ทธ๋ฌ๋ ๊ธฐ์กด์ ๊ฐ๋ฐ๋ contrastive learning ๋ฑ self-supervised ํ์ต ๋ฐฉ๋ฒ๋ค์ image, video๋ language ๋ฑ์๋ง ์ ์ฉ๋์ด ์์ผ๋ฉฐ, ๊ธฐ์กด์ ์ฐ๊ตฌ๋ ๋ฐฉ๋ฒ๋ค์ ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ(์, RF ์ ํธ)์์ ์ ์ฉํ์ ๊ฒฝ์ฐ ์ฑ๋ฅ์ด ํฌ๊ฒ ์ ํ๋๋ ๋ฌธ์ ๊ฐ ์์ด, ๋๋ฆฌ ์ฌ์ฉํ๊ธฐ ์ด๋ ค์
๊ฒ๋ค๊ฐ ์ฑ๊ณต์ ์ธ self-supervised ํ์ต ๋ชจ๋ธ๋ค์ ํฌ๊ธฐ๊ฐ ์ปค์ ์์ ์ฅ์น์ ํ์ฌํ์ฌ AI๋ฅผ ๋๋ฆฌ deployํ๊ธฐ ์ด๋ ต๋ค๋ ๋ฌธ์ ๊ฐ ์์ผ๋ฉฐ, ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ชจ๋ธ์ ๊ฒฝ๋ํ ํ๋ ์ฐ๊ตฌ๋ค๋ ์งํ๋๊ณ ์์ผ๋, self-supervised ํ์ต์ ์ํ ๊ฒฝ๋ํ ๋ฐฉ๋ฒ์ ๊ฑฐ์ ์ฐ๊ตฌ๋์ง ์์ ์ํฉ์
์๋ก์ด ๋ชจ๋ฌ๋ฆฌํฐ๋ก์ ์ผ๋ฐํ์ ๊ฒฝ๋ ๋ชจ๋ธ์์์ self-supervised ํ์ต ๋ฐฉ๋ฒ์ ๊ธฐ์ ์ ์ผ๋ก ๋งค์ฐ ๋์ ์ ์ธ ์ฃผ์ ๋ก ์์ง๊น์ง ์ธ๊ณ์ ์ผ๋ก ์ฑ๊ณต ์ฌ๋ก๊ฐ ์๋ ์์ฒ๊ธฐ์ ์
Research Goal
์ต์ข ๋ชฉํ
Contrastive Learning ๊ธฐ๋ฐ ๋น์ง๋ ํ์ต์ multi-modal ๋ฐ resource-limited device๋ก ํ์ฅํ ์ ์๋ ์๊ณ ๋ฆฌ์ฆ ์ฐ๊ตฌ
์ธ๋ถ ์ฐ๊ตฌ๋ชฉํ
Multi-modal self-supervised learning ๋ฐฉ๋ฒ ์ฐ๊ตฌย
Resource efficient self-supervised learning ๋ฐฉ๋ฒ ์ฐ๊ตฌ
Multi-modal resource efficient self-supervised learning ๋ฐฉ๋ฒ ์ฐ๊ตฌ
๋น๊ณ ์ฌํญ
GIST-MIT ๊ณต๋์ฐ๊ตฌ
Contributions
๊ธฐ๋ํจ๊ณผ
์๋ก์ด modality๋ก ์ ์ฉํ self-supervised learning framework์ ๊ฐ๋ฐ
Unsupervised ํ์ต ๋ฐฉ๋ฒ์ ์ ์ฉ ๋ฒ์๋ฅผ ํฌ๊ฒ ๋ํ๋ ์์ฒ ๊ธฐ์ ํ๋ณด
AI์ ์ ์ฉ ๋ฒ์๋ฅผ ํฌ๊ฒ ๋ํ์ ๊ธฐ์ ์ ๋ณด๊ธ์ ํ๋ํ๊ณ ์ฐ์ ์ ๋ฐ์ AI์ ์ ์ฉ ์ง์ ์ฅ๋ฒฝ์ ๋ฎ์ถ์ด AI์ ๋ฏผ์ฃผํ(democratize)์ ๊ธฐ์ฌ