연구실 소개
서울과학기술대학교 Big Data-Driven AI 연구실 (연구책임자: 권혁윤 교수)은 대학 4학년 학부 학생들을 대상으로 25년 여름방학 하계 인턴을 모집합니다 (그 밖에 학부생 연구원, 석사과정, 박사과정 지원자는 하단 이메일로 따로 연락주세요.)
본 연구실은 아래의 연구를 주로 수행하며, AI, 데이터마이닝, 데이터베이스, 분산컴퓨팅 분야에서 세계적인 수준의 Top Tier 학술대회 및 저널 논문 제출을 목표로 합니다.
Data-Driven AI
Anomaly detection and forecasting in time-series (NeurIPS2024, IEEE TII2024, AAAI2025)
Representation learning in graphs (SIGMOD2025, IEEE TKDE2024, ICDM2023)
Image segmentation and video highlight detection (Applied Soft Computing 2022)
AI-focused Practical Analysis
Fairness of datasets and AI models
Continual learning (IEEE BigData2024a, IEEE BigData2024b)
Self-training (IEEE TII2024)
Federated learning (ICDE2025)
Multimodal learning
Large language model (Knowledge-Based Systems 2024)
Scalable Data Computing
Data scraping (Data & Knowledge Engineering 2024)
Edge-Cloud computing (IEEE TII2025)
Distributed data pipeline and ingestion
연구실구성원: 박사과정 6명 (외국인학생 1명포함), 석박사통합과정 1명, 석사과정: 5명 (외국인학생 1명포함), 학부생인턴: 3명, 행정원: 1명
주요 프로젝트: 연구재단 중견연구(2025~2030), BK(2020~2027), 연구재단 중점연구소(2019~2028), 전자제조인력양성사업 (2021~2026), 국립중앙의료원(2024~2025), 산업부 한-영 국제공동기술연구개발 (2024~2026), 중기부 시장대응형 (2024~2026)
최근 2년 주요 실적 (학생 Underline)
[Top Conference, 국제공동연구(LSU, USA)] Bo-Young Lim, Jeong-Ha Park, Kisung Lee, and Hyuk-Yoon Kwon*, "Multi-Level Graph Representation Learning Through Predictive Community-based Partitioning," In Proc. 2025 ACM SIGMOD Int'l Conf. on Management of Data, Berlin, Germany, June 2025
[Top Conference, 국제공동연구(Georgia Tech, USA)] Jihoon Moon, Ling Liu, Hyuk-Yoon Kwon*, "FedSDP: Federated Self-Derived Prototypes for Personalized Federated Learning," 2025 IEEE 41st International Conference on Data Engineering (ICDE), Hong Kong, May 2025.
[Top Journal] Junghwan Im, Young Il Lee, Changdae Lee, Hyuk-Yoon Kwon*, "Orchestration of Edge Controller and Cloud Metric Engine for Managing OPC UA-based Microgrids," IEEE Transactions on Industrial Informatics, May 2025 (Accepted).
[Top Conference] Jaeseok Jang and Hyuk-Yoon Kwon*, "TAIL-MIL: Time-Aware and Instance-Learnable Multiple Instance Learning for Multivariate Time Series Anomaly Detection," The 39th Annual AAAI Conference on Artificial Intelligence (AAAI2025), Philadelphia, Pennsylvania, USA, Feb. 2025.
[Top Conference] Jaeseok Jang and Hyuk-Yoon Kwon*, "Are Multiple Instance Learning Algorithms Learnable for Instances?," Thirty-Eighth Annual Conference on Neural Information Processing Systems (NeurIPS 2024), Vancouver, Canada, Dec. 2024 [PDF] [VIDEO] .
[Top Journal, 국제공동연구(LSU, USA)] Jeong-Ha Park, Bo-Young Lim, Kisung Lee, and Hyuk-Yoon Kwon*, "SaaN 2L-GRL: Two-Level Graph Representation Learning Empowered with Subgraph-as-a-Node," IEEE Transactions on Knowledge and Data Engineering (TKDE), Dec. 2024 (Impact Factor: 8.9, top 1.8%)
[국제공동연구(Georgia Tech, USA)] Min-Seon Kim, Ling Liu, and Hyuk-Yoon Kwon*, "SPrint: Self-Paced Continual Learning with Adaptive Curriculum and Memory Replay," 2024 IEEE International Conference on Big Data (IEEE BigData 2024), Washington D.C, USA, Dec. 2024 (acceptance rate = 18.8%) [video] .
[국제공동연구(Georgia Tech, USA)] Min-Seon Kim, Ling Liu, and Hyuk-Yoon Kwon*, "OL4TeX: Adaptive Online Learning for Text Classification under Distribution Shifts," 2024 IEEE International Conference on Big Data (IEEE BigData 2024), Washington D.C, USA, Dec. 2024 (acceptance rate = 19.7%) (Ack: 2022R1F1A1067008 and 2020M3H2A1078119) [video] .
[Top Journal] Jong Seong Park, Jeong-Ha Park, Jihyeok Choi, and Hyuk-Yoon Kwon*, "Learning with Correlation-Guided Attention for Multi-Energy Consumption Forecasting," IEEE Transactions on Industrial Informatics (TII), Nov. 2024 (Impact Factor: 11.7, top 1.5%)
Seung-Kyu Hong, Jae-Seok Jang, and Hyuk-Yoon Kwon*, "Enhancing Performance of Transformer-based Models in Natural Language Understanding through Word Importance Embedding," Knowledge-Based Systems, Nov. 2024 (Impact Factor: 7.2 top 13.5%).
[Top Journal] Jae-yeol Kim and Hyuk-Yoon Kwon*, "Self-Training of Cyber-Threat Classification Model with Threat-Payload Centric Augmentation," IEEE Transactions on Industrial Informatics (TII), Oct. 2024 (Impact Factor: 11.7, top 1.5%) .
Taehee Kim, Jae-Seok Jang, and Hyuk-Yoon Kwon, "Correlation-Driven Multi-Level Learning for Anomaly Detection on Multiple Energy Sources," Applied Soft Computing, July 2024 (Impact Factor: 7.2, top 8.6%) .
[국제공동연구(NAIST, Japan)] Yun-Tae Jin, Jae-Beom You, Shoko Wakamiya, and Hyuk-Yoon Kwon*, "Analyzing User Reactions Using Relevance between Location Information of Tweets and News Articles," EPJ Data Science, June 2024 (Impact Factor: 3.0 top 12.7%).
[Top Conference, 국제공동연구(LSU, USA)] Jeong-Ha Park, Kisung Lee, and Hyuk-Yoon Kwon*, "Two-Level Graph Representation Learning with Community-as-a-Node Graphs," In Proc. 23rd IEEE International Conference on Data Mining (IEEE ICDM 2023), Shanghai, China, Dec. 2023 (oral presentation, acceptance rate = 19.94%) .
Min-Seon Kim, Bo-Young Lim, Han-Sub Shin, and Hyuk-Yoon Kwon*, "Historical Credibility for Movie Reviews and Its Application to Weakly Supervised Classification," Information Sciences, Vol. 630, pp. 325-340, June 2023 (Impact Factor: 8.233, Top 9.45%).
모집분야 (중복접수가능)
분야1: 연합학습 (1명)
연구주제: Federated Codebook Learning for Generalizable Vector Quantization
연구목표
학습 데이터 분포에 민감한 Vector Quantization(VQ)의 한계를 해결하기 위해, 사전학습된 AutoEncoder/VQ-VAE 기반의 코드북을 연합학습 방식으로 공유하는 구조를 제안
각 클라이언트는 freeze된 encoder로부터 latent를 생성하고, 로컬 코드북을 학습
이후 각 클라이언트의 코드북을 서버에서 통합하여 다양한 데이터 분포를 포괄하는 범용적인 코드북 공간을 구축
제출: AAAI (9월 중)
상세내용소개: 바로가기
분야2: LLM 공정성 평가 (1명)
연구주제: CommonCrawl 분석 및 LLM 공정성 영향 연구
연구목표
LLM 페르소나 기반 분석을 통해 CommonCrawl 웹 코퍼스의 내재적 편향성 규명
데이터 필터링 방식이 콘텐츠 대표성에 미치는 영향 분석
편향이 확인된 데이터와 균형 조정된 데이터로 학습한 LLM 성능 비교
제출: WSDM(8월 중) / WWW(10월 중)
상세내용소개: 바로가기
분야3: 웹 데이터 편향성 (1명)
연구주제: Web Fair 데이터셋 구축 방법론
연구목표
다차원 특성(정치적 성향, 주제별 입장 등)을 고려한 웹 데이터의 벡터/그래프 표현 학습
공정성을 최적화하는 다차원 공간 샘플링 알고리즘 개발
구축된 데이터셋의 공정성 평가 및 LLM 학습 효과 검증
제출: WSDM(8월 중) / WWW(10월 중)
상세내용소개: 바로가기
분야 4: 자연어 처리 (1명)
연구주제: NLP에서의 Spike와 SNN 모델 간의 관계
연구목표
Spike 발생량과 SNN 모델 학습 경향의 관계 규명
SNN 모델의 학습 속도와 성능 최적화를 위한 하이퍼 파라미터 최적화
SNN의 새로운 미분 방법론 제안
제출: NAACL (2025. 10월 중)
상세내용소개: 바로가기
분야 5: 의료 질병 영상 분류 모델 (1명)
연구주제: 확장 가능한 다중 도메인 안저 이미지 연합학습 프레임워크
연구목표
본 연구는 보안이 중요한 안저 의료 영상에 대해 데이터 유출 없이 학습 가능한 자가 지도 연합 학습 프레임워크를 제안한다.
Pretraining (Federated Self-Supervised Learning)
Label 데이터 없이도 학습 가능한 MAE 기반 MIM(Masked Image Modeling) 방식을 채택
다양한 병원에서 수집된 도메인 분산 안저 이미지를 활용해 글로벌 일반화 encoder 학습
Fine-tuning (Supervised Learning)
Encoder는 동결하고 각 클라이언트는 Shallow CNN Adapter + Classifier를 학습
도메인 특화 표현 및 결정 경계를 로컬 학습으로 확보
Pseudo Labeling (Semi-supervised Collaboration)
Label 데이터가 없는 클라이언트는 Encoder + Adapter + Classifier를 활용한 공유 모델을 통해 Pseudo Label을 획득
획득된 라벨을 기반으로 로컬 모델 재학습 수행
제출: Medical Image Analysis (9월 중)
상세내용소개: 바로가기
분야 6: 엣지-클라우드 컴퓨팅 (1명)
연구 주제: Community-aware Lightweight Adaptation for Edge-Level Time Series Forecasting
연구 목표
자원 제약이 있는 Edge 환경에서 모델 학습 오버헤드 및 자원 사용량 최적화를 위해 유사한 시계열을 묶어 하나의 모델로 학습하는 Community 기반 예측 모델 구축 프레임워크 제안한다.
각 Edge에서 경량 후처리 adaptor를 활용하여 예측 성능을 보정하는 구조를 제안한다.
제출: AAAI(9월 중)
상세내용소개: 바로가기
모집대상
데이터 엔지니어링 기술과 데이터 기반 AI기술을 접목한 연구를 경험하고 싶은 학생
지도교수님 및 박사과정과 세계 최고수준 Top Tier 학술대회 및 SCI 저널 논문 작성을 목표로 연구 과정을 경험해 보고 싶은 학생
(25년 가을, 26년 봄/가을학기) 석사/석박사통합 과정 진학을 염두에 둔 학생
자격요건
컴퓨터공학/산업공학/데이터사이언스 학과 전공자 또는 해당 전공을 공부해보고 싶은 학생
높은 수준의 연구를 경험해보고 싶은 학부 4학년
1주일 40시간 이상 연구에 시간 투자할 수 있는 학생
데이터를 다루는 것에 흥미가 있는 학생
성실하고 끈기있는 학생
1개 이상의 자신있는 프로그래밍 언어를 갖춘 학생 (optional)
혜택
여름방학 8주간 장학금 200만원 지급 (Full time 기준)
제출한 논문이 Accept될 경우 해외학회 경비 지원
국제공동연구기회
인턴 이후 지속적인 연구를 수행할 경우 미국 대학 방문 (8주) 또는 온라인 연구 진행
Georgia Tech (미국, Prof. Ling Liu), Louisiana State University (미국, Prof. Kisung Lee), University of Florida (미국, Prof. Thai), NAIST (미국, Prof. Wakamiya)
국가연구개발프로젝트(연구재단-중견연구, 산자부 한국-영국 공동연구, 중소벤처기업부 등) 및 산학협력프로젝트 (국립의료원, 산업AI 기업, 제조AI 기업 등) 참여기회
Timeline
서류 제출 마감: ~ 2025년 6월 13일(금)
인터뷰 대상자 안내: 2025년 6월 16일(월)
인터뷰 (대면 또는 Zoom): 2025년 6월 17일(화) ~ 6월 19일(목)
결과 공지: 6월20일(금)
인턴 기간: 6월23일(월)부터 8주 (시작날짜 조정가능)
Contact
연구실 홈페이지: https://bigdata.seoultech.ac.kr
연구실 랩대표 (박사과정 2년차 임정환) 이메일: ijh4565 [at] naver [dot] com
교수님 이메일: hyukyoon.kwon [at] seoultech [dot] ac [dot] kr (LinkedIn)
연구실위치: 서울과학기술대학교 무궁관 712호
선발결과
분야2,3: 이재원 (국민대), 이세훈 (고려대)
분야5: 박우진 (삼육대)
분야6: 김남호 (서울과학기술대)