연구실 소개
서울과학기술대학교 Big Data-Driven AI 연구실 (연구책임자: 권혁윤 교수)은 대학 학부 3학년 (4학년 진학 예정) 또는 4학년 (26년 2월 또는 8월 졸업예정) 학생들을 대상으로 25년 겨울방학 동계 인턴을 모집합니다 (그 밖에 학부생 연구원, 석사과정, 박사과정 지원자는 하단 이메일로 따로 연락주세요.)
본 연구실은 아래의 연구를 주로 수행하며, AI, 데이터마이닝, 데이터사이언스, 데이터베이스, 분산컴퓨팅 분야에서 세계적인 수준의 Top Tier 학술대회 및 저널 논문 제출을 목표로 합니다.
AI-focused Practical Analysis
Fairness of LLM-RAG (CIKM2025, WSDM2026a, WSDM2026b)
Continual learning (IEEE BigData2024a, IEEE BigData2024b)
Self-training (IEEE TII2024, IEEE TII2025)
Federated learning (ICDE2025)
Neuromorphic AI (CIKM2025)
Large language model (Knowledge-Based Systems 2024)
Data-Driven AI
Anomaly detection and forecasting in time-series (NeurIPS2024, IEEE TII2024, AAAI2025)
Representation learning in graphs (SIGMOD2025, IEEE TKDE2024, ICDM2023)
Image segmentation and video highlight detection (Applied Soft Computing 2022)
Scalable Data Computing
Edge-Cloud computing (IEEE TII2025, JIII2025)
Data scraping (Data & Knowledge Engineering 2024)
연구실구성원: 박사과정 6명 (외국인학생 1명포함), 석박사통합과정 1명, 석사과정 6명 (진학예정 2명 포함), 학부생인턴 3명, 행정원 1명
주요 프로젝트: 연구재단 중견연구(2025~2030), BK21(2020~2027), 연구재단 중점연구소(2019~2028), 전자제조인력양성사업 (2021~2026), 국립중앙의료원(2024~2027), 연구재단 한-프랑스 국제공동연구개발 (2025-2027), 산업부 한-영 국제공동기술연구개발 (2024~2026), 중기부 시장대응형 (2024~2026)
최근 2년 주요 실적 (학생 Underline)
[Top Conference, 국제공동연구(Georgia Tech / LSU, USA)] Jaebeom You, Seung-Kyu Hong, Ling Liu, Kisung Lee, and Hyuk-Yoon Kwon*, "Geo-Personalization Bias in News Search: Analyzing Filter Bubbles in Search Engine Results with Multi-Perspective LLM Annotation," In Proc. The 19th ACM International Conference on Web Search and Data Mining (WSDM), Boise, Idaho, USA, Feb. 2026.
[Top Conference] Jaebeom You, Jaewon Lee, Sehun Lee, and Hyuk-Yoon Kwon*, "From Data to Model in Bias: A Statistical Analysis of Political Bias in the C4 Corpus and Its Impact on LLMs," In Proc. The 19th ACM International Conference on Web Search and Data Mining (WSDM), Boise, Idaho, USA, Feb. 2026.
[Top Conference, 국제공동연구(Georgia Tech / LSU, USA)] Jaebeom You, Seung-Kyu Hong, Ling Liu, Kisung Lee, and Hyuk-Yoon Kwon,* "FAIR-SE: Framework for Analyzing Information Disparities in Search Engines with Diverse LLM-Generated Personas," In Proc. the 34th ACM International Conference on Information and Knowledge Management (CIKM), Seoul, Korea, Nov. 2025.
[Top Conference] Seung-Kyu Hong and Hyuk-Yoon Kwon*, "Adaptive Spike Neural Networks for Natural Language Inference Tasks with Dynamic Spike Predictor," In Proc. the 34th ACM International Conference on Information and Knowledge Management (CIKM), Seoul, Korea, Nov. 2025.
[Top Journal] Beyza Nur Kebeli and Hyuk-Yoon Kwon*, "CTI-ANN: Self-Training-Based Annotation with Tailored Augmentation for Cyber Threat Intelligence Posts," IEEE Transactions on Industrial Informatics, Nov. 2025 (accepted).
[Top Journal] Changdae Lee, Hyuk-Yoon Kwon*, Young Il Lee,* "OPC UA-based three-layer architecture for aggregated microgrids integrating edge cloud computing and IEC 62264," Journal of Industrial Information Integration, Vol. 48, pp. 1-15, Nov. 2025.
[Top Conference, 국제공동연구(LSU, USA)] Bo-Young Lim, Jeong-Ha Park, Kisung Lee, and Hyuk-Yoon Kwon*, "Multi-Level Graph Representation Learning Through Predictive Community-based Partitioning," In Proc. 2025 ACM SIGMOD Int'l Conf. on Management of Data, Berlin, Germany, June 2025
[Top Conference, 국제공동연구(Georgia Tech, USA)] Jihoon Moon, Ling Liu, Hyuk-Yoon Kwon*, "FedSDP: Federated Self-Derived Prototypes for Personalized Federated Learning," 2025 IEEE 41st International Conference on Data Engineering (ICDE), Hong Kong, May 2025.
[Top Journal] Junghwan Im, Young Il Lee, Changdae Lee, Hyuk-Yoon Kwon*, "Orchestration of Edge Controller and Cloud Metric Engine for Managing OPC UA-based Microgrids," IEEE Transactions on Industrial Informatics, May 2025 (Accepted).
[Top Conference] Jaeseok Jang and Hyuk-Yoon Kwon*, "TAIL-MIL: Time-Aware and Instance-Learnable Multiple Instance Learning for Multivariate Time Series Anomaly Detection," The 39th Annual AAAI Conference on Artificial Intelligence (AAAI2025), Philadelphia, Pennsylvania, USA, Feb. 2025.
[Top Conference] Jaeseok Jang and Hyuk-Yoon Kwon*, "Are Multiple Instance Learning Algorithms Learnable for Instances?," Thirty-Eighth Annual Conference on Neural Information Processing Systems (NeurIPS 2024), Vancouver, Canada, Dec. 2024 [PDF] [VIDEO] .
[Top Journal, 국제공동연구(LSU, USA)] Jeong-Ha Park, Bo-Young Lim, Kisung Lee, and Hyuk-Yoon Kwon*, "SaaN 2L-GRL: Two-Level Graph Representation Learning Empowered with Subgraph-as-a-Node," IEEE Transactions on Knowledge and Data Engineering (TKDE), Dec. 2024 (Impact Factor: 8.9, top 1.8%)
[국제공동연구(Georgia Tech, USA)] Min-Seon Kim, Ling Liu, and Hyuk-Yoon Kwon*, "SPrint: Self-Paced Continual Learning with Adaptive Curriculum and Memory Replay," 2024 IEEE International Conference on Big Data (IEEE BigData 2024), Washington D.C, USA, Dec. 2024 (acceptance rate = 18.8%) [video] .
[국제공동연구(Georgia Tech, USA)] Min-Seon Kim, Ling Liu, and Hyuk-Yoon Kwon*, "OL4TeX: Adaptive Online Learning for Text Classification under Distribution Shifts," 2024 IEEE International Conference on Big Data (IEEE BigData 2024), Washington D.C, USA, Dec. 2024 (acceptance rate = 19.7%) (Ack: 2022R1F1A1067008 and 2020M3H2A1078119) [video] .
[Top Journal] Jong Seong Park, Jeong-Ha Park, Jihyeok Choi, and Hyuk-Yoon Kwon*, "Learning with Correlation-Guided Attention for Multi-Energy Consumption Forecasting," IEEE Transactions on Industrial Informatics (TII), Nov. 2024 (Impact Factor: 11.7, top 1.5%)
Seung-Kyu Hong, Jae-Seok Jang, and Hyuk-Yoon Kwon*, "Enhancing Performance of Transformer-based Models in Natural Language Understanding through Word Importance Embedding," Knowledge-Based Systems, Nov. 2024 (Impact Factor: 7.2 top 13.5%).
[Top Journal] Jae-yeol Kim and Hyuk-Yoon Kwon*, "Self-Training of Cyber-Threat Classification Model with Threat-Payload Centric Augmentation," IEEE Transactions on Industrial Informatics (TII), Oct. 2024 (Impact Factor: 11.7, top 1.5%) .
Taehee Kim, Jae-Seok Jang, and Hyuk-Yoon Kwon, "Correlation-Driven Multi-Level Learning for Anomaly Detection on Multiple Energy Sources," Applied Soft Computing, July 2024 (Impact Factor: 7.2, top 8.6%) .
[국제공동연구(NAIST, Japan)] Yun-Tae Jin, Jae-Beom You, Shoko Wakamiya, and Hyuk-Yoon Kwon*, "Analyzing User Reactions Using Relevance between Location Information of Tweets and News Articles," EPJ Data Science, June 2024 (Impact Factor: 3.0 top 12.7%).
[Top Conference, 국제공동연구(LSU, USA)] Jeong-Ha Park, Kisung Lee, and Hyuk-Yoon Kwon*, "Two-Level Graph Representation Learning with Community-as-a-Node Graphs," In Proc. 23rd IEEE International Conference on Data Mining (IEEE ICDM 2023), Shanghai, China, Dec. 2023 (oral presentation, acceptance rate = 19.94%) .
모집분야 (중복접수가능)
분야1: 비전/의료 연합학습 (Federated Learning)
주제: VQ-VAE 기반 개인화 연합학습 (Personalized Federated Learning: Taming Data Heterogeneity with VQ-VAE)
제출 목표: ICML(26년 1월), ICCV(26년 3월)
상세내용소개: 바로가기
분야2: 비전/의료 연속학습 (Continual Learning)
주제: VQ 압축 기반 메모리 효율적 연속학습 (Memory-Efficient Continual Learning via VQ-Compression)
제출 목표: ICML(26년 1월), ICCV(26년 3월)
상세내용소개: 바로가기
분야3: LLM 및 RAG 편향성 (LLM Bias)
주제: LLM과 RAG의 편향성 전이 경로 추적 (Tracing the Neural Roots of Bias in LLM & RAG)
제출 목표: SIGIR(26년 1월), ACL (26년 2월), VLDB(26년 3월)
상세내용소개: 바로가기
분야4: 차세대 비전 SNN (Vision SNN)
주제: Vision SNN을 위한 시공간 RoPE 개발 (Optimizing SNN Transformers with Spatiotemporal RoPE)
제출 목표: ICML (26년 1월), IJCAI (26년 1월), ICCV (26년 3월)
상세내용소개: 바로가기
분야 5: 시계열 예측
주제: 스트리밍 시계열 데이터를 위한 경량 어댑터 (Lightweight Adaptation for Streaming Time Series)
제출 목표: ICML (26년 1월), IJCAI (26년 1월), VLDB (26년 3월)
상세내용소개: 바로가기
분야 6: 의료 AI
주제1: 전안부 이미지로부터 백내장 자동 탐지 기술 연구
주제2: 망막당뇨 병변 라벨링 자동화 및 Acitve Learning
모집대상
데이터 엔지니어링 기술과 데이터 기반 AI기술을 접목한 연구를 경험하고 싶은 학생
지도교수님 및 박사과정과 세계 최고수준 Top Tier 학술대회 및 SCI 저널 논문 작성을 목표로 연구 과정을 경험해 보고 싶은 학생
(26년 가을/ 27년 봄학기) 석사/석박사통합 과정 진학을 염두에 둔 학생
자격요건
컴퓨터공학/산업공학/데이터사이언스 학과 전공자 또는 해당 전공을 공부해보고 싶은 학생
높은 수준의 연구를 경험해보고 싶은 학부 4학년
1주일 40시간 이상 연구에 시간 투자할 수 있는 학생
데이터를 다루는 것에 흥미가 있는 학생
성실하고 끈기있는 학생
1개 이상의 자신있는 프로그래밍 언어를 갖춘 학생 (optional)
혜택
겨울방학 8주간 장학금 200만원 지급 (Full time 기준)
제출한 논문이 Accept될 경우 해외학회 경비 지원
국제공동연구기회
인턴 이후 지속적인 연구를 수행할 경우 미국 대학 방문 (8주) 또는 온라인 연구 진행
Georgia Tech (미국, Prof. Ling Liu), Louisiana State University (미국, Prof. Kisung Lee), University of Florida (미국, Prof. Thai), NAIST (미국, Prof. Wakamiya)
국가연구개발프로젝트(연구재단-중견연구, 산자부 한국-영국 공동연구, 연구재단 한국-프랑스 공동연구, 중소벤처기업부 등) 및 산학협력프로젝트 (국립의료원, LLM-RAG 구축, 산업AI, 제조AI 등) 참여기회
25년 하계인턴 4명 (7-8월) 연구실적
(2명 참여) [Top Conference, accepted, LLM 편향성 분야, 26년 2월 발표] "From Data to Model in Bias: A Statistical Analysis of Political Bias in the C4 Corpus and Its Impact on LLMs," In Proc. The 19th ACM International Conference on Web Search and Data Mining (WSDM), Boise, Idaho, USA, Feb. 2026.
(1명 참여) [Top Conference, submitted, 시계열 예측 분야, 심사중, Avg. Score: 7.0] COSA: Context-aware Output-Space Adapter for Test-Time Adaptation in Time Series Forecasting, ICLR 2026 submit (25년 9월).
(1명 참여) [Top Journal, submitted, 의료AI 분야, 심사중] Scalable Multi-domain Federated Learning with Quality-Aware Prototype Learning for Collaborative Label Transfer in Diabetic Retinopathy Diagnosis, Medical Image Analysis (25년 9월).
Timeline
서류 제출 마감: 2025년 11월25일(화) ~ 2025년 12월12일(금)
인터뷰 대상자 안내: 2025년 12월15일(월)
인터뷰 (대면 또는 Zoom): 2025년 12월16일(화) ~ 12월18일(목)
결과 공지: 2025년 12월19일(금)
인턴 기간: 2025년 12월22일(월)부터 8주 (시작날짜 조정가능)
Contact
연구실 홈페이지: https://bigdata.seoultech.ac.kr
연구실 랩대표 (박사과정 2년차 임정환) 이메일: ijh4565 [at] naver [dot] com
교수님 이메일: hyukyoon.kwon [at] seoultech [dot] ac [dot] kr (LinkedIn)
연구실위치: 서울과학기술대학교 무궁관 712호