SCAI LAB - Full List of Publications

International Conferences

SelFusion: Self-distillation for Diffusion Language Models

H. Lim*, J. Kim*, E. S. Seo, M. H. Jang, and J. W. Yoon✝

Proc. ACL (main), 2026.

BiCycle: Group-wise Recursive Transformer Based on ASR Mechanism

M. H. Jang, E. S. Seo, J. Kim, H. Lim, and J. W. Yoon✝

Proc. AAAI, 2026.

GrayKD: Distilling Better Knowledge from Black-box LLM via Multi-rationale Injection

H. Lim, H. Y. Kim, J. Kim, M. H. Jang, E. S. Seo, Y. Lim, S. Choi, J. Park, Y. Lim, H. Lee, B. Kim, and J. W. Yoon✝

Proc. AAAI, 2026.

CCQA: Generating Question from Solution Can Improve Inference-Time Reasoning in SLMs

J. Kim and J. W. Yoon✝

Proc. EMNLP (main), 2025.

FADEL: Uncertainty-aware Fake Audio Detection with Evidential Deep Learning

J. Y. Kang, J. W. Yoon, S. Kim, M. H. Han, and N. S. Kim

Proc. ICASSP, 2025.

* Oral presentation

Heuristic-free Knowledge Distillation for Streaming ASR via Multi-modal Training

J. W. Yoon

Proc. AAAI, 2025.

Gene-Gene Relationship Modeling Based on Genetic Evidence for Single-Cell RNA-Seq Data Imputation

D. Um, J. W. Yoon, S. J. Ahn and Y. Yeo

Proc. NeurIPS, 2024.

Unseen Road Type Detection in Road Networks for Intelligent Transportation Systems

D. Um, Y. Yeo, J. W. Yoon, and J. Y. Choi

Proc. IEEE ITSC, 2024.

EEND-EM: End-to-End Neural Speaker Diarization with EM-Network

B. J. Woo, J. W. Yoon, M. H. Han, C. Y. Moon, and N. S. Kim

Proc. APSIPA ASC, 2024.

HuBERT-EE: Early Exiting HuBERT for Efficient Speech Recognition

J. W. Yoon, B. J. Woo, and N. S. Kim

Proc. Interspeech, 2024.

* Oral presentation

MCR-Data2vec 2.0: Improving Self-supervised Speech Pre-training via Model-level Consistency Regularization

J. W. Yoon, S. M. Kim, and N. S. Kim

Proc. Interspeech, 2023.

EM-Network: Oracle Guided Self-distillation for Sequence Learning

J. W. Yoon, S. Ahn, H. Lee, M. Kim, S. M. Kim, and N. S. Kim

Proc. ICML, 2023.

Inter-KD: Intermediate Knowledge Distillation for CTC-Based Automatic Speech Recognition

J. W. Yoon, B. J. Woo, S. Ahn, H. Lee, and N. S. Kim

Proc. IEEE SLT, 2022.

Speech to Text Adaptation: Towards an Efficient Cross-Modal Distillation

W. I. Cho, D. Kwak, J. W. Yoon, and N. S. Kim

Proc. Interspeech, 2020.

International Journals

Towards Maximum Likelihood Training for Transducer-based Streaming Speech Recognition

H. Lee, J. W. Yoon, S. Kim, and N. S. Kim

IEEE Signal Processing Letters, 2024.

Cons-KD: Dropout-robust Knowledge Distillation for CTC-based Automatic Speech Recognition

J. W. Yoon, H. Lee, J. Kang, and N. S. Kim

IEEE Access, vol. 12, pp. 131136-131146, 2024.

Oracle Teacher: Leveraging Target Information for Better Knowledge Distillation of CTC Models

J. W. Yoon, H. Y. Kim, H. Lee, S. Ahn, and N. S. Kim

IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 31, pp. 2974-2987, 2023.

Neurally Optimized Decoder for Low Bitrate Speech Codec

H. Y. Kim, J. W. Yoon, W. I. Cho, and N. S. Kim

IEEE Signal Processing Letters, vol. 29, pp. 244-248, 2021.

TutorNet: Towards Flexible Knowledge Distillation for End-to-End Speech Recognition

J. W. Yoon, H. Lee, H. Y. Kim, W. I. Cho, and N. S. Kim

IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 29, pp. 1626-1638, 2021.

A Multi-Resolution Approach to GAN-Based Speech Enhancement

H. Y. Kim, J. W Yoon, S. J. Cheon, W. H. Kang, and N. S. Kim

Applied Sciences, 11(2), 721, 2021.

Domestic Conferences

우범준, 김석민, 김지환, 문성환, 윤지원, 이현승, 최병진, 한민현, 김남수 "화자의 특징 정보를 활용한 대상 음성 분리 알고리즘," 한국통신학회 동계종합학술발표회, 2023, pp 617-618.
윤지원, 김석민, 김남수, “음성 감정인식 모델 내 정규화 파라미터의 표현력 및 영향 연구," 한국전자파학회 하계종합학술대회, 2022.
김세민, 윤지원, 김정훈, 이현승, 한민현, 김남수, "적대적 훈련을 통해 학습한 VAE 기반의 음성향상 기술에 관한 연구", 한국통신학회 하계종합학술발표회, 2022.
이현승, 윤지원, 김민찬, 김세민, 김남수 "한국어종단형 음성인식 모델의 weight 평균 기법에 대한 ablation study," 한국통신학회 동계종합학술발표회, 2022, pp. 1656-1657.
김석민, 안성환, 윤지원, 이현승, 정명훈, 김남수, "트랜스포머를 이용한 종단형 한국어-영어 음성 번역," 대한전자공학회 하계종합학술발표회, 2021, pp. 1084-1085.
윤지원, 이현승, 김민찬, 정명훈, 이동준, 김남수, "종단간 한국어 음성 인식을 위한 언어 모델 활용," 한국전자파학회 동계종합학술대회, 2021, pp. 328.
우범준, 김형용, 윤지원, 김정훈, 김남수, "음향 혼합 데이터 증강 기법을 이용한 SincNet 기반의 음향 사건 감지," 한국통신학회 동계종합학술발표회, 2021, pp. 616 – 617.
김형주, 조원익, 윤지원, 손병찬, 김남수, "학습 가능한 사전 확률 분포를 가진 플로우 생성 모델에 관한 연구," 한국통신학회 동계종합학술발표회, 2020, pp. 132-133.
김형용, 채석완, 유주현, 윤지원, 김남수, "어텐션 기법을 활용한 Sincnet 기반 화자인식 알고리즘", 한국통신학회 하계종합학술발표회, 2019, pp. 1207-1208.
윤지원, 이강현, 김정훈, 최인규, 유주현, 김남수, "잡음과 반향 환경에서 강인한 음성인식을 위한 Joint Training", 한국통신학회 동계학술발표회, 2019, pp. 803-804.
문성환, 강우현, 이강현, 이현승, 윤지원, 김남수, "화자 특성을 고려한 I-vector기반의 DNN 화자식별 알고리즘," 한국통신학회 하계종합학술발표회, 2018, pp. 1073-1074.
채석완, 최인규, 김형용, 윤지원, 김남수, "2-단계 딥러닝 기반 단일 채널 음성 분리," 한국군사 과학기술학회 창립 20주년 종합학술대회, 2018, pp. 617-618.

Patents

Ji Won Yoon, Eun Seo SEO. DEEP VOICE DETECTION METHOD AND APPARATUS, 미국특허, 출원번호 19/320,514, 출원일자 2025년 09월 05일.
윤지원, 김진영. 소형 언어 모델의 추론 능력 향상 방법, 출원번호 10-2025-0073024, 출원일자 2025년 06월 04일.
윤지원, 서은서. 딥보이스 탐지 방법 및 장치, 출원번호 10-2025-0060863, 출원일자 2025년 05월 12일.
김남수, 윤지원. Method and device with speech processing, 출원번호 18/903,676, 출원일자 2025월 05월 08일.
김남수, 윤지원. 효율적인 음성 인식을 위한 음성 자기지도 학습 모델의 조기 종료 시스템 및 방법, 출원번호 10-2023-0180207, 출원일자 2023년 12월 13일.
김남수, 윤지원. 음성 처리 방법 및 장치, 출원번호 10-2023-0152826, 출원일자 2023년 11월 7일.
Nam Soo Kim, Ji Won Yoon. Method and apparatus with neural network training, 미국특허, 출원번호 18/108,727, 출원일자 2023년 02월 13일.
김남수, 윤지원. 인공 신경망 모델의 동작 방법 및 장치. 출원번호 10-2022-0105734. 출원일자 2022년 08월 23일.
Nam Soo Kim, Ji Won Yoon. Method and apparatus with abnormal channel of microphone array detection and compensation signal generation, 미국특허, 등록번호 US 12,342,149 B2, 등록일자 2025년 06월 24일.
김남수, 윤지원. 마이크 어레이의 이상 채널 검출 및 보상 신호 생성 방법 및 장치. 출원번호 10-2021-0132102. 출원일자 2021년 10월 06일.

Page updated

Google Sites

Report abuse