Private and Secure Federated Learning
연합학습은 IoT 디바이스 등 갈수록 분산화 되어가는 구조 및 환경에 알맞게 설계된 분산 AI 기술 중 하나에 해당한다. 초기에는, 딥러닝 등의 AI가 처리해야 할 데이터의 양이 기하급수적으로 늘어남과 동시에 이에 대한 분석을 위한 딥러닝 모델의 계층 구조가 매우 깊어져(deep), N개의 GPU 자원을 통해 AI 학습을 수행해야 했고, 이는 자연스럽게 분산 머신러닝(DML, Distributed machine learning) 이라는 용어로써 분산 AI 컴퓨팅 기술이 발전되어왔다. 이와 유사하게, 지리적으로 분산되어있는 방대한 데이터를 학습할 시, 어떻게 효율적으로 학습할 수 있는 지에 대한 연구도 진행되어왔다.
결정적으로, EU에서는 2018년에 GDPR(General Data Protection Regulation)이라는 프라이버시 관련 규제가 발효되었다. 이를 간략히 해석하자면 비즈니스를 수행하는 엔터프라이즈 업체는 어떠한 동의 없이 사용자의 데이터를 함부로 수집할 수 없음을 의미하고 있다. 하지만, 엔터프라이즈는 MLaaS 등의 서비스를 사용자에게 제공하기 위해서는 사용자 데이터 기반의 AI 학습을 필수적으로 수행해야 했다. DML은 이러한 문제점에 대한 해결책으로 급부상하였다. 특히, 연합학습(Federated learning, 이하 FL)은 IoT 디바이스를 기반으로 상대적으로 최적화된 FedAvg 기반 분산 학습 모델을 제안하였고, 이후 폭발적인 인기를 얻게 되었다.
하지만 FL도 역시 안전성 및 효율성에 대한 보완이 필요한 상태이며, 이와 관련된 연구들이 매우 많은 분야에서 진행되고 있다. 본 연구에서는 FL에 대해 안전하면서 효율적인 알고리즘 개발 및 보완을 목표로 하며, 매우 다양한 환경에서 적용될 수 있는 FL 기술에 대해 다양하고 심층적으로 연구해보고자 한다.