Project Description
IoT 단말의 데이터 전송주기를 다양한 상황에 따라 가변적으로 전송함으로써, 필요한 데이터만을 IoT 단말로부터 수집하고, 데이터 전송에 드는 IoT 단말의 에너지 낭비를 방지하는 “강화학습 기반의 IoT 단말의 자율적 운영기법 개발 연구”을 진행함
Project Role : 연구책임자 (2022.09-2023.09)
Funding : National Research Foundation of Korea (NRF)
Project Task1
다차원 IoT 데이터의 특성 및 상관관계 분석
다차원 데이터간 상관관계를 고려하여 복원되는 데이터의 정확도 기반으로 각 단말 별 스코어 함수를 개발하고, 이를 활용하여, 전송주기조절 시, 서로 간의 스코어 함수 기반 내 전송주기조절 기술개발을 지원함
(To do list) 여러 데이터 간의 적절한 Embedding Vector 구성
Project Task2
여러 IoT 단말들이 분포한 Multi-agent 환경 내에서 전송주기조절 성능을 최적화할 수 있는 심층강화학습 기법
데이터 기반의 강화학습 모델 train을 위한 Environment 환경 구성 (Open AI Gym Framework 활용)
IoT 환경 내 수집된 데이터의 학습의 안전성을 위하여, v-step delay reward 함수 설계
학습 모델을 경량화하여, 실제 환경에 탑재되어 동작할 수 있도록 설계
(To do list) 실제 환경 내 state 정보의 불확정성을 고려한 모델 설계
(To do list) 강화학습 모델의 학습 시, 데이터의 샘플링 효율성 제고 방안 고려
Collaborators : 이경호 (KAIST)