SISReL KAIST - AMBERmethod

SISReL 박사과정 한승열 군의 논문 "AMBER: Adaptive Multi-Batch Experience Replay for Continuous Action Control ," 이 머신러닝 학회 International Joint Conference on Artificial Intelligence (IJCAI) 2019에서 열리는 the 2nd Workshop on Scaling Up Reinforcement Learning (SURL) 에 Accept 되어, 2019년 8월 중국 Maaco에서 발표 예정입니다.

위 논문은 PPO등과 같은 on-policy 강화학습에서 이전 batch의 샘플들을 효율적으로 사용할 수 있는 방식을 제안하여, 강화학습에서 sample efficiency 향상에 기여한 논문입니다. 또한, 이 방식은 본 연구실이 제안한 Dimension-Wise Importance Sampling Weight Clipping (DISC) 알고리즘에 적용되어 High-action dimension 강화학습 성능향상에 적용되었습니다.