SISReL 정휘영 박사과정생이 "Population-Guided Parallel Policy Search for Reinforcement Learning" 의 논문으로 삼성전자에서 주최하는 제26회 휴먼테크 논문대상 Computer Science & Engineering 분과에서 은상을 수상하였습니다. 본 논문은 강화학습에서 Parallel Learning 을 이용한 성능 향상에 있어 기존의 Population-Based Learning (PBT) 알고리즘의 단점을 개선하는 기법을 제안하였고 제안한 알고리즘의 평균 성능의 단조 증가를 수학적으로 증명하여, 그 기여를 인정받아 ICLR 2020에서도 발표되었습니다.

모두 축하해 주시기 바랍니다.