Reinforcement Learning

안정성 보장 제어 공식을 활용한 학습 제어기 업데이트

최적 제어기가 만족하는 공식을 충족하도록 근사함수 업데이트

배기 후처리 시스템에 적용하여 성능 확인