
Research Topic

  주행 중에 발생할 수 있는 모든 상황에 대한 데이터를 확보하는 것은 불가능하기에 기존의 지도학습 방법이 아닌 강화학습 방식의 자율주행 제어 알고리즘이 새로운 해결책이 될 것이라 전문가들이 예측함. 이러한 이유로 최근 강화학습 기반의 자율주행 알고리즘 연구가 대두되고 있으며, 강화학습 기반의 알고리즘으로 자율주행에 성공한 사례들이 발표되고 있음. 하지만, 강화학습 기반 자율주행 알고리즘 역시 돌발 상황 등에 대처할 수 없다는 한계점이 존재하며, 학습된 알고리즘이 최적이라고 단정할 수 없기에 지속적으로 업그레이드가 필요하다고 할 수 있음. 이에 본 연구팀은 전문가의 데이터를 단순 모방하는 것이 아닌 이를 해석하고 분석할 수 있는 의도 추정 알고리즘을 개발하여 돌발 상황에 대한 대처를 가능하게 할 뿐만 아니라 전문가를 뛰어넘는 정책을 습득할 수 있는 강화학습 시스템을 위한 원천기술을 연구함.

  비접촉 방식의 도플러 레이더 센서 기반으로 얻은 피험자의 심장 신호(Doppler Cardiogram, DCG)를 기존 접촉식 방식의 심전도 신호(Electrocardiotram)를 사용하는 심혈관 진잔 방법에 적용가능 하게 해주는 인공지능 기반 신호처리 방법에 대해 연구함. 심박 및 호흡수 뿐만 아니라 심박변이도 분석에도 그 가능성을 확인하였으며, 향후 멀티모달 센서 융합기반 비접촉 환자 모니터링을 위한 연구로 확장될 예정임.

  디지털 가상환경 시뮬레이터 Mujoco를 활용하여 수직 다관절 로봇팔을 이용한 다양한 작업을 수행할 수 있는 강화학습 기반의 제어 방법 연구.  DDPG, SAC, PPO 등의 강화학습 알고리즘 및 리플레이 버퍼 활용 최적화 등을 통해 고난이도 작업을 수행할 수 있는 시스템 개발을 목표로 함.

Conventional control theory has allowed man to control and automate his environment for centuries. Modern control techniques have allowed engineers to optimize the control systems they build for cost and performance. However, optimal control algorithms are not always tolerant to changes in the control system or the environment. Robust control theory is a method to measure the performance changes of a control system with changing system parameters. Application of this technique is important to building dependable embedded systems. The goal is to allow exploration of the design space for alternatives that are insensitive to changes in the system and can maintain their stability and performance. One desirable outcome is for systems that exhibit graceful degradation in the presence of changes or partial system faults. 

※ 학부 연구생 Study & Project

강화학습 기반 2048 게임 플레이

교내 자율주행 경진대회