동향

강화학습 연구 및 융합 기술 동향

분야

정보/통신

발행기관

정보통신기획평가원

발행일

2021.03.31

URL


강화학습은 제어를 위한 의사결정이 필요한 시스템 환경(Environment)에서
상태 변화에 따른 단일 혹은 다중 에이전트(Agent)의 반복적 행동과
이에 따른 보상(Reward) 학습을 기반으로 시스템 최적 제어를 달성하기 위한 인공지능(AI) 지능학습 단계인 기계학습(Machine Learning) 알고리즘이다.

강화학습은 일반적으로 시스템(시뮬레이션) 환경에서 에이전트(Agent)의 행동에 따라 잘 설계된 보상함수(Reward Function)를 통해 최적값을 형성되기 때문에
보상함수를 설계에 많은 시간과 노력이 필요하며 실제 환경에 적용하기 위한 한계점이 많다.

따라서 최근 이러한 문제점을 극복하고 개선하기 위해 진행되고 있는 새로운 연구 기술에 대해 살펴보고, 이와 함께 최근 제시되고 있는 융합 기술(Convergence of Application Skill)의 사례들에 대해 살펴보기로 한다.

<목차>
Ⅰ. 서론
Ⅱ. 비지도 강화학습
Ⅲ. 비지도 강화학습 응용 분야
Ⅳ. 결론
 
* 출처 : 정보통신기획평가원 주간기술동향 1990호
* 자세한 내용은 첨부파일을 참고하여 주시기 바랍니다.

 

리포트 평점  
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다.
0.0 (0개의 평가)
평가하기
등록된 댓글이 없습니다.