상태 변화에 따른 단일 혹은 다중 에이전트(Agent)의 반복적 행동과
이에 따른 보상(Reward) 학습을 기반으로 시스템 최적 제어를 달성하기 위한 인공지능(AI) 지능학습 단계인 기계학습(Machine Learning) 알고리즘이다.
강화학습은 일반적으로 시스템(시뮬레이션) 환경에서 에이전트(Agent)의 행동에 따라 잘 설계된 보상함수(Reward Function)를 통해 최적값을 형성되기 때문에
보상함수를 설계에 많은 시간과 노력이 필요하며 실제 환경에 적용하기 위한 한계점이 많다.
따라서 최근 이러한 문제점을 극복하고 개선하기 위해 진행되고 있는 새로운 연구 기술에 대해 살펴보고, 이와 함께 최근 제시되고 있는 융합 기술(Convergence of Application Skill)의 사례들에 대해 살펴보기로 한다.
<목차>
Ⅰ. 서론
Ⅱ. 비지도 강화학습
Ⅲ. 비지도 강화학습 응용 분야
Ⅳ. 결론
* 출처 : 정보통신기획평가원 주간기술동향 1990호
* 자세한 내용은 첨부파일을 참고하여 주시기 바랍니다.
추천 리포트
-
[동향보고서] 메타버스 관련 법적 쟁점
-
[동향보고서] 제조 분야 인공지능 활용 동향과 도입 고려사항
-
[동향보고서] 인공지능 프로세서 컴파일러 개발 동향
-
[코센리포트] 사물인터넷 측면에서의 디지털트윈 기술 특징
-
[코센리포트] 강화학습의 진화 및 미래
-
[동향보고서] 빅데이터 플랫폼의 운영 실태와 개선방안
-
[코센리포트] 설명 가능한 인공지능 기술(Explainable AI)에 의한 인공지능 응용 시장의 향후 변화
-
리포트 평점
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다. -
0.0 (0개의 평가)