Mastering the game of Go with deep neural networks and tree search
2016-03-07
org.kosen.entty.User@3ec1dade
김수진(mauvepale)
분야
개최일
2016. 1. 28
신청자
김수진(mauvepale)
개최장소
URL
첨부파일
행사&학회소개
1. Abstract
2. Supervised learning of policy networks
3. Reinforcement learning of policy networks
4. Reinforcement learning of value networks
5. Searching with policy and value networks
6. Evaluating the playing strength of AlphaGo
7. Discussion
8. Methods (references 사이에 있음)
2. Supervised learning of policy networks
3. Reinforcement learning of policy networks
4. Reinforcement learning of value networks
5. Searching with policy and value networks
6. Evaluating the playing strength of AlphaGo
7. Discussion
8. Methods (references 사이에 있음)
보고서작성신청
2016년 새해부터 인간 대 인공지능의 바둑 대결로 전세계적인 이슈로 등장한 구글의 알파고 관련 논문입니다. 이미 수많은 매체와 전문가들로 부터 다양한 뉴스화 되었으며 이세돌 9단과의 대결이 다가옴에 따라 더욱 뜨거운 감자로 인식되고 있습니다.
본 논문은 지난 1월 유럽챔피언 판후이 2단과의 대결 내용이 포함되어 있습니다. 구글 딥마인드 알파고의 기술적인 이해를 돕는 매우 중요한 논문입니다. 또한 딥러닝이 강화학습을 통해 어떻게 바둑의 전략을 학습해가는지를 이해할 수 있는 매우 좋은 자료입니다.
본 논문은 지난 1월 유럽챔피언 판후이 2단과의 대결 내용이 포함되어 있습니다. 구글 딥마인드 알파고의 기술적인 이해를 돕는 매우 중요한 논문입니다. 또한 딥러닝이 강화학습을 통해 어떻게 바둑의 전략을 학습해가는지를 이해할 수 있는 매우 좋은 자료입니다.