[강화학습 스터디] Introduction to Reinforcement Learning
Naive Concept Introduction OpenAI Gym Mathematical concept 벨만 방정식 마르코프 체인 1. Introduction 1) 강화학습(reinforcement learning)이란? : computational approach to learning from interaction STATE(상태) ACTION(행동) REWARD(보상) 이렇게 3가지의 가장 기본적인 개념으로 구성되는 시스템이라고 볼 수 있다. 환경과의 상호작용(보상)을 통해 새로운 행동을 취하고, 그에 따라 계속적으로 변하는 상태라고 이해할 수 있다. 2) 강화학습의 적용/응용 연구 분야 Robotics : 관절에 걸리는 돌림힘(토크) 계산 Business operations 재고 관리 자원 할당 ..
심화 스터디/강화학습
2022. 4. 4. 17:01