[강화학습 스터디] Q-network
Q-Table (큐테이블)은 state와 action이 주어지면 사용자가 취할 수 있는 최대값은 얼마라고 나왔다. 지금까지 큐테이블을 사용해왔지만 이는 한계점이 존재한다. 실생활의 더 어려운 예제에 적용해보면 위와 같은 문제에 대해서 표현할 수 있는 수가 상당히 커지기에 한계가 존재한다. 이를 극복하고자 Q-network이 등장하게 된 것이다. 신경망을 이용해 큐테이블에 근사하는 Q-network이다. 이 신경망은 input으로 어떤 state를 받고 output으로 모든 가능한 action의 큐값이 나온다. 이렇게 신경망을 구축한 뒤 큐테이블에서 큐값을 업데이트한 것처럼 신경망도 업데이트를 시켜줘야한다. 이때 이 신경망들의 weights를 W라고 하고 input state를 s라고 하면 output s..
심화 스터디/강화학습
2022. 3. 31. 10:52