KUBIG 2022-1 활동 블로그

고정 헤더 영역

글 제목

메뉴 레이어

KUBIG 2022-1 활동 블로그

메뉴 리스트

  • 홈
  • 태그
  • 분류 전체보기 (109)
    • 소개 (4)
    • 방학 세션 (13)
      • 방학 스터디 (5)
      • KUBIG 미니 프로젝트 (8)
    • 심화 스터디 (90)
      • Practical Statistics for Da.. (44)
      • 시각화 (11)
      • 강화학습 (11)
      • 금융데이터 (5)
      • 분류 예측 (16)
      • 이미지 (3)
    • 장기 프로젝트 (0)
      • Instagram Youtube 썸네일 기반 게시.. (0)
      • 고대 신문 프로젝트 (0)
      • 도로 위 사물 판단(Object Detection.. (0)
      • 분류 예측 1팀 (0)
      • 분류 예측 2팀 (0)
      • 분류 예측 3팀 (0)
      • 식당 및 카페 추천 시스템 (0)
      • 음악 추천 시스템 (0)
      • 텍스트 (0)
    • 알쓸쿠잡 (1)

검색 레이어

KUBIG 2022-1 활동 블로그

검색 영역

컨텐츠 검색

Q-network

  • [강화학습 스터디] Q-network

    2022.03.31 by 남르미누

[강화학습 스터디] Q-network

Q-Table (큐테이블)은 state와 action이 주어지면 사용자가 취할 수 있는 최대값은 얼마라고 나왔다. 지금까지 큐테이블을 사용해왔지만 이는 한계점이 존재한다. 실생활의 더 어려운 예제에 적용해보면 위와 같은 문제에 대해서 표현할 수 있는 수가 상당히 커지기에 한계가 존재한다. 이를 극복하고자 Q-network이 등장하게 된 것이다. 신경망을 이용해 큐테이블에 근사하는 Q-network이다. 이 신경망은 input으로 어떤 state를 받고 output으로 모든 가능한 action의 큐값이 나온다. 이렇게 신경망을 구축한 뒤 큐테이블에서 큐값을 업데이트한 것처럼 신경망도 업데이트를 시켜줘야한다. 이때 이 신경망들의 weights를 W라고 하고 input state를 s라고 하면 output s..

심화 스터디/강화학습 2022. 3. 31. 10:52

추가 정보

인기글

페이징

이전
1
다음
TISTORY
KUBIG 2022-1 활동 블로그 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바