KUBIG 2022-1 활동 블로그

고정 헤더 영역

글 제목

메뉴 레이어

KUBIG 2022-1 활동 블로그

메뉴 리스트

  • 홈
  • 태그
  • 분류 전체보기 (109)
    • 소개 (4)
    • 방학 세션 (13)
      • 방학 스터디 (5)
      • KUBIG 미니 프로젝트 (8)
    • 심화 스터디 (90)
      • Practical Statistics for Da.. (44)
      • 시각화 (11)
      • 강화학습 (11)
      • 금융데이터 (5)
      • 분류 예측 (16)
      • 이미지 (3)
    • 장기 프로젝트 (0)
      • Instagram Youtube 썸네일 기반 게시.. (0)
      • 고대 신문 프로젝트 (0)
      • 도로 위 사물 판단(Object Detection.. (0)
      • 분류 예측 1팀 (0)
      • 분류 예측 2팀 (0)
      • 분류 예측 3팀 (0)
      • 식당 및 카페 추천 시스템 (0)
      • 음악 추천 시스템 (0)
      • 텍스트 (0)
    • 알쓸쿠잡 (1)

검색 레이어

KUBIG 2022-1 활동 블로그

검색 영역

컨텐츠 검색

강화학습

  • [강화학습 스터디] Policy Based Methods

    2022.05.12 by 남르미누

  • [강화학습 스터디] Introduction to Reinforcement Learning

    2022.04.04 by 로몽25

[강화학습 스터디] Policy Based Methods

작성자 : 남정재 1. 메타러닝 메타러닝 높은 단계의 AI가 낮은 단계의 AI 혹은 그들 여러개를 최적화하는 것 (강의 URL) https://www.youtube.com/watch?v=2z0ofe2lpz4&feature=emb_imp_woyt '메타' : 한 차원 위의 개념적 용어로 대상의 전반적인 특성을 반영 메타 러닝은 데이터의 패턴을 정해진 프로세스로 학습하는 것이 아니라, 데이터의 특성에 맞춰서 모델 네트워크의 구조를 변화시키면서 학습하는 것 즉, 배우는 방법을 배우는 것(Learning to learn). 메타 러닝은 범위 : 굉장히 광범위 최근에는 하이퍼파라미터 최적화, 자동 신경망 네트워크 설계 등으로 가장 많이 활용됨 기존의 딥러닝 모델은 일반적으로 데이터가 많은 경우 효과적임 BUT, ..

심화 스터디/강화학습 2022. 5. 12. 02:12

[강화학습 스터디] Introduction to Reinforcement Learning

Naive Concept Introduction OpenAI Gym Mathematical concept 벨만 방정식 마르코프 체인 1. Introduction 1) 강화학습(reinforcement learning)이란? : computational approach to learning from interaction STATE(상태) ACTION(행동) REWARD(보상) 이렇게 3가지의 가장 기본적인 개념으로 구성되는 시스템이라고 볼 수 있다. 환경과의 상호작용(보상)을 통해 새로운 행동을 취하고, 그에 따라 계속적으로 변하는 상태라고 이해할 수 있다. 2) 강화학습의 적용/응용 연구 분야 Robotics : 관절에 걸리는 돌림힘(토크) 계산 Business operations 재고 관리 자원 할당 ..

심화 스터디/강화학습 2022. 4. 4. 17:01

추가 정보

인기글

페이징

이전
1
다음
TISTORY
KUBIG 2022-1 활동 블로그 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바