본문 바로가기 메뉴 바로가기

왕초보 개발자의 일기장

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

왕초보 개발자의 일기장

검색하기 폼
  • 전체보기 (105)
    • Computer Science (11)
      • Algorithm (8)
      • OS (3)
    • A.I (17)
      • RL by David Silver (4)
      • RL by Sung Kim (7)
      • Study (6)
    • Development (76)
      • Backend (6)
      • Unix and Linux (18)
      • Android (26)
      • AWS (7)
      • Git (17)
      • 기타 (2)
  • 방명록

Markov Decision Process (1)
Lecture 2 : Markov Decision Process

본 내용은 David Silver 교수님의 강의를 듣고 정리한 내용입니다. https://youtu.be/lfHX2hHRMVQ1. IntroductionMarkov Decision Processes formally describe an environment for reinforcement learningWhere the environment is fully observable2. Markov Process1) Markov PropertyThe future is independent of the past given the present (현재의 미래는 현재의 과거로부터 독립적이다)시작 S1 부터 미래 St+1에 도달할 확률과, 현재 St에서 St+1에 도달할 확률이 동일하다.현재는 과거의 미래이며, 현재는..

A.I/RL by David Silver 2019. 2. 18. 19:36
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • Github
  • Facebook
  • LinkedIn
TAG
  • Gradient descent algorithm
  • #handsonlab
  • rl
  • Android
  • p-value
  • Reinforcement Learning
  • ausg
  • MDP
  • OS
  • Linux
  • Memory segmetation
  • #AWS
  • commands
  • Preprocessing
  • sequelize
  • branch
  • #ausg
  • System
  • Android Studio
  • MySQL
  • 통계적 가설 검정
  • Algorithm
  • AWS
  • Reinforcement Learniing
  • gitgnore
  • #ab
  • Confustion Matrix
  • Markov Decision Process
  • git
  • 강화학습
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바