개인정보처리방침 1. 개인정보의 처리 목적 (‘없음’이하 ‘없음’) 은(는) 다음의 목적을 위하여 개인정보를 처리하고 있으며, 다음의 목적 이외의 용도로는 이용하지 않습니다. 2. 개인정보의 처리 및 보유 기간 ① (‘없음’이하 ‘없음’) 은(는) 정보주체로부터 개인정보를 수집할 때 동의 받은 개인정보 보유․이용기간 또는 법령에 따른 개인정보 보유․이용기간 내에서 개인정보를 처리․보유합니다. ② 구체적인 개인정보 처리 및 보유 기간은 다음과 같습니다. ☞ 아래 예시를 참고하여 개인정보 처리업무와 개인정보 처리업무에 대한 보유기간 및 관련 법령, 근거 등을 기재합니다. (예시)- 고객 가입 및 관리 : 서비스 이용계약 또는 회원가입 해지시까지, 다만 채권․채무관계 잔존시에는 해당 채권․채무관계 정산시까지 ..
분명 나는 npm install -g [package] 로 설치를 하였고, npm list -g 로 확인도 하였는데 명령어가 not found로 나오는 경우가 있다. 이 경우 npm의 prefix path가 잘못되었기 때문이다. 다시한번 npm list -g를 사용하여 리스트를 확인해 보면 패키지들이 설치된 path가 보일 것이다. 이것을 바꾸어 주어야 한다. 나의 macbook 기준으로 다음과 같이 해결하였다. npm config set prefix /usr/local

Model-Free Prediction Policy를 따라 학습을 진행하면서, Sample backup을 통해 Value Function을 Update하는 것을 Model-Free Prediction이라 한다. Model-Free : Environment의 model을 모르는 상태로 학습을 진행한다. DP는 model을 알아야 학습이 가능했다(Model-based). Agent가 Trial-and-Error(시행착오)를 통해 학습을 진행한다. 모든 경로를 사용해 Update하는 Full-width backup이 아닌, 실제 경험한 경로만 사용해 Update하는 Sample backup을 사용한다. Model-Free 방법은 두 가지가 존재한다. Monte-Carlo Temporal-Difference 1..
Planning by Dynamic Programming1. Introduction�What is Dynamic Programming?The term dynamic programming refers to a collection of algorithms that can be used to compute optimal policies given a perfect model of the environment as a Markov decision processTwo properties of Dynamic ProgrammingOptimal subproblemPrinciple of optimality appliesOptimal solution can be decomposed into subproblemsOverla..
출처 : https://sdtimes.com/cloud/google-open-source-platform-spinnaker-1-0/ 1. Blue / Green 배포 - 새 버전의 서버 그룹의 배포가 완료되면 로드밸런서의 트래픽을 신버전으로 바꿉니다.- 단점 : 실제 운영서버의 2배수의 서버가 필요함 2. Rolling Blue / Green 배포 - 일반 Blue /Green 처럼 트래픽을 신버전으로 한번에 바꾸는 것이 아니라, 신버전의 서버를 하나씩 배포하면서 구버전의 서버를 하나씩 대체해 나가는 방식이다.- 서버 대수가 적거나 한정적일때 효율적 3. Canary 배포 - 구 버전의 일부를 신버전으로 대체한 뒤, 운영상에 문제가 없음이 확인되면 100%를 신버전으로 대체한다.
1. FIFO (First In First Out) - 가장 오래전에 저장된 페이지를 삭제한다. 2. OPT (Optimal Page Replacement) - 앞으로 가장 사용하지 않을 페이지를 예측해서 교체한다. 3. LRU (Least Recently Used) - 가장 오랫동안 사용하지 않은 페이지를 교체한다. 4. LFU (Least Frequently Used) - 사용 빈도가 가장 적은 페이지를 교체한다. 5. MFU (Most Frequently Used) - 사용 빈도가 가장 많은 페이지를 교체한다.
1. Round Robin (순차 방식) - 요청이 들어오는 순서대로 서버에 균등하게 분배한다. - 서버들의 성능이 동일한 경우 효율적 - 알고리즘의 속도가 빠르나 경로가 보장되지 않는다. 2. Weighted Round Robin - 가중치가 높은 서버에 더 많은 트래픽을 할당 - 서버들의 성능이 다른 경우 효율적 3. Least Connection (최소 접속 방식) - Connection이 가장 적은 서버에 요청을 분배 - Connection을 동적으로 카운트한다. 4. Weighted Least Connection (가중치 최소접속 방식) - 서버에 가중치를 추가한 Least Connection 알고리즘 - 서버의 성능에 따른 가중치에 따라서 트래픽을 분산 - 가중치와 Connection 연산 등..
본 내용은 David Silver 교수님의 강의를 듣고 정리한 내용입니다. https://youtu.be/lfHX2hHRMVQ1. IntroductionMarkov Decision Processes formally describe an environment for reinforcement learningWhere the environment is fully observable2. Markov Process1) Markov PropertyThe future is independent of the past given the present (현재의 미래는 현재의 과거로부터 독립적이다)시작 S1 부터 미래 St+1에 도달할 확률과, 현재 St에서 St+1에 도달할 확률이 동일하다.현재는 과거의 미래이며, 현재는..
- Total
- Today
- Yesterday
- #handsonlab
- Reinforcement Learning
- Linux
- AWS
- commands
- p-value
- Memory segmetation
- Preprocessing
- System
- rl
- OS
- Reinforcement Learniing
- 통계적 가설 검정
- Android
- Algorithm
- Gradient descent algorithm
- sequelize
- gitgnore
- branch
- #AWS
- git
- ausg
- #ab
- MDP
- 강화학습
- #ausg
- MySQL
- Markov Decision Process
- Confustion Matrix
- Android Studio
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |