마르코프 의사 결정 과정
in Quant with Reinforcement learning on Quant
마르코프 가정 & 과정
연속적인 상태가 이어질때 어떤 시점에서 상태는 그 시점 바로 이전의 상태에만 영향을 받는다는 가정 -> 어려운 문제들을 단순화 하고 만족스러운 결과를 도출
in Quant with Reinforcement learning on Quant
연속적인 상태가 이어질때 어떤 시점에서 상태는 그 시점 바로 이전의 상태에만 영향을 받는다는 가정 -> 어려운 문제들을 단순화 하고 만족스러운 결과를 도출
in Quant with Reinforcement learning on Quant
~~~ import numpy as np from quantylab.rltrader import utils
in Quant with Reinforcement learning on Quant
학습 페이지: 6p,92p,113~115p
in etc on Etc
in etc on Etc
정지문제는 어떠한 프로그램이 영원히 돌아갈지 멈출지 판단하는 프로그램이 존재하는가에 대한 문제입니다