마르코프 전략

Markov strategy

게임 이론에서 마르코프 전략은 게임의 역사를 이런저런 방법으로 요약하는 국가 변수에만 의존하는 전략이다.[1] 예를 들어, 상태 변수는 반복된 게임에서 현재 플레이가 될 수도 있고, 최근의 플레이 순서에 대한 해석일 수도 있다.

마르코프 전략의 프로필은 게임의 모든 상태에서 내시 평형이라면 마르코프 완벽한 평형이다.

참조

  1. ^ Fudenberg, Drew (1995). Game Theory. Cambridge, MA: The MIT Press. pp. 501–40. ISBN 0-262-06141-4.