순차 평형

Sequential equilibrium
순차 평형
게임 이론솔루션 개념
관계
부분 집합서브게임 퍼펙트 평형, 완벽한 베이시안 평형
Superset광형 떨림 손완전 평형, 준완전 평형
의의
제안자데이비드 M. 크렙스로버트 윌슨
에 사용됨광범위한 폼 게임

순차적 평형이란 데이비드 M. 크렙스와 로버트 윌슨으로 인해 광범위한 폼 게임을 위한 내쉬 평형을 정교화한 이다. 순차적 균형은 선수 개개인에 대한 전략뿐만 아니라 선수 개개인에 대한 믿음도 명시한다. 믿음은 플레이어가 속한 게임의 각 정보 집합에 대해 정보 집합의 노드에 확률 분포를 제공한다. 전략과 신념의 프로필을 게임에 대한 평가라고 한다. 비공식적으로 말하자면, 평가는 그 신념이 합리적이고 신념이 그 전략에 의해 주어진 결과 경로에서 확인된다면 완벽한 베이시안 평형이다. 순차적 평형성의 정의는 또한 동일한 성질에 대한 믿음과 관련 전략의 임의적인 작은 동요가 있어야 한다. 이러한 이론적 개념의 한 가지 구체적인 구현을 강화 학습이라고 하는데, 여기서 학습자는 자신의 행동에 따라 보상을 받고 따라서 어떤 최적의 전략을 채택하도록 훈련받는다. 이 개념은 새로운 것은 아니지만, 많은 개방적인 문제들로 인해 여전히 뜨거운 연구 주제가 되고 있다.

일관성 있는 평가

어떤 믿음이 주어진 합리적인 전략의 공식적 정의는 직선적이다; 전략은 단지 모든 정보 집합에서 기대되는 이익을 최대화해야 한다. 또한 전략에 따라 긍정적인 확률을 가지고 도달한 정보 집합에 대해 합리적인 믿음이 무엇인지 정의하는 것은 간단하다; 신념은 정보 집합의 노드에 도달한 경우에 조건부 확률 분포가 되어야 한다. 이것은 베이즈의 통치의 적용을 수반한다.

전략에 따라 확률 0으로 도달한 정보 집합에 대해 합리적인 믿음이 무엇이어야 하는지를 정의하는 것은 순발력과는 거리가 멀다. 실제로 이것이 크렙스와 윌슨의 주요 개념적 공헌이다. 이들의 일관성 요구사항은 다음과 같다. 평가는 위의 직선적인 의미에서 완전히 혼합된 전략 프로파일과 관련된 합리적인 믿음의 시퀀스의 한계점이 되어야 한다.

기타 평형 개선과의 관계

순차 평형이란 서브게임 퍼펙트 평형, 심지어 베이시안 평형까지 더욱 정교하게 다듬은 것이다. 그것은 그 자체로 광범위한 형태의 떨리는 손의 완벽한 평형적절한 평형에 의해 정제된다. 순차적 평형(또는 광범위한 형태의 떨림 완벽한 평형) 전략은 반드시 허용될 수 있는 것은 아니다. 수용성을 보장하는 순차적 평형의 정교함은 준완전한 평형이다.

참조

데이비드 M. 크렙스로버트 윌슨. "Sequential Equilibria", Econometrica 50:863-894, 1982.