솔루션 개념

Solution concept
게임 이론에서 선택된 평형 개선. 화살표는 정교함에서 보다 일반적인 개념으로 가리킨다즉,ESS {\displaystyle \정확함).

게임 이론에서 해법 개념은 게임이 어떻게 펼쳐질지 예측하기 위한 공식적인 규칙이다. 이러한 예측을 "솔루션"이라고 하며, 플레이어가 어떤 전략을 채택할 것인지, 따라서 게임의 결과를 기술한다. 가장 일반적으로 사용되는 용액 개념은 평형 개념으로, 가장 유명한 것은 내쉬 평형이다.

많은 게임에 대한 많은 솔루션 개념은 하나의 솔루션 이상을 초래할 것이다. 이것은 해결책 중 하나를 의심하게 하기 때문에, 게임 이론가는 해결책을 좁히기 위해 정교함을 적용할 수 있다. 다음에 제시된 각 연속적인 솔루션 개념은 더 풍부한 게임에서 믿을 수 없는 평형성을 제거함으로써 이전 게임의 개념을 개선한다.

형식 정의

Let be the class of all games and, for each game , let be the set of strategy profiles of . A solution concept is an element of the direct product i.e., a function such that for all

합리성 및 반복 지배력

이 솔루션 개념에서 플레이어는 합리적이라고 가정되고 따라서 엄격히 지배되는 전략은 실행 가능한 전략 집합에서 제거된다. 다른 플레이어가 선택하는 전략과 상관없이 항상 더 높은 보상을 받는 플레이어가 사용할 수 있는 다른 전략이 있을 때 전략은 엄격히 지배된다. (최소한의 게임 트리 검색에서도 엄격히 지배되는 전략이 중요하다.) 예를 들어, (단일 기간) 죄수들의 딜레마(아래에 표시)에서, 어느 한 선수가 상대가 무엇을 하든 상관없이 항상 결함을 플레이하는 것이 더 낫기 때문에, 협조는 두 선수 모두에게 엄격하게 결함을 지배한다.

죄수2 협력 죄수 2 결함
죄수1 협력 −0.5, −0.5 −10, 0
죄수 1 결함 0, −10 −2, −2

나시 평형

나시 평형이란 전략 프로파일(예: 전술 프로파일은 위의 죄수 딜레마 게임(협조, 결함)에서 죄수 1은 협력하고 죄수 2는 결함을 플레이한다고 명시)이며, 모든 전략은 다른 모든 전략에 대해 최선의 대응이다. 플레이어의 전략은 다른 플레이어의 전략이 실행되는 어떤 상황에서든 더 높은 보상을 산출할 수 있는 다른 전략이 없다면 다른 플레이어의 전략에 대한 최선의 대응이다.

후진 유도

여러 개의 나시 평형을 가진 게임이 있는데, 그 중 일부는 비현실적이다. 역동적인 게임의 경우, 비현실적인 나시 평형성은 미래의 플레이가 합리적일 것이라고 가정하는 후진 유도를 적용함으로써 없어질 수도 있다. 따라서, 그러한 위협은 선수가 그렇게 하도록 요청받았을 때 실행하기에는 비이성적이기 때문에 교정 불가능한 위협을 제거한다.

예를 들어, 플레이어가 업계의 현존하는 기업이고 해당 산업에 참여할 수 있는 잠재력이 있는 역동적인 게임을 고려해 보십시오. 현재 상태로는 현업자가 산업에 대한 독점권을 가지고 있으며 진입자에게 시장 점유율의 일부를 빼앗기고 싶지 않다. 진입자가 진입하지 않기로 선택할 경우, 현업자에 대한 보수가 높고(그것은 독점권을 유지하며), 진입자는 손실도 이득도 없다(그 보수는 0이다). 입회자가 들어오면 현직자가 입회자와 싸우거나 입회할 수 있다. 그것은 가격을 낮추고, 진입자를 폐업시키고, (그리고 퇴출 비용-부정적인 보상으로) 자신의 이익을 손상시킴으로써 싸울 것이다. 진입자를 수용하면 매출의 일부를 잃게 되지만 높은 가격이 유지되고 가격을 낮추는 것보다 더 큰 이익을 얻는다(단독점 이익보다 낮음).

If the entrant enters, the best response of the incumbent is to accommodate. If the incumbent accommodates, the best response of the entrant is to enter (and gain profit). Hence the strategy profile in which the incumbent accommodates if the entrant enters and the entrant enters if the incumbent accommodates is a Nash equilibrium. However, if the incumbent is going to play fight, the best response of the entrant is to not enter. If the entrant does not enter, it does not matter what the incumbent chooses to do (since there is no other firm to do it to - note that if the entrant does not enter, fight and accommodate yield the same payoffs to both players; the incumbent will not lower its prices if the entrant does not enter). Hence fight can be considered as a best response of the incumbent if the entrant does not enter. Hence the strategy profile in which the incumbent fights if the entrant does not enter and the entrant does not enter if the incumbent fights is a Nash equilibrium. Since the game is dynamic, any claim by the incumbent that it will fight is a non-credible threat because by the time the decision node is reached where it can decide to fight (i.e. the entrant has entered), it would be irrational to do so. Therefore, this Nash equilibrium can be eliminated by backward induction.

See also:

Subgame perfect Nash equilibrium

A generalization of backward induction is subgame perfection. Backward induction assumes that all future play will be rational. In subgame perfect equilibria, play in every subgame is rational (specifically a Nash equilibrium). Backward induction can only be used in terminating (finite) games of definite length and cannot be applied to games with imperfect information. In these cases, subgame perfection can be used. The eliminated Nash equilibrium described above is subgame imperfect because it is not a Nash equilibrium of the subgame that starts at the node reached once the entrant has entered.

완벽한 베이시안 평형

때때로 서브게임의 완벽성은 불합리한 결과에 대해 충분히 큰 제한을 가하지 않는다. 예를 들어 서브게임은 정보 세트를 가로지를 수 없기 때문에 불완전한 정보의 게임은 서브게임 그 자체만 가질 수 있으므로 서브게임의 완벽성은 내시 평형증을 제거하는 데 사용될 수 없다. 완벽한 베이시안 평형(PBE)은 게임의 플레이로 정보 세트에서 어느 노드에 도달했는지에 대한 플레이어의 전략과 신념의 규격이다. 의사결정 노드에 대한 믿음은 특정 플레이어가 (평형 경로에서) 노드가 작동 중이거나 재생될 것이라고 생각할 확률이다. 특히 PBE의 직관은 PBE가 지정하는 선수의 신념과 그것이 지정하는 신념이 그것이 지정하는 전략과 일치한다는 점을 감안할 때 합리적인 선수 전략을 명시한다는 것이다.

베이시안 게임에서 전략은 플레이어가 통제하는 모든 정보 세트에서 플레이어가 무엇을 하는지를 결정한다. 신념이 전략과 일치해야 한다는 요구사항은 하위 게임의 완벽성에 의해 규정되지 않은 것이다. 따라서 PBE는 선수들의 신념에 대한 일관성 있는 조건이다. 나시 평형에서와 마찬가지로 PBE에서 어떤 플레이어의 전략도 엄격히 지배되어 있지 않으며, 어떤 정보 세트에서도 플레이어의 전략은 엄격히 지배되어 있지 않다. 즉, 플레이어가 해당 정보 세트에서 보유할 수 있는 모든 믿음에는 해당 플레이어에 대해 더 큰 기대 수익을 산출하는 전략이 없다. 위의 솔루션 개념과 달리 평형 경로를 벗어나더라도 설정된 어떤 정보에서 시작하는 플레이어의 전략은 엄격히 지배적이다. 따라서 PBE에서 플레이어는 평형 경로를 설정한 어떤 정보에서 시작되어 엄격히 지배되는 전략을 실행하도록 위협할 수 없다.

이 솔루션 개념의 이름으로 베이시안은 플레이어가 베이즈의 정리에 따라 자신의 신념을 갱신한다는 사실을 암시한다. 그들은 게임에서 이미 일어난 일에 대해 주어진 확률을 계산한다.

Forward induction

Forward induction is so called because just as backward induction assumes future play will be rational, forward induction assumes past play was rational. Where a player does not know what type another player is (i.e. there is imperfect and asymmetric information), that player may form a belief of what type that player is by observing that player's past actions. Hence the belief formed by that player of what the probability of the opponent being a certain type is based on the past play of that opponent being rational. A player may elect to signal his type through his actions.

Kohlberg and Mertens (1986) introduced the solution concept of Stable equilibrium, a refinement that satisfies forward induction. A counter-example was found where such a stable equilibrium did not satisfy backward induction. To resolve the problem Jean-François Mertens introduced what game theorists now call Mertens-stable equilibrium concept, probably the first solution concept satisfying both forward and backward induction.

See also

References