체인스토어 역설

체인스토어 역설은 체인스토어 게임이 수반하는 명백한 게임 이론 역설로, 표준 게임 이론 추론의 후진 유도 전략 대신 '결정 전략'이 최적으로 나타난다.

체인 스토어 게임

독점자(A선수)는 20개 마을에 지사를 두고 있다. 그는 각 마을마다 한 명씩 20명의 잠재적인 경쟁자들과 마주하게 되는데, 그들은 그 경쟁자들을 선택할 수 있을 것이다. 안팎으로 그들은 순차적으로 그리고 한 번에 하나씩 그렇게 한다. 잠재적 경쟁자가 선택할 경우, 그는 1의 보상을 받는 반면, A는 5의 보상을 받는다. 그가 선택하게 되면 자신의 행동에 대한 A 선수의 반응에 따라 2나 0의 보상을 받게 된다. 플레이어 A는 인의 선택에 대응하여 협력적이거나 공격적인 두 가지 가격 전략 중 하나를 선택해야 한다. 협동조합을 선택하면 A 선수와 경쟁자 모두 2의 보수가 주어지고, A 선수가 공격적으로 선택하면 각 선수에게 0의 보수가 주어진다.

이러한 결과는 게임을 위한 두 가지 이론, 즉 유도(게임 이론적으로 최적의 버전)와 억제 이론(약하게 지배하는 이론)으로 이어진다.

유도이론

20번째 및 최종 선수가 입/퇴선할 것인지 결정하는 것을 고려하십시오. 그는 만약 그가 선택한다면, A선수는 공격적인 것보다 협력을 선택하는 것에서 더 높은 보상을 받게 되고, 게임의 마지막 기간인 만큼, 더 이상 A선수가 시장에서 위협할 만한 미래의 경쟁자가 없다는 것을 알고 있다. 이를 알고 20번째 선수가 시장에 진출하고, A 선수가 협력한다(0대신 2의 성과급을 받는다).

The outcome in the final period is set in stone, so to speak. Now consider period 19, and the potential competitor's decision. He knows that A will cooperate in the next period, regardless of what happens in period 19. Thus, if player 19 enters, an aggressive strategy will be unable to deter player 20 from entering. Player 19 knows this and chooses in. Player A chooses cooperate.

Of course, this process of backward induction holds all the way back to the first competitor. Each potential competitor chooses in, and Player A always cooperates. A receives a payoff of 40 (2×20) and each competitor receives 2.

Deterrence theory

This theory states that Player A will be able to get payoff of higher than 40. Suppose Player A finds the induction argument convincing. He will decide how many periods at the end to play such a strategy, say 3. In periods 1–17, he will decide to always be aggressive against the choice of IN. If all of the potential competitors know this, it is unlikely potential competitors 1–17 will bother the chain store, thus risking the safe payout of 1 ("A" will not retaliate if they choose "out"). If a few do test the chain store early in the game, and see that they are greeted with the aggressive strategy, the rest of the competitors are likely not to test any further. Assuming all 17 are deterred, Player A receives 91 (17×5 + 2×3). Even if as many as 10 competitors enter and test Player A's will, Player A will still receive a payoff of 41 (10×0+ 7×5 + 3×2), which is better than the induction (game theoretically correct) payoff.

The chain store paradox

If Player A follows the game theory payoff matrix to achieve the optimal payoff, they will have a lower payoff than with the "deterrence" strategy. This creates an apparent game theory paradox: game theory states that induction strategy should be optimal, but it looks like "deterrence strategy" is optimal instead.

The "deterrence strategy" is not a Subgame perfect equilibrium: It relies on the non-credible threat of responding to in with aggressive. A rational player will not carry out a non-credible threat, but the paradox is that it nevertheless seems to benefit Player A to carry out the threat.

셀텐의 반응

이 명백한 역설에 대한 라인하르트 셀튼의 대응은 게임 이론의 표준에 의해 비합리적이기는 하지만 사실 개인이 실제로 채용하는 합리성에 의해 '결정'이라는 생각이 수용 가능한 발상이라고 주장하는 것이다. 셀튼은 개인이 일상, 상상, 그리고 추론이라는 세 가지 수준의 결정을 내릴 수 있다고 주장한다.

완전한 정보?

게임 이론은 "모든 플레이어가 다른 플레이어가 사용할 수 있는 성과와 전략을 알고 있다"는 완전한 정보를 가정하여 각 매트릭스를 모델링한다는 개념에 근거한다. 여기서 "지급"이라는 단어는 플레이어가 최대화하려고 하는 것, 즉 행동을 기술한다. 첫 번째 마을에서, 경쟁자가 진입하고 독점자가 공격적이라면, 두 번째 경쟁자는 독점자가 상식과 전략에 대한 상식의 관점에서, 가정된 보상의 극대화가 아니라는 것을 관찰했다; 독점자가 이 마을에서 그렇게 하기를 기대하는 것은 의심스러운 것처럼 보인다.

경쟁자들이 독점자가 악의적일 가능성에 대해 아주 작은 확률이라도 걸고, 독점자가 공격적이 되는 것에 대해 본질적인 가치를 부여하고(또는 나타나는) 독점자가 이것을 알고 있다면, 독점자가 위에서 설명한 바와 같이 보상이 있더라도, 프로브를 증가시킨다면, 공격성이 있는 초기 도시에의 진입에 대응하는 것이 최적일 것이다.이후 경쟁자들이 독점자의 독설을 부추기는 능력.

셀튼의 의사 결정 수준

루틴 레벨

개인은 결정의 결과에 대한 과거의 경험을 현재의 선택에 대한 그들의 반응을 이끌기 위해 사용한다. "결정 상황 간 유사성의 기본 기준은 조잡하고 때로는 불충분하다."(셀텐)

상상력 수준

개인은 서로 다른 대안들의 선택이 미래 사건의 개연성에 어떤 영향을 미칠 수 있는지를 시각화하려고 한다. 이 수준은 절차적 결정 내에서 일상적인 수준을 사용한다. 이 방법은 컴퓨터 시뮬레이션과 비슷하다.

추리 수준

개인은 과거의 경험과 논리적인 사고를 모두 이용하여 상황을 합리적으로 분석하려는 의식적인 노력을 한다. 이 결정 방식은 가정이 상상력의 산물인 단순화된 모델을 사용하며, 게임 이론에 의해 허용되고 기대되는 유일한 추론 방법이다.

의사 결정 과정

선견지명이 있다.

문제에 사용할 방법(경로, 상상 또는 추리)을 선택하고, 이 결정 자체는 일상적인 수준에서 이루어진다.

최종 결정

어느 수준을 선택하느냐에 따라 개인이 의사결정 절차를 시작한다. 그러면 개인은 가능한 각 수준에 대해 (아마도 다른) 결정에 도달한다. (우리가 상상력을 선택했다면, 우리는 일상적인 결정과 가능성과 상상력의 결정에 도달할 것이다.) 셀튼은 개인들은 항상 일상적인 결정에 도달할 수 있지만, 아마도 더 높은 수준은 아닐 것이라고 주장한다. 개인이 모든 결정을 내리게 되면 어떤 대답을 사용할지 결정할 수 있다...최종 결정 일상적인 수준에서 최종 결정이 내려지고 실제 행동을 지배한다.

참고 항목

참조

Ordeshook, Peter C. (1992). "Reputation and the Chain-Store Paradox". A Political Theory Primer. Routledge. pp. 247–249. ISBN 0-415-90241-X.
Selten, Reinhard (1978). "The chain store paradox". Theory and Decision. 9 (2): 127–159. doi:10.1007/BF00131770. ISSN 0040-5833.

추가 읽기

체인스토어의 역설과 헌법정치의 관계

Search