매칭 페니

Matching pennies
앞면. 꼬리
앞면. +1, −1 −1, +1
꼬리 −1, +1 +1, −1
매칭 페니

페니를 맞추는 것은 게임 이론에서 사용되는 간단한 게임의 이름이다. 이븐과 오드 두 명의 선수 사이에서 경기한다. 각 선수는 1페니를 가지고 있고 몰래 1페니를 앞이나 뒤쪽으로 돌려야 한다. 그러면 선수들은 자신의 선택을 동시에 드러낸다. 페니가 일치하면(머리 또는 양쪽 꼬리 모두) 이븐은 두 페니를 모두 보관하므로 홀수(+1)에서 1(이븐의 경우), 홀수(-1)에서 1승을 거둔다. 페니가 일치하지 않을 경우(머리 1개와 꼬리 1개) Old는 두 페니를 모두 보관하므로 Even(이븐의 경우), Od의 경우 +1을 받는다.

이론

매칭 페니는 각 참가자의 효용 손익이 다른 참가자의 효용성 손실에 의해 정확히 균형을 이루기 때문에 제로섬 게임이다. 참가자들의 총 이득을 합산하고 총 손실을 빼면 총액은 0이 된다.

게임은 보상 매트릭스(오른쪽 사진 - 이븐의 관점에서)로 쓸 수 있다. 매트릭스의 각 셀에는 이븐의 보상이 먼저 나열되어 있는 두 플레이어의 보상이 표시된다.

페니 매칭은 주로 혼합 전략과 혼합 전략 나시 평형의 개념을 설명하는데 사용된다.[1]

이 게임은 최상의 반응에 가장 좋은 반응인 순수 전략(머리나 꼬리)이 없기 때문에 순수한 전략인 내쉬 평형이 없다. 다른 선수가 무엇을 할 것인지 말하면 어느 선수도 바꾸고 싶어하지 않을 정도로 순수한 전략이 한 쌍도 없다는 얘기다. 대신 이 게임의 독특한 나시 평형은 각 플레이어가 동일한 확률로 앞이나 꼬리를 선택하는 혼합 전략이다.[2] 이런 식으로 각 선수는 상대 선수를 머리와 꼬리 중 어느 쪽을 택하든 무관심하게 만들기 때문에 두 선수 모두 다른 전략을 시도할 동기를 부여받지 못한다. 혼합 전략에 대한 최선의 대응 기능은 아래 그림 1에 설명되어 있다.

그림 1 최고의 대응은 페니 매칭 게임에서 플레이어들에게 해당된다. 가장 왼쪽의 매핑은 이븐 플레이어에 대한 것이고, 가운데에는 오드 플레이어에 대한 매핑이 표시된다. 오른쪽 그래프에 나시 평형이 표시되어 있다. x는 Odd 플레이어가 헤드를 플레이할 확률이고 y는 Even이 헤드를 플레이할 확률이다. 이븐의 전략이 Odd의 전략에 가장 잘 대응하고, 그 반대의 경우도 마찬가지인 유일한 교차로다.

두 선수 중 한 선수가 평형을 유지할 때, 모든 선수의 예상 보수는 0이다.

변형

앞면. 꼬리
앞면. +7, -1 -1, +1
꼬리 -1, +1 +1, -1
매칭 페니

행렬의 보답을 변경하면 평형점을 변경할 수 있다. 예를 들어, 오른쪽에 보이는 표에서 이븐은 자신과 홀드 플레이 헤드를 둘 다 이기면 7승을 거둘 기회가 있다. 이 게임의 평형점을 계산하려면 혼합 전략을 구사하는 플레이어가 두 가지 동작 사이에서 무관심해야 한다는 점에 유의하십시오(그렇지 않으면 순수한 전략으로 전환함). 이렇게 하면 두 가지 방정식이 나온다.

  • For the Even player, the expected payoff when playing Heads is and when playing Tails , and these must be equal, so .
  • For the Odd player, the expected payoff when playing Heads is and when playing Tails , and these must be equal, so .

Oder의 Head-probability이고 Even의 Head-probability라는 점에 유의하십시오. 그래서 이븐의 보수가 바뀐 것은 오드의 전략이 아니라 전략에 영향을 미친다.

실험실 실험

인간 플레이어가 항상 균형 전략을 구사하는 것은 아니다. 실험실 실험은 선수들이 평형 전략에서 이탈하게 만드는 몇 가지 요인을 밝혀내는데, 특히 페니 매칭이 반복적으로 이루어지는 경우 더욱 그러하다.

  • 인간은 무작위화에 능하지 못하다. 그들은 그들의 행동을 Heads에서 Tails로, 그리고 그 반대로 바꾸어서 "Random" 시퀀스를 만들려고 할 수도 있지만, 그들은 너무 자주 그들의 행동을 바꾼다(도박자의 오류로 인해). 이를 통해 전문 플레이어들은 50% 이상의 성공 확률로 다음 행동을 예측할 수 있게 된다. 이러한 방법으로 긍정적인 기대보수가 달성될 수 있을 것이다.
  • 인간은 패턴을 탐지하도록 훈련을 받는다. 그런 패턴이 존재하지 않는 상황에서도 상대의 시퀀스에 있는 패턴을 탐지하고 그에 따라 전략을 조정하려고 한다.[3]
  • 인간의 행동은 프레임 효과에 의해 영향을 받는다.[4] 오드 플레이어가 '실수자'로, 이븐 플레이어가 '추측자'로 명명되면 전자는 무작위화, 후자는 패턴을 탐지하는 데 집중하게 되며, 이는 추측자의 성공 가능성을 높인다. 게다가 이븐이 시합이 있을 때 이긴다는 사실은 (부작용-반응 호환성 효과로 인해) 미스매칭보다 매칭이 잘되기 때문에 그에게 유리하다.

더욱이, 보상 매트릭스가 비대칭적일 때, 게임이 반복되지 않을 때에도 다른 요소들이 인간의 행동에 영향을 미친다.

  • 플레이어는 더 높은 보상을 주는 행동을 할 확률을 높이는 경향이 있다. 예를 들어 위의 보상 매트릭스에서 이븐은 더 많은 헤드를 플레이하는 경향이 있다. 이것은 직관적으로 이해할 수 있지만 내시 평형은 아니다: 위에서 설명한 것처럼 선수의 혼합 확률은 자신의 보수가 아니라 상대 선수의 보상에만 의존해야 한다. 이 편차는 수량 반응 평형이라고 설명할 수 있다.[5][6] 정량-반응-평형화에서 최량 반응 곡선은 표준 내시 평형에서처럼 날카롭지 않다. 오히려 확률이 0인 액션에서 확률 1(즉, 내시 평형에서 플레이어는 확률 1로 가장 좋은 반응을, 확률 0으로 가장 나쁜 반응을 선택하는 반면, 양자-응답-평형에서 플레이어는 sma인 높은 확률로 가장 좋은 반응을 선택한다.1보다 느리고 0보다 높은 확률로 최악의 반응이다. 평형점은 두 선수의 평활곡선의 교차점으로서 내시 평형점과는 다르다.
  • 자기 보상 효과는 위험 회피에 의해 완화된다.[7] 플레이어는 높은 이득을 과소평가하고 높은 손실을 과대평가하는 경향이 있다. 이것은 정량-반응 곡선을 이동시키고 정량-반응-균형점을 변화시킨다. 이는 정밀하게 반복된 제로섬 게임에서 위험 회피의 부적절성에 관한 이론적 결과와 상반되는 것으로 보인다.[8]

실생활자료

실험실 실험의 결론은 여러 가지 이유로 비판되어 왔다.[9][10]

  • 실험실 실험에서의 게임은 인위적이고 단순하며 실제 행동을 모방하지 않는다.
  • 실험실 실험에서 얻는 이득은 작기 때문에 피실험자들은 최적으로 놀 수 있는 동기가 별로 없다. 실생활에서 시장은 그러한 불합리성을 '도박'하고 플레이어가 더 이성적으로 행동하게 할 수도 있다.
  • 피실험자들은 어리석게 보이지 않도록 하거나 실험자를 기쁘게 하는 것과 같은 금전적 보상을 극대화하는 것 외에 다른 고려사항이 있다.
  • 실험실 실험은 짧고, 과목들은 최적의 전략을 배우기에 충분한 시간이 없다.

이러한 어려움을 극복하기 위해, 몇몇 저자들이 프로 스포츠 게임의 통계적 분석을 해 왔다. 이들은 보수가 매우 높은 제로섬 게임으로, 선수들은 전문가가 되기 위해 일생을 바쳤다. 종종 그러한 게임은 페니를 맞추는 것과 전략적으로 유사하다.

  • 축구 페널티킥에서 키커는 왼발과 오른발 중 두 가지 옵션이 있고 골키퍼는 왼발과 오른발 중 두 가지 옵션이 있다.[11] 키커는 선택이 일치하지 않을 때 골을 넣을 확률이 더 높고, 선택이 일치하지 않을 때는 더 낮다. 일반적으로 각 키커의 다리가 더 강하고(보통 오른쪽 다리) 반대 방향(왼쪽)으로 차면 승산이 더 크기 때문에 보수가 비대칭적이다. 키커와 골키퍼의 행동을 면밀히 살펴본 결과 이들의 행동이 내시 평형 예측에서 크게 벗어나지 않는 것으로 나타났다[9][10].
  • 테니스 서브 앤드 리턴 플레이에서도 상황은 비슷하다. 승률이 미니맥스 가설과 일치하지만 선수들의 선택은 무작위가 아닌 것으로[12] 조사됐다. 프로 테니스 선수들도 무작위화에 서툴고, 행동을 너무 자주 바꾼다.

참고 항목

  • 동전이 아닌 손가락으로 하는 같은 전략적 구조를 가진 게임.
  • 가위바위보 - 각 플레이어가 두 가지 대신 세 가지 전략을 갖는 비슷한 게임.
  • 패리티 게임 - 관련 없는(그리고 훨씬 더 복잡한) 2인용 논리 게임, 컬러 그래프에서 실행된 게임.

참조

  1. ^ Gibbons, Robert (1992). Game Theory for Applied Economists. Princeton University Press. pp. 29–33. ISBN 978-0-691-00395-5.
  2. ^ "Matching Pennies". GameTheory.net. Archived from the original on 2006-10-01.
  3. ^ Mookherjee, Dilip; Sopher, Barry (1994). "Learning Behavior in an Experimental Matching Pennies Game". Games and Economic Behavior. 7: 62–91. doi:10.1006/game.1994.1037.
  4. ^ Eliaz, Kfir; Rubinstein, Ariel (2011). "Edgar Allan Poe's riddle: Framing effects in repeated matching pennies games". Games and Economic Behavior. 71: 88–99. doi:10.1016/j.geb.2009.05.010.
  5. ^ Ochs, Jack (1995). "Games with Unique, Mixed Strategy Equilibria: An Experimental Study". Games and Economic Behavior. 10: 202–217. doi:10.1006/game.1995.1030.
  6. ^ McKelvey, Richard; Palfrey, Thomas (1995). "Quantal Response Equilibria for Normal Form Games". Games and Economic Behavior. 10: 6–38. CiteSeerX 10.1.1.30.5152. doi:10.1006/game.1995.1023.
  7. ^ Goeree, Jacob K.; Holt, Charles A.; Palfrey, Thomas R. (2003). "Risk averse behavior in generalized matching pennies games" (PDF). Games and Economic Behavior. 45: 97–113. doi:10.1016/s0899-8256(03)00052-6.
  8. ^ Wooders, John; Shachat, Jason M. (2001). "On the Irrelevance of Risk Attitudes in Repeated Two-Outcome Games". Games and Economic Behavior. 34 (2): 342. doi:10.1006/game.2000.0808. S2CID 2401322.
  9. ^ a b Chiappori, P.; Levitt, S.; Groseclose, T. (2002). "Testing Mixed-Strategy Equilibria When Players Are Heterogeneous: The Case of Penalty Kicks in Soccer" (PDF). American Economic Review. 92 (4): 1138–1151. CiteSeerX 10.1.1.178.1646. doi:10.1257/00028280260344678. JSTOR 3083302.
  10. ^ a b Palacios-Huerta, I. (2003). "Professionals Play Minimax". Review of Economic Studies. 70 (2): 395–415. CiteSeerX 10.1.1.127.9097. doi:10.1111/1467-937X.00249.
  11. ^ 중간에 발차기/서기 옵션도 있지만, 덜 자주 사용된다.
  12. ^ Walker, Mark; Wooders, John (2001). "Minimax Play at Wimbledon". The American Economic Review. 91 (5): 1521–1538. CiteSeerX 10.1.1.614.5372. doi:10.1257/aer.91.5.1521. JSTOR 2677937.