초합리성

Superrationality

경제학과 게임 이론에서, 참가자는 완벽한 합리성을 가지고 있지만(따라서 그들의 효용성을 최대화) 다른 모든 참가자들 역시 초합리적이고 초합리적 개인은 항상 다른 초합리적 사상가들과 같은 전략을 생각해 낸다고 가정한다면 초합리적(또는 새로이 해석된 합리성)을 가진 것으로 간주된다. 같은 문제에 직면했을 때 정의를 적용하면, 죄수의 딜레마에서 초합리적 상대와 경기하는 초합리적 플레이어는 협력하는 반면 이성적으로 이기적인 플레이어는 탈주하게 된다.

결정규칙은 게임 이론 내에서 주류 모델이 아니며 더글러스 호프스태터가 그의 글, 시리즈, 책 메타게이티브 테마스에서[1] 널리 받아들여지고 있는 게임 이데올로기적 결정과는 다른 이성적 결정의 대안적 유형으로 제시한 것이다. 초합리적(superrationality)은 임마누엘 칸트의 정언적 명령의 한 형태로,[2][3] 경제학자 겸 분석가 로머가 제안한 칸트 평형 개념과 밀접한 관련이 있다.[4] 호프스태터는 "초국가적 사상가들은, 재귀적 정의에 의해, 그들이 초국가적 사상가 집단에 속해 있다는 사실을 그들의 계산에 포함시킨다"[1]라는 정의를 제공했다. 이는 마치 집단의 모든 사람들이 칸트의 단정적인 명령인 "한 사람은 그 행동을 취해야 하고 다른 모든 사람들도 그 행동을 취할 수 있는 행동만 취해야 한다"[4]에 복종하는 것처럼 추론에 해당한다.

"환원하는 인간"이라고 여겨지는 것과는 달리, 초합리적 사상가는 항상 총체적 사회적 효용을 최대화하는 평형을 행하지는 않을 것이며, 따라서 자선가가 되지 않을 것이다.

죄수의 딜레마

초합리성의 개념은 같은 문제를 분석하는 두 논리적인 사상가가 같은 정답을 생각한다는 것이다. 예를 들어, 만약 두 사람이 모두 수학을 잘 하고 둘 다 해야 할 같은 복잡한 문제가 주어진다면, 두 사람 모두 같은 정답을 얻게 될 것이다. 수학에서는 두 개의 답이 같을 것이라는 것을 아는 것이 문제의 가치를 바꾸지는 않지만, 게임 이론에서는 답이 같을 것이라는 것을 아는 것 자체가 답을 바꿀 수도 있다.

죄수의 딜레마는 보통 범죄자에 대한 징역형이라는 측면에서 틀이 잡히지만, 대신 현금 상과 동등하게 진술될 수 있다. 두 선수에게 각각 협력(C) 또는 망명(D) 선택권이 주어진다. 상대편이 어떻게 할지도 모른 채 선수들이 선택한다. 두 사람이 협력하면 각각 100달러를 받는다. 둘 다 망치면 각각 1달러씩 받는다. 한 명이 협력하고 다른 한 명이 결함을 하면 그 결함을 가진 선수는 200달러를 받는 반면 협력한 선수는 아무것도 얻지 못한다.

네 가지 결과와 각 선수에 대한 보상은 아래에 열거되어 있다.

B선수가 협력 선수 B의 결함
A선수가 협력하다 둘 다 100달러를 받는다. A 선수: $0
B 선수: 200달러
A 플레이어 결함 A 선수: 200달러
선수 B: $0
둘 다 1달러를 받는다.

선수들이 납득할 수 있는 한 가지 타당한 방법은 다음과 같다.

  1. 다른 플레이어가 결함을 가정할 때, 내가 협조하면 나는 아무것도 얻지 못하고, 내가 결함을 하면 1달러를 받는다.
  2. 다른 선수가 협조한다고 가정하면 나는 100달러를 받고, 내가 탈당하면 200달러를 받는다.
  3. 그래서 상대 선수가 무엇을 하든 내 보수는 1달러만 내더라도 탈주함으로써 증가한다.

결론은 합리적이지 못한 것이 탈주라는 것이다. 이러한 유형의 추리는 게임-이론적 합리성과 이 게임을 하는 두 게임-이론적 이성적 플레이어가 결함과 동시에 각각 1달러를 받는다.

초합리성은 추론의 대안이다. 첫째, 대칭적인 문제에 대한 해답은 모든 초합리적 플레이어에게 동일할 것으로 가정한다. 따라서 전략이 무엇일지 알기 전에 동일성을 고려한다. 모두 같은 전략을 쓴다고 가정해 각 선수에 대한 보답을 최대화함으로써 전략을 찾아낸다. 슈퍼리전스 플레이어는 다른 슈퍼리전스 플레이어가 같은 일을 할 것이라는 것을 알고 있기 때문에, 그것이 무엇이든 간에, 슈퍼리전스 플레이어는 두 명의 슈퍼리전스 플레이어에 대해 두 가지 선택밖에 없다. 둘 다 초합리적 답변의 가치에 따라 협조하거나 둘 다 낙마한다. 따라서 이 해답이 그들의 보상을 극대화하기 때문에 두 초합리적 플레이어는 협력할 것이다. 이 게임을 하는 두 명의 초합리적 선수들이 각각 100달러를 가지고 떠날 것이다.

전략상 슈퍼리전스 플레이어는 슈퍼리전스 플레이어가 동의할 것으로 가정할 뿐이므로, 게임 이데올로기적 이성 플레이어와 대결하는 슈퍼리전스 플레이어는 망명할 것이라는 점에 유의하십시오. 초합리성이 불확실한 선수와 경기하는 초합리적인 플레이어는 상대 선수가 초합리적일 가능성에 기초해 때로는 이탈하기도 하고 때로는 협력하기도 한다.[citation needed]

표준 게임 이론은 합리성에 대한 상식을 가정하지만, 다른 방식으로 그렇게 한다. 게임 이론적 분석은 각 플레이어가 다른 플레이어와 독립적으로 전략을 변경할 수 있도록 함으로써 보상을 최대화한다. 비록 대칭적인 게임에서의 해답은 모두에게 동일할 것이라고 가정한다. 일방적으로 코스를 변경해 어떤 선수도 보답을 개선할 수 없는 안정적 전략을 정의한 게임-이론적 내시 평형의 정의다. 대칭 게임에서의 초합리적 평형은 최대화 단계 이전에 모든 플레이어의 전략이 같을 수밖에 없는 것이다.(초합성 개념의 비대칭 게임으로의 확장에 대해서는 합의된 것이 없다.)

초합리성은 선수 개개인이 협력하기로 한 결정이 소통이 안 돼도 상대방 선수가 협력하게 만들 것이라고 추측하는 일종의 마법적 사고를 내포하고 있다는 주장도[who?] 있다. 호프스태터는 선수의 목표가 무엇인가를 알아내는 것일 때는 '선택'의 개념이 적용되지 않으며, 그 결정이 상대방 선수의 협력을 유발하는 것이 아니라, 오히려 같은 논리로 인해 의사소통이나 인과관계와 무관하게 같은 해답이 나온다고 지적한다. 이 논쟁은 인간이 초합리적이라는 것이 무엇을 의미하는지 아닌 초합리적 방식으로 행동하는 것이 타당한지에 대한 논쟁이며, 게임 이론에 의해 기술된 바와 같이 인간이 '합리적' 방식으로 행동하는 것이 타 플레이어들이 자신에게 물어봄으로써 무엇을 할 것인가를 알아낼 수 있을 것인가에 대한 논쟁과 유사하다., 내가 그들이라면 어떻게 하겠는가, 그리고 역유도 전략을 적용하고 지배적인 전략의 제거를 반복한다).

확률론적 전략

단순성을 위해, 초합리성에 대한 앞에서 설명한 설명은 혼합된 전략을 무시했다: 최선의 선택은 동전을 뒤집는 것일 수도 있고, 더 일반적으로 어느 정도 확률로 다른 결과를 선택하는 것일 수도 있다. 죄수의 딜레마에서 한 선수가 협력하고 다른 결점이 있을 때의 평균 보수가 협력할 때와 같기 때문에 두 선수가 협력할 때의 평균 보수가 양쪽의 결손 위험을 증가시켜 예상 보수가 줄어들기 때문에 혼합된 전략이 인정될 때에도 확률 1과 협력하는 것이 초합리적이다. 그러나 경우에 따라서는 초합리적 전략이 혼재되기도 한다.

예를 들어 의 지급액이 다음과 같은 경우:

CC – $100/$100
CD – $0/100,000
DC – $100,000/$0
DD – $1/$1

그래서 결손에 막대한 보상이 있다는 점에서 초합리적 전략은 499,900/999,899 또는 49.995% 조금 넘는 확률로 결손하고 있는 것이다. 보상이 무한대로 증가하면 확률의 1/2만 더 접근하게 되고, 더 간단한 전략의 1/2(이미 최소화된) 채택에 따른 손실은 0에 근접하게 된다. 덜 극단적인 예로, 협력자 1명과 탈북자 1명의 보수가 각각 400달러와 0달러였다면, 초합리적 혼합 전략 세계는 100/299 또는 약 1/3의 확률로 탈주하고 있는 것이다.

플레이어가 더 많은 유사한 상황에서 무작위화 장치를 사용하는 것이 필수적일 수 있다. 호프스태터가 논의한 한 예는 플라토니아 딜레마인데, 괴짜 조력자가 20명과 접촉해, 그 중 한 명만 다음날 정오까지 (아무 비용도 들지 않는 것으로 가정) 전보를 보내면, 그 사람은 10억 달러를 받게 될 것이라고 그들에게 말한다. 한 통 이상의 전보를 받거나 아예 받지 않으면 아무도 돈을 받지 못하며 선수 간 의사소통이 금지된다. 이런 상황에서 초합리적(모든 20이 초합리적이라는 것이 알려지면)은 확률 p=1/20으로 전보를 보내는 것이다. 즉, 각 수신자는 본질적으로 20면 주사위를 굴리며 "1"이 올라오면 전보를 보내는 것이다. 이것은 정확히 하나의 전보가 수신될 확률을 최대화한다.

기존의 게임 이론 분석에서는 이것이 해결책이 아니라는 점에 유의하십시오. 경기 이론적으로 이성적인 20명의 선수들은 각각 전보를 쳐서 아무것도 받지 못할 것이다. 이는 전보를 보내는 것이 지배적인 전략이기 때문이다. 만일 개인 플레이어가 전보를 보내면 돈을 받을 기회가 있지만, 전보를 보내지 않으면 아무것도 얻을 수 없다. (모든 전보가 도착하도록 보장받으면, 그들은 오직 한 개만 보낼 것이고, 아무도 돈을 받을 것이라고 예상하지 못할 것이다.)

참고 항목

참조

  1. ^ a b Hofstadter, Douglas (June 1983). "Dilemmas for Superrational Thinkers, Leading Up to a Luring Lottery". Scientific American. 248 (6). – 재인쇄:
  2. ^ Campbell, Paul J. (January 1984). "Reviews". Mathematics Magazine. 57 (1): 51–55. doi:10.2307/2690298. JSTOR 2690298.
  3. ^ Diekmann, Andreas (December 1985). "Volunteer's Dilemma". The Journal of Conflict Resolution. 29 (4): 605–610. doi:10.1177/0022002785029004003. JSTOR 174243. S2CID 143954605.
  4. ^ a b Roemer, John E. (2010). "Kantian Equilibrium". The Scandinavian Journal of Economics. 112 (1): 1–24. doi:10.1111/j.1467-9442.2009.01592.x. ISSN 1467-9442. S2CID 13381456.