Tit for tat

Tit for tat
서구의 비즈니스 문화에서 누군가를 만날 때 악수를 하는 것은 초기 협력의 신호탄이다.

Tit for tat은 "평등한 보복"을 의미하는 영어 속담이다.그것은 1558년에 처음 기록된 "tip for tap"에서 발전했다.[1]

게임 이론에서도 매우 효과적인 전략이다.이 전략을 사용하는 에이전트는 먼저 협력한 다음, 이후 상대방의 이전 행동을 복제한다.상대가 이전에 협조적이었다면 에이전트도 협조적이다.만약 그렇지 않다면, 에이전트는 그렇지 않다.

게임 이론

티격태격은 반복된 죄수의 딜레마에 대한 전략으로 매우 성공적으로 사용되어 왔다.이 전략은 1980년경 열린 로버트 액슬로드의 두 대회에서 아나톨 라포포트가 처음 도입했다.[2]특히, 그것은 (두 경우 모두) 가장 단순한 전략이자 직접 경쟁에서 가장 성공적이었다.

이 전략을 사용하는 에이전트는 먼저 협력한 다음, 이후 상대방의 이전 행동을 복제한다.상대가 이전에 협조적이었다면 에이전트도 협조적이다.만약 그렇지 않다면, 에이전트는 그렇지 않다.이것은 생물학의 호혜적 이타주의와 비슷하다.

시사점

이름이 적대적 성격을 강조함에도 불구하고 대체로 협조적인 티격태격 전략의 성공은 많은 이들을 깜짝 놀라게 했다.다양한 팀들이 만들어낸 전략에 맞서 2개 대회에서 우승했다.첫 번째 대회 이후, 티격태격과 싸우기 위해 특별히 고안된 새로운 전략들은 서로 부정적인 상호작용 때문에 실패했다; 티격태격 이외의 성공적인 전략은 티격태격과 자신을 모두 염두에 두고 수립되어야 했을 것이다.

이러한 결과는 동물 집단(특히 인간 사회)이 어떻게 홉스주의적인 자연 상태에 종사하는 개인들로부터 기대될 수 있는 개인주의적인 "빨간 이빨과 발톱" 방식이 아닌, 대부분(또는 전적으로) 협력 사회에서 살게 되었는지에 대한 통찰력을 줄 수 있다.이것, 특히 인간 사회와 정치에의 적용은 로버트 액슬로드의 저서 <협력진화>의 주제다.

게다가, 티격태격 전략은 갈등을 줄이기 위한 효과적인 기술을 연구하는 데 있어 사회 심리학자들과 사회학자들에게 유익하게 사용되어 왔다.연구 결과에 따르면 일정 기간 동안 경쟁을 해온 개인들이 더 이상 서로를 신뢰하지 않을 때 가장 효과적인 경쟁 역전자는 티격태격 전략의 사용이라고 한다.개인은 일반적으로 행동 동화에 관여하는데, 이것은 그들이 협력하거나 경쟁하는 그룹 구성원에 의해 보여지는 것과 그들 자신의 행동을 일치시키는 경향이 있다.따라서 티격태격 전략이 협력에서 시작되면 협력이 뒤따른다.반면 상대방이 경쟁할 경우 티격태격 전략이 대안세력의 경쟁도 이끌게 된다.궁극적으로, 다른 구성원에 의한 각각의 행동은 일치된 대응, 경쟁과 경쟁, 협력과 협력으로 대응된다.

갈등 해결의 경우, 티격태격 전략은 몇 가지 이유로 효과적이다: 그 기술은 명확하고, 멋지고, 공격적이고, 용서받을 수 있는 것으로 인식된다.첫째, 명확하고 인지할 수 있는 전략이다.그것을 사용하는 사람들은 그것의 우발성을 빠르게 인식하고 그에 따라 그들의 행동을 조정한다.더욱이 협력에서 시작해 경쟁적인 움직임을 따라가는 데만 하자가 있어 좋은 것으로 평가받는다.이 전략은 또한 경쟁자들에 대한 즉각적인 보복을 제공하기 때문에 계획적일 수 있다.마지막으로, 경쟁자가 협조적인 움직임을 보일 경우 즉시 협력이 이루어지기 때문에 용서한다.

티격태격 전략의 의미는 갈등 연구, 해결 및 응용 사회과학의 많은 측면과 관련이 있다.[3]

수학

다음과 같은 무한 반복 죄수 딜레마 게임을 예로 들어보자.

C D
C 6, 6 2, 9
D 9, 2 3, 3

Tit for Tat 전략은 다른 플레이어가 이전에 선택한 것을 복사한다.선수들이 전략(C,C)으로 협력하면 영원히 협력한다.

1 2 3 4 ...
p1 C C C C ...
p2 C C C C ...

협력은 다음과 같은 보상을 준다(여기서 (는) 할인 요인이다).

에 요약한 기하 급수.

선수가 이탈하면(D) 다음 라운드에서 처벌을 받는다.p1이 협력하는 결과와 p2가 이탈하는 결과를 번갈아 가며, 그 반대의 결과를 도출한다.

1 2 3 4 ...
p1 C D C D ...
p2 D C D C ...

편차는 다음과 같은 보상을 준다.

오는 두 개의 기하 급수적인 연속.

일탈의 보상이 협력보다 낫지 않으면 협업을 기대하라.

Δ 3 {\인 경우 계속 협조하십시오.

< 인 경우 계속 이탈

문제

액셀로드 감독이 경험적으로 이 전략이 직접 경쟁의 일부 경우 최적이라는 것을 보여준 반면, att를 위해 att를 하는 두 에이전트는 여전히 취약하다.어느 한 참가자의 사건 해석에 있어 일회성 단발성 실수는 끝이 없는 "죽음의 소용돌이"로 이어질 수 있다. 즉, 만일 한 명의 에이전트와 상대가 협조한다면, 두 에이전트 모두 교대로 협력하고 결손하게 되어, 두 에이전트가 지속적으로 협력할 때보다 더 낮은 보상을 받게 된다.이 상황은 운동장 싸움에서부터 내전과 지역 전쟁에 이르기까지 실제 세계 분쟁에서 자주 발생한다.이러한 이슈의 이유는 할인율의 칼날 조건 하에서는 빼고는 tit for tat for tat는 서브게임 퍼펙트 평형이 아니기 때문이다.[4]이 서브 게임은 두 에이전트가 직접 타트 전략을 위해 티트를 치는 것에 의해 도달할 수 있는 것은 아니지만, 전략은 서브 게임을 완벽히 하기 위해서는 모든 서브 게임에서 내시 평형이어야 한다.또한, 에이전트의 신호에 잡음이 허용될 경우 이 하위 게임에 도달할 수 있다."contrite tit for tat"로 알려진 tat의 서브게임 퍼펙트 변형인 "tit for tat"은 기본적인 평판 메커니즘을 사용하여 만들어질 수 있다.[5]

칼날은 "외생변수의 정확한 값에 대해서만 존재하는 평형"이다.조금이라도 변수를 바꾸면 칼끝 평형이 사라진다."[6]

나시 평형과 칼날 평형 둘 다일 수 있다.평형이 정확한 값에 "엄청나게" 있기 때문에 칼날 평형이라고 알려져 있다.

예:

왼쪽 맞다
(X, X) (0, 0)
다운 (0, 0) (−X, −X)

X = 0이라고 가정합시다.(아래쪽, 왼쪽) 또는 (위쪽, 오른쪽)으로부터의 수익성 편차는 없다.그러나 X의 값이 아무리 작더라도 어떤 양으로라도 어긋난다면 평형은 더 이상 서 있지 않게 된다.예를 들어 X의 값이 0이 아니라 0.000001이면 위로 벗어나는 것이 이익이 된다.그러므로 평형은 매우 위태롭다.위키백과 기사에서 칼날 조건은 매우 드물게 특정 조건이 충족되고 예를 들어 X와 같은 특정 값이 평형이 있다는 사실을 언급하고 있다.

이 문제를 완화하기 위해 두 개의 tat에 대한 Tit를 사용할 수 있다. 아래 설명을 참조하십시오.[7]'용서를 담은 타투'는 죽음의 소용돌이를 벗어나려는 비슷한 시도다.상대가 결함을 느낄 때, 이 전략을 사용하는 플레이어는 어쨌든 다음 동작에서 때때로 협력할 것이다.선수가 협조로 대응할 정확한 확률은 상대 라인업에 따라 달라진다.

게다가, 티격태격 전략은 총체적 경쟁에 미치지 못하는 상황에서 최적으로 증명되지 않는다.예를 들어, 파티가 친구일 때, 플레이어가 때때로 다른 플레이어의 일탈에도 불구하고 모든 단계에서 협력할 때 우정에 가장 좋을 수 있다.현실 세계의 대부분의 상황은 티격태격 전략이 경쟁에서 이긴 전체 경쟁보다 덜 경쟁적이다.

Tit for tat는 경쟁자가 협력을 선택할 경우 즉시 협력을 생산하기 때문에 자연에서 용서한다는 점에서 엄연한 방아쇠와는 매우 다르다.반면 그림 방아쇠는 가장 용서할 수 없는 전략이다. 단 한 번의 결함이라도 남은 경기 동안 어두운 방아쇠 결함을 이용해 플레이하게 만들 수 있다는 점에서 말이다.[8]

Tit for tats 2개

2타트의 티트는 tit for tat과 비슷하지만 상대가 보복하기 전에 합의된 전략에서 두 번 이탈할 수 있도록 한다.이러한 측면은 att 전략을 사용하는 플레이어가 상대에게 더 "용서"하게 보이게 한다.

tit for tat 전략에서, 일단 상대가 결함을 하면, tit for at Player는 다음 동작에서 결함으로 즉시 대응한다.이는 두 가지 보복 전략이 지속적으로 서로를 상대로 귀순해 두 선수 모두에게 좋지 않은 결과를 초래하는 불행한 결과를 초래한다.두 명의 타츠 선수를 위한 티트는 이전 사례의 "죽음의 소용돌이"를 피하기 위한 수단으로 첫 번째 탈당을 문제 삼지 않게 할 것이다.상대가 2회 연속 결함을 보일 경우 2타츠 플레이어의 tit가 결함으로 응답한다.

전략은 Robert AxelrodLand에서 2차 컴퓨터 시뮬레이션 동안 제안한 것이다.첫 번째 실험 결과를 분석한 후, 그는 참가자가 다른 프로그램보다 더 높은 누적 점수를 가지고 두 개의 타이트 전략에 대해 tit를 입력했다고 판단했다.이에 따라 2차 대회에서도 큰 기대를 갖고 직접 입장했다.불행히도 용서하는 성격을 잘 활용할 수 있었던 2차전에 투입된 프로그램들의 공격적 성격 때문에 2타트의 tit는 tit에 대한 tit보다 (게임 이론상으로는) 훨씬 더 심하게 했다.[9]

실제 사용

피어 투 피어 파일 공유

비트토렌트 동료들은 그들의 다운로드 속도를 최적화하기 위해 티격태격 전략을 사용한다.[10]좀 더 구체적으로 말하면, 대부분의 비트토렌트 동료들은 비트토렌트 용어로 규칙적인 언취킹이라고 불리는 두 개의 타트에 대해 tit의 변형을 사용한다.BitTorrent 피어에는 다른 피어에 할당할 업로드 슬롯 수가 제한되어 있다.결과적으로, 피어의 업로드 대역폭이 포화 상태일 때, 그것은 티격태격 전략을 사용할 것이다.업로드 대역폭을 다운로드 대역폭과 교환할 때 협력이 이루어진다.그러므로 피어가 우리의 피어 업로딩에 대한 대가로 업로드가 되지 않을 때, 비트토렌트 프로그램은 비협조적인 피어와의 연결을 질식시키고 이 업로드 슬롯을 희망적으로 더 협조적인 피어에게 할당한다.규칙적인 금연법은 죄수들의 딜레마에서 첫 번째 움직임에서 항상 협력하는 것과 관련이 있다.주기적으로, 피어는 무작위로 선택한 비협조적인 피어(unchoke)에 업로드 슬롯을 할당한다.이것을 낙관적 금연이라고 한다.이러한 행동은 더 협조적인 또래들을 검색할 수 있게 하고 이전에 비협조적인 또래들에게 두 번째 기회를 준다.이 전략의 최적 문턱값은 여전히 연구 대상이다.

동물 공동체에서의 상호 이타주의 설명

동물의 친사회적 행동에 대한 연구는 많은 윤리학자들과 진화심리학자들이 이타주의가 많은 동물사회에서 왜 진화하는지 설명하기 위해 티격태격 전략을 적용하도록 이끌었다.폰 노이만모겐스터른(1953)이 공식화한 수학 이론에서 유래한 진화 게임 이론은 메이너드 스미스(1972)에 의해 처음 고안되어 로버트 힌데에 의해 새의 행동을 더욱 탐구하였다.그들이 동물 전략의 진화에 게임 이론을 적용한 것은 동물의 행동을 분석하는 완전히 새로운 방법을 시작했다.

호혜적 이타주의는 음식, 짝짓기 권리, 둥지 또는 영토의 거래에서 은인에게 주는 비용이 수혜자에게 주는 이익보다 적은 동물 공동체에서 작용한다.이 이론은 또한 이타주의 행위는 필요의 균형이 역전되면 보답되어야 한다는 것을 고수하고 있다.보답하지 못하는 "치터"를 확인하고 처벌하는 메커니즘, 사실상 tit의 형태로, 호혜적 이타주의를 규제하는 데 중요하다.예를 들어, 티격태격은 구피에서 협동 포식자 검사 행동의 메커니즘으로 제안된다.

전쟁

어느 한쪽이 약자로 인식되거나 적과 협력하는 것을 두려워하여 분쟁에서 물러서지 못하는 티격태격은 역사적으로 많은 오랜 분쟁의 원인이 되어왔다.

그러나, att 전략에 대한 비난은 또한 분석가들에 의해 1차 세계대전의 참호전 동안 발생한 "생존하고 내버려두다"라고 불리는 자발적인 비폭력적 행동에서 감지되었다.서로 불과 몇 백 피트 떨어진 곳에 파놓은 군대는 무언의 이해를 진화시킬 것이다.저격수가 한쪽에서 병사를 죽였다면 다른 쪽에서는 동등한 보복이 예상됐다.반대로 한 동안 아무도 죽이지 않았다면, 상대방은 이것을 암시하는 "truce"를 인정하고 그에 따라 행동할 것이다.이로 인해 참호 사이에 '분리된 평화'가 형성되었다.[11]

참고 항목

참조

  1. ^ Shaun Hargreaves Heap, Yanis Varoufakis (2004). Game theory: a critical text. Routledge. p. 191. ISBN 978-0-415-25094-8.
  2. ^ 액슬로드 토너먼트
  3. ^ 포사이스, D.R. (2010) 그룹 다이나믹스
  4. ^ Gintis, Herbert (2000). Game Theory Evolving. Princeton University Press. ISBN 978-0-691-00943-8.
  5. ^ Boyd, Robert (1989). "Mistakes Allow Evolutionary Stability in the Repeated Prisoner's Dilemma Game". Journal of Theoretical Biology. 136 (1): 47–56. CiteSeerX 10.1.1.405.507. doi:10.1016/S0022-5193(89)80188-2. PMID 2779259.
  6. ^ "Knife-Edge Equilibria – Game Theory 101". Retrieved 2018-12-10.
  7. ^ Dawkins, Richard (1989). The Selfish Gene. Oxford University Press. ISBN 978-0-19-929115-1.
  8. ^ Axelrod, Robert (2000-01-01). "On Six Advances in Cooperation Theory". Analyse & Kritik. 22 (1). CiteSeerX 10.1.1.5.6149. doi:10.1515/auk-2000-0107. ISSN 2365-9858.
  9. ^ Axelrod, Robert (1984). The Evolution of Cooperation. Basic Books. ISBN 978-0-465-02121-5.
  10. ^ Cohen, Bram (2003-05-22). "Incentives Build Robustness in BitTorrent" (PDF). BitTorrent.org. Retrieved 2011-02-05.
  11. ^ 멋진 녀석들이 먼저 끝낸다.리처드 도킨스.BBC. 1986.

외부 링크