진화적으로 안정된 전략

Evolutionarily stable strategy
진화적으로 안정된 전략
게임 이론솔루션 개념
관계
서브셋내시 평형
슈퍼셋확률적으로 안정된 평형, 안정된 강한 내쉬 평형
와 교차하다서브게임 퍼펙트 평형, 떨리는퍼펙트 평형, 퍼펙트 베이지안 평형
중요성
제안자존 메이나드 스미스와 조지 R. 가격
사용처생물학적 모델링과 진화적 게임 이론
호크도브

진화적으로 안정된 전략(ESS)은 특정 환경에 적응하기 위해 모집단에 의해 채택될 때 침투할 수 없는 전략(또는 전략 세트)이다. 즉, 신규적이거나 초기에 드물 수 있는 대안 전략(또는 전략 세트)으로 대체될 수 없다.John Maynard Smith와 George R에 의해 소개되었습니다. 1972/[1][2]3년에 가격이 책정되었으며, 행동 생태학, 진화 심리학, 수학 게임 이론경제학에서 중요한 개념이며, 인류학, 철학 정치학과 같은 다른 분야에서 응용된다.

게임이론적인 관점에서 ESS는 내쉬 평형의 정제이며, "진화적으로 안정적"인 내쉬 평형이다.따라서, 일단 모집단에 고정되면, 자연 선택만으로도 대안(변종) 전략이 그것을 대체하는 것을 막기에 충분하다(이것은 환경 변화로부터 발생하는 선택적인 압력에 대응하여 더 나은 전략 또는 일련의 전략이 나타날 가능성을 배제하지는 않는다).

역사

진화적으로 안정된 전략은 존 메이나드 스미스와 조지 R에 의해 정의되고 도입되었다. 1973년 네이처지에 [2]실린 가격.네이처지에 대한 논문을 동료 검토하는 데 걸린 시간이 너무 길어서 메이나드 스미스가 1972년에 [1]에세이집 '진화에 대하여'에 앞서 쓴 에세이가 나왔다.1972년 에세이는 때때로 1973년 논문 대신 인용되기도 하지만, 대학 도서관은 네이처의 복사본을 훨씬 더 많이 가지고 있을 것이다.자연 속의 논문은 대개 짧다; 1974년 메이나드 스미스는 이론 생물학 [3]저널에 더 긴 논문을 발표했다.메이나드 스미스는 1982년 저서 '진화와 게임 [4]이론'에서 더 자세히 설명한다.때때로 이것들은 대신 인용된다.사실, ESS는 게임 이론의 중심이 되어 독자들이 그것을 잘 알고 있다고 가정하기 때문에 종종 인용이 주어지지 않는다.

Maynard Smith는 Price의 논문을 동료 검토하면서 읽었던 Price의 구두 주장을 수학적으로 공식화했다.Maynard Smith는 다소 정돈되지 않은 Price가 출판을 위해 자신의 기사를 수정할 준비가 되어 있지 않다는 것을 깨닫고 Price를 공동 저자로 추가하겠다고 제안했습니다.

이 개념은 R. H. 맥아더[5] W. D. 해밀턴의[6] 성비 연구, 특히 해밀턴의 불패 전략 개념에서 파생되었다.메이나드 스미스는 진화적으로 안정된 전략의 개념 개발과 행동 [7]진화에 게임 이론을 적용한 공로로 1999년 크레이포드 상을 공동 수상했다.

ESS의 용도:

동기

내쉬 균형게임 이론에서 전통적솔루션 개념입니다.그것은 선수들의 인지 능력에 달려있다.경기 구조를 의식해 상대 선수의 움직임을 예측하고 자신의 이익을 극대화하려고 하는 것으로 추정된다.또한 모든 참가자가 이를 알고 있다고 가정한다(상식 참조).이러한 가정은 참가자들이 내쉬 균형 전략을 선택하는 이유를 설명하기 위해 사용된다.

진화적으로 안정된 전략은 전혀 다른 동기를 부여합니다.여기서, 플레이어의 전략은 생물학적으로 암호화되어 있고 유전적인 것으로 추정됩니다.개인은 자신의 전략을 통제할 수 없고 게임을 의식할 필요도 없다.이들은 번식하고 자연선택의 영향을 받으며, 게임의 보상은 생식 성공(생물학적 적합성)을 나타낸다.게임의 대체 전략은 돌연변이와 같은 과정을 통해 가끔 발생한다고 상상된다.ESS가 되려면 전략이 이러한 대안들에 대해 내성을 가져야 합니다.

근본적으로 다른 동기 부여 가정을 고려할 때, ESSes와 Nash 평형이 종종 일치한다는 것은 놀라운 일이 될 수 있다.사실, 모든 ESS는 내쉬 평형에 해당하지만, 일부 내쉬 평형은 ESS가 아니다.

내시 평형

ESS는 내쉬 평형정제 또는 변형된 형태입니다.(양자를 대조하는 예에 대해서는, 다음의 항을 참조해 주세요).내시 균형에서, 모든 참가자가 각자의 부품을 채택한다면, 어떤 참가자도 대안 전략으로 전환함으로써 이익을 얻을 수 없다.2인용 게임에서는 전략적인 쌍입니다.E(S,T)가 전략 S를 전략 T와 겨룬 것에 대한 보상을 나타내도록 하자.전략 쌍(S, S)은 두 플레이어 모두 전략 T에 대해 두 플레이어 모두일 경우에만 내쉬 균형이다.

E(S,S) e E(T,S)

이 정의에서 전략 TsS는 S에 대한 중립적 대안이 될 수 있다(점수는 동등하지만 더 우수하지는 않다).내시 균형은 S 대신 T를 채택하는 참가자들에게 장기적인 인센티브가 없다는 가정 하에 T가 동등하게 점수를 매겨도 안정적인 것으로 가정한다.이 사실은 ESS의 출발점을 나타냅니다.

Maynard Smith[2] Price는 전략 S가 ESS가 되기 위한 두 가지 조건을 지정합니다.모든 T'S에 대해서

  1. E(S,S) > E(T,S) 또는
  2. E(S,S) = E(T,S) 및 E(S,T) > E(T,T)

첫 번째 조건은 때때로 엄격한 내쉬 [9]균형이라고 불린다.두 번째는 "메이나드 스미스의 두 번째 조건"이라고 불리기도 한다.두 번째 조건은 전략 T가 전략 S에 대한 보상에 대해 중립적이지만 전략 S를 계속 플레이하는 플레이어 집단이 전략 S에 대해 플레이할 때 유리하다는 것을 의미한다.

Thomas에 의해 [10]ESS에 대한 대안적이고 강력한 정의도 있다.이것은 ESS 개념에서 내쉬 균형 개념의 역할에 대해 다른 강조점을 둔다.위의 첫 번째 정의에 기재된 용어에 따라 이 정의에서는 모든 T'S에 대해 다음 조건을 충족해야 합니다.

  1. E(S,S) e E(T,S) 및
  2. E(S,T)> E(T,T)

이 공식에서 첫 번째 조건은 전략이 내쉬 균형임을 명시하고, 두 번째 조건은 메이나드 스미스의 두 번째 조건을 충족함을 명시한다.예를 들어, 아래 코디네이션 게임의 각 순수한 전략은 첫 번째 정의에서는 ESS이지만 두 번째 정의에서는 ESS가 아닙니다.

즉, 이 정의는 다음과 같습니다.두 선수가 전략 S를 플레이할 때 첫 번째 선수의 보상은 다른 전략 T로 변경할 때 첫 번째 선수의 보상은 더 높고, 두 번째 선수가 전략 S를 지킬 때 첫 번째 선수의 보상은 두 선수가 모두 T로 전략을 변경할 때 그의 보상보다 더 높다.그들의 전략을 T에게 알립니다.

이 공식은 ESS에서 내쉬 평형 조건의 역할을 더 명확하게 강조한다.또한 약한 ESS 또는 진화적으로 안정[10]집합과 같은 관련 개념을 자연스럽게 정의할 수 있습니다.

내쉬 평형과 ESS 간의 차이 예

협조하다 결함
협조하다 3, 3 1, 4
결함 4, 1 2, 2
죄수의 딜레마
A B
A 2, 2 1, 2
B 2, 1 2, 2
이웃을 해치다

대부분의 간단한 게임에서 ESSes와 Nash 균형은 완벽하게 일치합니다.예를 들어, 죄수의 딜레마에는 오직 하나의 내쉬 평형이 있고, 그 전략(결함) 또한 ESS이다.

일부 게임은 ESS가 아닌 내쉬 평형을 가질 수 있습니다.예를 들어, 당신의 이웃(여기에 표시된 보상 행렬의 경우)에서 (A, A)와 (B, B)는 둘 다 내쉬 평형이다. 왜냐하면 참가자들은 어느 쪽에서도 전환함으로써 더 잘 할 수 없기 때문이다.단, B만이 ESS(및 강한 내쉬)입니다.A는 ESS가 아니기 때문에 B는 A의 전략가 집단에 중성적으로 침입하여 우세할 수 있다. 왜냐하면 B가 B보다 B대해 더 높은 점수를 받기 때문이다.이 역학은 E(A, A) = E(B, A) 이후 Maynard Smith의 두 번째 조건에 의해 포착되지만, E(A, B) > E(B, B)는 그렇지 않다.

C D
C 2, 2 1, 2
D 2, 1 0, 0
모두에게 해를 끼치다
스위브 머물러.
스위브 0,0 −1,+1
머물러. +1,−1 −20,−20
치킨.

평점이 동일한 대안을 가진 내시 평형은 ESS가 될 수 있다.를 들어 Har everyone 게임에서 C는 Maynard Smith의 두 번째 조건을 만족시키기 때문에 ESS입니다.D 전략가는 C에 대해 동등하게 점수를 매김으로써 일시적으로 C 전략가 집단에 침입할 수 있지만, 그들은 서로 상대하기 시작할 때 대가를 치른다. CD보다 D에 대해 더 좋은 점수를 받는다.따라서 여기서 E(C, C) = E(D, C)이지만 E(C, D) > E(D, D)도 마찬가지입니다.그 결과 C는 ESS가 됩니다.

게임이 순수 전략 내쉬 평형을 가지고 있다고 해도, 그 중 어느 것도 ESS가 아닐 수 있다.치킨 게임을 생각해 보세요.이 게임에는 순수 전략인 내쉬 균형(스위브, 스테이)과 (스위브) 두 가지가 있다.그러나 상관되지 않은 비대칭이 없는 경우 Swerve와 Stay는 모두 ESS가 아닙니다.이 게임의 ESS인 혼합 전략인 세 번째 내쉬 평형이 있다(해설은 Hawk-dove 게임과 Best response 참조).

이 마지막 예는 내쉬 평형과 ESS 사이의 중요한 차이를 나타낸다.내시 균형은 전략 세트(각 참가자에 대한 전략 사양)에 정의되며, ESS는 전략 자체 측면에서 정의된다.ESS에 의해 정의된 평형은 항상 대칭이어야 하며, 따라서 평형점이 더 적어야 한다.

진화적으로 안정된 상태와 비교

모집단 생물학에서, 진화적으로 안정된 전략(ESS)과 진화적으로 안정된 상태의 두 개념은 밀접하게 연관되어 있지만 다른 상황을 설명한다.

진화적으로 안정된 전략에서, 집단의 모든 구성원이 그것을 채택한다면,[4] 어떤 돌연변이 전략도 침입할 수 없다.일단 인구의 거의 모든 구성원이 이 전략을 사용한다면, '합리적인' 대안은 없다.ESS는 고전 게임 이론의 일부입니다.

진화적으로 안정된 상태에서 교란이 너무 크지 않으면 교란 후 선택에 의해 집단의 유전자 구성이 복원된다.진화적으로 안정된 상태는 초기 상태에서 교란된 경우 전략을 사용하거나 혼합 전략을 사용하는 집단의 동적 특성입니다.그것은 집단 유전학, 동적 시스템 또는 진화적 게임 이론의 일부이다.이를 수렴 [11]안정성이라고 합니다.

B. Thomas(1984)는 혼합될 수 있는 개별 전략에 ESS라는 용어를 적용하고 혼합된 [12]ESS와 공식적으로 동등할 수 있는 순수 전략의 모집단 혼합에 진화적으로 안정적인 모집단 상태를 적용한다.

집단이 진화적으로 안정적인지는 유전적 다양성과 관련이 없다: 그것은 유전적으로 단일형일 수도 있고 [4]다형일 수도 있다.

확률적 ESS

ESS의 고전적인 정의에서는 어떤 돌연변이 전략도 침입할 수 없습니다.유한 모집단에서, 어떤 돌연변이도 원칙적으로 침입할 수 있으며, 낮은 확률이지만, 이는 어떤 ESS도 존재할 수 없음을 암시한다.무한대 집단에서 ESS는 대신 확률 p의 새로운 돌연변이 전략에 의해 침해될 경우, 베트헤딩[13]진화에 의해 설명되었듯이 확률 > p의 단일 시작 개체로부터 반격할 수 있는 전략으로 정의될 수 있다.

죄수의 딜레마

협조하다 결함
협조하다 3, 3 1, 4
결함 4, 1 2, 2
죄수의 딜레마

이타주의와 사회적 협력의 공통 모델은 죄수들의 딜레마이다.여기서 플레이어 그룹은 Cooper를 플레이할 수 있으면 전체적으로 더 잘 살 수 있지만, Defect 운임이 더 좋기 때문에 각 플레이어들은 Defect를 플레이할 동기를 가집니다.이 문제에 대한 한 가지 해결책은 개인이 같은 플레이어를 상대로 반복적으로 게임을 하게 함으로써 보복의 가능성을 도입하는 것이다.이른바 '죄수의 딜레마'라고 불리는 이 두 사람은 계속해서 죄수의 딜레마를 연기한다.죄수의 딜레마는 단 두 가지 전략(협조와 결함)을 가지고 있는 반면, 반복된 죄수의 딜레마는 엄청난 수의 가능한 전략을 가지고 있다.개인은 역사마다 다른 비상계획을 가질 수 있고 게임은 무기한으로 반복될 수 있기 때문에 실제로 그러한 비상계획은 무한히 존재할 수 있다.

많은 관심을 받고 있는 간단한 비상대책은 Always Defect, Always Cooper, Tit for Tat 등 3가지입니다.첫 번째 두 가지 전략은 다른 플레이어의 액션에 관계없이 동일한 작업을 수행하지만, 다음 라운드는 이전 라운드에서 수행한 작업을 수행함으로써 응답합니다. 즉, 다음 라운드에서 "협력결함의 협력"에 응답합니다.

전체 모집단이 Tit-for-Tat를 플레이하고 Always Defect를 플레이하는 돌연변이가 발생하면 Tit-for-TatAlways Defect를 능가합니다.돌연변이 개체 수가 너무 커지면 돌연변이 백분율은 작게 유지됩니다.따라서 Tit for Tat은 이 두 가지 전략에 대해서만 ESS입니다.한편, Always Defect 플레이어의 섬은 소수의 Tit-for-Tat 플레이어의 침입에 대해서는 안정적이지만 다수의 [14]플레이어에 대해서는 안정되지 않습니다.Always Cooper를 도입하면 Tit-for-Tat 인구는 더 이상 ESS가 아닙니다.Tit-for-Tat 플레이어 집단은 항상 협력하기 때문에 전략 Always Cooper는 이 집단에서 동일하게 동작합니다.그 결과, Always Cooper 역할을 하는 돌연변이는 제거되지 않을 것이다.그러나 Always Cooper와 Tit-for-Tat은 공존할 수 있지만, Always Defect인 모집단의 비율이 작을 경우 선택적인 압력은 Always Cooper에 반대하며 Tit-for-Tat에 찬성한다.이는 상대방이 불량할 경우 탈주할 때보다 협조할 때 받는 보상이 적기 때문이다.

이는 전략 공간이 큰 게임에 ESS의 정식 정의를 적용하는 것이 어렵다는 것을 보여주며, 일부에서는 대안을 고려하도록 동기를 부여하고 있다.

인간의 행동

사회생물학과 진화심리학 분야는 동물과 인간의 행동과 사회구조를 주로 진화적으로 안정된 전략으로 설명하려고 한다.소시오패스(만성 반사회적 또는 범죄 행동)는 그러한 두 [15]가지 전략의 조합의 결과일 수 있다.

진화적으로 안정된 전략은 원래 생물학적 진화를 위해 고려되었지만, 그것들은 다른 맥락에도 적용될 수 있다.사실, 많은 종류의 적응 역학에는 안정된 상태가 존재합니다.결과적으로, 그것들은 유전적 영향이 없는 인간의 행동을 설명하는 데 사용될 수 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Maynard Smith, J. (1972). "Game Theory and The Evolution of Fighting". On Evolution. Edinburgh University Press. ISBN 0-85224-223-9.
  2. ^ a b c Maynard Smith, J.; Price, G.R. (1973). "The logic of animal conflict". Nature. 246 (5427): 15–8. Bibcode:1973Natur.246...15S. doi:10.1038/246015a0.
  3. ^ Maynard Smith, J. (1974). "The Theory of Games and the Evolution of Animal Conflicts" (PDF). Journal of Theoretical Biology. 47 (1): 209–21. doi:10.1016/0022-5193(74)90110-6. PMID 4459582.
  4. ^ a b c Maynard Smith, John (1982). Evolution and the Theory of Games. ISBN 0-521-28884-3.
  5. ^ MacArthur, R. H. (1965). Waterman T.; Horowitz H. (eds.). Theoretical and mathematical biology. New York: Blaisdell.
  6. ^ Hamilton, W.D. (1967). "Extraordinary sex ratios". Science. 156 (3774): 477–88. Bibcode:1967Sci...156..477H. doi:10.1126/science.156.3774.477. JSTOR 1721222. PMID 6021675.
  7. ^ 1999년 크레이포드상 보도자료
  8. ^ Alexander, Jason McKenzie (23 May 2003). "Evolutionary Game Theory". Stanford Encyclopedia of Philosophy. Retrieved 31 August 2007.
  9. ^ Harsanyi, J (1973). "Oddness of the number of equilibrium points: a new proof". Int. J. Game Theory. 2 (1): 235–50. doi:10.1007/BF01737572.
  10. ^ a b Thomas, B. (1985). "On evolutionarily stable sets". J. Math. Biology. 22: 105–115. doi:10.1007/bf00276549.
  11. ^ Apaloo, J.; Brown, J. S.; Vincent, T. L. (2009). "Evolutionary game theory: ESS, convergence stability, and NIS". Evolutionary Ecology Research. 11: 489–515. Archived from the original on 2017-08-09. Retrieved 2018-01-10.
  12. ^ Thomas, B. (1984). "Evolutionary stability: states and strategies". Theor. Popul. Biol. 26 (1): 49–67. doi:10.1016/0040-5809(84)90023-6.
  13. ^ King, Oliver D.; Masel, Joanna (1 December 2007). "The evolution of bet-hedging adaptations to rare scenarios". Theoretical Population Biology. 72 (4): 560–575. doi:10.1016/j.tpb.2007.08.006. PMC 2118055. PMID 17915273.
  14. ^ Axelrod, Robert (1984). The Evolution of Cooperation. ISBN 0-465-02121-2.
  15. ^ Mealey, L. (1995). "The sociobiology of sociopathy: An integrated evolutionary model". Behavioral and Brain Sciences. 18 (3): 523–99. doi:10.1017/S0140525X00039595.

추가 정보

외부 링크