솔루션 개념

게임 이론에서 선택된 평형 개선. 화살표는 정교함에서 보다 일반적인 개념으로 가리킨다

(

즉,

\subset

ESS

display

{\displaystyle \

subset }

정확함

\subset

).

게임 이론에서 해법 개념은 게임이 어떻게 펼쳐질지 예측하기 위한 공식적인 규칙이다. 이러한 예측을 "솔루션"이라고 하며, 플레이어가 어떤 전략을 채택할 것인지, 따라서 게임의 결과를 기술한다. 가장 일반적으로 사용되는 용액 개념은 평형 개념으로, 가장 유명한 것은 내쉬 평형이다.

많은 게임에 대한 많은 솔루션 개념은 하나의 솔루션 이상을 초래할 것이다. 이것은 해결책 중 하나를 의심하게 하기 때문에, 게임 이론가는 해결책을 좁히기 위해 정교함을 적용할 수 있다. 다음에 제시된 각 연속적인 솔루션 개념은 더 풍부한 게임에서 믿을 수 없는 평형성을 제거함으로써 이전 게임의 개념을 개선한다.

형식 정의

Let $\Gamma$ be the class of all games and, for each game $G\in \Gamma$ , let $S_{G}$ be the set of strategy profiles of $G$ . A solution concept is an element of the direct product ${\displaystyle \Pi _{G\in \$ $Gamma }2^{S_{G}};}$ i.e., a function $F:\Gamma \rightarrow \bigcup \nolimits _{G\in \Gamma }2^{S_{G}}$ such that $F(G)\subseteq S_{G}$ for all $G\in \Gamma .$

합리성 및 반복 지배력

이 솔루션 개념에서 플레이어는 합리적이라고 가정되고 따라서 엄격히 지배되는 전략은 실행 가능한 전략 집합에서 제거된다. 다른 플레이어가 선택하는 전략과 상관없이 항상 더 높은 보상을 받는 플레이어가 사용할 수 있는 다른 전략이 있을 때 전략은 엄격히 지배된다. (최소한의 게임 트리 검색에서도 엄격히 지배되는 전략이 중요하다.) 예를 들어, (단일 기간) 죄수들의 딜레마(아래에 표시)에서, 어느 한 선수가 상대가 무엇을 하든 상관없이 항상 결함을 플레이하는 것이 더 낫기 때문에, 협조는 두 선수 모두에게 엄격하게 결함을 지배한다.

	죄수2 협력	죄수 2 결함
죄수1 협력	−0.5, −0.5	−10, 0
죄수 1 결함	0, −10	−2, −2

나시 평형

나시 평형이란 전략 프로파일(예: 전술 프로파일은 위의 죄수 딜레마 게임(협조, 결함)에서 죄수 1은 협력하고 죄수 2는 결함을 플레이한다고 명시)이며, 모든 전략은 다른 모든 전략에 대해 최선의 대응이다. 플레이어의 전략은 다른 플레이어의 전략이 실행되는 어떤 상황에서든 더 높은 보상을 산출할 수 있는 다른 전략이 없다면 다른 플레이어의 전략에 대한 최선의 대응이다.

후진 유도

여러 개의 나시 평형을 가진 게임이 있는데, 그 중 일부는 비현실적이다. 역동적인 게임의 경우, 비현실적인 나시 평형성은 미래의 플레이가 합리적일 것이라고 가정하는 후진 유도를 적용함으로써 없어질 수도 있다. 따라서, 그러한 위협은 선수가 그렇게 하도록 요청받았을 때 실행하기에는 비이성적이기 때문에 교정 불가능한 위협을 제거한다.

예를 들어, 플레이어가 업계의 현존하는 기업이고 해당 산업에 참여할 수 있는 잠재력이 있는 역동적인 게임을 고려해 보십시오. 현재 상태로는 현업자가 산업에 대한 독점권을 가지고 있으며 진입자에게 시장 점유율의 일부를 빼앗기고 싶지 않다. 진입자가 진입하지 않기로 선택할 경우, 현업자에 대한 보수가 높고(그것은 독점권을 유지하며), 진입자는 손실도 이득도 없다(그 보수는 0이다). 입회자가 들어오면 현직자가 입회자와 싸우거나 입회할 수 있다. 그것은 가격을 낮추고, 진입자를 폐업시키고, (그리고 퇴출 비용-부정적인 보상으로) 자신의 이익을 손상시킴으로써 싸울 것이다. 진입자를 수용하면 매출의 일부를 잃게 되지만 높은 가격이 유지되고 가격을 낮추는 것보다 더 큰 이익을 얻는다(단독점 이익보다 낮음).

If the entrant enters, the best response of the incumbent is to accommodate. If the incumbent accommodates, the best response of the entrant is to enter (and gain profit). Hence the strategy profile in which the incumbent accommodates if the entrant enters and the entrant enters if the incumbent accommodates is a Nash equilibrium. However, if the incumbent is going to play fight, the best response of the entrant is to not enter. If the entrant does not enter, it does not matter what the incumbent chooses to do (since there is no other firm to do it to - note that if the entrant does not enter, fight and accommodate yield the same payoffs to both players; the incumbent will not lower its prices if the entrant does not enter). Hence fight can be considered as a best response of the incumbent if the entrant does not enter. Hence the strategy profile in which the incumbent fights if the entrant does not enter and the entrant does not enter if the incumbent fights is a Nash equilibrium. Since the game is dynamic, any claim by the incumbent that it will fight is a non-credible threat because by the time the decision node is reached where it can decide to fight (i.e. the entrant has entered), it would be irrational to do so. Therefore, this Nash equilibrium can be eliminated by backward induction.

Subgame perfect Nash equilibrium

A generalization of backward induction is subgame perfection. Backward induction assumes that all future play will be rational. In subgame perfect equilibria, play in every subgame is rational (specifically a Nash equilibrium). Backward induction can only be used in terminating (finite) games of definite length and cannot be applied to games with imperfect information. In these cases, subgame perfection can be used. The eliminated Nash equilibrium described above is subgame imperfect because it is not a Nash equilibrium of the subgame that starts at the node reached once the entrant has entered.

완벽한 베이시안 평형

때때로 서브게임의 완벽성은 불합리한 결과에 대해 충분히 큰 제한을 가하지 않는다. 예를 들어 서브게임은 정보 세트를 가로지를 수 없기 때문에 불완전한 정보의 게임은 서브게임 그 자체만 가질 수 있으므로 서브게임의 완벽성은 내시 평형증을 제거하는 데 사용될 수 없다. 완벽한 베이시안 평형(PBE)은 게임의 플레이로 정보 세트에서 어느 노드에 도달했는지에 대한 플레이어의 전략과 신념의 규격이다. 의사결정 노드에 대한 믿음은 특정 플레이어가 (평형 경로에서) 노드가 작동 중이거나 재생될 것이라고 생각할 확률이다. 특히 PBE의 직관은 PBE가 지정하는 선수의 신념과 그것이 지정하는 신념이 그것이 지정하는 전략과 일치한다는 점을 감안할 때 합리적인 선수 전략을 명시한다는 것이다.

베이시안 게임에서 전략은 플레이어가 통제하는 모든 정보 세트에서 플레이어가 무엇을 하는지를 결정한다. 신념이 전략과 일치해야 한다는 요구사항은 하위 게임의 완벽성에 의해 규정되지 않은 것이다. 따라서 PBE는 선수들의 신념에 대한 일관성 있는 조건이다. 나시 평형에서와 마찬가지로 PBE에서 어떤 플레이어의 전략도 엄격히 지배되어 있지 않으며, 어떤 정보 세트에서도 플레이어의 전략은 엄격히 지배되어 있지 않다. 즉, 플레이어가 해당 정보 세트에서 보유할 수 있는 모든 믿음에는 해당 플레이어에 대해 더 큰 기대 수익을 산출하는 전략이 없다. 위의 솔루션 개념과 달리 평형 경로를 벗어나더라도 설정된 어떤 정보에서 시작하는 플레이어의 전략은 엄격히 지배적이다. 따라서 PBE에서 플레이어는 평형 경로를 설정한 어떤 정보에서 시작되어 엄격히 지배되는 전략을 실행하도록 위협할 수 없다.

이 솔루션 개념의 이름으로 베이시안은 플레이어가 베이즈의 정리에 따라 자신의 신념을 갱신한다는 사실을 암시한다. 그들은 게임에서 이미 일어난 일에 대해 주어진 확률을 계산한다.

Forward induction

Forward induction is so called because just as backward induction assumes future play will be rational, forward induction assumes past play was rational. Where a player does not know what type another player is (i.e. there is imperfect and asymmetric information), that player may form a belief of what type that player is by observing that player's past actions. Hence the belief formed by that player of what the probability of the opponent being a certain type is based on the past play of that opponent being rational. A player may elect to signal his type through his actions.

Kohlberg and Mertens (1986) introduced the solution concept of Stable equilibrium, a refinement that satisfies forward induction. A counter-example was found where such a stable equilibrium did not satisfy backward induction. To resolve the problem Jean-François Mertens introduced what game theorists now call Mertens-stable equilibrium concept, probably the first solution concept satisfying both forward and backward induction.

References

Cho, I-K.; Kreps, D. M. (1987). "Signaling Games and Stable Equilibria". Quarterly Journal of Economics. 102 (2): 179–221. CiteSeerX 10.1.1.407.5013. doi:10.2307/1885060. JSTOR 1885060.
Fudenberg, Drew; Tirole, Jean (1991). Game theory. Cambridge, Massachusetts: MIT Press. ISBN 9780262061414. Book preview.
Harsanyi, J. (1973) Oddness of the number of equilibrium points: a new proof. International Journal of Game Theory 2:235–250.
Govindan, Srihari & Robert Wilson, 2008. "Refinements of Nash Equilibrium," The New Palgrave Dictionary of Economics, 2nd Edition.[1]
Hines, W. G. S. (1987) Evolutionary stable strategies: a review of basic theory. Theoretical Population Biology 31:195–272.
Kohlberg, Elon & Jean-François Mertens, 1986. "On the Strategic Stability of Equilibria," Econometrica, Econometric Society, vol. 54(5), pages 1003-37, September.
Leyton-Brown, Kevin; Shoham, Yoav (2008). Essentials of Game Theory: A Concise, Multidisciplinary Introduction. San Rafael, CA: Morgan & Claypool Publishers. ISBN 978-1-59829-593-1.
Mertens, Jean-François, 1989. "Stable Equilibria - A reformulation. Part 1 Basic Definitions and Properties," Mathematics of Operations Research, Vol. 14, No. 4, Nov. [2]
Noldeke, G. & Samuelson, L. (1993) An evolutionary analysis of backward and forward induction. Games & Economic Behaviour 5:425–454.
메이너드 스미스, J. (1982) 진화론과 게임 이론. ISBN 0-521-28884-3
Osborne, Martin J.; Rubinstein, Ariel (1994). A course in game theory. MIT Press. ISBN 978-0-262-65040-3..
Selten , R. (1983) 광범위한 2인칭 게임에서의 진화적 안정성. 수학. Soc. 과학. 5:269–363.
Selten, R. (1988) 광범위한 2인칭 게임에서의 진화적 안정성 – 수정 및 추가 개발. 수학. 과학탐구 16:223–266
Shoham, Yoav; Leyton-Brown, Kevin (2009). Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations. New York: Cambridge University Press. ISBN 978-0-521-89943-7.
토마스, B. (1985a) 진화론적 안정성에 대해. J. 수학. 비올. 22:105–115.
토마스, B. (1985b) 혼합 전략 모델에서 진화적인 안정적 세트. 이론. 팝. 비올. 28:332–341

v t 게임 이론의 주제
정의들	혼잡 게임 협동 게임 결정성 약속의 에스컬레이션 포브스폼 게임 1번과 2번 우승 게임 복잡성 게임 설명 언어 그래픽 게임 믿음의 위계 정보 세트 노멀 폼 게임 선호 순차 게임 동시 게임 동시 동작 선택 해결된 게임 간결한 게임
평형 개념	나시 평형 서브게임 완성도 메르텐스-안정성 평형 베이시안 나시 평형 완벽한 베이시안 평형 떨리는 손 적정 평형 엡실론 평형화 상관평형 순차 평형 준완벽 평형 진화적으로 안정된 전략 위험 우위 코어 샤플리 값 파레토 효율 깁스 평형 양자 반응 평형 자기 확인 평형 강한 나시 평형 마르코프 완전 평형
전략들	우세한 전략 순수전략 혼합 전략 전략-스틸링 인수 Tit for tat 그림 트리거 공모 후진 유도 전진 유도 마르코프 전략 입찰 셰이딩
반 사냥감의	협상문제 싸구려 말씨 글로벌 게임 자동 게임 평균 필드 게임 메커니즘 설계 n-플레이어 게임 완벽한 정보 대형 포아송 게임 포텐셜 게임 반복 게임 스크리닝 게임 신호 게임 엄격하게 결정된 게임 확률 게임 대칭 게임 제로섬 게임
게임.	가다 체스 무한 체스 체커스 틱택토 죄수의 딜레마 선물 교환 게임 선택형수의 딜레마 여행자의 딜레마 코디네이션 게임 치킨 지네 게임 루이스 시그널 게임 자원봉사자의 딜레마 달러 경매 성 전투 사슴 사냥 매칭 페니 얼티메이텀 게임 가위바위보 해적 게임 독재자 게임 공공재 게임 블로토 게임 소모전 엘 파롤 바 문제 공정분할 페어 케이크 커팅 쿠르노 게임 교착 상태 다이너의 딜레마 평균의 2/3을 추측하라. 쿤 포커 나시 흥정 게임 유도 퍼즐 트러스트 게임 공주와 괴물 게임 랑데부 문제
정리	화살의 불가능 정리 오만의 합의 정리 민속 정리 미니맥스 정리 내시의 정리 정화 정리 계시의 원리 제르멜로의 정리
키 수치	앨버트 W. 터커 아모스 트베르스키 앙투안 아우구스틴 쿠르노 아리엘 루빈스타인 클로드 섀넌 대니얼 카너 데이비드 K. 레빈 데이비드 M. 크렙스 도널드 B. 길리스 드루 푸덴베르크 에릭 마신 해럴드 쿤 허버트 사이먼 헤르베 물랭 존 콘웨이 장 티롤 장프랑수아 메르텐스 제니퍼 투어 체이스 존 하사니 존 메이너드 스미스 존 나시 존 폰 노이만 케네스 애로우 케네스 빈모어 레오니드 후르비츠 로이드 샤플리 멜빈 드레스허 메릴 M. 홍수 올가 본다레바 오스카르 모겐스턴 폴 밀그롬 페이턴 영 라인하르트 셀턴 로버트 액슬로드 로버트 아우만 로버트 B. 윌슨 로저 마이어슨 새뮤얼 보울스 수잔 스카치머 토머스 셸링 윌리엄 비크리
잡다한	올페이 경매 알파-베타 가지치기 베르트랑 역설 한정적 합리성 콤비네이터 게임 이론 대립분석 쿠페티션 진화 게임 이론 체스의 첫 동작의 이점 게임 설명 언어 게임 역학 게임 이론 용어집 게임 이론가 목록 게임 이론의 게임 목록 승리가 없는 상황 체스 풀기 위상 게임 공동체의 비극 작은 결정의 횡포

Search