노멀 폼 게임

Normal-form game

게임 이론에서 정상 형태게임에 대한 설명이다. 광범위한 형태와 달리, 정상 형태 표현은 그래픽으로 표현되는 것이 아니라 매트릭스를 통해 게임을 표현한다. 이러한 접근방식은 엄격히 지배하는 전략내시 평형성을 식별하는 데 더 유용할 수 있지만, 광범위한 형태 표현에 비해 일부 정보는 손실된다. 게임의 정상적인 형태 표현은 각 플레이어에 대해 감지할 수 있고 상상할 수 있는 모든 전략과 그에 상응하는 보상을 포함한다.

완전하고 완벽한 정보의 정적 게임에서, 게임의 정상적인 형태 표현은 플레이어의 전략 공간과 보상 기능의 규격이다. 플레이어를 위한 전략 공간은 플레이어가 사용할 수 있는 모든 전략의 집합인 반면, 전략은 플레이에서 실제로 스테이지가 발생하는지 여부에 관계없이 게임의 모든 단계에 대한 완전한 행동 계획이다. 플레이어에 대한 보상 함수는 플레이어의 전략 공간의 교차 생산물에서 플레이어의 보상 세트(일반적으로 숫자가 플레이어의 기본 또는 순서형 유틸리티를 나타냄)에 대한 매핑이다. 즉, 플레이어의 보상 함수는 플레이어의 입력 전략으로서 취한다. 프로필(모든 플레이어에 대한 전략 명세서) 및 결과물로 보상의 표현을 제공한다.

일반형 게임
2번 선수

플레이어 1
왼쪽 맞다
4, 3 −1, −1
밑단 0, 0 3, 4

제공된 매트릭스는 플레이어가 동시에 움직이며(또는 적어도 자신의 것을 만들기 전에 다른 플레이어의 움직임을 관찰하지 않음) 플레이어가 수행된 동작의 조합에 대해 지정된 대로 보상을 받는 게임의 정상적인 형태 표현이다. 예를 들어, 1번 선수가 상위 플레이를 하고 2번 선수가 좌회전하면 1번 선수가 4번, 2번 선수가 3번을 받는다. 각 셀에서 첫 번째 번호는 행 플레이어(이 경우 플레이어 1)에 대한 보상을 나타내고, 두 번째 번호는 열 플레이어(이 경우 플레이어 2)에 대한 보상을 나타낸다.

기타 표현

죄수의 딜레마, 스태그 헌트, 치킨 등의 게임을 포함한 2인 2 전략 게임의 일부 토폴로지

대칭 게임(각 행동을 선택하는 플레이어에 따라 보상이 달라지지 않는 게임)은 하나의 보상으로만 표현되는 경우가 많다. 이것이 바로 줄타기 선수에 대한 보답이다. 예를 들어, 아래의 오른쪽과 왼쪽의 지불 매트릭스는 같은 게임을 나타낸다.

두 선수 모두
2번 선수

플레이어 1
숫사슴 산토끼
숫사슴 3, 3 0, 2
산토끼 2, 0 2, 2
just low
2번 선수

플레이어 1
숫사슴 산토끼
숫사슴 3 0
산토끼 2 2

관련 성과급 매트릭스가 있는 게임의 위상학적 공간도 매핑할 수 있으며, 인접한 게임도 가장 유사한 매트릭스를 가진다. 이것은 점진적인 인센티브 변화가 어떻게 게임을 변화시킬 수 있는지를 보여준다.

정규형식의 사용

지배적인 전략

죄수의 딜레마
2번 선수

플레이어 1
협력하다 결함
협력하다 −1, −1 −5, 0
결함 0, −5 −2, −2

성과급 매트릭스는 지배적인 전략의 제거를 용이하게 하며, 대개 이 개념을 설명하기 위해 사용된다. 예를 들어 죄수의 딜레마에서 우리는 각 죄수가 '협조'하거나 '결함'을 할 수 있다는 것을 알 수 있다. 정확히 한 명의 죄수가 결함을 보이면 쉽게 하차하고 다른 죄수는 오랫동안 감금된다. 그러나 둘 다 결손하면 둘 다 더 짧은 시간 동안 갇혀 있게 된다. 협력결함에 의해 엄격히 지배된다고 판단할 수 있다. 각 열의 첫 번째 숫자, 이 경우 0 > -1과 -2 > -5를 비교해야 한다. 이는 칼럼 플레이어가 무엇을 선택하든 행 플레이어가 결함을 선택함으로써 더 잘한다는 것을 보여준다. 마찬가지로 각 행의 두 번째 보수는 0 > -1과 -2 > -5를 비교한다. 이것은 어떤 행이 하든지 결점을 선택하면 컬럼이 더 잘 된다는 것을 보여준다. 이것은 이 게임의 독특한 나시 평형이 (결함, 결함)임을 보여준다.

정상적인 형태의 순차 게임

서브게임 불완전성과 완벽한 나시 평형(Nash 평형)이 각각 빨간색과 파란색으로 표시된 순차 게임의 광범위하고 정상적인 형태 삽화.
순차 게임
2번 선수

플레이어 1
왼쪽, 왼쪽 왼쪽, 오른쪽 오른쪽, 왼쪽 그렇죠, 맞습니다.
4, 3 4, 3 −1, −1 −1, −1
밑단 0, 0 3, 4 0, 0 3, 4

이러한 매트릭스는 동시(또는 더 일반적으로 정보가 불완전한) 게임만을 나타낸다. 위의 매트릭스는 이 경우 2명의 각 전략을 명시하지 않기 때문에, 1명이 먼저 움직이고, 2명이 먼저 움직인 다음 2명이 움직이는 게임을 나타내지 않는다.순차적 게임을 대표하기 위해서, 우리는 게임 과정에서 결코 일어날 수 없는 우발상황에서도, 플레이어 2의 모든 행동을 명시해야 한다. 이 게임에서 2번 플레이어는 이전과 같이 왼쪽오른쪽의 액션이 있다. 이전과 달리 1번 선수의 행동에 따라 4가지 전략을 구사했다. 전략은 다음과 같다.

  1. 플레이어 1이 상단 및 왼쪽을 재생하는 경우 왼쪽
  2. 플레이어 1이 상단 및 오른쪽을 재생하는 경우 왼쪽, 그렇지 않은 경우 왼쪽
  3. 플레이어 1이 상단 및 왼쪽을 재생하는 경우 오른쪽
  4. 1번 플레이어가 상단 및 오른쪽 플레이어를 할 경우 오른쪽, 그렇지 않으면 오른쪽

오른쪽은 이 게임의 정상적인 형태 표현이다.

일반 제형

게임이 정상적인 형태를 갖출 수 있도록 다음과 같은 데이터를 제공한다.

선수들의 한정된 세트 I이 있는데, 각각의 선수들은 I에 의해 표시된다. 각 플레이어 i는 유한 k순수 전략을 가지고 있다.

순수한 전략 프로파일은 선수에 대한 전략의 연관성, 즉 아이투플이다.

그런

지불함수는 함수다.

의도된 해석은 경기 결과에 따라 단일 선수에게 주어지는 상이다. 따라서 게임을 완전히 지정하기 위해서는 플레이어 세트 I= {1, 2, ..., I}의 각 플레이어에 대해 지급 함수를 지정해야 한다.

정의: 정상적인 형태의 게임은 구조다.

여기서:

한 무리의 선수들,

순수한 전략 세트의 I-tuple이며, 각 플레이어마다 하나씩, 그리고

보상 기능의 I-tuple이다.

참조

  • Fudenberg, D.; Tirole, J. (1991). Game Theory. MIT Press. ISBN 0-262-06141-4.
  • 88페이지에 달하는 수학 서론Leyton-Brown, Kevin; Shoham, Yoav (2008). Essentials of Game Theory: A Concise, Multidisciplinary Introduction. San Rafael, CA: Morgan & Claypool Publishers. ISBN 978-1-59829-593-1., 많은 대학에서 무료 온라인.
  • Luce, R. D.; Raiffa, H. (1989). Games and Decisions. Dover Publications. ISBN 0-486-65943-7.
  • Shoham, Yoav; Leyton-Brown, Kevin (2009). Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations. New York: Cambridge University Press. ISBN 978-0-521-89943-7.. 계산적 관점에서의 포괄적인 참조. 3장을 참조하십시오. 온라인으로 무료로 다운로드 가능.
  • Weibull, J. (1996). Evolutionary Game Theory. MIT Press. ISBN 0-262-23181-6.
  • J. 노이만O. Morgenstern, 게임과 경제 행동 이론, John Wiley Science Editions, 1964. 이 책은 원래 1944년에 프린스턴 대학교 출판부에서 출판했다.