연속 게임

Continuous game

연속 게임은 틱택토(tic-tac-toe, 0과 크로스)나 체커(draft, 드래프트)와 같은 평범한 게임의 개념을 일반화하는 수학 개념이다.다시 말해, 이것은 플레이어가 한정된 일련의 순수한 전략 중에서 선택하는 이산 게임의 개념을 확장합니다.연속적인 게임 컨셉을 통해 게임은 셀 수 없이 무한할 수 있는 보다 일반적인 순수한 전략 세트를 포함할 수 있습니다.

일반적으로 셀 수 없이 무한한 전략 세트를 가진 게임이 반드시 내쉬 평형 솔루션을 가질 필요는 없습니다.그러나 전략 집합이 콤팩트하고 효용이 연속적으로 기능한다면, 내쉬 평형이 보장될 것이다; 이것은 카쿠타니 고정점 정리에 대한 글릭스버그의 일반화이다.이러한 이유로 연속 게임의 클래스는 일반적으로 전략 세트가 작고 유틸리티 기능이 연속적으로 작동하는 더 큰 클래스의 무한 게임(즉, 무한 전략 세트를 가진 게임)의 하위 집합으로 정의되고 연구된다.

형식적 정의

n플레이어 연속 G (P , ,) { G = ( , \ { , \ )를 정의합니다.

,,,n {\ P={1 n{\ n 세트입니다.
( , 2, , ) { =( 여기서 { { i 플레이어 메트릭 공간에 대응하는 콤팩트 세트입니다.
( 1,2, , n) { ( {C} \ \mathbb i 플레이어의
보렐 확률 측도의 집합으로 정의하여 플레이어 의 혼합 전략 공간을 제공한다
프로파일 ( 1,2, , n ) {\ \ \= ( \ {1} , , \ { 합니다.

- ( display style - i( )를 제외한 모든 플레이어의 전략 프로파일로 합니다.다른 과 마찬가지로 i( (}\}, (display style b_{i}), b( style i, display i, display i, display i display i, display i, display i, display i, display i, display i, disp display i display상대 플레이어 프로파일에 대한 모든 확률 분포 집합에서 전략 집합까지의 관계입니다.이러한 각 요소는

- \ _에 대한 의 응답입니다.정의

( ) ( - )× 2( - )×b ( - n) ( \ \ { b } ( \ \ {} ) _ { ( \ \ { n

A strategy profile is a Nash equilibrium if and only if The existence of a Nash equilibrium for any continuous game with continuous utility functions can be proven using Irving Glicksberg카쿠타니 고정점 [1]정리 일반화.일반적으로 콤팩트하지 않은 s를 허용하거나 비연속적인 유틸리티 기능을 허용하면 해결책이 없을 수 있습니다.

분리 가능한 게임

분리 가능한 게임은 i에 대해 효용 i: {\ style \(를) 곱의 합계 형식으로 나타낼 수 있는 연속 게임입니다.

i( ) m1 … , n ( 1) ... n ( style _ { } ( \ { s } ) \ _ { { 1 _ { } \ \ sum \ _ { { n } \ i \ s { } \ _ {} , , 1 n R\ a _ , , , , {1} \ k _ { n } \ \ { R \ the the the the the the the the : : : { i :(는) 연속형입니다.

다항식 게임은 각 R 콤팩트 구간이며, 각 효용 함수를 다변수 다항식으로 쓸 수 있는 분리형 게임이다.

일반적으로 분리 가능한 게임의 혼합 내쉬 균형은 다음 정리에 의해 암시되는 비분리 가능한 게임보다 계산하기가 더 쉽다.

분리 가능한 게임에는 플레이어 i가 + 순수한 전략을 [2]혼합하는 내쉬 평형이 적어도 하나 존재합니다.

비분리형 게임의 평형 전략은 셀 수 없이 무한한 지원을 필요로 할 수 있는 반면, 분리형 게임은 완전히 지원되는 혼합 전략을 가진 적어도 하나의 내쉬 평형을 가질 것을 보증한다.

분리 가능한 게임

다항식 게임

X Y [ , ]({ C_} {)인 X와 Y 사이의 제로섬 2인 게임을 고려합니다. X C 를 각각x(\ x y(\ y .유틸리티 H ( , ) x ( , ) - y ( , H, y )= y )를 정의합니다.

(x , ) ( - ) {\ H)=(

순수한 전략 베스트 대응 관계는 다음과 같습니다.

X { b { 교차하지 않으므로 다음과 같은 이 있습니다.

순수한 전략이 내쉬 균형은 없다.그러나 혼합 전략 균형이 있어야 한다.이 값을 찾으려면 기대값 [ ( , ) {{ v=\ [ X와 Y 확률 분포의 첫 번째와 두 번째 모멘트의 선형 조합으로 표현합니다.

( N [ N { _}=\ [ Y에 대해서도 마찬가지).

1(\style \ _ X(\ _ 제약조건은 Hausdorff의해 다음과 같이 제시됩니다.

구속조건의 각 쌍은 평면에서 콤팩트한 볼록 부분 집합을 정의합니다.v{\ v 선형이기 에 플레이어의 처음 두 순간에 관한 모든 극단점은 이 서브셋의 경계에 있습니다.플레이어 I의 균형 전략은 다음과 같습니다.

첫 번째 방정식은 0과 1의 혼합만 허용하는 반면 두 번째 방정식은 순수한 전략만 허용합니다.또한 플레이어 i에 대한 특정 포인트에서 최적의 응답이 _있는 경우, 이 응답은 라인 전체에 하므로 과 1이 모두 입니다 y{X1 Y {\(는) 0과 1 둘 다 주지 않습니다. b x y = 1/2일 때 0과 1을 제공합니다.내쉬 평형은 다음 경우에 존재합니다.

이것은 플레이어 X가 시간의 1/2 시간 동안 0과 다른 1/2 시간 동안 1의 랜덤 혼합을 플레이하는 하나의 고유한 평형을 결정합니다.플레이어 Y는 1/2의 순수한 전략을 펼칩니다.그 게임의 가치는 1/4이다.

분리할 수 없는 게임

합리적인 보상 기능

X Y [ , ]({ C_} {)인 X와 Y 사이의 제로섬 2인 게임을 고려합니다. X C 를 각각x(\ x y(\ y .유틸리티 H ( , ) x ( , ) - y ( , H, y )= y )를 정의합니다.

이 게임은 순수한 내쉬 균형 전략이 없다.다음과 같은 확률 밀도 함수의 쌍과 함께 고유한 혼합 전략 내쉬 평형이 존재한다는 것을 보여줄[3] 수 있다.

이 게임의 값은 / \ 4 / \ 입니다.

칸토어 배포 필요

X Y [ , ]({ C_} {)인 X와 Y 사이의 제로섬 2인 게임을 고려합니다. X C 를 각각x(\ x y(\ y .유틸리티 H ( , ) x ( , ) - y ( , H, y )= y )를 정의합니다.

이 게임은 각 플레이어가 칸토어 단수 함수를 누적 분배 [4]함수로 혼합 전략을 펼치는 독특한 혼합 전략 평형을 가지고 있다.

추가 정보

  • H. W. 쿤과 A. W. 터커, ed.(1950).게임이론에 대한 공헌: 제2권수학연보 28.프린스턴 대학 출판부 ISBN0-691-07935-8.

「 」를 참조해 주세요.

레퍼런스

  1. ^ I.L. 글릭스버그내쉬 평형점에 대한 적용으로 카쿠타니 고정점 정리의 추가 일반화.미국 수학회 의사록, 3(1):170-174, 1952년 2월.
  2. ^ N. Stein, A. Ozdaglar 및 P.A.파릴로.'분리형 게임과 하위 연속 게임'국제 게임 이론 저널, 37(4): 475~504, 2008년 12월.https://arxiv.org/abs/0707.3462
  3. ^ Gliksberg, I. & Gross, O.(1950)."광장 위의 게임에 대한 노트"쿤, H.W. & Tucker, A.W. Eds.게임 이론에 대한 공헌: 제2권.수학연보 28, 페이지 173–183.프린스턴 대학 출판부
  4. ^ 징그럽다, O.(1952)"칸토어 분포의 합리적인 보상 특성"기술 보고서 D-1349, 랜드 코퍼레이션.