연속 게임

연속 게임은 틱택토(tic-tac-toe, 0과 크로스)나 체커(draft, 드래프트)와 같은 평범한 게임의 개념을 일반화하는 수학 개념이다.다시 말해, 이것은 플레이어가 한정된 일련의 순수한 전략 중에서 선택하는 이산 게임의 개념을 확장합니다.연속적인 게임 컨셉을 통해 게임은 셀 수 없이 무한할 수 있는 보다 일반적인 순수한 전략 세트를 포함할 수 있습니다.

일반적으로 셀 수 없이 무한한 전략 세트를 가진 게임이 반드시 내쉬 평형 솔루션을 가질 필요는 없습니다.그러나 전략 집합이 콤팩트하고 효용이 연속적으로 기능한다면, 내쉬 평형이 보장될 것이다; 이것은 카쿠타니 고정점 정리에 대한 글릭스버그의 일반화이다.이러한 이유로 연속 게임의 클래스는 일반적으로 전략 세트가 작고 유틸리티 기능이 연속적으로 작동하는 더 큰 클래스의 무한 게임(즉, 무한 전략 세트를 가진 게임)의 하위 집합으로 정의되고 연구된다.

형식적 정의

n플레이어 연속 $G=(P,\mathbf {C} ,\mathbf {U} )$ G $G=(P,\mathbf {C} ,\mathbf {U} )$ ( $G=(P,\mathbf {C} ,\mathbf {U} )$ P , $G=(P,\mathbf {C} ,\mathbf {U} )$ , $G=(P,\mathbf {C} ,\mathbf {U} )$ ) { $displaystyle$ G = ( $P$ , \ $mathbf$ { $C }$ , \ $mathbf { U }$ )를 $G=(P,{\mathbf {C}},{\mathbf {U}})$ 정의합니다.

P={1,2,3,\ldots ,n}

=

,

P={1,2,3,\ldots ,n}

,

P={1,2,3,\ldots ,n}

,

P={1,2,3,\ldots ,n}

n {\

displaystyle

P={1

,2,3,\ldots,n}

은

P={1,2,3,\ldots ,n}

n

n\,

{\

displaystyle

n

,}

의

n\,

n\,

세트입니다.

\mathbf {C} =(C_{1},C_{2},\ldots ,C_{n})

=

(

\mathbf {C} =(C_{1},C_{2},\ldots ,C_{n})

,

\mathbf {C} =(C_{1},C_{2},\ldots ,C_{n})

2,

\mathbf {C} =(C_{1},C_{2},\ldots ,C_{n})

,

\mathbf {C} =(C_{1},C_{2},\ldots ,C_{n})

) {

displaystyle \mathbf {C}

=(

C_{1},C_{2},\ldots,C_{n})

여기서

\mathbf {C} =(C_{1},C_{2},\ldots ,C_{n})

C_{i}\,

C_{i}\,

{

displaystyle C_{i}

는

C_{i}\,

i\,

{

style

i

}

플레이어의

i\,

메트릭 공간에 대응하는 콤팩트 세트입니다.

\mathbf {U} =(u_{1},u_{2},\ldots ,u_{n})

\mathbf {U} =(u_{1},u_{2},\ldots ,u_{n})

(

\mathbf {U} =(u_{1},u_{2},\ldots ,u_{n})

1,

\mathbf {U} =(u_{1},u_{2},\ldots ,u_{n})

2,

\mathbf {U} =(u_{1},u_{2},\ldots ,u_{n})

,

\mathbf {U} =(u_{1},u_{2},\ldots ,u_{n})

n

\mathbf {U} =(u_{1},u_{2},\ldots ,u_{n})

) {

displaystyle \mathbf {U}

u_{i}:\mathbf {C} \to \mathbb {R}

(

u_{1},u_{2},\ldots,u_

{n

})

u_{i}:\mathbf {C} \to \mathbb {R}

서

{\mathbf {U}}=(u_{1},u_{2},\ldots ,u_{n})

u_{i}:{\mathbf {C}}\to \mathbb{R}

u_{i}:\mathbf {C} \to \mathbb {R}

:\

mathbf

{C} \

to

\mathbb

{R

}

은

u_{i}:\mathbf {C} \to \mathbb {R}

i

i\,

플레이어의

함수입니다.

우리

는

\Delta _{i}\,

{\i

를

Ci

에

C_{i}\,

보렐 확률 측도의 집합으로 정의하여 플레이어

i

의 혼합 전략 공간을 제공한다

C_{i}\,

{\boldsymbol {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{n})

프로파일

{\boldsymbol {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{n})

(

\sigma _{i}\in \Delta _{i}\,

1,

{\boldsymbol {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{n})

2,

{\boldsymbol {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{n})

,

{\boldsymbol {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{n})

n ) {

displaystyle

\

boldsymbol

\

symbol

\

}

= ( \

displaystyle _

{1} ,

\ ldots

, \

displaystyle _

{

i

를

{\boldsymbol {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{n})

\sigma _{i}\in \Delta _{i}\,

합니다.

${\boldsymbol {\sigma }}_{-i}$ - ${\boldsymbol {\sigma }}_{-i}$ ( display style $)$ - i( $display style$ ${\boldsymbol {\sigma }}_{-i}$ )를 제외한 모든 플레이어의 전략 프로파일로 합니다.다른 $i\,$ 과 마찬가지로 i $i\,$ ( $display style$ $b_{i}\$ $i\,$ $b_{i}\$ $b_{i}\$ ( $display b_{$ $i$ }\ $b_{i}\$ }, $b_{i}\,$ (display style b_{i}), b $b_{i}\,$ ( $display$ style $b_{i$ i, display i, display i, display i $i$ display i, display i, display i, display i, display i, display i, disp $,$ display i $,$ display상대 플레이어 프로파일에 대한 모든 확률 분포 집합에서 $i$ 의 $i$ 전략 집합까지의 관계입니다.이러한 각 요소는

(\displaystyle b_{i}(\displaystyle _{-i}),

$\sigma _{-i}$ - $\style$ \ $sigma$ _ ${-i$ 에 대한 $\sigma _{-i}$ 의 응답입니다.정의

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

(

σ

)

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

(

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

-

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

)

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

×

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

2

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

(

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

-

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

)

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

×

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

b

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

(

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

- n

\mathbf {b} ({\boldsymbol {\sigma }})=b_{1}(\sigma _{-1})\times b_{2}(\sigma _{-2})\times \cdots \times b_{n}(\sigma _{-n})

) ( \

displaystyle

\

mathbf

{ b } ( \

boldsymbol

\

mathbf

{

b

} )

= b

_ {

1

( \

times b _ 2 ）

\

cdots _

{ n

}

A strategy profile ${\boldsymbol {\sigma }}*$ is a Nash equilibrium if and only if ${\boldsymbol {\sigma }}*\in \mathbf {b} ({\boldsymbol {\sigma }}*)$ The existence of a Nash equilibrium for any continuous game with continuous utility functions can be proven using Irving Glicksberg의 카쿠타니 고정점 ^[1]정리 일반화.일반적으로 콤팩트하지 않은 $C_{i}\,$ 인 $displaystyle C_{i$ s를 허용하거나 비연속적인 유틸리티 기능을 허용하면 해결책이 없을 수 있습니다.

분리 가능한 게임

분리 가능한 게임은 i에 대해 효용 $u_{i}:\mathbf {C} \to \mathbb {R}$ $u_{i}:\mathbf {C} \to \mathbb {R}$ i $u_{i}:\mathbf {C} \to \mathbb {R}$ : $u_{i}:\mathbf {C} \to \mathbb {R}$ $u_{i}:\mathbf {C} \to \mathbb {R}$ {\ $display$ style $u_{i}:\mathbf {C}$ \ $to \mathbb {R}}$ 을 $u_{i}:{\mathbf {C}}\to \mathbb{R}$ (를) 곱의 합계 형식으로 나타낼 수 있는 연속 게임입니다.

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

i

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

(

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

)

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

m1 …

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

,

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

…

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

n

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

(

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

1

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

) ...

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

n (

u_{i}(\mathbf {s} )=\sum _{k_{1}=1}^{m_{1}}\ldots \sum _{k_{n}=1}^{m_{n}}a_{i\,,\,k_{1}\ldots k_{n}}f_{1}(s_{1})\ldots f_{n}(s_{n})

){

display

style

u

_ {

i

} ( \

mathbf

{ s } )

=

\

sum

_ {

k _

{ 1

}^{ m

_ {

n

} \

sum

\ sum \

sum

_ { { n }

{s}

\

in \mathbf {C}

s_{i}\in C_{i}

s_{i}\in C_{i}

s_{i}\in C_{i}

i \

displaystyle

s

_

{

i

} \

in C

_ {

i

} ,

a_{i\,,\,k_{1}\ldots k_{n}}\in \mathbb {R}

,

a_{i\,,\,k_{1}\ldots k_{n}}\in \mathbb {R}

1

a_{i\,,\,k_{1}\ldots k_{n}}\in \mathbb {R}

a_{i\,,\,k_{1}\ldots k_{n}}\in \mathbb {R}

n

a_{i\,,\,k_{1}\ldots k_{n}}\in \mathbb {R}

R

a_{i\,,\,k_{1}\ldots k_{n}}\in \mathbb {R}

\

displaystyle

a _

{ i

, , , ,

k _

{1} \

ldots

k _ { n } \

in

\

mathbb

{ R

}

\

f_{i\,,\,k}:C_{i}\to \mathbb {R}

the the the the the the the

f_{i\,,\,k}:C_{i}\to \mathbb {R}

f_{i\,,\,k}:C_{i}\to \mathbb {R}

the

f_{i\,,\,k}:C_{i}\to \mathbb {R}

: : : {

f_{i\,,\,k}:C_{i}\to \mathbb {R}

i :

C_{i}\to \mathbb {R}}

은

f_{{i\,,\,k}}:C_{i}\to \mathbb{R}

(는) 연속형입니다.

다항식 게임은 각 $displaystyle C_{i},)$ 가 $C_{i}\,$ R $displaystyle \mathbb {R},)$ 의 $\mathbb{R} \,$ 콤팩트 구간이며, 각 효용 함수를 다변수 다항식으로 쓸 수 있는 분리형 게임이다.

일반적으로 분리 가능한 게임의 혼합 내쉬 균형은 다음 정리에 의해 암시되는 비분리 가능한 게임보다 계산하기가 더 쉽다.

분리 가능한 게임에는 플레이어 i가

m_{i}+1\,

+

({

의

m_{i}+1\,

순수한 전략을 ^[2]혼합하는 내쉬 평형이 적어도 하나 존재합니다.

비분리형 게임의 평형 전략은 셀 수 없이 무한한 지원을 필요로 할 수 있는 반면, 분리형 게임은 완전히 지원되는 혼합 전략을 가진 적어도 하나의 내쉬 평형을 가질 것을 보증한다.

예

분리 가능한 게임

다항식 게임

$C_{X}=C_{Y}=\left[0,1\right]$ X $C_{X}=C_{Y}=\left[0,1\right]$ $C_{X}=C_{Y}=\left[0,1\right]$ Y $C_{X}=C_{Y}=\left[0,1\right]$ [ $C_{X}=C_{Y}=\left[0,1\right]$ , $C_{X}=C_{Y}=\left[0,1\right]$ ]({ $displaystyle$ C_ ${X$ } $=$ {)인 $C_{X}=C_{Y}=\left[0,1\right]$ X와 Y 사이의 제로섬 2인 게임을 고려합니다. $Y}=\left[0,1\right$ $C_{X}\,$ X $displaystyle C_{X},})$ $C_{Y}\,$ C $displaystyle C_{Y},})$ 의 $C_{Y}\,$ $C_{X}\,$ 를 각각 $x\,$ x(\ $displaystyle$ x $,}$ $y\,$ y(\ $displaystyle$ y $)$ 로 $y\,$ $x\,$ .유틸리티 $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ H ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ ) $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ x ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ ) $=$ - $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ y ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ $){$ $displaystyle$ H $(x$ , y )= $u_{x}(x$ $,$ y )를 정의합니다 $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ .

H(x,y)=(x-y)^{2}\,

(

H(x,y)=(x-y)^{2}\,

x ,

H(x,y)=(x-y)^{2}\,

)

=

(

H(x,y)=(x-y)^{2}\,

-

H(x,y)=(x-y)^{2}\,

)

H(x,y)=(x-y)^{2}\,

{\

displaystyle

H

(x,y

)=(

x-y)^{2

순수한 전략 베스트 대응 관계는 다음과 같습니다.

{\displaystyle b_{X}(y)=begin{case}1,&{\mbox{if}}y\left[0,1/2\right]\\0\text{}1,&{\mbox{if}}y=1/2\0,&{\mbox{if}}}}\in\left{1/{\1/{\1\light}}\light}.

b_{Y}(x)=x,

$b_{X}(y)\,$ X $)$ { $displaystyle b_{X}(y),}$ 와 $b_{X}(y)\,$ b $)$ { $display b_{Y}(x),}$ 는 $b_{Y}(x)\,$ 교차하지 않으므로 다음과 같은 $b_{X}(y)\,$ 이 있습니다.

순수한 전략이 내쉬 균형은 없다.그러나 혼합 전략 균형이 있어야 한다.이 값을 찾으려면 기대값 $v=\mathbb {E} [H(x,y)]$ $=$ [ $v=\mathbb {E} [H(x,y)]$ ( $v=\mathbb {E} [H(x,y)]$ , $v=\mathbb {E} [H(x,y)]$ ) $]$ {{ $displaystyle$ v=\ $mathbb {E}$ [ $H(x,y)]}$ 를 $v={\mathbb {E}}[H(x,y)]$ X와 Y 확률 분포의 첫 번째와 두 번째 모멘트의 선형 조합으로 표현합니다.

v=\mu _{X2}-2\mu _{X1}\mu _{Y1}+\mu _{Y2},

( $\mu _{XN}=\mathbb {E} [x^{N}]$ 서 $\mu _{XN}=\mathbb {E} [x^{N}]$ $\mu _{XN}=\mathbb {E} [x^{N}]$ N $=$ [ $\mu _{XN}=\mathbb {E} [x^{N}]$ N $]$ { $displaystyle \mu$ _ ${XN$ }=\ $mathbb {E}$ [ $x^{N}})$ 및 $\mu _{XN}=\mathbb {E} [x^{N}]$ Y에 대해서도 마찬가지).

$\mu _{X1}\,$ $\mu _{X1}\,$ 1(\style \ $mu$ _ ${X1},})$ $\mu _{X2}$ $\mu _{X2}$ X $\mu _{X2}$ (\ $style \mu$ _ ${X2})$ 에 $\mu _{X1}\,$ 제약조건은 Hausdorff에 의해 다음과 같이 제시됩니다.

{begin{aligned}\mu _{X1}\geq \mu _{X2}^{2}\leq \mu _{X2}\end{aligned}\qquad {{begin{aligned}\mu _{Y1}\geq \mu _{Y2}^{2}^{2}^{2}\leq^{2}^2}_2}_2}{{{1

구속조건의 각 쌍은 평면에서 콤팩트한 볼록 부분 집합을 정의합니다.v $v\,$ {\ $displaystyle$ v $}$ 는 $v\,$ 선형이기 $v\,$ 에 플레이어의 처음 두 순간에 관한 모든 극단점은 이 서브셋의 경계에 있습니다.플레이어 I의 균형 전략은 다음과 같습니다.

\displaystyle \mu _{i1}=\mu _{i2}{또는 }}\mu _{i1}^{2}=\mu _{i2}}

첫 번째 방정식은 0과 1의 혼합만 허용하는 반면 두 번째 방정식은 순수한 전략만 허용합니다.또한 플레이어 i에 대한 특정 포인트에서 최적의 응답이 $\mu _{i1}=\mu _{i2}\,$ $\mu _{i1}=\mu _{i2}\,$ $=$ $\mu _{i1}=\mu _{i2}\,$ $\mu _{i1}=\mu _{i2}\,$ $displaystyle$ $\mu$ $_$ ${i1$ $}=\mu$ $\mu _{i1}=\mu _{i2}\,$ _ ${i2$ 에 $b_{Y}(\mu _{X1},\mu _{X2})\,$ 있는 경우, 이 응답은 라인 전체에 $b_{Y}(\mu _{X1},\mu _{X2})\,$ 하므로 $b_{Y}(\mu _{X1},\mu _{X2})\,$ 과 1이 모두 $최적$ 의 $b_{Y}(\mu _{X1},\mu _{X2})\,$ 입니다 $.$ ${\displaystyle$ y $=\mu _$ {X1 $y=\mu _{X1}\,$ $b_{Y}\,$ $b_{Y}\,$ Y {\ $displaystyle b_{$ $Y},}$ 은 $b_{Y}\,$ (는) 0과 1 둘 다 주지 않습니다. $b_{x}\,$ b x $displaystyle b_{x},)$ 는 $b_{x}\,$ y = 1/2일 때 0과 1을 제공합니다.내쉬 평형은 다음 경우에 존재합니다.

\displaystyle (\mu _{X1}*,\mu _{X2}*,\mu _{Y1}*,\mu _{Y2}*)=(1/2,1/2,1/4),

이것은 플레이어 X가 시간의 1/2 시간 동안 0과 다른 1/2 시간 동안 1의 랜덤 혼합을 플레이하는 하나의 고유한 평형을 결정합니다.플레이어 Y는 1/2의 순수한 전략을 펼칩니다.그 게임의 가치는 1/4이다.

분리할 수 없는 게임

합리적인 보상 기능

$C_{X}=C_{Y}=\left[0,1\right]$ X $C_{X}=C_{Y}=\left[0,1\right]$ $C_{X}=C_{Y}=\left[0,1\right]$ Y $C_{X}=C_{Y}=\left[0,1\right]$ [ $C_{X}=C_{Y}=\left[0,1\right]$ , $C_{X}=C_{Y}=\left[0,1\right]$ ]({ $displaystyle$ C_ ${X$ } $=$ {)인 $C_{X}=C_{Y}=\left[0,1\right]$ X와 Y 사이의 제로섬 2인 게임을 고려합니다. $Y}=\left[0,1\right$ $C_{X}\,$ X $displaystyle C_{X},})$ $C_{Y}\,$ C $displaystyle C_{Y},})$ 의 $C_{Y}\,$ $C_{X}\,$ 를 각각 $x\,$ x(\ $displaystyle$ x $,}$ $y\,$ y(\ $displaystyle$ y $)$ 로 $y\,$ $x\,$ .유틸리티 $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ H ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ ) $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ x ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ ) $=$ - $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ y ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ $){$ $displaystyle$ H $(x$ , y )= $u_{x}(x$ $,$ y )를 정의합니다 $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ .

H(x,y)=frac {(1+x)(1+y)}{(1+xy)^{2}}}.

이 게임은 순수한 내쉬 균형 전략이 없다.다음과 같은 확률 밀도 함수의 쌍과 함께 고유한 혼합 전략 내쉬 평형이 존재한다는 것을 보여줄^[3] 수 있다.

f^{*}(x)=flac {2}{\pi {\pi {x}(1+x}}}}\qquad g^{*}(y)=flac {2}{\pi {\fi {y}}(1+y)}}}}.

이 게임의 값은 $4/\pi$ / $（$ \ $displaystyle$ 4 / \ $pi$ 입니다.

칸토어 배포 필요

$C_{X}=C_{Y}=\left[0,1\right]$ X $C_{X}=C_{Y}=\left[0,1\right]$ $C_{X}=C_{Y}=\left[0,1\right]$ Y $C_{X}=C_{Y}=\left[0,1\right]$ [ $C_{X}=C_{Y}=\left[0,1\right]$ , $C_{X}=C_{Y}=\left[0,1\right]$ ]({ $displaystyle$ C_ ${X$ } $=$ {)인 $C_{X}=C_{Y}=\left[0,1\right]$ X와 Y 사이의 제로섬 2인 게임을 고려합니다. $Y}=\left[0,1\right$ $C_{X}\,$ X $displaystyle C_{X},})$ $C_{Y}\,$ C $displaystyle C_{Y},})$ 의 $C_{Y}\,$ $C_{X}\,$ 를 각각 $x\,$ x(\ $displaystyle$ x $,}$ $y\,$ y(\ $displaystyle$ y $)$ 로 $y\,$ $x\,$ .유틸리티 $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ H ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ ) $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ x ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ ) $=$ - $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ y ( $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ , $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ $){$ $displaystyle$ H $(x$ , y )= $u_{x}(x$ $,$ y )를 정의합니다 $H(x,y)=u_{x}(x,y)=-u_{y}(x,y)\,$ .

H(x,y)=\sum _{n=0}^{\infty }{\frac {1}{2^{n}}}\left(2x^{n}-\left(\left(1-{\frac {x}{3}}\right)^{n}-\left({\frac {x}{3}}\right)^{n}\right)\right)\left(2y^{n}-\left(\left(1-{\frac {y}{3}}\right)^{n}-\left({\frac {y}{3}}\right)^{n}\right)\right)

^{n}\right)\left(2y^{n}-\left(\left(1-{\frac {y}{3}}\right)^{n}-\left\frac {y}{3}}\right)

^{n}\right)\right

이 게임은 각 플레이어가 칸토어 단수 함수를 누적 분배 ^[4]함수로 혼합 전략을 펼치는 독특한 혼합 전략 평형을 가지고 있다.

추가 정보

H. W. 쿤과 A. W. 터커, ed.(1950).게임이론에 대한 공헌: 제2권수학연보 28.프린스턴 대학 출판부 ISBN 0-691-07935-8.

「」를 참조해 주세요.

그래프 연속

레퍼런스

^ I.L. 글릭스버그내쉬 평형점에 대한 적용으로 카쿠타니 고정점 정리의 추가 일반화.미국 수학회 의사록, 3(1):170-174, 1952년 2월.
^ N. Stein, A. Ozdaglar 및 P.A.파릴로.'분리형 게임과 하위 연속 게임'국제 게임 이론 저널, 37(4): 475~504, 2008년 12월.https://arxiv.org/abs/0707.3462
^ Gliksberg, I. & Gross, O.(1950)."광장 위의 게임에 대한 노트"쿤, H.W. & Tucker, A.W. Eds.게임 이론에 대한 공헌: 제2권.수학연보 28, 페이지 173–183.프린스턴 대학 출판부
^ 징그럽다, O.(1952)"칸토어 분포의 합리적인 보상 특성"기술 보고서 D-1349, 랜드 코퍼레이션.

[1] I.L. 글릭스버그내쉬 평형점에 대한 적용으로 카쿠타니 고정점 정리의 추가 일반화.미국 수학회 의사록, 3(1):170-174, 1952년 2월.

[2] N. Stein, A. Ozdaglar 및 P.A.파릴로.'분리형 게임과 하위 연속 게임'국제 게임 이론 저널, 37(4): 475~504, 2008년 12월.https://arxiv.org/abs/0707.3462

[3] Gliksberg, I. & Gross, O.(1950)."광장 위의 게임에 대한 노트"쿤, H.W. & Tucker, A.W. Eds.게임 이론에 대한 공헌: 제2권.수학연보 28, 페이지 173–183.프린스턴 대학 출판부

[4] 징그럽다, O.(1952)"칸토어 분포의 합리적인 보상 특성"기술 보고서 D-1349, 랜드 코퍼레이션.

[1]

[2]

[3]

[4]

Search

연속 게임

네임스페이스

더

목차

형식적 정의

분리 가능한 게임

예

분리 가능한 게임

다항식 게임

분리할 수 없는 게임

합리적인 보상 기능

칸토어 배포 필요

추가 정보

「」를 참조해 주세요.

레퍼런스

Search

연속 게임

형식적 정의

분리 가능한 게임

예

분리 가능한 게임

다항식 게임

분리할 수 없는 게임

합리적인 보상 기능

칸토어 배포 필요

추가 정보

「 」를 참조해 주세요.

레퍼런스

「」를 참조해 주세요.