전략예방성

Strategyproofness

게임 이론에서, 플레이어들이 개인 정보가지고 있는 비대칭 게임은 모든 플레이어가 자신의 개인 정보를 공개하는 약점 전략이라면,[1]: 244 , 다른 플레이어가 하는 일에 대한 정보가 없다면, 여러분은 진실됨으로써 최고를 하거나 최소한 더 나빠지지 않을 것이다.

SP는 다른 종류의 인센티브 호환성과 구별하기 위해 진실하거나 지배적인 전략-인센트럴 호환(DSIC)이라고도 불린다.[1]: 415

SP 게임은 항상 담합에 면역이 되는 것은 아니지만, 강력한 변형이다; 그룹 전략 방지가 있으면 어떤 그룹도 모든 구성원을 더 잘 살게 하는 방식으로 자신의 선호도를 잘못 보고하도록 공모할 수 없고, 강력한 그룹 전략 방지가 있으면 어떤 그룹도 적어도 하나의 멤브레인 방식으로 자신의 선호도를 잘못 보고하도록 공모할 수 없다.나머지 멤버들 중 누구도 더 나쁘게 만들지 않고 그룹의 더 나은 삶을 사는 것이다.[2]

SP 메커니즘의 대표적인 예는 두 가지 대안, 즉 2차 가격 경매와 VCG 메커니즘 사이에서 다수결된 것이다.

SP가 아닌 메커니즘의 대표적인 예로는 3개 이상의 대안간 복수투표, 1차 경매 등이 있다.

SP는 네트워크 라우팅에도 적용된다.네트워크를 각 에지(즉, 링크)에 링크 소유자에게 개인적으로 알려진 관련 전송 비용포함된 그래프로 간주한다.링크 소유자는 메시지 릴레이에 대해 보상을 받기를 원한다.네트워크의 메시지 발신인으로서, 최소 비용 경로를 찾고자 한다.대규모 네트워크에서도 이를 위한 효율적인 방법이 있다.그러나 한 가지 문제가 있는데, 각 링크에 대한 비용을 알 수 없다는 것이다.순진한 접근방식은 각 링크의 소유주에게 비용을 물어보고, 최소 비용 경로를 찾기 위해 이러한 공시가격을 사용하고, 공시가격 경로에 있는 모든 링크를 지불하는 것이다.그러나, 이 지불방식은 SP가 아니라는 것을 보여줄 수 있다. 즉, 일부 링크의 소유주는 비용에 대해 거짓말을 함으로써 이익을 얻을 수 있다.우리는 실제 비용보다 훨씬 더 많은 돈을 지불하게 될지도 모른다.네트워크와 플레이어(링크 소유자)에 대한 특정 가정을 감안할 때 VCG 메커니즘의 변형은 SP임을 알 수 있다.

표기법

가능한 X 이(가) 있다.

각 결과에 대해 서로 다른 가치를 갖는 개의 에이전트가 있다.에이전트 의 평가는 함수로 표현된다.

각 대안에 대해 가지고 있는 가치를 금전적인 측면에서 표현한다.

에이전트에 Quasilinar utility 기능이 있다고 가정한다. 즉, 가 x 이고, 게다가 에이전트가 i i}(양수 또는 음수)를 받는 경우 i {\의 총 효용은 다음과 같다.

모든 가치 기능의 벡터는 로 표시된다

모든 에이전트 대해 다른 에이전트의 모든 값 기능의 벡터는 - 로 표시된다 따라서 v (v ,- i ) v

메커니즘은 한 쌍의 기능이다.

  • 값 벡터 을(를) 입력하여 결과 x{ 을(를) 반환하는 c e {\ x\in X사회 선택 함수라고도 함).
  • 값 벡터 v 을(를) 입력하여 지급 벡터 ,,p ){\를 반환하여각 플레이어가 받아야 하는 금액을 결정하는 P m 함수.

플레이어 i 및 다른 플레이어 v - i :

특성화

주어진 메커니즘이 SP인지 아닌지를 점검할 수 있는 간단한 조건을 갖추는 것이 도움이 된다.이 하위섹션은 필요하면서도 충분한 두 가지 간단한 조건을 보여준다.

메커니즘이 SP인 경우 모든 에이전트 에 대해 다음 두 조건을 충족해야 한다[1]: 226

1. 에이전트 에 대한 지급은 선택된 결과와 에이전트 v- 의 평가의 함수지만 에이전트 자체 평가 v 의 직접적인 함수는 아니다 정식으로 가격 함수 r i i 가 존재한다. X {\ X 및 다른 에이전트 - i 에 대한 평가 벡터를 입력한 후 에이전트 에 대한 지급을 반환하여 , , - 에 대해 },v_{-i},v_i를 입력하십시오.

다음:

PRIP: 만약 P i, - i)> e ( , - ) 이면이후 그것은 그로 하여금 같은 결과와 더 큰 지불을 주P는 yment나는(vivi−)<>Payment_ᆫ(v_{나는}',v_{-i})}그때 평가와 대행 나는 '}{\displaystyle v_{나는}′ vi}{\displaystyle v_{나는}v보고할 수 있습니다; 비슷하게,&P나는(나는 ′ v, vi−) yment{\displaystyle P를 선호한다.ayment 그러면 평가 을(를) 가진 는 v 보고를 선호한다

코롤러리로서, 결과 {\\in 다른 v -i {\v_{-를 입력하는 "가격표" 함수 r 가 존재하며 v,마다 에이전트 에 대한 지불을 반환한다. 다음과 같은 경우:

다음:

2. 선택한 결과는 다른 에이전트의 평가를 고려할 때 i 에 가장 적합하다공식:

여기서 최대화는 t e (, - i) 의 범위에있는 모든 결과에 걸쳐 이루어진다.

PROOF:만약 또 다른 결과)′ 것이다.)Outc입니다 me(나는 ′ v, vi−){\displaystyle x'=Outcome(v_{나는}',v_{-i})}가 vi()′)+Pr나는 c ei()′, vi−)>v 나는())+Pr나는 c ei(x, v 나는 −){\displaystyle v_{나는}(x')+Price_ᆴ(x',v_{-i})>, v_ᆵ())+Price_ᆶ(x,v_{-i})}, 그때 anagent 평가 가 더 큰 총 유틸리티를 제공하기 때문에 v 보고하기를 선호한다

조건 1과 2는 필요할 뿐만 아니라 충분하다: 조건 1과 조건 2를 만족시키는 모든 메커니즘은 SP이다.

교정: 평가 v ,v - i {\ v_ v_{- denote

t o e (i, - i) {\x:=i},i}) - 에이전트가 진실하게 행동하는 경우의 결과.
- 에이전트가 거짓으로 행동할 때의 결과.

속성 1에 따라, 진실하게 플레이할 때 에이전트의 효용은 다음과 같다.

거짓된 플레이를 할 때 에이전트의 효용은 다음과 같다.

속성 2:

그래서 에이전트가 진실하게 행동하는 것이 지배적인 전략이다.

결과 함수 특성화

메커니즘의 실제 목표는 c o e {\ 기능이다. 지불 기능은 플레이어가 진실하게 행동하도록 유도하는 도구일 뿐이다.따라서 일정한 결과 함수를 감안할 때 SP 메커니즘을 사용하여 구현될 수 있는지 아닌지를 아는 것이 유용하다(이 속성을 구현성이라고도 한다).단일성(메커니즘 설계) 속성은 필요하며, 또한 종종 충분하다.

단일 매개변수 도메인의 진실된 메커니즘

단일 파라미터 도메인은 각 플레이어 이(가) "승부"에 대해 양의 값 i 를 얻고 "losing"에 대한 값 0을 얻는 게임이다.간단한 예가 단일 경매인데, v 는 플레이어 항목에 할당하는 값이다.

이 설정을 위해, 진실된 메커니즘을 특징짓는 것은 쉽다.몇 가지 정의로 시작하십시오.

매 낙찰가마다 0을 지불하면 메커니즘은 정상이라고 불린다.

선수가 낙찰가를 올릴 때 (약하게) 우승 가능성이 높아지면 메커니즘은 모노톤이라고 불린다.

단조로운 메커니즘의 경우, 모든 플레이어 i와 다른 플레이어의 입찰 조합에 대해 플레이어가 패배에서 승부로 전환하는 결정적인 가치가 있다.

단일 매개변수 영역에서 정규화된 메커니즘은 다음의 두 조건이 유지된다면 진실이다.[1]: 229–230

  1. 할당 함수는 각 입찰에서 단조로우며, 다음과 같다.
  2. 낙찰될 때마다 중요한 가치가 있다.

확률이 높은 진실성

모든 상수 ϵ<>를 사용하여 들어 0{\displaystyle \epsilon>0}, 무작위 메커니즘 진실한 확률 1과 −ϵ{1-\epsilon\displaystyle}라고 불린다 만약을 위해서 모든 요원과 모든 벡터의 입찰 확률은 요원 혜택에 입찰 non-truthfully에서 대부분의ϵ{\displaystyle \epsilon}이 probabil.ity은메커니즘의 무작위성을 [1]: 349 넘겨받았지

입찰자의 수가 증가할 때 상수 이(가) 0으로 가면메커니즘은 높은 확률로 진실이라고 불린다.이 개념은 완전한 진실성보다는 약하지만, 경우에 따라서는 여전히 유용하다. 예를 들어 합의 추정치를 참조하라.

거짓명확증

인터넷 기반 경매의 풍성함과 함께 보편화된 새로운 유형의 사기행위는 허위명세 입찰이다 - 단일 입찰자가 복수의 전자우편 주소와 같은 복수의 식별자를 사용하여 제출한 입찰이다.

허위명확증이란 선수들 중 어느 누구도 허위명세서를 발급할 유인이 없다는 것을 의미한다.이것은 전략적인 방편보다 더 강한 생각이다.특히 비크리-클라크-그로브스(VCG) 경매는 거짓 이름 방지가 아니다.[3]

거짓 이름-방지는 개인만이 일반적으로 여러 개인들의 유착 조율을 필요로 하는 특정 행동을 시뮬레이션할 수 있다고 가정하기 때문에 그룹 전략-방호와는 중요한 차이가 있다.

참고 항목

추가 읽기

  • Parkes, David C. (2004) On Learnable Mechanism Design, in: Tumer, Kagan 및 David Wolpert (Eds). 수집과 복잡한 시스템의 설계, 뉴욕 U.A.O., 페이지 107–133.
  • 아카디 슬링코의 "고전적 사회선택의 무증상 전략-증언 규칙"에 관한 기사에서 투표제도의 전략-증언에 관한 기사가 나왔다.

참조

  1. ^ a b c d e Vazirani, Vijay V.; Nisan, Noam; Roughgarden, Tim; Tardos, Éva (2007). Algorithmic Game Theory (PDF). Cambridge, UK: Cambridge University Press. ISBN 0-521-87282-0.
  2. ^ "Group Strategy-proofness And Social Choice Between Two Alternatives" (PDF). Archived from the original (PDF) on 2020-02-12.
  3. ^ Yokoo, M.; Sakurai, Y.; Matsubara, S. (2004). "The effect of false-name bids in combinatorial auctions: New fraud in internet auctions". Games and Economic Behavior. 46: 174–188. CiteSeerX 10.1.1.18.6796. doi:10.1016/S0899-8256(03)00045-9.