전략예방성
Strategyproofness게임 이론에서, 플레이어들이 개인 정보를 가지고 있는 비대칭 게임은 모든 플레이어가 자신의 개인 정보를 공개하는 약점 전략이라면,[1]: 244 즉, 다른 플레이어가 하는 일에 대한 정보가 없다면, 여러분은 진실됨으로써 최고를 하거나 최소한 더 나빠지지 않을 것이다.
SP는 다른 종류의 인센티브 호환성과 구별하기 위해 진실하거나 지배적인 전략-인센트럴 호환(DSIC)이라고도 불린다.[1]: 415
SP 게임은 항상 담합에 면역이 되는 것은 아니지만, 강력한 변형이다; 그룹 전략 방지가 있으면 어떤 그룹도 모든 구성원을 더 잘 살게 하는 방식으로 자신의 선호도를 잘못 보고하도록 공모할 수 없고, 강력한 그룹 전략 방지가 있으면 어떤 그룹도 적어도 하나의 멤브레인 방식으로 자신의 선호도를 잘못 보고하도록 공모할 수 없다.나머지 멤버들 중 누구도 더 나쁘게 만들지 않고 그룹의 더 나은 삶을 사는 것이다.[2]
예
SP 메커니즘의 대표적인 예는 두 가지 대안, 즉 2차 가격 경매와 VCG 메커니즘 사이에서 다수결된 것이다.
SP가 아닌 메커니즘의 대표적인 예로는 3개 이상의 대안간 복수투표, 1차 경매 등이 있다.
SP는 네트워크 라우팅에도 적용된다.네트워크를 각 에지(즉, 링크)에 링크 소유자에게 개인적으로 알려진 관련 전송 비용이 포함된 그래프로 간주한다.링크 소유자는 메시지 릴레이에 대해 보상을 받기를 원한다.네트워크의 메시지 발신인으로서, 최소 비용 경로를 찾고자 한다.대규모 네트워크에서도 이를 위한 효율적인 방법이 있다.그러나 한 가지 문제가 있는데, 각 링크에 대한 비용을 알 수 없다는 것이다.순진한 접근방식은 각 링크의 소유주에게 비용을 물어보고, 최소 비용 경로를 찾기 위해 이러한 공시가격을 사용하고, 공시가격 경로에 있는 모든 링크를 지불하는 것이다.그러나, 이 지불방식은 SP가 아니라는 것을 보여줄 수 있다. 즉, 일부 링크의 소유주는 비용에 대해 거짓말을 함으로써 이익을 얻을 수 있다.우리는 실제 비용보다 훨씬 더 많은 돈을 지불하게 될지도 모른다.네트워크와 플레이어(링크 소유자)에 대한 특정 가정을 감안할 때 VCG 메커니즘의 변형은 SP임을 알 수 있다.
표기법
가능한 의 X 이(가) 있다.
각 결과에 대해 서로 다른 가치를 갖는 의 개의 에이전트가 있다.에이전트 의 평가는 함수로 표현된다.
각 대안에 대해 가지고 있는 가치를 금전적인 측면에서 표현한다.
에이전트에 Quasilinar utility 기능이 있다고 가정한다. 즉, 가 x 이고, 게다가 에이전트가 i i}(양수 또는 음수)를 받는 경우 i {\의 총 효용은 다음과 같다.
모든 가치 기능의 벡터는 로 표시된다
모든 에이전트 에대해 다른 에이전트의 모든 값 기능의 벡터는 - 로 표시된다 따라서 v (v ,- i ) v
메커니즘은 한 쌍의 기능이다.
- 값 벡터 을(를) 입력하여 결과 x{ 을(를) 반환하는 c e {\ x\in X사회 선택 함수라고도 함).
- 값 벡터 v 을(를) 입력하여 지급 벡터 ,…,p ){\를 반환하여각 플레이어가 받아야 하는 금액을 결정하는 P m 함수.
플레이어 i 및 다른 플레이어 v - i :
특성화
주어진 메커니즘이 SP인지 아닌지를 점검할 수 있는 간단한 조건을 갖추는 것이 도움이 된다.이 하위섹션은 필요하면서도 충분한 두 가지 간단한 조건을 보여준다.
메커니즘이 SP인 경우 모든 에이전트 에 대해 다음 두 조건을 충족해야 한다[1]: 226
1. 에이전트 에 대한 지급은 선택된 결과와 에이전트 v- 의 평가의 함수지만 에이전트 자체 평가 v 의 직접적인 함수는 아니다 정식으로 가격 함수 r i i 가 존재한다. X {\ X 및 다른 에이전트 - i 에 대한 평가 벡터를 입력한 후 에이전트 에 대한 지급을 반환하여 , ′, - 에 대해 },v_{-i},v_i를 입력하십시오.
다음:
PRIP: 만약 P i, - i)> e ( , - ) 이면이후 그것은 그로 하여금 같은 결과와 더 큰 지불을 주P는 yment나는(vivi−)<>Payment_ᆫ(v_{나는}',v_{-i})}그때 평가와 대행 나는 '}{\displaystyle v_{나는}′ vi}{\displaystyle v_{나는}v보고할 수 있습니다; 비슷하게,&P나는(나는 ′ v, vi−) yment{\displaystyle P를 선호한다.ayment 그러면 평가 을(를) 가진 는 v 보고를 선호한다
코롤러리로서, 결과 {\\in 및 다른 v -i {\v_{-를 입력하는 "가격표" 함수 r 가 존재하며 v,마다 에이전트 에 대한 지불을 반환한다. 다음과 같은 경우:
다음:
2. 선택한 결과는 다른 에이전트의 평가를 고려할 때 i 에 가장 적합하다공식:
여기서 최대화는 t e (, - i) 의 범위에있는 모든 결과에 걸쳐 이루어진다.
PROOF:만약 또 다른 결과)′ 것이다.)Outc입니다 me(나는 ′ v, vi−){\displaystyle x'=Outcome(v_{나는}',v_{-i})}가 vi()′)+Pr나는 c ei()′, vi−)>v 나는())+Pr나는 c ei(x, v 나는 −){\displaystyle v_{나는}(x')+Price_ᆴ(x',v_{-i})>, v_ᆵ())+Price_ᆶ(x,v_{-i})}, 그때 anagent 평가 가 더 큰 총 유틸리티를 제공하기 때문에 v 보고하기를 선호한다
조건 1과 2는 필요할 뿐만 아니라 충분하다: 조건 1과 조건 2를 만족시키는 모든 메커니즘은 SP이다.
교정: 및 평가 v ,v - i {\ v_ v_{- denote
- t o e (i, - i) {\x:=i},i}) - 에이전트가 진실하게 행동하는 경우의 결과.
- - 에이전트가 거짓으로 행동할 때의 결과.
속성 1에 따라, 진실하게 플레이할 때 에이전트의 효용은 다음과 같다.
거짓된 플레이를 할 때 에이전트의 효용은 다음과 같다.
속성 2:
그래서 에이전트가 진실하게 행동하는 것이 지배적인 전략이다.
결과 함수 특성화
메커니즘의 실제 목표는 c o e {\ 기능이다. 지불 기능은 플레이어가 진실하게 행동하도록 유도하는 도구일 뿐이다.따라서 일정한 결과 함수를 감안할 때 SP 메커니즘을 사용하여 구현될 수 있는지 아닌지를 아는 것이 유용하다(이 속성을 구현성이라고도 한다).단일성(메커니즘 설계) 속성은 필요하며, 또한 종종 충분하다.
단일 매개변수 도메인의 진실된 메커니즘
단일 파라미터 도메인은 각 플레이어 이(가) "승부"에 대해 양의 값 i 를 얻고 "losing"에 대한 값 0을 얻는 게임이다.간단한 예가 단일 경매인데, v 는 플레이어 가 항목에 할당하는 값이다.
이 설정을 위해, 진실된 메커니즘을 특징짓는 것은 쉽다.몇 가지 정의로 시작하십시오.
매 낙찰가마다 0을 지불하면 메커니즘은 정상이라고 불린다.
선수가 낙찰가를 올릴 때 (약하게) 우승 가능성이 높아지면 메커니즘은 모노톤이라고 불린다.
단조로운 메커니즘의 경우, 모든 플레이어 i와 다른 플레이어의 입찰 조합에 대해 플레이어가 패배에서 승부로 전환하는 결정적인 가치가 있다.
단일 매개변수 영역에서 정규화된 메커니즘은 다음의 두 조건이 유지된다면 진실이다.[1]: 229–230
- 할당 함수는 각 입찰에서 단조로우며, 다음과 같다.
- 낙찰될 때마다 중요한 가치가 있다.
확률이 높은 진실성
모든 상수 ϵ<>를 사용하여 들어 0{\displaystyle \epsilon>0}, 무작위 메커니즘 진실한 확률 1과 −ϵ{1-\epsilon\displaystyle}라고 불린다 만약을 위해서 모든 요원과 모든 벡터의 입찰 확률은 요원 혜택에 입찰 non-truthfully에서 대부분의ϵ{\displaystyle \epsilon}이 probabil.ity은메커니즘의 무작위성을 [1]: 349 넘겨받았지
입찰자의 수가 증가할 때 상수 이(가) 0으로 가면 그 메커니즘은 높은 확률로 진실이라고 불린다.이 개념은 완전한 진실성보다는 약하지만, 경우에 따라서는 여전히 유용하다. 예를 들어 합의 추정치를 참조하라.
거짓명확증
인터넷 기반 경매의 풍성함과 함께 보편화된 새로운 유형의 사기행위는 허위명세 입찰이다 - 단일 입찰자가 복수의 전자우편 주소와 같은 복수의 식별자를 사용하여 제출한 입찰이다.
허위명확증이란 선수들 중 어느 누구도 허위명세서를 발급할 유인이 없다는 것을 의미한다.이것은 전략적인 방편보다 더 강한 생각이다.특히 비크리-클라크-그로브스(VCG) 경매는 거짓 이름 방지가 아니다.[3]
거짓 이름-방지는 개인만이 일반적으로 여러 개인들의 유착 조율을 필요로 하는 특정 행동을 시뮬레이션할 수 있다고 가정하기 때문에 그룹 전략-방호와는 중요한 차이가 있다.
참고 항목
추가 읽기
- Parkes, David C. (2004) On Learnable Mechanism Design, in: Tumer, Kagan 및 David Wolpert (Eds). 수집과 복잡한 시스템의 설계, 뉴욕 U.A.O., 페이지 107–133.
- 아카디 슬링코의 "고전적 사회선택의 무증상 전략-증언 규칙"에 관한 기사에서 투표제도의 전략-증언에 관한 기사가 나왔다.
참조
- ^ a b c d e Vazirani, Vijay V.; Nisan, Noam; Roughgarden, Tim; Tardos, Éva (2007). Algorithmic Game Theory (PDF). Cambridge, UK: Cambridge University Press. ISBN 0-521-87282-0.
- ^ "Group Strategy-proofness And Social Choice Between Two Alternatives" (PDF). Archived from the original (PDF) on 2020-02-12.
- ^ Yokoo, M.; Sakurai, Y.; Matsubara, S. (2004). "The effect of false-name bids in combinatorial auctions: New fraud in internet auctions". Games and Economic Behavior. 46: 174–188. CiteSeerX 10.1.1.18.6796. doi:10.1016/S0899-8256(03)00045-9.