랜덤화 가중치 다수 알고리즘

Randomized weighted majority algorithm

무작위 가중치 다수 알고리즘은 기계 학습 [1]이론의 알고리즘입니다.이것에 의해, 가중치 있는 다수 알고리즘의 실수 경계가 개선됩니다.

매일 아침 주식 시장이 열리기 전에 우리는 각각의 "전문가"들로부터 주식 시장이 상승할지 하락할지에 대한 예측을 받는다고 상상해 보십시오.우리의 목표는 이 일련의 예측을 하나의 예측으로 결합하여 그날의 구매 또는 판매 결정을 내리는 것입니다.RWMA는 우리의 예측 기록이 가장 뛰어난 전문가 한 명과 거의 맞먹을 수 있도록 우리에게 이 조합을 할 수 있는 방법을 제공한다.

동기

기계학습에서 WMA(Weighted majority algorithm)는 "전문가 조언을 통해 예측"하는 메타학습 알고리즘입니다.이것은 랜덤화 알고리즘이 아닙니다.

각 라운드에 대해 모든 전문가를 가중치로 초기화 1. 모든 전문가를 대상으로 여론조사를 실시하고 예측에 대한 가중 다수결로 예측합니다.실수하는 모든 전문가의 몸무게를 절반으로 줄인다. 

를 들어 디스플레이 스타일의n명이고 최고의 전문가가 실수를 가정합니다.Weighted Majority Algorithm(WMA; 가중치 24n + 실수를 합니다.이것은 그다지 좋은 경계가 아닙니다.랜덤화를 도입하면 더 잘 할 수 있습니다.

Randomized Weighted Majority Algorithm(RWMA)

Non-Randomized Weighted Majority Algorithm(WMA; 비랜덤화 가중치 다수결 알고리즘)은 2.4 2 +(\.4 _+ 만을 보증합니다.이는 오류가 발생하기 쉬운 전문가에게 문제가 됩니다(예를 들어 최고의 전문가는 여전히 20%의 실수를 저지릅니다).n { n명의 전문가를 하여 N N라운드를 한다고 가정합니다.최고의 전문가가 m m)의 실수를 경우, 실수의 4 210 + 56(\2. _ + 뿐입니다.

이는 WMA의 알려진 한계이므로m에 의존도를 개선하기 위해 이 단점을 개선하려는 시도가 검토되었습니다. 다수결로 예측하지 않고 확률로 가중치를 사용합니다. 즉, 무작위 가중치 과반수라는 명칭입니다. i(\w= _라면 W.으로 i i 따릅니다.W 목표는 동전을 던지기 전에 상대(세계)가 정답 중 하나를 선택해야 한다고 가정할 때 최악의 예상 실수 수를 제한하는 입니다.왜 최악의 경우 이것이 더 나은가?아이디어: 결정론적 알고리즘(가중치 과반수 알고리즘)의 최악의 경우는 가중치가 50/50으로 분할되는 경우였다.하지만 지금은 50대 50의 확률로 맞힐 수 있기 때문에 그렇게 나쁘지 않다.또한 2의 균형을 맞추기 위해 반드시 \< >을 곱하는 대신 β< \ \ <을 곱하는 것으로 일반화합니다.

분석.

에서는 오답의 가중치 로 정의하기 때문에tt\}에서 실수할 확률이 됩니다. 지금까지의 총 실수를 나타냅니다.또한 E[ ] t tt \ E [ M ] = \ { t } F{ t}을(를) 정의하며, 기대치가 가법이라는 점을 이용한다.\ t,,( - ( - ) ( - ( 1 - ( 1 - \ 이유: t{\ 에서는β(\를 곱하고 .따라서 W l n (- ( - ( ) ) 1 ( 1 - ( - ) F2 ) { } . { } .
를 들어 m은 지금까지 최고의 전문가의 실수 수라고 . W m \\ ^ { } 를 사용할 수 있습니다. 이제 푸겠습니다.먼저, 양쪽의 자연 통나무를 취한다. ln(n) + t ( 1-( - ) \ \ ) + \_ { } \ ( 1 - \ 심플화:
- - - 3 - . {\ ( 1 - x ) = - - { \ { x ^ {2 } - { \ {x^ {3} - ...、 。그래서,


다음으로 E[ ] t tt t t [ [ M ]= \ _ { } _ { } 를 합니다.그 결과는 다음과 같습니다.

진전이 있었는지 확인해 봅시다.

1 일 경우 1 + n)이 \ . \ ( ) 。
3 이면1.m + lnµ ()이 .\ + ()
진전이 있었음을 알 수 있습니다.대략 ( + ) +" - " ( n\ ( + \ \ ^ { -( n )

Randomized Weighted Majority Algorithm(RWMA) 사용

랜덤화 가중치 과반수 알고리즘을 사용하여 복수의 알고리즘을 조합할 수 있습니다.이 경우 RWMA는 원래의 알고리즘의 거의 최선의 퍼포먼스를 기대할 수 있습니다.

또한 전문가들이 결합할 수 없는(또는 쉽게 결합할 수 없는) 선택을 하는 상황에서는 무작위 가중 다수결 알고리즘을 적용할 수 있다.예를 들어 RWMA는 반복적인 게임 플레이나 온라인 최단 경로 문제에 적용할 수 있습니다.온라인 최단 경로 문제에서는 전문가마다 운전해서 출근하는 방법이 다릅니다.RWMA를 사용하여 하나의 경로를 선택합니다.나중에 제안된 모든 경로를 사용하여 얼마나 잘 수행했는지 확인하고 적절한 처벌을 내릴 수 있습니다.이를 위해 0 또는 1의 "손실"에서 [0,1]의 손실로 일반화하고자 합니다.목표는 최고의 전문가의 손실보다 훨씬 크지 않은 예상 손실을 갖는 것입니다.우리는 \ }의 패널티를 적용하여 RWMA를 일반화할 수 있다(즉, 1/2의 손실은 1의 손실과 0의 손실과 같은 무게로 귀결된다).이전 섹션에서 설명한 분석은 크게 변경되지 않습니다.

내선번호

  • 멀티 암 밴디트 문제
  • 많은 전문가가 있는 경우에 따라서는 효율적인 알고리즘입니다.
  • 수면 전문가/"전문가" 설정.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Littlestone, N.; Warmuth, M. (1994). "The Weighted Majority Algorithm". Information and Computation. 108 (2): 212–261. doi:10.1006/inco.1994.1009.

추가 정보