랜덤화 가중치 다수 알고리즘
Randomized weighted majority algorithm무작위 가중치 다수 알고리즘은 기계 학습 [1]이론의 알고리즘입니다.이것에 의해, 가중치 있는 다수 알고리즘의 실수 경계가 개선됩니다.
매일 아침 주식 시장이 열리기 전에 우리는 각각의 "전문가"들로부터 주식 시장이 상승할지 하락할지에 대한 예측을 받는다고 상상해 보십시오.우리의 목표는 이 일련의 예측을 하나의 예측으로 결합하여 그날의 구매 또는 판매 결정을 내리는 것입니다.RWMA는 우리의 예측 기록이 가장 뛰어난 전문가 한 명과 거의 맞먹을 수 있도록 우리에게 이 조합을 할 수 있는 방법을 제공한다.
동기
기계학습에서 WMA(Weighted majority algorithm)는 "전문가 조언을 통해 예측"하는 메타학습 알고리즘입니다.이것은 랜덤화 알고리즘이 아닙니다.
각 라운드에 대해 모든 전문가를 가중치로 초기화 1. 모든 전문가를 대상으로 여론조사를 실시하고 예측에 대한 가중 다수결로 예측합니다.실수하는 모든 전문가의 몸무게를 절반으로 줄인다.
를 들어 디스플레이 스타일의가n명이고 최고의 전문가가의 실수를 가정합니다.Weighted Majority Algorithm(WMA; 가중치 은 24n +의 실수를 합니다.이것은 그다지 좋은 경계가 아닙니다.랜덤화를 도입하면 더 잘 할 수 있습니다.
Randomized Weighted Majority Algorithm(RWMA)
Non-Randomized Weighted Majority Algorithm(WMA; 비랜덤화 가중치 다수결 알고리즘)은 2.4 2 +의 (\.4 _+ 만을 보증합니다.이는 오류가 발생하기 쉬운 전문가에게 문제가 됩니다(예를 들어 최고의 전문가는 여전히 20%의 실수를 저지릅니다).n { n명의 전문가를 하여 N N라운드를 한다고 가정합니다.최고의 전문가가 m m개)의 실수를 경우, 실수의 은 4 210 + 56(\2. _ + 뿐입니다.
이는 WMA의 알려진 한계이므로m에 의존도를 개선하기 위해 이 단점을 개선하려는 시도가 검토되었습니다. 다수결로 예측하지 않고 확률로 가중치를 사용합니다. 즉, 무작위 가중치 과반수라는 명칭입니다. 가 i(\w= _의 라면 W로 .으로 i i를 따릅니다.W 목표는 동전을 던지기 전에 상대(세계)가 정답 중 하나를 선택해야 한다고 가정할 때 최악의 예상 실수 수를 제한하는 입니다.왜 최악의 경우 이것이 더 나은가?아이디어: 결정론적 알고리즘(가중치 과반수 알고리즘)의 최악의 경우는 가중치가 50/50으로 분할되는 경우였다.하지만 지금은 50대 50의 확률로 맞힐 수 있기 때문에 그렇게 나쁘지 않다.또한 와 2의 균형을 맞추기 위해 반드시 \< >을 곱하는 대신 β< \ \ <을 곱하는 것으로 일반화합니다.
분석.
에서는 오답의 가중치 로 정의하기 때문에t는t\}에서 실수할 확률이 됩니다.은 지금까지의 총 실수를 나타냅니다.또한 E[ ] t tt \ E [ M ] = \ { t } F{ t}을(를) 정의하며, 기대치가 가법이라는 점을 이용한다.\ t,,( - ( - ) ( - ( 1 - ( 1 - \ 이유: t{\ 에서는β(\를 곱하고 .따라서 W l n (- ( - ( ) ) (1 ( 1 - ( - ) F2 ) { } . { } .
를 들어 m은 지금까지 최고의 전문가의 실수 수라고 . W m \\ ^ { } 를 사용할 수 있습니다. 이제 푸겠습니다.먼저, 양쪽의 자연 통나무를 취한다. ln(n) + t ( 1-( - ) \ \ ) + \_ { } \ ( 1 - \ 심플화:
- ) - - 3 - . {\ ( 1 - x ) = - - { \ { x ^ {2 } - { \ {x^ {3} - ...、 。그래서,
다음으로 E[ ] t tt t t [ [ M ]= \ _ { } _ { } 를 합니다.그 결과는 다음과 같습니다.
진전이 있었는지 확인해 봅시다.
1 일 경우 1 + n)이 \ . \ ( ) 。
3 이면1.m + lnµ ()이 .\ + ()
진전이 있었음을 알 수 있습니다.대략 ( + ) +" - " ( n\ ( + \ \ ^ { -( n )。
Randomized Weighted Majority Algorithm(RWMA) 사용
랜덤화 가중치 과반수 알고리즘을 사용하여 복수의 알고리즘을 조합할 수 있습니다.이 경우 RWMA는 원래의 알고리즘의 거의 최선의 퍼포먼스를 기대할 수 있습니다.
또한 전문가들이 결합할 수 없는(또는 쉽게 결합할 수 없는) 선택을 하는 상황에서는 무작위 가중 다수결 알고리즘을 적용할 수 있다.예를 들어 RWMA는 반복적인 게임 플레이나 온라인 최단 경로 문제에 적용할 수 있습니다.온라인 최단 경로 문제에서는 전문가마다 운전해서 출근하는 방법이 다릅니다.RWMA를 사용하여 하나의 경로를 선택합니다.나중에 제안된 모든 경로를 사용하여 얼마나 잘 수행했는지 확인하고 적절한 처벌을 내릴 수 있습니다.이를 위해 0 또는 1의 "손실"에서 [0,1]의 손실로 일반화하고자 합니다.목표는 최고의 전문가의 손실보다 훨씬 크지 않은 예상 손실을 갖는 것입니다.우리는 \ }의 패널티를 적용하여 RWMA를 일반화할 수 있다(즉, 1/2의 손실은 1의 손실과 0의 손실과 같은 무게로 귀결된다).이전 섹션에서 설명한 분석은 크게 변경되지 않습니다.
내선번호
- 멀티 암 밴디트 문제
- 많은 전문가가 있는 경우에 따라서는 효율적인 알고리즘입니다.
- 수면 전문가/"전문가" 설정.
「 」를 참조해 주세요.
레퍼런스
- ^ Littlestone, N.; Warmuth, M. (1994). "The Weighted Majority Algorithm". Information and Computation. 108 (2): 212–261. doi:10.1006/inco.1994.1009.