랜덤화 가중치 다수 알고리즘

무작위 가중치 다수 알고리즘은 기계 학습 ^[1]이론의 알고리즘입니다.이것에 의해, 가중치 있는 다수 알고리즘의 실수 경계가 개선됩니다.

매일 아침 주식 시장이 열리기 전에 우리는 각각의 "전문가"들로부터 주식 시장이 상승할지 하락할지에 대한 예측을 받는다고 상상해 보십시오.우리의 목표는 이 일련의 예측을 하나의 예측으로 결합하여 그날의 구매 또는 판매 결정을 내리는 것입니다.RWMA는 우리의 예측 기록이 가장 뛰어난 전문가 한 명과 거의 맞먹을 수 있도록 우리에게 이 조합을 할 수 있는 방법을 제공한다.

동기

기계학습에서 WMA(Weighted majority algorithm)는 "전문가 조언을 통해 예측"하는 메타학습 알고리즘입니다.이것은 랜덤화 알고리즘이 아닙니다.

각 라운드에 대해 모든 전문가를 가중치로 초기화 1. 모든 전문가를 대상으로 여론조사를 실시하고 예측에 대한 가중 다수결로 예측합니다.실수하는 모든 전문가의 몸무게를 절반으로 줄인다.

$예$ 를 들어 디스플레이 스타일의 $전문가$ 가n명이고 $n$ 최고의 전문가가 $m개$ 의 $m$ 실수를 $한다고$ 가정합니다.Weighted Majority Algorithm(WMA; 가중치 $2.4(\log _{2}n+m)$ $알고리즘)$ 은 $최대$ 2 $2.4(\log _{2}n+m)$ 4 $(log 2 n$ n + $m )$ 의 $2.4(\log_2n+ m)$ 실수를 합니다.이것은 그다지 좋은 경계가 아닙니다.랜덤화를 도입하면 더 잘 할 수 있습니다.

Randomized Weighted Majority Algorithm(RWMA)

Non-Randomized Weighted Majority Algorithm(WMA; 비랜덤화 가중치 다수결 알고리즘)은 2.4 $2.4(\log _{2}n+m)$ 2 $2.4(\log _{2}n+m)$ + $)$ 의 $2.4(\log _{2}n+m)$ (\ $displaystyle 2$ .4 $(\log$ _ ${2}n$ + $m$ 만을 보증합니다.이는 오류가 발생하기 쉬운 전문가에게 문제가 됩니다(예를 들어 최고의 전문가는 여전히 20%의 실수를 저지릅니다).n $n=10$ $n=10$ { $displaystyle$ n $=10}$ 명의 $n=10$ 전문가를 $n=10$ 하여 N $N=100$ $N=100$ ${displaystyle$ N $=100}$ 라운드를 $N=100$ $N=100$ 한다고 가정합니다.최고의 전문가가 m $m=20$ $({displaystyle$ m $=20}$ 개 $m=20$ )의 실수를 $m=20$ 경우, 실수의 $2.4(\log _{2}10+20)\approx 56$ 은 $2.4(\log _{2}10+20)\approx 56$ 4 $2.4(\log _{2}10+20)\approx 56$ 2 $2.4(\log _{2}10+20)\approx 56$ 10 + $2.4(\log _{2}10+20)\approx 56$ 56(\ $style$ 2. $4(\log$ _ ${2} 10$ + $20)\56)$ 뿐입니다 $2.4(\log _{2}10+20)\approx 56$ .

이는 WMA의 알려진 한계이므로m에 $대한$ 의존도를 개선하기 위해 이 단점을 개선하려는 시도가 검토되었습니다. 다수결로 예측하지 않고 확률로 가중치를 사용합니다. 즉, 무작위 가중치 과반수라는 명칭입니다. $(\$ $displaystyle$ $w_$ ${i$ $i$ 가 $w_{i}$ $expert$ i(\ $displaystyle$ w= $\sum$ _ ${i$ 의 $w_{i}$ 라면 W ${\frac {w_{i}}{W}}$ $W=\sum _{i}w_{i}$ ${i}$ 로 $W=\sum _{i}w_{i}$ . ${\frac {w_{i}}{W}}$ 으로 $expert$ i $(\$ $displaystyle$ i $)$ 를 $i$ 따릅니다.W ${\frac {w_{i}}{W}}$ 목표는 동전을 던지기 전에 상대(세계)가 정답 중 하나를 선택해야 한다고 가정할 때 최악의 예상 실수 수를 제한하는 $것$ 입니다.왜 최악의 경우 이것이 더 나은가?아이디어: 결정론적 알고리즘(가중치 과반수 알고리즘)의 최악의 경우는 가중치가 50/50으로 분할되는 경우였다.하지만 지금은 50대 50의 확률로 맞힐 수 있기 때문에 그렇게 나쁘지 않다.또한 $m에$ $\log _{2}n$ 와 $\log _{2}n$ 2 $nn$ 의 균형을 맞추기 위해 반드시 ${\frac {1}{2}}$ \ $displaystyle \$ $beta$ < $1$ >을 곱하는 대신 β $\beta <1$ < $\beta <1$ \ $displaystyle$ \ $beta$ < $1$ 을 곱하는 것으로 일반화합니다.

분석.

$\displaystyle$ $\$ $t$ 에서는 $\ t$ $Ft를$ 오답의 가중치 $\ F_{t}$ 로 정의하기 때문에 $\ F_{t}$ $\$ $displaystyle\F_{$ t $\ F_{t}$ $}$ 는 $\ t$ t\ $displaystyle\t$ }에서 $\ t$ 실수할 확률이 됩니다. $(\displaystyle\M)$ 은 $\ M$ 지금까지의 총 실수를 나타냅니다.또한 E $E[M]=\ \sum _{t}F_{t}$ [ $E[M]=\ \sum _{t}F_{t}$ ] $E[M]=\ \sum _{t}F_{t}$ t $E[M]=\ \sum _{t}F_{t}$ t $E[M]=\ \sum _{t}F_{t}$ t \ $displaystyle$ E [ M ] = \ $sum _$ { t } F $_$ { t $E[M]=\ \sum _{t}F_{t}$ }을(를) 정의하며, 기대치가 가법이라는 점을 이용한다. $W$ $\ t$ \ $displaystyle$ $\$ t $\ t$ ,, $W$ $\ W(1-(1-\beta )F_{t})$ ( $\ W(1-(1-\beta )F_{t})$ - ( $\ W(1-(1-\beta )F_{t})$ - $\ W(1-(1-\beta )F_{t})$ ) $\ W(1-(1-\beta )F_{t})$ $\ W(1-(1-\beta )F_{t})$ $)\$ $displaystyle \ W$ ( $1$ - ( 1 - ( 1 - \ $beta )$ $F_{t$ 이유: $\ F_{t}$ t $\ F_{t}$ {\ $displaystyle\F_$ ${t$ $}$ $\ F_{t}$ 에서는 $\ \beta$ β(\ $displaystyle\\display$ 를 곱하고 $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ .따라서 W $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ l $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ n $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ ( $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ - ( $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ - ( $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ ) $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ ) $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ （ $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ 1 $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ ( 1 - ( $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ - $\ W_{final}=n*(1-(1-\beta )F_{1})*(1-(1-\beta )F_{2})...$ ) F2 ) $）$ { $displaystyleanal$ } . { $displaystyledisplaystyledisponal$ } . $F_{2}...$ $}$
$예$ 를 들어 $,$ m은 지금까지 $\ m$ 최고의 전문가의 실수 수라고 $합시다$ . $\ W\geq \beta ^{m}$ W $\ W\geq \beta ^{m}$ m \ $geq$ \ $beta$ ^ { $m$ } 를 사용할 수 있습니다. 이제 푸겠습니다.먼저, 양쪽의 자연 통나무를 취한다. $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ ln $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ ( $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ n $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ ) + $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ t $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ ( 1 $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ - $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ ( $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ - $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ ) $\ m\ln \beta \leq \ln(n)+\sum _{t}\ln(1-(1-\beta )F_{t})$ $){$ $displaystyle \ m$ \ $ln$ \ $ln ( n$ ) + \ $sum$ _ { $t$ } \ $ln$ ( 1 - \ $beta )$ $F_{t$ 심플화:
$\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ - $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ ） $=$ - $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ - $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ 3 - . { $displaystyle$ \ $\ln$ ( 1 - x ) = - $x$ - { \ $frac$ { x ^ {2 $}$ } - { \ $frac$ { $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ x $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ ^ {3 $}$ } - ... $\ \ln(1-x)=-x-{\frac {x^{2}}{2}}-{\frac {x^{3}}{3}}-...$ 、。그래서,
$\ \ln(1-(1-\beta )F_{t})<-(1-\beta )F_{t}$ $F_{t} <-(1-\beta)$ $F_{t$
$\displaystyle \m\ln \leq \ln(n)-(1-\beta)*\sum _{t}F_{t}$
다음으로 E $\ E[M]=\ \sum _{t}F_{t}$ [ $\ E[M]=\ \sum _{t}F_{t}$ ] $=$ t $\ E[M]=\ \sum _{t}F_{t}$ t $\ E[M]=\ \sum _{t}F_{t}$ t t t [ $E$ [ M ]= \ $sum$ _ { $t$ } $F$ _ { $t$ } 를 $\ E[M]=\ \sum _{t}F_{t}$ 합니다.그 결과는 다음과 같습니다.
${\displaystyle\E[M]\leq {m\ln(1/\beta)+\ln(n)}{1-\beta }}$
진전이 있었는지 확인해 봅시다.

$\ \beta ={\frac {1}{2}}$ $=$ 1 $({displaystyle \\displayfrac {1}{2$ 일 경우 1 $\ 1.39m+2\ln(n).$ + $\ 1.39m+2\ln(n).$ $\ 1.39m+2\ln(n).$ n $\ 1.39m+2\ln(n).$ )이 $.{$ $displaystyle$ \ $1$ . $39m + 2$ \ $ln$ ( $\ 1.39m+2\ln(n).$ ) 。 $\ 1.39m+2\ln(n).$
$\ \beta ={\frac {3}{4}}$ $=$ 3 $\ \beta ={\frac {3}{4}}$ 이면 $\ 1.15m+4\ln(n)$ 1. $\ 1.15m+4\ln(n)$ m + $\ 1.15m+4\ln(n)$ ln $\ 1.15m+4\ln(n)$ µ ( $\ 1.15m+4\ln(n)$ )이 $\ 1.15m+4\ln(n)$ .\ $displaystyle \ 1.15m$ + $4\ln$ ( $n$ )
진전이 있었음을 알 수 있습니다.대략 ( $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ + $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ ) $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ + $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ " - $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ " $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ ( n $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ \ ( $1$ + \ $epsilon )* m +$ \ $epsilon$ ^ { - $1$ ( n ) $\ (1+\epsilon )*m+\epsilon ^{-1}*\ln(n)$ 。

Randomized Weighted Majority Algorithm(RWMA) 사용

랜덤화 가중치 과반수 알고리즘을 사용하여 복수의 알고리즘을 조합할 수 있습니다.이 경우 RWMA는 원래의 알고리즘의 거의 최선의 퍼포먼스를 기대할 수 있습니다.

또한 전문가들이 결합할 수 없는(또는 쉽게 결합할 수 없는) 선택을 하는 상황에서는 무작위 가중 다수결 알고리즘을 적용할 수 있다.예를 들어 RWMA는 반복적인 게임 플레이나 온라인 최단 경로 문제에 적용할 수 있습니다.온라인 최단 경로 문제에서는 전문가마다 운전해서 출근하는 방법이 다릅니다.RWMA를 사용하여 하나의 경로를 선택합니다.나중에 제안된 모든 경로를 사용하여 얼마나 잘 수행했는지 확인하고 적절한 처벌을 내릴 수 있습니다.이를 위해 0 또는 1의 "손실"에서 [0,1]의 손실로 일반화하고자 합니다.목표는 최고의 전문가의 손실보다 훨씬 크지 않은 예상 손실을 갖는 것입니다.우리는 $\beta ^{loss}$ $\beta ^{loss}$ \ $displaystyle \beta ^{loss$ } $\beta ^{loss}$ 의 패널티를 적용하여 RWMA를 일반화할 수 있다(즉, 1/2의 손실은 1의 손실과 0의 손실과 같은 무게로 귀결된다).이전 섹션에서 설명한 분석은 크게 변경되지 않습니다.

내선번호

멀티 암 밴디트 문제
많은 전문가가 있는 경우에 따라서는 효율적인 알고리즘입니다.
수면 전문가/"전문가" 설정.

「」를 참조해 주세요.

레퍼런스

^ Littlestone, N.; Warmuth, M. (1994). "The Weighted Majority Algorithm". Information and Computation. 108 (2): 212–261. doi:10.1006/inco.1994.1009.

추가 정보

[LW94-1] Littlestone, N.; Warmuth, M. (1994). "The Weighted Majority Algorithm". Information and Computation. 108 (2): 212–261. doi:10.1006/inco.1994.1009.

[1]

Search

랜덤화 가중치 다수 알고리즘

네임스페이스

더

목차

동기

Randomized Weighted Majority Algorithm(RWMA)

분석.

Randomized Weighted Majority Algorithm(RWMA) 사용

내선번호

「」를 참조해 주세요.

레퍼런스

추가 정보

Search

랜덤화 가중치 다수 알고리즘

동기

Randomized Weighted Majority Algorithm(RWMA)

분석.

Randomized Weighted Majority Algorithm(RWMA) 사용

내선번호

「 」를 참조해 주세요.

레퍼런스

추가 정보

「」를 참조해 주세요.