개시점수

Inception score

인셉션 스코어(IS)생성적 적대 네트워크(GAN)[1]와 같은 생성적 이미지 모델에 의해 생성된 이미지의 품질을 평가하는 데 사용되는 알고리즘입니다.점수는 생성 모델에 의해 생성된 샘플(일반적으로 약 30,000개)의 영상에 적용된 별도의 사전 교육 Inceptionv3 영상 분류 모델의 출력을 기반으로 계산됩니다.인셉션 점수는 다음 조건이 충족될 때 최대화됩니다.

  1. 생성된 영상에 대해 Inceptionv3 모델에 의해 예측된 라벨 분포의 엔트로피가 최소화됩니다.즉, 분류 모델은 각 이미지에 대해 자신 있게 단일 레이블을 예측합니다.직관적으로 이는 생성된 이미지의 "선명한" 또는 "구분적인" 요구에 해당합니다.
  2. 분류 모형의 예측은 가능한 모든 레이블에 고르게 분포되어 있습니다.이는 생성 모델의 출력이 "다양"[2]하다는 요구에 해당합니다.

관련 프레셰 개시 [3]거리로 다소 대체되었다.Inception Score는 생성된 영상의 분포만 평가하는 반면 FID는 생성된 영상의 분포를 실제 영상의 분포("실제 사실")와 비교합니다.

정의.

이미지 X \Omega _{과 라벨 Y 공간(\ _의 공간을 지정합니다.라벨의 공간은 한정되어 있습니다.

\ (를 판단하고 싶은 X에 대한 확률 .

판별자를 유형의 함수로 한다.

서 M( Y) ( \ ( \ _ { )는 Y ( \ _{ Y } 의 모든 확률 분포 세트입니다.이미지 x( \ x)및 y ( \ y)의 경우,에 따르면 p ( x) { p { } ( )는 x {\ x 라벨y {\ y가 붙을 확률입니다.보통 ImageNet에서 훈련받은Inception-v3 네트워크로 구현됩니다.

대한 인셉션 점수는 다음과 같습니다.

동등한 개서에는 다음이 포함됩니다.
Jensen의 부등식에 의해 음이 아닙니다

유사 코드:

INPUT s

INPUT g g

제너레이터의 i표시 }) 샘플.

s( i) ( \ _ { } ( \ x _ { i} ) x \ _ {} image condition 。

결과를 종합하여 p. 값은 p s (x ) g ( ) \ style \ p_x) 입니다.

제너레이터에서 더 x 샘플링하여 각각 L ( s( x ) p) { } \ ( _ { dis } \ x _ { \ { \ 합니다.

결과를 평균화하고 지수를 구합니다.

결과를 반환합니다.

해석

n { 선명하고 뚜렷한 이미지 컬렉션이기 때문에 초기 점수가 높을수록 "더 나은" 것으로 해석됩니다.

I ( e , i )[ [0 , N style \ IS ( _ { , p { }\[ , \ NN은 사용 가능한 라벨의 총수입니다.

I ( p n , d ) { \ IS (_ { , p { } =} iffff (x ~ n \ x \ _ { } )

즉, style )는 완전히 "불명확한" 입니다.즉, n {\ 에서 샘플링된 x {\x 대해 식별자는 정확히 동일한 라벨 sx 를 반환합니다.

최고 개시 점수 N N 다음 두 조건이 모두 충족될 경우에만 달성됩니다.

  • ~p { x \ p _ { } almost p s ( x )\ p { } ( x )는 하나의 라벨에 집중됩니다., y[ s ( ) { [ x)]= 입니다즉, })에서 샘플링된 모든 이미지는 식별자에 의해 정확하게 분류됩니다.
  • y(\ y에 대해 y y 라벨이 지정된 생성 이미지의 비율은 E ~ n [ s ( )] N(\ {gen} [ }(y x)] = }} } } } )입니다.즉, 생성된 이미지는 모든 라벨에 균등하게 분포됩니다.

레퍼런스

  1. ^ Salimans, Tim; Goodfellow, Ian; Zaremba, Wojciech; Cheung, Vicki; Radford, Alec; Chen, Xi; Chen, Xi (2016). "Improved Techniques for Training GANs". Advances in Neural Information Processing Systems. Curran Associates, Inc. 29. arXiv:1606.03498.
  2. ^ Frolov, Stanislav; Hinz, Tobias; Raue, Federico; Hees, Jörn; Dengel, Andreas (December 2021). "Adversarial text-to-image synthesis: A review". Neural Networks. 144: 187–209. doi:10.1016/j.neunet.2021.07.019. PMID 34500257. S2CID 231698782.
  3. ^ Borji, Ali (2022). "Pros and cons of GAN evaluation measures: New developments". Computer Vision and Image Understanding. 215: 103329. arXiv:2103.09396. doi:10.1016/j.cviu.2021.103329. S2CID 232257836.