서브모듈러 세트 함수

Submodular set function

수학에서 서브모듈러 집합함수(submodular set function이라고도 함)는 비공식적으로 입력 집합에 추가할 때 단일 요소가 만드는 함수의 증분값의 차이가 입력 집합의 크기가 증가함에 따라 감소하는 속성을 갖는 집합함수다. 하위 모델 함수는 자연적으로 감소하는 반환 속성을 가지고 있어 근사 알고리즘, 게임 이론(사용자 선호도를 모델링하는 함수로서) 및 전기 네트워크를 포함한 많은 애플리케이션에 적합하다. 최근, 서브모듈러 기능도 자동 요약, 다중 문서 요약, 특징 선택, 능동 학습, 센서 배치, 이미지 수집 요약 및 기타 많은 도메인을 포함한 기계 학습인공지능의 몇 가지 실제 문제에서 엄청난 효용성을 발견했다.[1][2][3][4]

정의

If is a finite set, a submodular function is a set function , where denotes the power set of , which satisfies one of the following equivalent conditions.[5]

  1. For every with and every we have that .
  2. For every we have that .
  3. For every and such that we have that cup \{x_(X .

음이 아닌 하위종 함수도 하위종 함수가 되지만 하위종 함수는 하위종 함수가 될 필요가 없다. (가) 유한하다고 가정하지 않으면 위의 조건은 동등하지 않다. , ( 유한하다면 f (에 의해 정의된 f {\ }, S {\ S이( 무한이면 (이(가)가위의 첫 번째 조건을 하지만, S {\ S S}에 실패한다. 교차점이 유한한 무한 집합이다.

하위 모듈 함수의 유형

모노톤

S 대해 ) f을 갖는다면 submodular function f f은 다음과 같다

선형(모듈러) 함수
)= i 형식의 모든 기능을 선형 함수라고 한다. 또한 , w 0 0 경우 f는 단조롭다.
예산 추가 기능
Any function of the form for each and is called budget additive.[citation needed]
커버리지 함수
={ E , 2, n 은(는 일부 접지 집합의 하위 집합 모음입니다 f() = E {\ Si}\ 탐지함수 함수로 불린다. 이는 원소에 음이 아닌 가중치를 추가하면 일반화할 수 있다.
엔트로피
={ , X 을(를) 변수의 집합으로 한다. Then for any we have that is a submodular function, where is the entropy of the set of random variables , a fact known as Shannon's inequality.[6] 엔트로피 함수에 대한 추가 불평등은 이질 벡터를 참조하는 으로 알려져 있다.
마트로이드 계급적 기능.
={ e ,e ,… ,e 을(를) 매트로이드 정의가 설정된 지면 세트라고 한다. 그렇다면 매트로이드의 순위함수는 하위함수다.[7]

논모노톤

모노톤이 아닌 서브모듈라 함수를 비모노톤이라고 한다.

대칭

A non-monotone submodular function is called symmetric if for every we have that . Examples of symmetric non-monotone submodular functions include:

그래프 자르기
={ ,v , 을(를) 그래프의 꼭지점으로 한다. For any set of vertices let denote the number of edges such that and . This can be generalized by adding non-negative weights to the 가장자리
상호정보
={ , X 을(를) 변수의 집합으로 한다. Then for any we have that is a submodular function, where is the mutual information.

비대칭

대칭이 아닌 비모노톤 서브모듈라 함수를 비대칭이라고 한다.

방향 컷
={ ,v , v 을(를) 지시된 그래프의 정점이 되도록 한다. For any set of vertices let denote the number of edges such that and . This can be generalized by adding non-negative weights to the 방향 가장자리

연속연장

로바스 확장

이 확장명은 수학자 Laszlo Lovasz의 이름을 따서 지어졌다. Consider any vector such that each . Then the Lovász extension is defined as [0 간격의 균일한 분포에서 선택한 을(를) 초과하는 기대 Lovász 확장은 가 하위 함수인 경우에만 볼록 함수다.

다선 확장

Consider any vector such that each . Then the multilinear extension is defined as S

볼록 폐쇄

Consider any vector such that each . Then the convex closure is defined as . 세트함수의 볼록한 닫힘은[ ]{\에 걸쳐 볼록하다 하위함수의 경우 ( )= -( )

오목폐쇄

Consider any vector such that each . Then the concave closure is defined as .

특성.

  1. 부차함수의 등급은 음이 아닌 선형 조합으로 폐쇄된다. 임의의 하위 함수 , 2,… , {\ 비음수 , 고려하십시오 그러면 ( )= = i ( ) = 이(가) 정의한 g{\이 하위모델로 된다.
  2. 하위 모듈 함수 f 에 대해 g( )= f ( S ){\에 의해 정의된 함수는 하위 모듈이다
  3. 함수 ()= ( ( ), c) 서 c (는) 실제 숫자이며 f이(가) 단조하수일 때마다 submodular이다. 보다 일반적으로, 감소하지 않는 오목함수 에 대해 ()= (은(는) 하위모듈이다
  4. 확률 p 과(와) 으로T {\ 의 각 원소에 대해 된 T 을(를) 선택하는 랜덤 프로세스를 고려하십시오 그 후 다음의 불평등은 E [ ( )] p (+ ( -p ) ( ) 빈 집합인 경우다. 으로 S 이(가) 구성되는 다음과 같은 랜덤 프로세스를 고려하십시오. For each of construct by including each element in independently into with probability . Furthermore let = S Then the following inequality is true .[citation needed]

최적화 문제

서브모듈라 함수는 볼록함수오목함수와 매우 유사한 성질을 가지고 있다. 이러한 이유로 볼록함수 또는 오목함수의 최적화와 관련된 최적화 문제는 일부 제약조건에 따르는 하위함수의 최대화 또는 최소화를 위한 문제라고도 설명할 수 있다.

서브모듈러 세트 기능 최소화

가장 간단한 최소화 문제는 하위 모듈 함수를 최소화하는 S 을(를) 찾는 것이다. 이것이 제약 없는 문제다. 이 문제는 [8][9]다항식 시간에 계산할 [10][11]수 있다 그래프에서 최소 컷을 계산하는 것은 일반적인 최소화 문제의 특별한 경우다. 그러나 카디널리티 하한과 같은 단순한 제약조건을 추가하면 근사 인자에 대한 다항 인자 하한과 함께 최소화 문제가 어려워진다.[12][13]

서브모듈러 세트 함수 최대화

최소화의 경우와는 달리, 제한되지 않은 설정에서도 하위 모듈 함수를 최대화하는 것은 NP-hard이다. 서브모듈라(초모듈라) 함수의 로컬 및 글로벌 맥시마(minima)를 찾기 위한 이론 및 열거 알고리즘은 B에서 찾을 수 있다. 골덴고린. European Journal of Operational Research 198(1):102-112, DOI: 10.1016/j.ejor.2008.08.022 예를 들어, 기능이 음이 아닌 경우에만 필요한 경우에도 최대 컷은 특별한 경우다. 제약이 없는 문제는 음성으로 허용될 경우 거의 다루기 어려운 것으로 나타날 수 있다. 함수가 음성이 아닐 때 제한된 하위 함수의 최대화에 대한 광범위한 연구가 있었다. 일반적으로 이러한 문제에 대한 근사 알고리즘은 탐욕스러운 알고리즘이나 로컬 검색 알고리즘에 기초한다. 비 음의 대칭하중함수를 최대화하는 문제는 1/2 근사 알고리즘을 허용한다.[14] 그래프의 최대 컷을 계산하는 것은 이 문제의 특별한 경우다. 비 음의 하위모형 함수를 최대화하는 보다 일반적인 문제 또한 1/2 근사 알고리즘을 인정한다.[15] 카디널리티 제약에 따른 단조하함수의 최대화 문제는 - / 근사 알고리즘을 허용한다.[16][page needed][17] 최대 커버리지 문제는 이 문제의 특별한 경우다. 매트로이드 제약을 받는 단조하함수를 최대화하는 보다 일반적인 문제 또한 - 1/ 근사 알고리즘을 허용한다.[18][19][20] 이러한 알고리즘의 대부분은 알고리즘의 반 차이에 기초한 프레임워크 내에서 통일될 수 있다.[13]

관련 최적화 문제

서브모듈라 최소화와 최대화를 제외하고, 또 다른 자연스러운 문제는 서브모듈라 최적화의 차이다.[21][22] 불행히도, 이 문제는 NP가 어려울 뿐만 아니라 거의 다루기 어렵다.[22] 관련 최적화 문제는 서브모듈라 레벨 세트 제약조건(하위모델 커버 또는 서브모듈라 배낭 제약조건에 따른 서브모듈라 최적화라고도 함)에 따라 서브모듈라 함수를 최소화하거나 최대화하는 것이다. 이 문제는 한정된 근사 보증을 허용한다.[23] 또 다른 최적화 문제에는 평균 복지를 극대화하기 위해 서브모델 함수에 기반한 데이터를 분할하는 것이 포함된다. 이 문제를 하위종류 복지문제라고 한다.[24]

적용들

하위 모델 기능은 경제학, 게임 이론, 머신러닝, 컴퓨터 비전 등 여러 실제 애플리케이션에서 자연스럽게 발생한다. 수익률이 감소하기 때문에 하위 모델 함수는 종종 더 큰 할인이 발생하며 구매 품목의 증가가 있기 때문에 자연스럽게 품목의 원가를 모델링한다. 하위모델 함수는 복잡성, 유사성 및 협력의 개념을 최소화하는 문제에 나타날 때 모델링한다. 반면에 최대화 문제에서는 다양성, 정보 및 커버리지의 개념을 모델링한다. 특히 기계 학습의 하위 모듈 적용에 대한 자세한 내용은 을 참조하십시오.

참고 항목

인용구

  1. ^ H. Lin과 J. Bilmes, A Class of Submodular Functions for Document Summary, ACL-2011.
  2. ^ 츠치아츠체크, R. Iyer, H. Wei 및 J. Bilmes, 이미지 수집 요약용 하위 도함수의 혼합물 학습, NIPS-2014.
  3. ^ A. 크라우스와 C. Guestrin, 그래픽 모델 UAI-2005에서 정보의 거의 최적 비근시적 가치.
  4. ^ a b A. 크라우스와 C. Guestrin, Beyond Volcxity: 기계학습의 하위모델성, ICML-2008의 자습서
  5. ^ (Schrijver 2003, §44, 페이지 766)
  6. ^ "Information Processing and Learning" (PDF). cmu.
  7. ^ 후지시게(2005) 페이지 22
  8. ^ Iwata, S.; Fleischer, L.; Fujishige, S. (2001). "A combinatorial strongly polynomial algorithm for minimizing submodular functions". J. ACM. 48 (4): 761–777. doi:10.1145/502090.502096. S2CID 888513.
  9. ^ Schrijver, A. (2000). "A combinatorial algorithm minimizing submodular functions in strongly polynomial time". J. Combin. Theory Ser. B. 80 (2): 346–355. doi:10.1006/jctb.2000.1989.
  10. ^ Grötschel, M.; Lovasz, L.; Schrijver, A. (1981). "The ellipsoid method and its consequences in combinatorial optimization". Combinatorica. 1 (2): 169–197. doi:10.1007/BF02579273. hdl:10068/182482. S2CID 43787103.
  11. ^ Cunningham, W. H. (1985). "On submodular function minimization". Combinatorica. 5 (3): 185–192. doi:10.1007/BF02579361. S2CID 33192360.
  12. ^ Z. Svitkina와 L. Fleischer, Submodular 근사: 샘플링 기반 알고리즘과 하한, SIAM Journal on Computing(2011년)
  13. ^ a b R. Iyer, S. Jegelka 및 J. Bilmes, Fast Semidiffeule 기반 서브모듈라 함수 최적화, Proc. ICML(2013).
  14. ^ U. Feige, V. Mirrokni 및 J. Vondrak, 비모노톤 하위 모듈 함수 최대화, 제48회 FOCS(2007), 페이지 461–471.
  15. ^ N. Buchbinder, M. Feldman, J. Naor, R. Schwartz, 제한되지 않은 하위 종 최대화에 대한 엄격한 선형 시간(1/2)- 53번째 FOCS(2012), 페이지 649-658.
  16. ^ G. L. Nemhauser, L. A. Wolsey 및 M. L. Fisher, 서브모듈러 세트 함수 I, Mathematical Programming 14(1978), 265–294의 최대화를 위한 근사치의 분석.
  17. ^ Williamson, David P. "Bridging Continuous and Discrete Optimization: Lecture 23" (PDF).
  18. ^ G. 칼리네스쿠, C. 체쿠리, M. Pal, J. Vondrak, Matroid 구속조건의 대상인 서브모듈러 집합함수, SIAM J. Comp. 40:6(2011), 1740-1766.
  19. ^ M. Feldman, J. Naor, R. Schwartz, 52번째 FOCS(2011년)의 Proc. 하위 종 최대화를 위한 통합 연속 탐욕 알고리즘이다.
  20. ^ Y. Filmus, J. Ward, 매트로이드 구속조건에 따른 서브모듈럼 최대화를 위한 촘촘한 결합 알고리즘, 53번째 FOCS(2012), 페이지 659-668.
  21. ^ M. Narasimhan과 J. Bilmes는 차별적 구조 학습인 In Proc에 응용되는 하위 모듈형 절차다. UAI(2005년).
  22. ^ a b R. Iyer와 J. Bilmes, 서브모듈라 함수의 차이를 대략적으로 최소화하기 위한 알고리즘, In Proc. UAI(2012년).
  23. ^ R. Iyer 및 J. Bilmes, 서브모듈라 커버 및 서브모듈라 배낭 제약 조건의 서브모듈라 최적화, In In In Proves of NIPS(2013).
  24. ^ J. Vondrak, 가치 오라클 모델, STOC(2008)의 Proc. (2008) 페이지 461–471의 하위 모델 복지 문제에 대한 최적의 근사치.
  25. ^ http://submodularity.org/.
  26. ^ J. Bilmes, 기계 학습 응용 프로그램의 하위 모델, AAAI-2015의 자습서.

참조

외부 링크