서브모듈러 세트 함수
Submodular set function수학에서 서브모듈러 집합함수(submodular set function이라고도 함)는 비공식적으로 입력 집합에 추가할 때 단일 요소가 만드는 함수의 증분값의 차이가 입력 집합의 크기가 증가함에 따라 감소하는 속성을 갖는 집합함수다. 하위 모델 함수는 자연적으로 감소하는 반환 속성을 가지고 있어 근사 알고리즘, 게임 이론(사용자 선호도를 모델링하는 함수로서) 및 전기 네트워크를 포함한 많은 애플리케이션에 적합하다. 최근, 서브모듈러 기능도 자동 요약, 다중 문서 요약, 특징 선택, 능동 학습, 센서 배치, 이미지 수집 요약 및 기타 많은 도메인을 포함한 기계 학습과 인공지능의 몇 가지 실제 문제에서 엄청난 효용성을 발견했다.[1][2][3][4]
정의
If is a finite set, a submodular function is a set function , where denotes the power set of , which satisfies one of the following equivalent conditions.[5]
- For every with and every we have that .
- For every we have that .
- For every and such that we have that cup \{x_(X .
음이 아닌 하위종 함수도 하위종 함수가 되지만 하위종 함수는 하위종 함수가 될 필요가 없다. 이(가) 유한하다고 가정하지 않으면 위의 조건은 동등하지 않다. , 이( 유한하다면 f (에 의해 정의된 f {\ }, S {\ S이( 무한이면 (이(가)가위의 첫 번째 조건을 하지만, S {\ S과 S}에 실패한다. 은 교차점이 유한한 무한 집합이다.
하위 모듈 함수의 유형
모노톤
S 에 대해 ) f을 갖는다면 submodular function f f은 다음과 같다
- 선형(모듈러) 함수
- )= i 형식의 모든 기능을 선형 함수라고 한다. 또한 , w 0 0인 경우 f는 단조롭다.
- 예산 추가 기능
- Any function of the form for each and is called budget additive.[citation needed]
- 커버리지 함수
- ={ E , 2, n 은(는 일부 접지 집합의 하위 집합 모음입니다 의 f() = E {\ Si}\은 탐지함수 함수로 불린다. 이는 원소에 음이 아닌 가중치를 추가하면 일반화할 수 있다.
- 엔트로피
- ={ , X 을(를) 변수의 집합으로 한다. Then for any we have that is a submodular function, where is the entropy of the set of random variables , a fact known as Shannon's inequality.[6] 엔트로피 함수에 대한 추가 불평등은 이질 벡터를 참조하는 것으로 알려져 있다.
- 마트로이드 계급적 기능.
- ={ e ,e ,… ,e 을(를) 매트로이드 정의가 설정된 지면 세트라고 한다. 그렇다면 매트로이드의 순위함수는 하위함수다.[7]
논모노톤
모노톤이 아닌 서브모듈라 함수를 비모노톤이라고 한다.
대칭
A non-monotone submodular function is called symmetric if for every we have that . Examples of symmetric non-monotone submodular functions include:
- 그래프 자르기
- ={ ,v , 을(를) 그래프의 꼭지점으로 한다. For any set of vertices let denote the number of edges such that and . This can be generalized by adding non-negative weights to the 가장자리
- 상호정보
- ={ , X 을(를) 변수의 집합으로 한다. Then for any we have that is a submodular function, where is the mutual information.
비대칭
대칭이 아닌 비모노톤 서브모듈라 함수를 비대칭이라고 한다.
- 방향 컷
- ={ ,v , v 을(를) 지시된 그래프의 정점이 되도록 한다. For any set of vertices let denote the number of edges such that and . This can be generalized by adding non-negative weights to the 방향 가장자리
연속연장
로바스 확장
이 확장명은 수학자 Laszlo Lovasz의 이름을 따서 지어졌다. Consider any vector such that each . Then the Lovász extension is defined as [0 간격의 균일한 분포에서 선택한 을(를) 초과하는 기대 Lovász 확장은 가 하위 함수인 경우에만 볼록 함수다.
다선 확장
Consider any vector such that each . Then the multilinear extension is defined as S
볼록 폐쇄
Consider any vector such that each . Then the convex closure is defined as . 세트함수의 볼록한 닫힘은[ ]{\에 걸쳐 볼록하다 하위함수의 경우 ( )= -( )
오목폐쇄
Consider any vector such that each . Then the concave closure is defined as .
특성.
- 부차함수의 등급은 음이 아닌 선형 조합으로 폐쇄된다. 임의의 하위 함수 , 2,… , {\ 비음수 , 을 고려하십시오 그러면 ( )= = i ( ) = 이(가) 정의한 g{\이 하위모델로 된다.
- 하위 모듈 함수 f 에 대해 g( )= f ( S ){\에 의해 정의된 함수는 하위 모듈이다
- 함수 ()= ( ( ), c) 서 c 은(는) 실제 숫자이며 f이(가) 단조하수일 때마다 submodular이다. 보다 일반적으로, 감소하지 않는 오목함수 에 대해 ()= (은(는) 하위모듈이다
- 확률 p 과(와) 으로T {\에 된 의 각 원소에 대해 된 T 을(를) 선택하는 랜덤 프로세스를 고려하십시오 그 후 다음의 불평등은 E [ ( )] p (+ ( -p ) ( ) 이빈 집합인 경우다. 으로 S 이(가) 구성되는 다음과 같은 랜덤 프로세스를 고려하십시오. For each of construct by including each element in independently into with probability . Furthermore let = S Then the following inequality is true .[citation needed]
최적화 문제
서브모듈라 함수는 볼록함수와 오목함수와 매우 유사한 성질을 가지고 있다. 이러한 이유로 볼록함수 또는 오목함수의 최적화와 관련된 최적화 문제는 일부 제약조건에 따르는 하위함수의 최대화 또는 최소화를 위한 문제라고도 설명할 수 있다.
서브모듈러 세트 기능 최소화
가장 간단한 최소화 문제는 하위 모듈 함수를 최소화하는 S 을(를) 찾는 것이다. 이것이 제약 없는 문제다. 이 문제는 [8][9]다항식 시간에 계산할 [10][11]수 있다 그래프에서 최소 컷을 계산하는 것은 일반적인 최소화 문제의 특별한 경우다. 그러나 카디널리티 하한과 같은 단순한 제약조건을 추가하면 근사 인자에 대한 다항 인자 하한과 함께 최소화 문제가 어려워진다.[12][13]
서브모듈러 세트 함수 최대화
최소화의 경우와는 달리, 제한되지 않은 설정에서도 하위 모듈 함수를 최대화하는 것은 NP-hard이다. 서브모듈라(초모듈라) 함수의 로컬 및 글로벌 맥시마(minima)를 찾기 위한 이론 및 열거 알고리즘은 B에서 찾을 수 있다. 골덴고린. European Journal of Operational Research 198(1):102-112, DOI: 10.1016/j.ejor.2008.08.022 예를 들어, 기능이 음이 아닌 경우에만 필요한 경우에도 최대 컷은 특별한 경우다. 제약이 없는 문제는 음성으로 허용될 경우 거의 다루기 어려운 것으로 나타날 수 있다. 함수가 음성이 아닐 때 제한된 하위 함수의 최대화에 대한 광범위한 연구가 있었다. 일반적으로 이러한 문제에 대한 근사 알고리즘은 탐욕스러운 알고리즘이나 로컬 검색 알고리즘에 기초한다. 비 음의 대칭하중함수를 최대화하는 문제는 1/2 근사 알고리즘을 허용한다.[14] 그래프의 최대 컷을 계산하는 것은 이 문제의 특별한 경우다. 비 음의 하위모형 함수를 최대화하는 보다 일반적인 문제 또한 1/2 근사 알고리즘을 인정한다.[15] 카디널리티 제약에 따른 단조하함수의 최대화 문제는 - / 근사 알고리즘을 허용한다.[16][page needed][17] 최대 커버리지 문제는 이 문제의 특별한 경우다. 매트로이드 제약을 받는 단조하함수를 최대화하는 보다 일반적인 문제 또한 - 1/ 근사 알고리즘을 허용한다.[18][19][20] 이러한 알고리즘의 대부분은 알고리즘의 반 차이에 기초한 프레임워크 내에서 통일될 수 있다.[13]
관련 최적화 문제
서브모듈라 최소화와 최대화를 제외하고, 또 다른 자연스러운 문제는 서브모듈라 최적화의 차이다.[21][22] 불행히도, 이 문제는 NP가 어려울 뿐만 아니라 거의 다루기 어렵다.[22] 관련 최적화 문제는 서브모듈라 레벨 세트 제약조건(하위모델 커버 또는 서브모듈라 배낭 제약조건에 따른 서브모듈라 최적화라고도 함)에 따라 서브모듈라 함수를 최소화하거나 최대화하는 것이다. 이 문제는 한정된 근사 보증을 허용한다.[23] 또 다른 최적화 문제에는 평균 복지를 극대화하기 위해 서브모델 함수에 기반한 데이터를 분할하는 것이 포함된다. 이 문제를 하위종류 복지문제라고 한다.[24]
적용들
하위 모델 기능은 경제학, 게임 이론, 머신러닝, 컴퓨터 비전 등 여러 실제 애플리케이션에서 자연스럽게 발생한다. 수익률이 감소하기 때문에 하위 모델 함수는 종종 더 큰 할인이 발생하며 구매 품목의 증가가 있기 때문에 자연스럽게 품목의 원가를 모델링한다. 하위모델 함수는 복잡성, 유사성 및 협력의 개념을 최소화하는 문제에 나타날 때 모델링한다. 반면에 최대화 문제에서는 다양성, 정보 및 커버리지의 개념을 모델링한다. 특히 기계 학습의 하위 모듈 적용에 대한 자세한 내용은 을 참조하십시오.
참고 항목
인용구
- ^ H. Lin과 J. Bilmes, A Class of Submodular Functions for Document Summary, ACL-2011.
- ^ 츠치아츠체크, R. Iyer, H. Wei 및 J. Bilmes, 이미지 수집 요약용 하위 도함수의 혼합물 학습, NIPS-2014.
- ^ A. 크라우스와 C. Guestrin, 그래픽 모델 UAI-2005에서 정보의 거의 최적 비근시적 가치.
- ^ a b A. 크라우스와 C. Guestrin, Beyond Volcxity: 기계학습의 하위모델성, ICML-2008의 자습서
- ^ (Schrijver 2003, §44, 페이지 766)
- ^ "Information Processing and Learning" (PDF). cmu.
- ^ 후지시게(2005) 페이지 22
- ^ Iwata, S.; Fleischer, L.; Fujishige, S. (2001). "A combinatorial strongly polynomial algorithm for minimizing submodular functions". J. ACM. 48 (4): 761–777. doi:10.1145/502090.502096. S2CID 888513.
- ^ Schrijver, A. (2000). "A combinatorial algorithm minimizing submodular functions in strongly polynomial time". J. Combin. Theory Ser. B. 80 (2): 346–355. doi:10.1006/jctb.2000.1989.
- ^ Grötschel, M.; Lovasz, L.; Schrijver, A. (1981). "The ellipsoid method and its consequences in combinatorial optimization". Combinatorica. 1 (2): 169–197. doi:10.1007/BF02579273. hdl:10068/182482. S2CID 43787103.
- ^ Cunningham, W. H. (1985). "On submodular function minimization". Combinatorica. 5 (3): 185–192. doi:10.1007/BF02579361. S2CID 33192360.
- ^ Z. Svitkina와 L. Fleischer, Submodular 근사: 샘플링 기반 알고리즘과 하한, SIAM Journal on Computing(2011년)
- ^ a b R. Iyer, S. Jegelka 및 J. Bilmes, Fast Semidiffeule 기반 서브모듈라 함수 최적화, Proc. ICML(2013).
- ^ U. Feige, V. Mirrokni 및 J. Vondrak, 비모노톤 하위 모듈 함수 최대화, 제48회 FOCS(2007), 페이지 461–471.
- ^ N. Buchbinder, M. Feldman, J. Naor, R. Schwartz, 제한되지 않은 하위 종 최대화에 대한 엄격한 선형 시간(1/2)- 53번째 FOCS(2012), 페이지 649-658.
- ^ G. L. Nemhauser, L. A. Wolsey 및 M. L. Fisher, 서브모듈러 세트 함수 I, Mathematical Programming 14(1978), 265–294의 최대화를 위한 근사치의 분석.
- ^ Williamson, David P. "Bridging Continuous and Discrete Optimization: Lecture 23" (PDF).
- ^ G. 칼리네스쿠, C. 체쿠리, M. Pal, J. Vondrak, Matroid 구속조건의 대상인 서브모듈러 집합함수, SIAM J. Comp. 40:6(2011), 1740-1766.
- ^ M. Feldman, J. Naor, R. Schwartz, 52번째 FOCS(2011년)의 Proc. 하위 종 최대화를 위한 통합 연속 탐욕 알고리즘이다.
- ^ Y. Filmus, J. Ward, 매트로이드 구속조건에 따른 서브모듈럼 최대화를 위한 촘촘한 결합 알고리즘, 53번째 FOCS(2012), 페이지 659-668.
- ^ M. Narasimhan과 J. Bilmes는 차별적 구조 학습인 In Proc에 응용되는 하위 모듈형 절차다. UAI(2005년).
- ^ a b R. Iyer와 J. Bilmes, 서브모듈라 함수의 차이를 대략적으로 최소화하기 위한 알고리즘, In Proc. UAI(2012년).
- ^ R. Iyer 및 J. Bilmes, 서브모듈라 커버 및 서브모듈라 배낭 제약 조건의 서브모듈라 최적화, In In In Proves of NIPS(2013).
- ^ J. Vondrak, 가치 오라클 모델, STOC(2008)의 Proc. (2008) 페이지 461–471의 하위 모델 복지 문제에 대한 최적의 근사치.
- ^ http://submodularity.org/.
- ^ J. Bilmes, 기계 학습 응용 프로그램의 하위 모델, AAAI-2015의 자습서.
참조
- Schrijver, Alexander (2003), Combinatorial Optimization, Springer, ISBN 3-540-44389-4
- Lee, Jon (2004), A First Course in Combinatorial Optimization, Cambridge University Press, ISBN 0-521-01012-8
- Fujishige, Satoru (2005), Submodular Functions and Optimization, Elsevier, ISBN 0-444-52086-4
- Narayanan, H. (1997), Submodular Functions and Electrical Networks, ISBN 0-444-82523-1
- Oxley, James G. (1992), Matroid theory, Oxford Science Publications, Oxford: Oxford University Press, ISBN 0-19-853563-5, Zbl 0784.05002
외부 링크
- http://www.cs.berkeley.edu/~stefje/properties.properties는 더 긴 참고 문헌을 가지고 있다.