구성 모델
Configuration model
네트워크 과학에서 컨피규레이션모델은 주어진 정도 시퀀스에서 랜덤 네트워크를 생성하는 방법입니다.모델러가 임의의 학위 분포를 통합할 수 있기 때문에 실제 소셜 네트워크의 참조 모델로 널리 사용됩니다.
네트워크 과학 | ||||
---|---|---|---|---|
네트워크 타입 | ||||
그래프 | ||||
| ||||
모델 | ||||
| ||||
| ||||
모형의 근거
구성모델에서는 주어진 정도가 선택되는 확률분포를 [2]갖는 것이 아니라 각 정점의 정도가 미리 정의된다.Erd's-Rényi 모델과 달리 설정 모델의 도수 시퀀스는 포아송 분포를 가지도록 제한되지 않습니다.이 모델에서는 사용자가 원하는 도수 분포를 네트워크에 제공할 수 있습니다.
알고리즘.
다음 알고리즘은 모델의 생성을 설명합니다.
- 각도 시퀀스를 취합니다. 즉, 각 정점에 스타일 })를 할당합니다.정점의 각도는 하프링크 또는 스터브로 표시됩니다.그래프를 작성하려면 스터브의 합계가 짝수여야 합니다( k m \ \ k { i } =m ) 。정도 시퀀스는 이론적인 분포에서 얻을 수도 있고 실제 네트워크를 나타낼 수도 있습니다(네트워크의 인접 매트릭스에서 결정).
- 무작위로 두 개의 스터브를 균일하게 선택하여 에지를 형성합니다. - 스터브에서 다른 쌍을 선택하여 연결합니다.스터브가 부족해질 때까지 계속합니다.그 결과, 도수 시퀀스가 미리 정의된 네트워크가 됩니다.네트워크의 실현은, 스탭이 선택되는 순서에 따라서 변화합니다.그것에는 사이클(b), 셀프 루프(c), 또는 멀티 링크(d)가 포함됩니다(그림 1).단, N → µ [1]한계에서는 자가 인식 및 다중 인식의 예상 수가 0이 됩니다.
셀프루프, 멀티에지 및 시사점
위의 알고리즘은 같은 확률의 스터브와 일치합니다.매칭의 균일한 분포는 생성된 네트워크의 다른 기능을 계산할 때 중요한 속성입니다.네트워크 생성 프로세스에서는 셀프 루프 또는 멀티 링크를 생성하는 이벤트를 제외하지 않습니다.셀프 루프와 멀티 에지가 허용되지 않는 프로세스를 설계한 경우 스터브의 매칭은 균일한 분포를 따르지 않습니다.단, 일부 대규모 네트워크에서는 자가 인식 및 다중 인식의 평균 수가 일정하기 때문에 자가 인식 및 다중 인식의 밀도는 N \ N \ \ infty [2]로 제로가 됩니다(자세한 내용은 인용 도서 참조).
셀프 루프와 멀티 에지의 또 다른 결과로서 모든 가능한 네트워크가 같은 확률로 생성되는 것은 아닙니다.일반적으로 모든 가능한 실현은 가능한 모든 방법으로 모든 정점의 스텁을 허용함으로써 생성할 수 있습니다.의 스터브순열수는 이므로 학위 시퀀스의 실현수는 N{ N}\}=\ _입니다.이는 각 깨달음이 동일한 확률로 발생한다는 것을 의미합니다.그러나 셀프 에지를 허용하면 변경되지 않은 현실화가 발생할 수 있으므로 셀프 루프 및 멀티 에지는 현실화 횟수를 변경할 수 있습니다.N N \ N \ \ infty n n n n n n n n n n 、 n n n- given given n n n n [2]n n n n n n n n n n n ishes n n ishes ishes n n n ishes n
특성.
에지 확률
stub는 의 다른 stub에 할 수 있습니다(전체적으로 2m의 stub이 하며 현재 감시하고 있는 stub은 제외해야 합니다).j(\ j에는 k 스터브가 있으며, 노드(\ i는 균일한 분포로 연결될 수 있습니다.스텁이 하나에 접속될 은 - 입니다.i의displaystylej}{노드 i의 (\ i}) 스텁은 ki(\i})를 가지므로 i의 style k_{i style k_{i} style} style stub} style} style style style styledisplaystyle에 된 g는 k -1({입니다 j j} {}).이 공식은 k j / 1 { _ { } _ { }/ m \ 1인 에만 볼 수 있으며, 보다 정확하게 i와j 의 에지 수를 나타냅니다.이 공식은 셀프 [2]edge의 경우 적용되지 않습니다.
도 p의 설정 모델에서는 무작위로 선택된 i의 가 확률은 p(\입니다 .다만 i의 한쪽 끝 뒤에 도달할 수 있는 정점 중 하나를 선택했을 경우,도수 k는 2 × k { \ { k}= np _ { _ { k } { \ np _ { 。 (의 노드에 도달할 확률은 입니다 fraction은 p \ style 의 일반적인 노드가 아닌 k\ _ { k에 합니다.따라서 일반 노드의 네이버는 일반 노드 자체보다 높은 차수를 가질 것으로 예상됩니다.이 구성 모델의 기능은 "내 친구가 나보다 더 많다"는 현상을 잘 묘사하고 있습니다.
군집화 계수
C g의 네이버가 접속될 평균 확률는 대략 다음과 같이 계산됩니다.
서k(\는 임의의 가장자리가 k 정점에 도달할 확률을 나타내며 style 가 아닌 1(\ 형식의 요소가 나타나는 것은 하나의 stub이 네이버라는 사실에 기인하기 때문입니다.공통 꼭지점입니다.상기의 평가 결과는
k / _k} / \ k \ 2 m kdisplay k display ( p \ { k } )를 하여 p\ k_rangle \ 도 분포를 .위의 정점의 수는 다음과 같습니다.
k 2 of \ \ displaystyle k는 학위 분포의 두 번째 순간을 나타냅니다. k 및 「 k가 일정하다고 가정하면, 상기의 동작은 다음과 같습니다.
여기서 상수는 k[2]에 따라 달라집니다.따라서 클러스터화 g(\는 N1(\ N) 에서는 작아집니다.
거성분
구성 모델에는 다음과 같은 경우 Giant Component(GC; 거대 컴포넌트)가 존재합니다.
여기서 k \ }및 2 \ 는 학위 분포의 첫 번째 및 두 번째 순간입니다.즉, 임계 임계값은 도 k에 의해 고유하게 결정되는 양에만 의존합니다.
컨피규레이션모델은 트리형 네트워크를 로컬로 생성합니다.즉, 이러한 네트워크 내의 모든 로컬네이버가 트리형식이 됩니다.보다 정확하게는 네트워크의 임의의 노드에서 시작하여 해당 시작 노드로부터 d(\ d 이하의 모든 노드 집합을 형성하는 경우 집합은 n → ,인 1로 경향이 있는 [3]트리의 형태를 취합니다.트리와 같은 구조에서는 네트워크 전체에서 두 번째 네이버의 인 })는 " -" 입니다.
일반적으로 dd에서의 평균 수치는 다음과 같이 쓸 수 있습니다.
즉, 의 이 1보다 클 경우 네트워크에 거대한 컴포넌트가 존재할 수 있습니다.이것은 Molloy-Red [4]기준으로 유명하다.이 기준의 배후에 있는 직관은 거대 구성요소(GC)가 존재하는 경우 연결된 구성요소에서 무작위로 선택된 i의평균 가 2 이상이어야 한다는 것이다.Molloy-Reed 기준도:∑ 나는 k 나는 을(나는 2− k);0,{\displaystyle \sum_{나는}(k_{나는}-2)>, 0,}, 비록 GC의 크기 p에 달려 있을 것 0{\displaystyle p_{0}}및 p2{\displaystyle p_{2}}을 시사하는 것 표현될 수 있는데에는 정도 0과 2노드의 수가에서 아무런 기여도 못하고 있다.exis거대 구성요소의 [3]텐스.
직경
컨피규레이션모델은 임의의 차수의 분포를 상정할 수 있으며, 작은 세계의 효과를 나타내고 있습니다.이는 컨피규레이션모델의 직경은 ( ln( 2 / 1) ln ( c 2 / c 1 d =frac {n ( N ) } { \ ( { }} }[5]。
유한한 크기의 성분
총 개수는 무한대인 경향이 있기 때문에 두 개의 거대 구성요소를 찾을 가능성은 없어지고 있습니다.즉, 희박한 체제에서 모델은 하나의 거대한 성분(있는 경우)과 유한 크기의 여러 개의 연결된 성분으로 구성됩니다.연결된 구성요소의 크기는 크기 n{\ - 무작위로 샘플링된 정점이 n의 연결된 구성요소에 속할 확률로 특징지어집니다 {\ n 정도 분포 k{\}}와 siz 사이에는 대응 관계가 있습니다. 포함} 정점의 총수가 인 경우 N→ {\ { N \ \infty}는 다음과 같은 관계가 된다[6]
서 1 ( ) : + k +, {\ }{\ k\1} u 1 {\1}^*} 은 n {\ n} 의컨볼루션 를 나타냅니다. w에 명시적 점근은 n1 { n 1} 및 2 - 2 k { \ k^ { \ - \ k \ 가 [6]0에 가까운 에 알 수 있습니다.이러한 점근에 대한 분석식은 의 분포 꼬리 β(k 의 두꺼운 꼬리 특징인 경우) 및 Molloy-Lreed criterium 부호에 따라 달라집니다.다음 표에는 이러한 관계가 요약되어 있습니다( 참조[6]).
k의 모멘트(\}) | k의 (\}) | ||
---|---|---|---|
가벼운 꼬리 | - 1 또는 1 | ||
0 | |||
헤비테일, {\ \> | -1 | ||
0 | |||
1 | |||
| 테일, β {\ \ | -1 | |
0 | |||
1 | |||
무거운 테일, <β < \ 3 < 4 | -1 | ||
0 | |||
1 | |||
| 테일, β {\ \ | 1 | |
무거운 테일, <β < \ 2 < \ | 1 |
모델링
실제 네트워크와의 비교
복잡한 네트워크의 3가지 일반적인 특성은 이종도 분포, 짧은 평균 경로 길이 및 높은 클러스터링입니다.[1][7][8]임의의 정도 시퀀스를 정의할 기회가 있으면 첫 번째 조건을 설계에 의해 충족할 수 있지만 위와 같이 글로벌 클러스터링 계수는 네트워크 크기의 역함수이기 때문에 대규모 구성 네트워크에서는 클러스터링이 작은 경향이 있습니다.베이스라인 모델의 이 기능은 경험적 네트워크의 기존 속성과 모순되지만 모델의 확장에 의해 이 문제를 해결할 수 있습니다( 참조).
응용 프로그램: 모듈식 계산
설정 모델은 네트워크 모듈화 계산에 벤치마크로 적용됩니다.모듈성은 네트워크를 모듈로 분할하는 정도를 측정합니다.다음과 같이 계산됩니다.
네트워크의 인접 매트릭스를 설정 모델에서 에 따라 다름) 사이에 엣지가 있을 확률과 비교합니다(자세한 내용은 페이지모듈리티 참조).
다이렉트 구성 모델
Directed Configuration Model(DCM;[11] 다이렉트컨피규레이션모델)에서는 각 노드에는 테일 및 헤드라고 불리는 다수의 하프엣지가 할당되어 있습니다.그런 다음 꼬리와 헤드가 무작위로 균일하게 일치하여 방향 가장자리를 형성합니다.거대 [11][12]성분의 크기, 일반적인 거리,[13] DCM의 직경이[14] 수학적으로 연구되었습니다.또한 [15][16][17]DCM의 무작위 보행에 대한 광범위한 연구가 있었다.신경 네트워크,[18] 금융[19] 및 소셜 [20]네트워크와 같은 일부 실제 복합 네트워크는 DCM에 의해 모델링되었습니다.
레퍼런스
- ^ a b c Network Science by Albert-László Barabási.
- ^ a b c d e Newman, Mark (2010-03-25). Networks: An Introduction – Oxford Scholarship. Oxford University Press. doi:10.1093/acprof:oso/9780199206650.001.0001. ISBN 9780191594175.
- ^ a b Newman, Mark (2018-10-18). Networks. Vol. 1. Oxford University Press. doi:10.1093/oso/9780198805090.001.0001. ISBN 978-0-19-880509-0.
- ^ Molloy, Michael; Reed, Bruce (1995-03-01). "A critical point for random graphs with a given degree sequence". Random Structures & Algorithms. 6 (2–3): 161–180. CiteSeerX 10.1.1.24.6195. doi:10.1002/rsa.3240060204. ISSN 1098-2418.
- ^ Chung, Fan; Lu, Linyuan (2002-12-10). "The average distances in random graphs with given expected degrees". Proceedings of the National Academy of Sciences. 99 (25): 15879–15882. Bibcode:2002PNAS...9915879C. doi:10.1073/pnas.252631999. ISSN 0027-8424. PMC 138532. PMID 12466502.
- ^ a b c Kryven, I (2017). "General expression for the component size distribution in infinite configuration networks". Physical Review E. 95 (5): 052303. arXiv:1703.05413. Bibcode:2017PhRvE..95e2303K. doi:10.1103/PhysRevE.95.052303. hdl:11245.1/fa1b270b-61a5-4f20-b496-ddf446fdfe80. PMID 28618550. S2CID 8421307.
- ^ Barabási, Albert-László; Albert, Réka (1999-10-15). "Emergence of Scaling in Random Networks". Science. 286 (5439): 509–512. arXiv:cond-mat/9910332. Bibcode:1999Sci...286..509B. doi:10.1126/science.286.5439.509. ISSN 0036-8075. PMID 10521342. S2CID 524106.
- ^ Watts, Duncan J.; Strogatz, Steven H. (1998). "Collective dynamics of 'small-world' networks". Nature. 393 (6684): 440–442. Bibcode:1998Natur.393..440W. doi:10.1038/30918. ISSN 1476-4687. PMID 9623998. S2CID 4429113.
- ^ Newman, M. E. J. (2009). "Random Graphs with Clustering". Physical Review Letters. 103 (5): 058701. arXiv:0903.4009. Bibcode:2009PhRvL.103e8701N. doi:10.1103/physrevlett.103.058701. PMID 19792540. S2CID 28214709.
- ^ Newman, M. E. J. (2004). "Finding and evaluating community structure in networks". Physical Review E. 69 (2): 026113. arXiv:cond-mat/0308217. Bibcode:2004PhRvE..69b6113N. doi:10.1103/physreve.69.026113. PMID 14995526. S2CID 197314.
- ^ a b COOPER, COLIN; FRIEZE, ALAN (May 2004). "The Size of the Largest Strongly Connected Component of a Random Digraph with a Given Degree Sequence". Combinatorics, Probability and Computing. 13 (3): 319–337. doi:10.1017/S096354830400611X. ISSN 1469-2163. S2CID 27511938.
- ^ Cai, Xing Shi; Perarnau, Guillem (10 April 2020). "The giant component of the directed configuration model revisited". arXiv:2004.04998 [math.PR].
- ^ van der Hoorn, Pim; Olvera-Cravioto, Mariana (June 2018). "Typical distances in the directed configuration model". The Annals of Applied Probability. 28 (3): 1739–1792. arXiv:1511.04553. doi:10.1214/17-AAP1342. S2CID 13683470.
- ^ Cai, Xing Shi; Perarnau, Guillem (10 March 2020). "The diameter of the directed configuration model". arXiv:2003.04965 [math.PR].
- ^ Bordenave, Charles; Caputo, Pietro; Salez, Justin (1 April 2018). "Random walk on sparse random digraphs". Probability Theory and Related Fields. 170 (3): 933–960. arXiv:1508.06600. doi:10.1007/s00440-017-0796-7. ISSN 1432-2064. S2CID 55211047.
- ^ Caputo, Pietro; Quattropani, Matteo (1 December 2020). "Stationary distribution and cover time of sparse directed configuration models". Probability Theory and Related Fields. 178 (3): 1011–1066. doi:10.1007/s00440-020-00995-6. ISSN 1432-2064. S2CID 202565916.
- ^ Cai, Xing Shi; Perarnau, Guillem (14 October 2020). "Minimum stationary values of sparse random directed graphs". arXiv:2010.07246 [math.PR].
- ^ Amini, Hamed (1 November 2010). "Bootstrap Percolation in Living Neural Networks". Journal of Statistical Physics. 141 (3): 459–475. arXiv:0910.0627. Bibcode:2010JSP...141..459A. doi:10.1007/s10955-010-0056-z. ISSN 1572-9613. S2CID 7601022.
- ^ Amini, Hamed; Minca, Andreea (2013). "Mathematical Modeling of Systemic Risk". Advances in Network Analysis and Its Applications. Mathematics in Industry. Springer. 18: 3–26. doi:10.1007/978-3-642-30904-5_1. ISBN 978-3-642-30903-8. S2CID 166867930.
- ^ Li, Hui (July 2018). "Attack Vulnerability of Online Social Networks". 2018 37th Chinese Control Conference (CCC): 1051–1056. doi:10.23919/ChiCC.2018.8482277. ISBN 978-988-15639-5-8. S2CID 52933445.