정도 유지 랜덤화

Degree-preserving randomization

정도 보존 랜덤화네트워크 과학에서 사용되는 기술로, 관찰된 네트워크에서 주어진 그래프에서 관찰된 변화가 노드에 고유한 속성이 아닌 그래프 고유의 구조적 특성의 인공물일 수 있는지 여부를 평가하는 것을 목적으로 한다.

배경

이르면 1996,[1]로 학위의 가장 단순한 구현 무선화 보존 Cataloged는 무작위와 같이 rewires의 충분한를 가지고, 네트워크의 정도 분포는 네트워크의 초기 정도 유통에 동일은 위상 s의 네트워크"또"을 재정리한 몬테카를로 알고리즘에 의존하고 있다.tru네트워크의 cture는 원래의 네트워크와는 완전히 다른 것이 되었습니다.

정도 보존 랜덤화 알고리즘의 단일 반복 시연입니다.

랜덤화 정도는 다양한 형태를 가지지만 일반적으로 비교적 단순한 접근 방식을 취합니다. E{\ E개의 에지를 N {\ N개의 노드로 된 네트워크의 경우 2개의 dyadic하게 연결된 노드를 선택합니다.이러한 쌍방향 쌍 각각에 대해 새 쌍방향 쌍이 일치하지 않도록 가장자리를 전환합니다.이러한 미스매치가 충분히 발생하면 네트워크는 원래의 관측된 토폴로지를 점점 잃게 됩니다.

으로서 알고리즘 마르코프 체인에 기초한 사이에 흔하다 비록 Espinoza[2]이 안전한 최소 역은 Q∗ E{Q*E\displaystyle}, Q{\displaystyle을 주장하고, 반복 횟수 또는 개별적 rewires의 수, 주어진 그래프에 따르면 그래프 충분히어서 원래 그래프에서 뚜렷한 무작위이다 같은 밝혀지지 않았지만 발생해야 한다.Q} "최소 100" (에스피노자)이 문제에 대한 다른 의견도 제시되어 있습니다.예를 들어 안전 최소값은 ( (\ {이 될 수 있습니다.여기서 엡실론은 10~ 10~ 에 속하지만,그의 정확한 번호는 [3][4]현재 알려져 있지 않다.

사용하다

네트워크 특성을 분석하기 위해 랜덤화를 보존하는 정도를 명시적으로 채용한 사례가 몇 가지 있습니다.Dekker는[5] 고도의 애착편향을 도입하는 2차 변수 를 추가하여 관찰된 소셜 네트워크를 보다 정확하게 모델링하기 위해 재배선을 사용했습니다.[6]또한 무작위화를 사용하여 시뮬레이션에서 동일한의 N개(\ N 노드를 포함하는 Erdss-Rényi 모델의 제어 중심성과 비교할 때 제어 중심성이 거의 변하지 않는다고 주장한다. - 류 등님은 네트워크 [7]제어성을 조사하는 후속 작업에서도 정도를 유지하는 랜덤화 모델을 사용해 왔습니다.

또한 루이스 등의 [8][9]연구에서와 같이 소셜 네트워크 분석에서 우려의 원인이 되는 것으로 나타난 네트워크 데이터 연구의 익명성 고려사항에 대처하기 위해 학위 보존 랜덤화를 어떻게 사용할 수 있는지 조사하기 위해 일부 작업이 수행되었다.궁극적으로 Ying과 Wu가 수행한 작업은 정도 보존 랜덤화의 기반에서 시작하여 몇 가지 수정 사항을 전달함으로써 관찰된 네트워크의 [10]기본 유틸리티의 무결성을 훼손하지 않고 익명성을 보호하는 데 있어 어느 정도 진전을 보였다.

또한, 이 방법은 [11][12]사회과학에서 널리 사용되는 지수 랜덤 그래프 모델과 본질적으로 유사하며, 실제로 실제 네트워크에서 표현되는 차이에 대해 식별하고 이론화하기 위해 관찰된 네트워크에 대한 다양한 형태의 모델링 네트워크와 유사하다.중요한 것은, '도 보존 랜덤화'는 프로그래밍에 익숙한 사용자가 사용 가능한 관찰 네트워크에 모델을 적용할 수 있도록 단순한 알고리즘 설계를 제공합니다.

다음에 나타내는 것은 네트워크의 정도 분포 측면을 유지하면서 랜덤한 변화에 대해 네트워크를 이해하기 위해 관찰된 네트워크에 정도 보존 랜덤화를 적용하는 방법을 보여주는 작은 예입니다.인터넷 연구자 협회(Association of Internet Researchers)에는 그들의 작업을 둘러싼 토론 스레드의 대부분을 구성하는 리스트 서브가 있습니다.이에 대해 회원들은 자신의 연구, 곧 있을 회의에 대한 최신 정보를 게시하고, 논문을 요청하며, 또한 각자의 분야에서 실질적인 토론에 서로 참여시킵니다.이들 이메일은 다이렉트 및 시간 네트워크 그래프를 구성할 수 있습니다.노드는 Listserv에 속하는 개별 이메일 계정이며 엣지는 Listserv의 다른 이메일 주소에 응답하는 경우입니다.

정도 보존 랜덤화 시행의 결과.

이 관찰된 네트워크에서 Listserv의 속성은 비교적 계산하기가 간단합니다. 3,235개의 개별 이메일 계정과 총 9,824개의 교환기를 가진 네트워크에서 관찰된 상호성은 약 0.074이며 [평균 경로 길이 평균 경로 길이]는 약 4.46입니다.이러한 값은 단순히 네트워크 고유의 구조를 통해 얻을 수 있을까요?

2n ( /" ){ \{ } {2 ( 1 / \ )}규칙을 적용하면 이 네트워크에서는 충분히 랜덤한 도 보존 그래프를 작성하기 위해 약 67,861개의 개별 엣지 리와이어가 필요합니다.실제 그래프에서 많은 랜덤한 정도 보존 그래프를 구축하면 상호성과 평균 경로 길이와 같은 특성을 위한 확률 공간을 생성하여 네트워크가 이러한 특성을 임의로 표현할 수 있는 정도를 평가할 수 있습니다. 534개의 네트워크는 정도 보존 랜덤화를 사용하여 생성되었습니다.이 그래프에서는 상호성과 평균 경로 길이가 모두 정규 분포를 따르며 상호성과 평균 경로 길이의 표준 편차가 관찰된 경우를 포함하기에는 너무 좁기 때문에 이 네트워크는 랜덤하지 않은 특성을 표현하고 있다고 합리적으로 판단할 수 있습니다(따라서 더 많은 이론과 모델링에 개방되어 있습니다).

레퍼런스

  1. ^ Rao, A Ramachandra; Jana, Rabindranath; Bandyopadhyay, Suraj (1996). "A Markov chain Monte Carlo method for generating random (0, 1)-matrices with given marginals" (PDF). Indian Journal of Statistics Series A. Retrieved November 5, 2014.
  2. ^ Espinoza, Max. "On Network Randomization Methods: A Negative Control Study" (PDF). {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  3. ^ Re: [igraph] Degree-preserving rewiring of a large graph
  4. ^ Pinar, Ali; Ray, Jaideep; Seshadri, S. (2012), Are we there yet? When to stop a Markov chain while generating random graphs (PDF), arXiv:1202.3473, Bibcode:2012arXiv1202.3473R
  5. ^ Dekker, A.H. (2007), "Realistic Social Networks for Simulation using Network Rewiring" (PDF), Proceedings MODSIM 2007
  6. ^ Liu, Y-Y.; Slotine, J-J; Barabási, A-L (2012), "Control Centrality and Hierarchical Structure in Complex Networks", PLOS ONE, 7 (9): e44459, arXiv:1203.2655, Bibcode:2012PLoSO...744459L, doi:10.1371/journal.pone.0044459, PMC 3459977, PMID 23028542
  7. ^ Liu, Yang-Yu; Slotine, Jean-Jacques; Barabási, Albert-Laszlo (2013), "Effect of correlations on network controllability", Sci. Rep., 3: 1067, arXiv:1203.5161, Bibcode:2013NatSR...3E1067P, doi:10.1038/srep01067, PMC 3545232, PMID 23323210
  8. ^ Parry, Marc (July 10, 2011), "Harvard Researchers Accused of Breaching Students' Privacy", The Chronicle of Higher Education, retrieved November 5, 2014
  9. ^ Lewis, Kevin; Kaufman, Jason; Gonzalez, Marco; Wimmer, Andreas; Christakis, Nicholas (2008), "Tastes, ties, and time: A new social network dataset using Facebook.com" (PDF), Social Networks, 30 (4): 330–342, CiteSeerX 10.1.1.158.9087, doi:10.1016/j.socnet.2008.07.002
  10. ^ Ying, Xiaowei; Wu, Xintao (2008), "Randomizing Social Networks: a Spectrum Preserving Approach", SDM: 739–750, CiteSeerX 10.1.1.140.6647, doi:10.1137/1.9781611972788.67, ISBN 978-0-89871-654-2
  11. ^ Snijders, Tom AB. (2002), "Markov chain Monte Carlo estimation of exponential random graph models", Journal of Social Structure, 3 (2): 1–40
  12. ^ Robins, Garry; Patterson, Pip; Kalish, Yuval; Lusher, Dean (2007), "An introduction to exponential random graph models for social networks", Social Networks, 29 (2): 173–191, doi:10.1016/j.socnet.2006.08.002, hdl:1959.3/216571

외부 링크