분기공정

Branching process

확률론에서 분기 과정확률론적 과정으로 알려진 수학적 객체의 한 유형으로, 랜덤 변수의 집합으로 구성된다. 확률적 공정의 랜덤 변수는 자연수에 의해 색인화된다. 분기의 원래 목적은 간단한 경우에, n displaystyle 의 각 개인이 + 1 n}세대의 몇 가지 무작위 개인을 생성하는 모집단의 수학적 모델로서 기능하는 것이었다 개인 [1]대 개인 분지 과정은 번식을 모형화하는 데 사용된다. 예를 들어, 개인은 박테리아에 해당할 수 있다. 박테리아는 각각 0, 1 또는 2명의 새끼와 단일 시간 단위에서 어느 정도 확률로 생성된다. 분기 공정은 계보에서 성()이 퍼지거나 원자로에서 중성자가 전파되는 등 역학 관계가 유사한 다른 시스템을 모델링하는 데도 사용될 수 있다.

분업 과정 이론의 중심 질문은 일부 한정된 세대 이후에 개인은 존재하지 않는 궁극적인 멸종의 확률이다. 월드의 방정식을 사용하면 0세대의 한 개인을 시작으로 n세대예상 크기는 μn 같으며 여기서 μ는 각 개인의 예상 자녀수임을 알 수 있다. 만약 μ < 1이라면, 기대되는 개체 수는 빠르게 0으로 가고, 이것은 마르코프불평등에 의한 확률 1로 궁극적인 멸종을 암시한다. 또는 μ > 1일 경우 최종 소멸 확률은 1보다 작다(그러나 반드시 0은 아니다). 각 개인이 0 또는 100명의 아이를 가지고 있는 과정을 고려해 보십시오. 이 경우, μ = 50이지만, 첫 번째 개인이 0명의 자녀를 가질 확률이기 때문에, 최종 소멸 가능성은 0.5보다 크다. μ = 1일 경우, 각 개인이 항상 정확히 하나의 아이를 갖지 않는 한 확률 1과 함께 궁극적인 소멸이 발생한다.

이론 생태학에서는 가지과정의 매개변수 μ기본 생식률이라고 한다.

수학적 공식화

분기 프로세스의 가장 일반적인 공식은 Galton-Watson 공정의 공식이다. Zn 기간 n의 상태를 나타내며(흔히 세대 n의 크기로 해석됨), Xn,i 기간 n의 멤버 i의 직접 후계자 수를 나타내는 임의변수로, 여기서 Xn,i 독립적이며 모든 n ∈{0, 1, 2, ...}과n i ∈ {1, ..., Z}에 걸쳐 동일하게 분포한다. 그렇다면 재발방정식은 다음과 같다.

Z0 = 1.

또는 분기 과정은 무작위 보행으로 공식화할 수 있다. Si 기간 i의 상태를 나타내며, Xi 모든 i에 걸쳐 iid인 임의 변수가 되게 한다. 그렇다면 재발방정식은 다음과 같다.

S0 = 1. 이 제형에 대한 직관력을 얻기 위해 모든 노드를 방문하는 것이 목표인 워크를 상상해 보십시오. 그러나 이전에 방문하지 않은 노드를 방문할 때마다 추가 노드도 방문해야 한다. Si 기간 i에서 공개되었지만 방문되지 않은 노드 수를 나타내며, Xi 노드 I를 방문할 때 표시되는 새 노드 수를 나타낸다. 그 다음 각 기간 동안 공개되지만 방문되지 않은 노드 수는 이전 기간의 노드 수와 같으며, 노드를 방문할 때 표시되는 새 노드 수는 방문한 노드를 뺀 것이다. 노출된 모든 노드를 방문하면 프로세스가 종료된다.

연속 시간 분기 프로세스

이산 시간 분기 프로세스의 경우, "지점 시간"은 모든 개인에 대해 1로 고정된다. 연속 시간 분기 프로세스의 경우 각 개인은 랜덤 시간(연속 랜덤 변수)을 기다렸다가 주어진 분포에 따라 분할한다. 다른 개인에 대한 대기 시간은 독립적이며, 어린이의 수에 따라 독립적이다. 일반적으로 대기 시간은 모든 개인에 대한 매개변수 λ을 갖는 지수 변수여서 공정이 마르코비안이다.

Galton Watson 공정의 소멸 문제

최종 소멸 확률은 다음과 같다.

비종교적 사례에 대해(다중적인 경우는 모집단의 모든 구성원에 대해 자손이 없을 확률이 0인 경우 - 이 경우 궁극적인 소멸 확률은 0인 경우) 최종 소멸 확률은 μ1일 경우 1과 같고, μ1일 경우 1보다 엄격히 작다.

공정은 확률생성함수의 방법을 이용하여 분석할 수 있다. p0, p1, p2, ...를 각 세대의 개인에 의해 0, 1, 2, ...의 자손이 생성될 확률로 한다. m세대th 의한 소멸확률로 하자m. 분명히 d0 = 0. m 생성th 의해 0으로 이어지는 모든 경로에 대한 확률을 더해야 하기 때문에 소멸 확률은 세대에 걸쳐 감소하지 않는다. 그것은

따라서 dm 한계 d로 수렴되고 d는 궁극적인 소멸 확률이다. 1세대에 j자식이 있다면, m세대에 의해 소멸되려면 이들 각 선은 m - 1세대로 소멸되어야 한다. 독자적으로 진행되기 때문에, 확률은 (dm−1)이다. 따라서,

방정식의 오른쪽은 확률 생성함수다. hi(z)를 p:에 대한 일반적인 생성 함수로 한다.

생성함수를 사용하면 이전 방정식이

dmd, d를 풀면 d를 찾을 수 있다.

이것은 또한 z ≥ 0에 대한 y = z와 y = h(z)의 교차점을 찾는 것과 동등하다. y = z는 직선이다. y = h(z) is an increasing (since ) and convex (since ) function. 교차로에는 최대 두 개의 지점이 있다. (1,1)은 항상 두 기능의 교차점이기 때문에 다음 세 가지 사례만 존재한다.

y = h(z)의 세 가지 사례가 y = z와 교차한다.

사례 1은 z < 1에 또 다른 교차점이 있다(그래프의 빨간색 곡선 참조).

사례 2는 z = 1에서 하나의 교차점만 가진다. (그래프의 녹색 곡선 참조)

사례 3은 z > 1에 또 다른 교차점이 있다. (그래프의 검은색 곡선 참조)

사례 1의 경우, 최종 소멸 확률은 절대적으로 1보다 작다. 사례 2와 3의 경우, 최종 소멸 확률은 1과 같다.

h′(1) = p1 + 2p2 + 3p3 + ...을 관찰함으로써 = μ는 부모가 생산할 수 있는 예상 자손의 수로서, 주어진 부모의 자손 수에 대해 함수 h(z)를 생성하는 분기 프로세스의 경우, 단일 부모에 의해 생산된 평균 자손 수가 1보다 작거나 같으면, 최종 소멸 확률은 1이라고 결론 내릴 수 있다. 한 부모에 의해 생산되는 평균 자손 수가 1보다 크면, 최종 소멸 확률은 1보다 확실히 작다.

크기 종속 분기 프로세스

크리슈나 아트레야는 개인이 한 세대 이상 사는 [2]그림메트에 의해 연령 의존적인 분기 과정이라고 알려진 보다 일반적인 분지 프로세스 모델에 대한 논의와 함께, 일반적인 적용이 있는 크기 의존적인 분기 과정 사이의 세 가지 차이를 확인했다. Athreya는 크기 의존적인 분기 프로세스의 세 가지 부류를 하위 중요도, 안정적, 초임계 분기 조치라고 파악한다. Athreya의 경우, 중심 매개변수는 서브임계 및 초임계 불안정한 분기(branching)를 피해야 하는지 여부를 제어하는 데 매우 중요하다.[3] 규모 의존 분기 프로세스도 자원 의존 분기 프로세스라는 주제[4] 논의된다.

소멸 문제의 예

부모가 적어도 두 명의 자식을 낳을 수 있다고 생각해라. 각 세대의 소멸 확률은 다음과 같다.

d0 = 0으로. 궁극적인 소멸확률을 위해서는 d = p0 + pd1 + pd22 만족시키는 d를 찾아야 한다.

생성된 p0 = 0.1, p1 = 0.6, p2 = 0.3의 확률로 볼 때 첫 20세대의 소멸 확률은 다음과 같다.

세대 #(1-10) 소멸 확률 세대 #(11–20) 소멸 확률
1 0.1 11 0.3156
2 0.163 12 0.3192
3 0.2058 13 0.3221
4 0.2362 14 0.3244
5 0.2584 15 0.3262
6 0.2751 16 0.3276
7 0.2878 17 0.3288
8 0.2975 18 0.3297
9 0.3051 19 0.3304
10 0.3109 20 0.331

이 예에서는 d = 1/3이라는 대수적으로 해결할 수 있으며, 이것은 멸종의 확률이 증가하는 세대와 수렴하는 값이다.

분기 프로세스 시뮬레이션

분기 프로세스는 다양한 문제에 대해 시뮬레이션할 수 있다. 시뮬레이션 분지 과정의 한 가지 특정한 용도는 진화 생물학 분야에 있다.[5][6] 예를 들어 계통생성 트리는 여러 모델에서 시뮬레이션할 수 있어 가설 [7]검사와 더불어 추정 방법을 개발하고 검증하는 데 도움이 된다.

멀티티프 분기 프로세스

멀티트페 분기 공정에서 개인은 동일하지 않지만, n종류로 분류할 수 있다. 매 시간 단계 후, 타입 i의 개인은 다른 타입의 개인을 생산하게 되며, 다른 타입의 어린이의 수를 나타내는 임의{\는 N { ^{에 대한 확률 분포를 만족한다.

예를 들어, 암줄기세포(CSC)와 비줄기암세포(NSC)의 모집단을 고려해 보자. 각 시간 간격 후에 각 CSC는 2개의 CSC(대칭 분할)를 생성할 확률 p CSC 1개와 NSC 1개를 생성할 확률 2}}, 확률 CSC 를 생성할 확률 p -을 갖는다. to produce nothing (death); each NSCC has probability to produce two NSCCs (symmetric division), probability to produce one NSCC (stagnation), and probability 을(를) 하지 않는다(죽음).[8]

멀티티프 분기 프로세스에 대한 대수의 법칙

다른 유형의 모집단이 기하급수적으로 증가하는 다중 유형 분기의 경우, 다른 유형의 비율은 거의 확실히 어떤 온화한 조건 하에서 일정한 벡터로 수렴한다. 이것은 다종류 분업 과정에 대한 많은 수의 강력한 법칙이다.

연속 시간 사례의 경우, 모집단의 기대 비율은 독특한 유치 고정점을 갖는 ODE 시스템을 만족시킨다. 이 고정점은 비율이 큰 수의 법칙에 수렴되는 벡터일 뿐이다.

Athreya와 Ney의 모노그래프는 이 대수의 법칙이 유효한 공통적인 조건들을 요약한다. 나중에 다른 조건들을 버림으로써 약간의 개선들이 있다.[10][11]

기타 분기 프로세스

예를 들어 각 세대에서 생식 법칙이 무작위로 선택되는 임의의 환경에서의 분업 과정이나 인구의 성장이 외부의 영향이나 상호 작용하는 과정에 의해 제어되는 분업 과정 등 다른 분업 과정이 많이 있다. 자원의 분배를 통제하는 변화하는 사회 구조 속에서 재생산할 수 있고 살기 위해 입자가 작용해야 하는 분기 과정(환경에 자원을 기여)은 이른바 자원 의존적인 분기 과정이다.

참고 항목

참조

  1. ^ Athreya, K. B. (2006). "Branching Process". Encyclopedia of Environmetrics. doi:10.1002/9780470057339.vab032. ISBN 978-0471899976.
  2. ^ G. R. 그리메트와 D. R. 스레자커, 확률과 무작위 프로세스, 2차 개정판, 옥스포드, 클라렌돈 프레스, 1992.
  3. ^ 크리슈나 아트레야와 피터 자거스. 분기 프로세스. 스프링거. 1973.
  4. ^ F. 토마스 브루스와 M. 듀린콕스(2015) "자원 의존적 분기 프로세스 및 사회의 외피", 적용 확률 연보 25: 324–372.
  5. ^ Hagen, O.; Hartmann, K.; Steel, M.; Stadler, T. (2015-05-01). "Age-Dependent Speciation Can Explain the Shape of Empirical Phylogenies". Systematic Biology. 64 (3): 432–440. doi:10.1093/sysbio/syv001. ISSN 1063-5157. PMC 4395845. PMID 25575504.
  6. ^ Hagen, Oskar; Andermann, Tobias; Quental, Tiago B.; Antonelli, Alexandre; Silvestro, Daniele (May 2018). "Estimating Age-Dependent Extinction: Contrasting Evidence from Fossils and Phylogenies". Systematic Biology. 67 (3): 458–474. doi:10.1093/sysbio/syx082. PMC 5920349. PMID 29069434.
  7. ^ Hagen, Oskar; Stadler, Tanja (2018). "TreeSimGM: Simulating phylogenetic trees under general Bellman–Harris models with lineage-specific shifts of speciation and extinction in R". Methods in Ecology and Evolution. 9 (3): 754–760. doi:10.1111/2041-210X.12917. ISSN 2041-210X. PMC 5993341. PMID 29938014.
  8. ^ Chen, Xiufang; Wang, Yue; Feng, Tianquan; Yi, Ming; Zhang, Xingan; Zhou, Da (2016). "The overshoot and phenotypic equilibrium in characterizing cancer dynamics of reversible phenotypic plasticity". Journal of Theoretical Biology. 390: 40–49. arXiv:1503.04558. doi:10.1016/j.jtbi.2015.11.008. PMID 26626088. S2CID 15335040.
  9. ^ Athreya, Krishna B.; Ney, Peter E. (1972). Branching Processes. Berlin: Springer-Verlag. pp. 199–206. ISBN 978-3-642-65371-1.
  10. ^ Janson, Svante (2003). "Functional limit theorems for multitype branching processes and generalized Pólya urns". Stochastic Processes and Their Applications. 110 (2): 177–245. doi:10.1016/j.spa.2003.12.002.
  11. ^ Jiang, Da-Quan; Wang, Yue; Zhou, Da (2017). "Phenotypic equilibrium as probabilistic convergence in multi-phenotype cell population dynamics". PLOS ONE. 12 (2): e0170916. Bibcode:2017PLoSO..1270916J. doi:10.1371/journal.pone.0170916. PMC 5300154. PMID 28182672.
  • C. M. Grinstad와 J. L. Snell, 확률 소개, 2차 개정. 10.3절에서는 분기 프로세스를 연구하기 위한 생성 기능의 적용과 함께 상세히 논한다.
  • G. R. 그리메트와 D. R. 스레자커, 확률과 무작위 프로세스, 2차 개정판, 옥스포드, 클라렌돈 프레스, 1992. 5.4절에서는 위에서 설명한 분기 프로세스 모델을 설명한다. 5.5절에서는 개인이 한 세대 이상 사는 연령 의존적 분기 프로세스라고 알려진 분기 프로세스의 보다 일반적인 모델을 설명한다.