연속 시간 마르코프 연쇄

Continuous-time Markov chain

연속시간 마르코프 연쇄(CTMC)는 각 상태에 대해 프로세스가 지수 랜덤 변수에 따라 상태를 변화시킨 확률행렬의 확률에 의해 지정된 다른 상태로 이동하는 연속 확률 과정이다.등가 공식은 프로세스가 이동할 수 있는 각 가능한 상태에 대해 하나씩, 현재 상태에 의해 결정되는 파라미터와 함께 일련의 지수 랜덤 변수의 최소값에 따라 변화하는 상태를 기술한다.

3가지 상태, 2 \{2\}을 가진 CTMC의 예는 다음과 같습니다. 프로세스는 유지시간에 의해 지정된 시간(지수 랜덤 i\ 후에 이행합니다.여기서 i는 현재 상태입니다.각 랜덤 변수는 독립적이며 0~ ( ){ \ { }(12{\ ( {\sim {textExp 이행이 이루어지는 경우 프로세스는 확률행렬을 가진 이산시간 마르코프 연쇄인 점프 체인에 따라 한다.

마찬가지로 이 CTMC는 서로 경쟁하는 지수의 이론에 따라 ~ ( i text의 최소 2개의 랜덤 변수에 따라 상태를 변경합니다.)는 i { ij ) 。여기서 파라미터는 Q (,j ) { Q = ( { , j ) } 。

각 비대각값은 점프 체인에서 소정 상태로 이동할 확률로 원상태 유지시간의 곱으로 계산할 수 있다.대각 값은 각 행의 합계가 0이 되도록 선택됩니다.

CTMC는 지수분포와 이산시간 마르코프 사슬의 기억불량 때문에 그 행동이 현재의 상태에만 의존하며 과거의 행동에 의존하지 않는다는 마르코프 속성을 만족시킨다.

정의.

, {\(\ {Pr 확률 공간,S {\ S 공란이 아닌 집합, T 0 {\ T=\} }로 .S 이산 메트릭을 장착하여 R { 0 S(\displaystyle \mathbb {R} _ 0S의 올바른 연속성을 이해할 수 있도록 . 연속 시간 마르코프 체인은 다음과 [1]같이 정의됩니다.

  • S S 확률 벡터 {아래에서는 마르코프 체인의 초기 분포로 해석합니다) 및
  • S S 속도 Q{\Q}, 즉 Q: 2 {\ Q 다음과 같습니다.
  1. 모든 i S \ i S,
  2. 모든 S {\ i S j : j , - i , .{ _ { \ I : \ i } { i , j= - { , i } (이것이에도예시의사후적으로는 합계가 유한해야 한다는 을 알고 (+ (\displaystyle ,i})와동일하다고 가정하고 Q-Q_{i})가 실제 가치라고 합니다.대신 일부 저자는 된 규정: R { - { - } { Q:{ \ 를 들어Q(\Q 안정적이거나 안정되어 Q(\{R} 즉 모든 엔트리가 실제 값입니다).[2][3][4]

Q Q 행 합계는 0: ∑ j i , 0 , { style \ i \ S ~ \ _ { \ I } , j } , more more = 0 입니다.이 상황은 전이행렬의 모든 행 합계가 동일한 이산 시간 마르코프 사슬의 상황과 대조된다.

X: \ X :TX ( t ){ \ t ~ ~ X() { style ( \ { } , { \ { } - 측정 가능.XX})를 초기 분포(\ 속도 Q(\ Q 전이 확률 또는 점프 체인 및 유지 시간을 [5]통해 마르코프라고 정의하는 세 가지 동등한 방법이 있습니다.

전이 확률 정의의 서막으로서, 우선 정규 속도 매트릭스의 정의에 동기를 부여한다.우리는 전이율 행렬Q(\ Q 사용하여 다음 정리를 통해S S전이 P 컬렉션을 생성하여 마르코프 체인의 역학을 지정한다

정리: 콜모고로프 [6]역방정식에 대한 솔루션의 존재. : P ( [ 0, ] ) \ P \ ( [ , ]^ 가 합니다. i S i S 대해 엔트리 ) T (Pj})_{t\T})는 미분 가능하며(\ P 콜모고로프의 역방정식을 만족합니다.

(0)

표시 스타일 위의 시스템에 고유성이 있음을 의미하며,[7][8] 즉 솔루션이 하나밖에 없다는 것을 의미합니다.Q Q 불규칙하다는 은 Q Q 정규적이지 않다는 것을 합니다.S S 유한한 , P ( tQ ) T {\ P= ( T Q 해는 정확히 1개입니다.그렇지 않으면, S{S\displaystyle}, 그리고 만약 Q{Q\displaystyle}일반이 불규칙한 전이율 매트릭스 S{S\displaystyle}에 .[를]는 고유한 방법 P{P\displaystyle}, 각 t∈ T{\displaystyle t\in T}을 위해, P(t){P(t)\displaystyle}가 될 것이다 확률 행렬:각 행의 존재하는 무한하다..[6]Q Q 다음 서브섹션의 시작부터 이 섹션의 끝부분까지 이라고 가정합니다.단, 이 전제조건을 포함하지 않는 것이[10][11][12] 일반적입니다.(전문가의 주의: 따라서 우리는 일반적으로 연속 시간 마르코프 사슬을 정의하는 것이 아니라 비폭발적 연속 시간 마르코프 사슬만을 정의하는 것이다.)

전이 확률 정의

P P 시스템(0)의 (고유) 솔루션으로 .(Q Q 이라는 가정 하에 고유성이 보증됩니다.)우리는 X{X\displaystyle}은 마르코프 초기 분배와 λ{\lambda\displaystyle}과 비율 매트릭스 Q{Q\displaystyle}를 의미하는 것:모든 실수가 음이 아닌 정수 n, 모든 t0,…을 tn+0{\displaystyle n\geq 0}≥ 1∈ T{\displaystyle t_{0},\dots T}가 t0<>⋯<>,t_{n+1}\in;기 위해서는 말한다n+1 i0 + {\i_0}, 1}\ I 대해 {\displaystyle <\ <+1}

( 0 0 , , t + + ) i k Z : k < P ( + - )k , k + ( \ style \ ( X 0 =0 , , X _ \ dots , 1 ) = { } { }

(1)

유도 및 A Pr ( ) 0 ( AB ) ( B ) () ,\ style \ A , B \ \{} ~\ \ ( A b B ) 。))나는}과 비음의 정수 n, 모든 t0,…을 tn+0{\displaystyle n\geq 0}≥ 1∈ T{\displaystyle t_{0},\dots}T가 t0<>,t_{n+1}\in, ⋯<>t n+1,{\displaystyle t_{0}<, \dots <, t_{n+1},}{\displaystyle i\in I,~\Pr(X_{0}일 경우 =i)=\lambda_{나는}λ에 대한 모든 나는 0,…, i. n+1∈ 나는< ( 0 , , t n ){ 0 < \ ( X { 0 } = i _ \ , _ { t _ { n } = }\ I) 。 ( 뒤에X _ { _ { n )

(2)

함수 ( ) ,j ) T { ( P ( ) _ { , j { \ T} (i , S \ i , \ S)의 연속성에 따라 궤적 () t T ( \ displaystyle i , j \ in S )가 S -null { N ( X () T right continuous} N { displaystyle \ { \ { \ \ : ( \ t ) } ( X ) T n T n n n n n n n n continu continu nn continu continu continu continu continu continu continu continu continu continu continu continu continu continu continu continu continu continu continu 、 N \ styledisplay

점프 체인/홀딩 타임 정의

오른쪽 연속 함수와 연관된 시퀀스

T \ fTS는 오른쪽 연속입니다(S에 이산 메트릭을 하는 경우). (f ) ( { ( , +u) : ( + ) ( )} T ) { {+ 、 0、 { h = h ( f )( \ \ \ \ \ \ \ infty )+ \ u \ ( t ) f _ ( t ( t ( t ) ) f ( t ( t )f{\ f에 연관된 시간 시퀀스를 선택하고 sS, \ s \ S ,} 를 합니다.

ff와 된 "상태 시퀀스"입니다.

점프 매트릭스 δ의 정의

Q 의존성을 강조하려면 점프 \Pi 매트릭스입니다.

서 Z ( ) { S : , { Z)=\{ S 함수k , )S . { S제로 세트입니다.

점프 체인/홀드 타임 속성

X X 초기 분포{\({ 레이트 Q({Q})를 갖는 마르코프라고 . 즉 X({X})의 궤적은 거의 확실하게 연속적이므로 f f를 X어디에나)를 수정한 입니다.- 연속 궤적, n Z H ( ( ) n + { _ {{} { \ 0 ( ( \) _ { n } _ { n } = + \ in \ ftfty} } surely ( surely surely surely surely surely surely surely surely surely surely surely surely surely surely the surely surely surely surely surely surely the surely surely the surely the thestyle the surely surelystyle X - 。초기 분포 rkov 체인 { \ - chain property trans trans transition trans r r r \ () n 0 R0 ( ( f) ) - Q){\ 0 B유지시간 속성

극소 정의

연속 시간 마르코프 사슬은 상태 i와 j 사이의 전이 확률의 시간에 대한 도함수인 전이율에 의해 특징지어진다.

X X 초기 분포 속도 Q(\ Q 가진 마르코프라고 . 즉, i S {\i S ( ) ) = _dai를 합니다. t h{\ h의 작은 양의 값에 대해서는 0< ( ( ) ) \ 0 < \ ( ( t ) =과 같은 모든 { t \ T}에 대해 다음 값이 유지됩니다.

j]+h

여기서 little-o o( {o( i { i[15][16]에 따라 달라집니다.

위의 방정식은 i ij})가 idisplay style ineqj에서 j i j)로 이행하는 속도와 i(\ ineq j에서 하는 속도를 측정하는 것으로 볼 수 있습니다.를 클릭합니다.

특성.

커뮤니케이션 클래스

통신 클래스, 전이, 재발 및 정의 및 늘 반복은 이산 시간 마르코프 사슬과 동일하게 정의된다.

일시적인 동작

항목ij p = P(Xt = j X0 = i)인 행렬에 P(t)를 씁니다.그러면 행렬 P(t)는 1차 미분 방정식인 순방향 방정식을 만족한다.

여기서 prime은 t에 대한 차이를 나타낸다.이 방정식의 해는 행렬 지수함수에 의해 주어진다.

상태 공간 {1,2}의 CTMC와 같은 단순한 경우.이러한 과정의 일반 Q 행렬은 α,β > 0인 다음 2 × 2 행렬이다.

이 경우 순행렬에 대한 위의 관계는 다음을 제공하기 위해 명시적으로 해결될 수 있습니다.

그러나 직접 해법은 더 큰 행렬에 대해 계산하기가 복잡합니다.Q가 행렬의 반군의 생성자라는 사실

사용됩니다.

고정 분포

환원 불가능한 반복 CTMC에 대한 정상 분포는 프로세스가 t의 큰 값에 대해 수렴하는 확률 분포입니다. 이전에 고려된 두 상태 프로세스에 대해 다음과 같이 주어진 P(t)에 대해 관찰하십시오.

t → ∞으로 인해 분포는 다음과 같은 경향이 있습니다.

각 행의 분포는 시작 상태에 따라 달라지지 않으므로 유의하십시오.행 벡터 θ는 다음을 통해 구할[17] 수 있다.

라는 추가적인 제약을 가하여

예 1

금융 시장 상태를 나타내는 연속 시간 마르코프 체인의 유도 그래프 표현(주: 숫자는 구성됨).

오른쪽 이미지는 상태 공간 {Bull market, Bear market, Stained market} 및 전이율 매트릭스를 가진 연속 시간 마르코프 체인을 나타냅니다.

이 체인의 정상 분포는 § {\ Q을(를) 해결하여 구할 수 있으며, 원소의 합계가 1이어야 합니다.

예 2

상태 1, 5, 6, 8에 대한 예시로, 전이 확률이 있는 전이 그래프.스테이트 2와 스테이트8 사이에는 쌍방향 비밀 통로가 있습니다.

오른쪽 이미지는 상태 공간이 {1,2,3,4,5,6,7,8,9}인 이산 시간 마르코프 연쇄 모델링 팩맨을 나타냅니다.플레이어는 팩맨을 미로를 통해 조종하며 팩팟을 먹는다.한편, 그는 유령에게 쫓기고 있다.편의상 미로는 작은 3x3 그리드로 하고 몬스터는 수평 및 수직 방향으로 무작위로 이동합니다.상태 2와 상태 8 사이의 비밀 통로는 양방향으로 사용할 수 있다.확률이 0인 엔트리는 다음 전이율 매트릭스에서 삭제됩니다.

이 마르코프 사슬은 환원할 수 없다. 왜냐하면 유령은 유한한 시간 안에 모든 상태에서 모든 상태로 날아갈 수 있기 때문이다.비밀 통로로 인해, 마르코프 사슬은 또한 비주기적인데, 이는 몬스터가 짝수 또는 불균일한 수의 상태 천이 모두에서 어떤 상태에서 어떤 상태로든 이동할 수 있기 때문이다.따라서, 고유한 정상 분포가 존재하며, 원소의 합계가 1이어야 하는 제약 조건을 조건으로 Q { Q=을 풀면 찾을 수 있습니다.이 제약조건의 선형방정식의 해는 ( .7 , 7, 4 입니다 = (, 11., 15.7, .7입니다.} 인접한 비밀통로의 중앙상태와 경계상태 2, 8이 가장 많이 들락날락하고 모서리상태의 방문이 가장 적게 들락날락한다

시간 반전

CTMCt X의 경우, 시간 지연 ^ T- \ \ hat { t }X_ { T -t} 로 정의됩니다.이 프로세스는 순방향 프로세스와 동일한 고정 분포를 가집니다.

체인(chain)은 반전 프로세스가 순방향 프로세스와 동일할 경우 가역적이라고 합니다.Kolmogorov의 기준은 프로세스를 되돌릴 수 있는 필요충분조건은 닫힌 루프 주위의 전이율의 곱이 양방향에서 동일해야 한다는 것이다.

임베디드 마르코프 연쇄

에르고딕 연속시간 마르코프 사슬 Q정상확률 분포 θ를 구하는 방법 중 하나는 우선 내장된 마르코프 사슬(EMC)을 찾는 것이다.엄밀히 말하면 EMC는 정규 이산 시간 마르코프 체인입니다.EMC, S의 1단계 전이 확률 행렬의 각 요소는 sij 나타내며, 상태 i에서 상태 j로 이행할 조건부 확률을 나타낸다.이러한 조건부 확률은 다음과 같이 구할 수 있습니다.

이로부터 S는 다음과 같이 쓸 수 있다.

여기서 I는 항등행렬이고 diag(Q)는 행렬 Q에서 대각선을 선택하고 다른 모든 요소를 0으로 설정하여 형성된 대각행렬입니다.

정상 확률 분포 벡터를 찾으려면 다음 찾아야 합니다.

{ \ \ = 1. 여기서 may는 다음과 같이 표시됩니다.

(S는 Q가 정기적이지 않은 경우에도 주기적일 수 있습니다.is이 발견되면 단위 벡터로 정규화해야 합니다.)

연속 시간 마르코프 사슬에서 파생될 수 있는 또 다른 이산 시간 과정은 δ 단위 시간 간격으로 X(t)를 관찰하여 형성된 (이산 시간) 마르코프 사슬인 γ-스켈튼이다.랜덤 변수 X(0), X(θ), X(2'), ...는 γ-skeleton이 방문한 상태의 시퀀스를 나타냅니다.

「 」를 참조해 주세요.

메모들

  1. ^ Ross, S.M. (2010). Introduction to Probability Models (10 ed.). Elsevier. ISBN 978-0-12-375686-2.
  2. ^ 앤더슨 1991, 64페이지의 정의를 참조하십시오.
  3. ^ Chen & Mao 2021, 정의 2.2.
  4. ^ Chen 2004, 정의 0.1(4)
  5. ^ 노리스 1997, 정리 2.8.4 및 정리 2.8.2(b)
  6. ^ a b 앤더슨 1991, 정리 2.2.2(1), 70페이지.
  7. ^ 앤더슨 1991, 정의(81페이지)
  8. ^ 2004년 첸, 2페이지.
  9. ^ 앤더슨 1991, 20페이지.
  10. ^ a b Suhov & Kelbert 2008, 정의 2.6.3.
  11. ^ Chen & Mao 2021, 정의 2.1.
  12. ^ Chen 2004, 정의 0.1.
  13. ^ Chen & Mao 2021 (56페이지), 정의 2.2 바로 아래.
  14. ^ 노리스 1997, 87페이지
  15. ^ 수호브 & 켈버트 2008, 정리 2.6.6.
  16. ^ 노리스 1997, 정리 2.8.2(c)
  17. ^ Norris, J. R. (1997). "Continuous-time Markov chains II". Markov Chains. pp. 108–127. doi:10.1017/CBO9780511810633.005. ISBN 9780511810633.

레퍼런스

  • Anderson, William J. (1991). Continuous-time Markov chains: an applications-oriented approach. Springer.
  • Leo Breiman(1992) [1968] 확률.애디슨 웨슬리 원판, 산업 응용 수학 학회 ISBN 0-89871-296-3 전재 (7장 참조)
  • Chen, Mu-Fa (2004). From Markov chains to non-equilibrium particle systems (Second ed.). World Scientific.
  • Chen, Mu-Fa; Mao, Yong-Hua (2021). Introduction to stochastic processes. World Scientific.
  • J. L. Doob(1953) 확률적 과정.뉴욕: John Wiley and Sons ISBN 0-471-52369-0.
  • A. A. 마르코프(1971년)."확률 이론의 한계 이론의 연계를 연쇄적으로 연결된 변수의 합으로 확장." 부록 B에 전재되었다.하워드.동적 확률론적 시스템, 제1권: 마르코프 연쇄.존 와일리와 아들들.
  • Markov, A. A. (2006). Translated by Link, David. "An Example of Statistical Investigation of the Text Eugene Onegin Concerning the Connection of Samples in Chains". Science in Context. 19 (4): 591–600. doi:10.1017/s0269889706001074.
  • S. P. 마인과 R. L. 트위디(1993) 마르코프 사슬과 확률적 안정성.런던: Springer-Verlag ISBN 0-387-19832-6.온라인:MCSS.두 번째 판, 캠브리지 대학 출판부, 2009.
  • Kemeny, John G.; Hazleton Mirkil; J. Laurie Snell; Gerald L. Thompson (1959). Finite Mathematical Structures (1st ed.). Englewood Cliffs, NJ: Prentice-Hall, Inc. Library of Congress Card Catalog Number 59-12841. 고전 텍스트. cf 6장 유한 마르코프 연쇄 페이지 384ff.
  • John G. Kemeny & J. Laurie Snell (1960) Finite Markov Chains, D. van Nostrand Company ISBN 0-442-04328-7
  • E. Nummelin. "General irreducible Markov chains and non-negative operators". Cambridge University Press, 1984, 2004. ISBN 0-521-60494-X
  • Seneta, E. Non-negative matrices and Markov chains. 2nd rev. ed., 1981, XVI, 288 p., Softcover Springer Series in Statistics. (Originally published by Allen & Unwin Ltd., London, 1973) ISBN 978-0-387-29765-1
  • Suhov, Yuri; Kelbert, Mark (2008). Markov chains: a primer in random processes and their applications. Cambridge University Press.
  1. ^ For instance, consider the example and being the (unique) transition rate matrix on such that . (Then the remaining entries of will all be zero. Cf. birth process.) Then is irregular. Then, for general infinite , indexing by the nonnegative integers yields that a suitably modified version of the above matrix will be irregular.[9]