자기 상관(단어)

수학의 한 분야인 결합학에서 단어의 자기 상관은 이 단어의 기간 집합이다.더 정확히 말하면, 그것은 단어의 끝이 단어의 시작과 얼마나 닮았는지를 나타내는 일련의 값이다.이 값은 예를 들어 임의 문자열에서 이 단어의 첫 발생 평균값을 계산하는 데 사용할 수 있다.

정의

이 글에서 A는 알파벳이며, $w=w_{1}\dots w_{n}$ = $w=w_{1}\dots w_{n}$ … $w=w_{1}\dots w_{n}$ n $w=w_{1}\dots w_{n}$ {\ $displaystyle$ w $=w_{1}\dots w_{n}}$ 는 $w=w_{1}\dots w_{n}$ 길이 n의 A에 대한 단어다. $w$ $w$ 의 자기 상관관계는 w $w$ 과 $w$ ( $와$ ) 자체와의 상관관계로 정의할 수 있다 $w$ .그러나, 우리는 이 개념을 아래에 다시 정의한다.

자기 상관 벡터

The autocorrelation vector of $w$ is $c=(c_{0},\dots ,c_{n-1})$ , with $c_{i}$ being 1 if the prefix of length $n-i$ equals the suffix of length $n-i$ , and with ${\displays$ $tyle c_{i}},$ 그렇지 않으면 0이 $c_{i}$ 된다. $c_{i}$ , c $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ ${\$ 는 w $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ + 1 $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ … $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ = $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ 1 $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ … $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ - $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$ ${\$ 을(를) 표시하는지 여부를 나타낸다 $c_{i}$ $w_{i+1}\dots w_{n}=w_{1}\dots w_{n-i}$

예를 들어 $aaa$ 의 자기 상관 벡터는 분명히 $aaa$ $i$ ${\displaystyle$ $(1,1,1)$ i $}$ 이(가) 0, 1 또는 2인 경우 $i$ $n-i$ n $n-i$ - i ${\displaystyn-i}$ 의 $n-i$ 접두사가 n - $n-i$ ${\displaystyn-i$ 의 접미사와 같기 때문에 $(1,1,1)$ $(1,1,1)$ ( $(1,1,1)$ 1 $1$ )이다 $.$ $b$ $abb$ 의 자기 상관 벡터는 엄격한 접미사와 동일한 접두사가 없기 $(1,0,0)$ 에 $(1,0,0)$ $(1,0,0)$ , $(1,0,0)$ 0 $(1,0,0)$ $(1,0,0)$ ) $(1,0,0)$ {\ $displaystyle ($ 1 $,0,0)}$ 이다 $abb$ .마지막으로, a $b$ $b$ $a$ $aabbaa$ 의 자기 상관 벡터는 다음 표와 같이 100011이다 $aabbaa$ .

a	a	b	b	a	a
a	a	b	b	a	a						1
	a	a	b	b	a	a					0
		a	a	b	b	a	a				0
			a	a	b	b	a	a			0
				a	a	b	b	a	a		1
					a	a	b	b	a	a	1

$c$ $c_{0}$ ${\$ 은(는) 길이 n $n$ 의 접두사와 접미사가 모두 $n$ $w$ $w$ 과(와 $)$ 같기 때문에 항상 1과 같다는 $c_{0}$ 점에 유의하십시오 $w$ $c_{n-1}$ 로, $c_{n-1}$ $c_{n-1}$ - $c_{n-1}$ 1 {\ $displaystystyle c_{n-1}$ 은 첫 $c_{n-1}$ 번째와 같은 경우에만 1이다.

자기 상관 다항식

The autocorrelation polynomial of $w$ is defined as $c(z)=c_{0}z^{0}+\dots +c_{n-1}z^{n-1}$ . It is a polynomial of degree at most $n-1$ .

For example, the autocorrelation polynomial of $aaa$ is $1+z+z^{2}$ and the autocorrelation polynomial of $abb$ is $1$ . Finally, the autocorrelation polynomial of $aabbaa$ is $1+z^{4}+z^{5}$ ${\displaystyle$ 1+z $^{4}+z^{5$

속성

이제 자기 상관 다항식을 사용하여 계산할 수 있는 몇 가지 속성을 나타낸다.

임의 문자열에서 단어 처음 발생

$확률$ ${\frac {1}{|A|}}$ ${\frac {1}{|A|}}$ $displaystyle {1}{{ A}$ 의 각 문자를 임의로 무한 $s$ s {\ $displaystyle$ $s$ $A$ 을(를 ${\frac {1}{|A|}}$ 선택한다고 가정합시다. $|A|$ 서 $|A|$ A {\ $displaystyle$ A $}$ 은(는 $|A|$ $)$ A {\ $displaystystyle$ A}의 $A$ 문자 $.$ E {\ $displaystystystystystystyte$ } $E$ $}$ $s$ $s$ 에서 $m$ m $m$ 이(가) 처음 발생할 것으로 $E$ 예상 $s$ 그러면 $E$ $E$ 이(가) A $|A|^{n}c\left({\frac {1}{|A|}}\right)$ $|A|^{n}c\left({\frac {1}{|A|}}\right)$ ( $|A|^{n}c\left({\frac {1}{|A|}}\right)$ A $|A|^{n}c\left({\frac {1}{|A|}}\right)$ ) ${\$ A $^{n}c\left({\frac$ { $1}{$ A $}\오른쪽)}$ 과 $E$ 같다 $|A|^{n}c\left({\frac {1}{|A|}}\right)$ 즉, 접두사 및 접미사인 $w$ $w$ 의 $v$ 각 하위 단어 $v$ ${\displaystyle v$ $}$ 이( $가)$ 나중에 $w$ $displaystyle w$ $}$ 의 $|A|^{|v|}$ 첫 번째 발생 평균 값을 $|A|^{|v|}$ 시킨다 $w$ .여기서 $|v|$ $displaystyle$ v $}$ 은(는) $|v|$ $displaystyle$ v $}$ 의 길이 입니다 $|v|$ $|v|$

For example, over the binary alphabet $A=\{a,b\}$ , the first occurrence of $aa$ is at position $2^{2}(1+{\frac {1}{2}})=6$ while the average first occurrence of $ab$ is at position ${\disp$ $레이스타일 2^{2}(1)=4$ 직관적으로 ${\$ $디스플레이스타일$ $aa}$ 의 첫 발생이 $b$ 의 $aa$ 첫 발생보다 늦다는 $사실$ 은 다음 두 가지 방법으로 설명할 수 있다 $ab$ .

각 위치 $p$ $p$ 에 대해 $w$ $w$ 이 $w$ 가) $p$ $p$ 에서 처음 발생하기 위한 요구 사항은 무엇인지 고려할 수 있다 $p$
- $b$ $ab$ 의 첫 번째 발생은 두 경우 모두 한 가지 방법으로만 위치 1에 있을 수 있다 $ab$ . $s$ $s$ 이 $w$ 가) w ${\displaystyle$ w $}(으$ )로 시작하는 $s$ 경우 w ${\displaystyle w$ 의 ${\frac {1}{4}}$ 고려된 값 모두에 ${\frac {1}{4}}$ ${\frac {1}{4}}$ 1 4 ${\$ 1}{ $4}}$ 가 있다.
- $길이$ 3의 $s$ $s$ $s$ 접두사가 $b$ $aab$ 이거나 $aab$ $b$ ${\displaystyle bab$ 인 경우 b $ab$ 의 첫 번째 발생 위치가 2이다 $ab$ . $그러나$ 길이 3의 $s$ $s$ $s$ 접두사가 $b$ {\ $displaystyle baa$ 인 경우에만 ${\displaystyle aa$ $}$ 의 첫 $aa$ 번째 $발생$ 위치가 $aaa$ 1인 경우 ${\displaysty aa}$ 이다 $aa$ .
- $일반적$ 으로 길이 $n+1$ + 1 $n+1$ 의 $n+1$ 접두사 수는 ${\displaystyle$ $aa}$ 이(가) 처음 $n$ 하는 $aa$ 위치n {\ $displaystyle$ n $}$ 이(가) $b$ ${\displaystyle ba$ 보다 $aa$ 작다 $n$ .이는 평균적으로 첫 번째 $a$ $aa$ 이(가) 첫 번째 $b$ $ab$ 보다 늦게 도착하는 $aa$ 이유를 설명한다 $ab$
길이 $l$ $l$ 의 임의 문자열에서 $w$ $w$ $w$ 의 평균 발생 횟수가 $|A|^{l-n}$ - $|A|^{l-n}$ ${\$ A $^{l-n}$ 인 점도 $l$ 고려할 수 있다 $|A|^{l-n}$ 이 숫자는 자기 상관 다항식과는 무관하다. $w$ $w$ 의 발생은 다른 방식으로 다른 발생과 겹칠 수 있다 $w$ .더 정확히 말하면, 자기 상관 벡터의 각 1은 발생이 겹치는 방법에 해당한다. $w$ $w$ 의 많은 발생 횟수를 중첩을 사용하여 함께 포장할 수 있지만 $w$ 평균 발생 횟수는 변경되지 않으므로 자기 상관 벡터에 1의 발생 횟수가 많을 때 두 개의 비 겹치지 않는 발생 간 거리가 더 커진다.

일반생성함수

자기 상관 다항식에서는 많은 자연문제의 일반적인 생성 함수(OGF)에 대한 간단한 방정식을 제공할 수 있다.

w $w$ 을(를) 포함하지 않는 단어의 언어 OGF는 c ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ ( z ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ ) ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ + ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ ( 1 ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ - A ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ ) ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ ( ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$ ) ${\$ 이다 $w$ ${\frac {c(z)}{z^{n}+(1-|A|z)c(z)}}$
w $w$ 을(를) 포함하는 단어의 언어 OGF는 ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ ( ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ - A ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ ) ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ ( ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ - A z ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ ( ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ - A z ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ ) ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$ ){\ $displaystyle {\\frac{z$ ^{ $n}{n$ }{(- A z $){z^{n}+(1-A z)}}}}$ 이다 $w$ ${\frac {z^{n}}{(1-|A|z)(z^{n}+(1-|A|z)c(z))}}$
$w$ ${\displaystyle w$ 의 단일한 발생을 포함하는 단어의 언어 OGF는 z ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$ ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$ ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$ + ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$ ( 1 ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$ - A ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$ ) ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$ ( $){\$ ^{n}}{z $^{n}+(1- A)c(z)}}}}}}}}$ 이다 ${\frac {z^{n}}{z^{n}+(1-|A|z)c(z)}}$

참조

Flajolet and Sedgewick (2010). Analytic Combinatorics. New York: Cambridge University Press. pp. 60-61. ISBN 978-0-521-89806-5.
Rosen, Ned. "Expected waiting times for strings of coin flips" (PDF). Retrieved 3 December 2017.
Odlyzko, A. M.; Guibas, L. J. (1981). "String overlaps, pattern matching, and nontransitive games". Journal of Combinatorial Theory. Series A 30 (2): 183–208. doi:10.1016/0097-3165(81)90005-4.

Search

자기 상관(단어)

네임스페이스

더

목차

정의

자기 상관 벡터

자기 상관 다항식

속성

임의 문자열에서 단어 처음 발생

일반생성함수

참조