자기 상관(단어)
Autocorrelation (words)수학의 한 분야인 결합학에서 단어의 자기 상관은 이 단어의 기간 집합이다.더 정확히 말하면, 그것은 단어의 끝이 단어의 시작과 얼마나 닮았는지를 나타내는 일련의 값이다.이 값은 예를 들어 임의 문자열에서 이 단어의 첫 발생 평균값을 계산하는 데 사용할 수 있다.
정의
이 글에서 A는 알파벳이며, = … n{\ w는 길이 n의 A에 대한 단어다. 의 자기 상관관계는 w 과 () 자체와의 상관관계로 정의할 수 있다.그러나, 우리는 이 개념을 아래에 다시 정의한다.
자기 상관 벡터
The autocorrelation vector of is , with being 1 if the prefix of length equals the suffix of length , and with 그렇지 않으면 0이 된다., c 는 w + 1… = 1… - 을(를) 표시하는지 여부를 나타낸다
예를 들어 의 자기 상관 벡터는 분명히 i이(가) 0, 1 또는 2인 경우 n- i 의 접두사가 n - 의 접미사와 같기 때문에(1)이다 의 자기 상관 벡터는 엄격한 접미사와 동일한 접두사가 없기 에 ,0 ){\1이다 .마지막으로, a 의 자기 상관 벡터는 다음 표와 같이 100011이다.
a | a | b | b | a | a | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
a | a | b | b | a | a | 1 | |||||
a | a | b | b | a | a | 0 | |||||
a | a | b | b | a | a | 0 | |||||
a | a | b | b | a | a | 0 | |||||
a | a | b | b | a | a | 1 | |||||
a | a | b | b | a | a | 1 |
은(는) 길이 n 의 접두사와 접미사가 모두 과(와 같기 때문에 항상 1과 같다는 점에 유의하십시오 로, -1 {\은 첫 번째와 같은 경우에만 1이다.
자기 상관 다항식
The autocorrelation polynomial of is defined as . It is a polynomial of degree at most .
For example, the autocorrelation polynomial of is and the autocorrelation polynomial of is . Finally, the autocorrelation polynomial of is 1+z
속성
이제 자기 상관 다항식을 사용하여 계산할 수 있는 몇 가지 속성을 나타낸다.
임의 문자열에서 단어 처음 발생
의 각 문자를 임의로 무한 s {\ 을(를 선택한다고 가정합시다. 서A {\ A은(는A {\ A}의문자 E {\} 에서 m 이(가) 처음 발생할 것으로 예상그러면 이(가) A ( A) A { A과 같다즉, 접두사 및 접미사인 의 각 하위 단어 이( 나중에 의 첫 번째 발생 평균 값을 시킨다 .여기서 v 은(는) v의 길이 입니다
For example, over the binary alphabet , the first occurrence of is at position while the average first occurrence of is at position 직관적으로 의 첫 발생이 의첫 발생보다 늦다는은 다음 두 가지 방법으로 설명할 수 있다.
- 각 위치 에 대해 이가) 에서 처음 발생하기 위한 요구 사항은 무엇인지 고려할 수 있다
- 의 첫 번째 발생은 두 경우 모두 한 가지 방법으로만 위치 1에 있을 수 있다. 이가) w w)로 시작하는 경우 w 의 고려된 값 모두에 1 4 1}{가 있다.
- 3의 접두사가 이거나 인 경우 b 의 첫 번째 발생 위치가 2이다. 길이 3의 접두사가 {\인 경우에만 의 첫 번째 위치가 1인 경우 이다 .
- 으로 길이 + 1 의 접두사 수는 이(가) 처음 하는 위치n {\ n이(가) 보다 작다.이는 평균적으로 첫 번째 이(가) 첫 번째 보다 늦게 도착하는 이유를 설명한다
- 길이 의 임의 문자열에서 의 평균 발생 횟수가 - A인 점도 고려할 수 있다이 숫자는 자기 상관 다항식과는 무관하다. 의 발생은 다른 방식으로 다른 발생과 겹칠 수 있다.더 정확히 말하면, 자기 상관 벡터의 각 1은 발생이 겹치는 방법에 해당한다. 의 많은 발생 횟수를 중첩을 사용하여 함께 포장할 수 있지만 평균 발생 횟수는 변경되지 않으므로 자기 상관 벡터에 1의 발생 횟수가 많을 때 두 개의 비 겹치지 않는 발생 간 거리가 더 커진다.
일반생성함수
자기 상관 다항식에서는 많은 자연문제의 일반적인 생성 함수(OGF)에 대한 간단한 방정식을 제공할 수 있다.
- w 을(를) 포함하지 않는 단어의 언어 OGF는 c( z) +( 1- A ) ( ) 이다
- w 을(를) 포함하는 단어의 언어 OGF는 (- A )(- A z (- A z)){\^{}{(- A z이다
- 의 단일한 발생을 포함하는 단어의 언어 OGF는 z +( 1- A ) ( ^{n}}{z이다
참조
- Flajolet and Sedgewick (2010). Analytic Combinatorics. New York: Cambridge University Press. pp. 60-61. ISBN 978-0-521-89806-5.
- Rosen, Ned. "Expected waiting times for strings of coin flips" (PDF). Retrieved 3 December 2017.
- Odlyzko, A. M.; Guibas, L. J. (1981). "String overlaps, pattern matching, and nontransitive games". Journal of Combinatorial Theory. Series A 30 (2): 183–208. doi:10.1016/0097-3165(81)90005-4.