자기 상관(단어)

Autocorrelation (words)

수학의 한 분야인 결합학에서 단어의 자기 상관은 이 단어의 기간 집합이다.더 정확히 말하면, 그것은 단어의 끝이 단어의 시작과 얼마나 닮았는지를 나타내는 일련의 값이다.이 값은 예를 들어 임의 문자열에서 이 단어의 첫 발생 평균값을 계산하는 데 사용할 수 있다.

정의

이 글에서 A알파벳이며, = n{\ w 길이 nA에 대한 단어다. 의 자기 상관관계는 w () 자체와의 상관관계로 정의할 수 있다.그러나, 우리는 이 개념을 아래에 다시 정의한다.

자기 상관 벡터

The autocorrelation vector of is , with being 1 if the prefix of length equals the suffix of length , and with 그렇지 않으면 0이 된다., c 는 w + 1= 1 - 을(를) 표시하는지 여부를 나타낸다

예를 들어 의 자기 상관 벡터는 분명히 i이(가) 0, 1 또는 2인 경우 n- i 접두사가 n - 의 접미사와 같기 때문에(1)이다 의 자기 상관 벡터는 엄격한 접미사와 동일한 접두사가 없기 ,0 ){\1이다.마지막으로, a 의 자기 상관 벡터는 다음 표와 같이 100011이다.

a a b b a a
a a b b a a 1
a a b b a a 0
a a b b a a 0
a a b b a a 0
a a b b a a 1
a a b b a a 1

은(는) 길이 n 의 접두사와 접미사가 모두 과(와 같기 때문에 항상 1과 같다는 점에 유의하십시오 로, -1 {\은 첫 번째와 같은 경우에만 1이다.


자기 상관 다항식

The autocorrelation polynomial of is defined as . It is a polynomial of degree at most .

For example, the autocorrelation polynomial of is and the autocorrelation polynomial of is . Finally, the autocorrelation polynomial of is 1+z

속성

이제 자기 상관 다항식을 사용하여 계산할 수 있는 몇 가지 속성을 나타낸다.

임의 문자열에서 단어 처음 발생

의 각 문자를 임의로 무한 s {\ 을(를 선택한다고 가정합시다. A {\ A은(는A {\ A}의문자 E {\} 에서 m 이(가) 처음 발생할 것으로 예상그러면 이(가) A ( A) A { A 같다즉, 접두사 및 접미사인 각 하위 단어 이( 나중에 첫 번째 발생 평균 값을 시킨다.여기서 v 은(는) v의 길이 입니다

For example, over the binary alphabet , the first occurrence of is at position while the average first occurrence of is at position 직관적으로 의 첫 발생이 첫 발생보다 늦다는은 다음 두 가지 방법으로 설명할 수 있다.

  • 각 위치 에 대해 가) 에서 처음 발생하기 위한 요구 사항은 무엇인지 고려할 수 있다
    • 의 첫 번째 발생은 두 경우 모두 한 가지 방법으로만 위치 1에 있을 수 있다. 가) w w)로 시작하는 경우 w 고려된 값 모두에 1 4 1}{가 있다.
    • 3의 접두사가 이거나 인 경우 b 의 첫 번째 발생 위치가 2이다. 길이 3의 접두사가 {\인 경우에만 의 첫 번째 위치가 1인 경우 이다.
    • 으로 길이 + 1 접두사 수는 이(가) 처음 하는 위치n {\ n이(가) 보다 작다.이는 평균적으로 첫 번째 이(가) 첫 번째 보다 늦게 도착하는 이유를 설명한다
  • 길이 의 임의 문자열에서 의 평균 발생 횟수가 - A인 점도 고려할 수 있다이 숫자는 자기 상관 다항식과는 무관하다. 의 발생은 다른 방식으로 다른 발생과 겹칠 수 있다.더 정확히 말하면, 자기 상관 벡터의 각 1은 발생이 겹치는 방법에 해당한다. 의 많은 발생 횟수를 중첩을 사용하여 함께 포장할 수 있지만 평균 발생 횟수는 변경되지 않으므로 자기 상관 벡터에 1의 발생 횟수가 많을 때 두 개의 비 겹치지 않는 발생 간 거리가 더 커진다.


일반생성함수

자기 상관 다항식에서는 많은 자연문제의 일반적인 생성 함수(OGF)에 대한 간단한 방정식을 제공할 수 있다.

  • w 을(를) 포함하지 않는 단어의 언어 OGF는 c( z) +( 1- A ) ( ) 이다
  • w 을(를) 포함하는 단어의 언어 OGF는 (- A )(- A z (- A z)){\^{}{(- A z이다
  • 의 단일한 발생을 포함하는 단어의 언어 OGF는 z +( 1- A ) ( ^{n}}{z이다

참조

  • Flajolet and Sedgewick (2010). Analytic Combinatorics. New York: Cambridge University Press. pp. 60-61. ISBN 978-0-521-89806-5.
  • Rosen, Ned. "Expected waiting times for strings of coin flips" (PDF). Retrieved 3 December 2017.
  • Odlyzko, A. M.; Guibas, L. J. (1981). "String overlaps, pattern matching, and nontransitive games". Journal of Combinatorial Theory. Series A 30 (2): 183–208. doi:10.1016/0097-3165(81)90005-4.