단시간 푸리에 변환

Short-time Fourier transform

짧은 시간 푸리에 변환(STFT)은 시간이 지남에 따라 신호의 로컬 섹션의 사인파 주파수 및 위상 함량을 결정하는 데 사용되는 푸리에 관련 변환이다.[1] 실제로 STFT를 계산하는 절차는 긴 시간 신호를 동일한 길이의 더 짧은 세그먼트로 나눈 다음 더 짧은 각 세그먼트에서 푸리에 변환을 별도로 계산하는 것이다. 이는 각 짧은 세그먼트의 푸리에 스펙트럼을 드러낸다. 그런 다음 일반적으로 스펙트럼을 시간의 함수로 표시하며, 이는 소프트웨어 정의 라디오(SDR) 기반 스펙트럼 표시에서 일반적으로 사용되는 것과 같이 스펙트럼 그림 또는 폭포도라고 알려져 있다. SDR의 전체 범위를 포괄하는 전체 대역폭 디스플레이는 일반적으로 데스크톱 컴퓨터에서 2^24 포인트의 FFT(Fast Fourier Transforms)를 사용한다.

오디오 신호의 충격 시간을 결정하는 데 사용되는 짧은 시간 푸리에 변환의 예

전진 STFT

연속 시간 STFT

간단히 말해서 연속 시간의 경우 변환할 함수에 단기간 0이 아닌 윈도우 함수를 곱한다. 결과 신호의 푸리에 변환(일차원 함수)은 윈도우가 시간 축을 따라 미끄러질 때 취해져 신호의 2차원 표현이 된다. 수학적으로 이것은 다음과 같이 쓰여 있다.

여기서 () w 기능이며, 으로 0을 중심으로 한 Hann 창 또는 가우스 창))은 변환할 신호( 이다 주파수 }}). X(, , ,) X은 본질적으로 ( ) -) 의 푸리에 변환으로 시간과 주파수에 따른 신호의 위상과 크기를 나타내는 복잡한 함수다. STFT의 위상 결과의 점프 불연속성을 억제하기 위해 종종 시간 { 과 주파수 축인 {\}을(를 따라 또는 둘 다 위상 언로딩이 사용된다. 시간지수 은 보통 "느린" 시간으로 간주되며 보통 t 만큼 고해상도로 표현되지 않는다이제는 STFT의 기능이 창 기능에 의해 복수의 푸리에 변환의 함수가 되므로 STFT도 윈도우 푸리에 변환 또는 시간 의존적인 푸리에 변환이라고 부른다.등식

이산 시간 STFT

이산형 시간 사례에서 변환할 데이터는 청크나 프레임(대개 서로 겹쳐지며, 경계에서 아티팩트를 줄일 수 있다)으로 나눌 수 있다. 각 청크는 푸리에 변환되며, 복잡한 결과는 매트릭스에 추가되며, 매트릭스는 각 시점과 빈도에 대한 규모와 위상을 기록한다. 이는 다음과 같이 표현할 수 있다.

마찬가지로, 신호 x[n] 및 창 w[n]. 이 경우 m은 이산형이고 Ω은 연속형이지만, 대부분의 일반적인 애플리케이션에서 STFT는 빠른 푸리에 변환을 사용하여 컴퓨터에서 수행되므로 두 변수 모두 이산형 및 정량형이다.

STFT의 크기 제곱은 다음 함수의 전력 스펙트럼 밀도를 스펙트럼 분석으로 나타낸다.

겹치는 창을 사용하는 푸리에 관련 변환이기도 한 수정된 이산 코사인 변환(MDCT)도 참조하십시오.

슬라이딩 DFT

소수의 Ω만 원하는 경우 또는 윈도우의 모든 변속 m에 대해 STFT를 평가하려면 슬라이딩 DFT 알고리즘을 사용하여 STFT를 더 효율적으로 평가할 수 있다.[2]

역 STFT

STFT는 변환할 수 없으며, 즉, Inverse STFT에 의해 변환으로부터 원래 신호를 복구할 수 있다. STFT를 반전시키는 가장 널리 수용되는 방법은 중복 추가(OLA) 방법을 사용하는 것으로, STFT 복합 스펙트럼을 수정할 수도 있다. 이를 통해 중첩수정 방법 추가라고 하는 다용도 신호 처리 방법을 사용할 수 있다.[3]

연속 시간 STFT

w(t) 윈도우 기능의 폭과 정의를 고려할 때, 우리는 처음에 윈도우 기능의 면적을 스케일링하여 윈도우 기능의 크기를 조정할 것을 요구한다.

그것은 쉽게 따라온다.

그리고

연속 푸리에 변환은

위에서 x(t) 대체:

통합 순서 스와핑:

따라서 푸리에 변환은 x(t)의 모든 STFT의 위상 일관성 있는 합으로 볼 수 있다. 역 푸리에 변환은

그런 다음 x(t)는 X(τ,Ω)에서 다음과 같이 복구할 수 있다.

또는

그것은 x(t)의 "회색" 또는 "파형"이 x(t)의 창문 위에 있는 것과 비교해서 볼 수 있다.

τ 고정 X( for,Ω)의 역 푸리에 변환

대체 정의에서 역 변환은 다음과 같다.

마스크 함수 ) 은(는) 항상 다음 속성을 갖는다.

(a)짝: ( t)= (- )
(b) (( t)= ( 0) (가 {\ 2}보다 크면 t_1}, (t ) {\displaystystyle 2보다 크거나
(c) ( ) 이(가) 크면 0과 유사함.

해결 문제

STFT의 함정 중 하나는 해상도가 고정되어 있다는 것이다. 윈도우 설정 기능의 폭은 신호가 어떻게 표현되는지와 관련이 있다. 이 폭은 양호한 주파수 분해능(함께 가까운 주파수 성분을 분리할 수 있음) 또는 양호한 시간 분해능(주파수가 변화하는 시간)이 있는지 여부를 결정한다. 넓은 창은 주파수 분해능은 좋아지지만 시간 분해능은 떨어진다. 창이 좁아지면 시간 분해능은 좋지만 주파수 분해능은 떨어진다. 이를 각각 협대역, 광대역 변환이라고 한다.

STFT 분해능 비교. 좌뇌는 시간 분해능이 좋고, 우뇌는 주파수 분해능이 좋다.

이는 파장 변환멀티솔루션 분석의 생성 이유 중 하나로, 고주파수 사건에 대한 양호한 시간 분해능과 저주파수 사건에 대한 양호한 주파수 분해능을 제공할 수 있으며, 이 조합은 많은 실제 신호에 가장 적합하다.

이 속성은 하이젠베르크불확실성 원리와 관련이 있지만 직접적으로는 관련이 없다 – 논의는 가보르 한계를 참조한다. 표준 편차의 산물은 시간과 빈도가 제한되어 있다. 가우스파가 푸리에 불확실성 원리를 최소화하기 때문에 불확실성 원리의 경계(둘 중 가장 좋은 동시 분해능)는 가우스 윈도우 기능(또는 콜 마스크 기능)으로 도달한다. 이것을 가보르 변환(그리고 멀티솔루션에 대한 수정과 함께 Morlet wavelet 변환이 됨)이라고 한다.

STFT는 아래 예시와 같이 창 크기를 변화시켜 계산할 수 있는 2차원 영역(시간과 빈도)으로서 다양한 창 크기에 대한 STFT를 고려할 수 있다. 그러나 이는 더 이상 엄격한 시간 빈도 표현이 아니며 커널이 전체 신호에 걸쳐 일정하지 않다.

원래 기능이 다음과 같은 경우:

Window B.png

우리는 간단한 예를 들 수 있다.

w(t) = B보다 작거나 같은 t의 경우 1

w(t) = 다른 경우 0

B = 창

이제 단시간 푸리에 변환의 원래 기능은 다음과 같이 변경할 수 있다.


다른 예:

다음 샘플 신호 ( ) 을(를) 사용하여 순차적으로 결합된 4개의 사인파 파형으로 구성된다. 각 파형은 4개의 주파수(10, 25, 50, 100Hz) 중 하나로만 구성된다. ( ) 의 정의는 다음과 같다.

그런 다음 400Hz로 샘플링된다. 다음과 같은 분광기가 제작되었다.

25ms 창
125ms 창
375ms 창
1000ms 창

25ms 창을 통해 신호가 바뀌는 정확한 시간을 파악할 수 있지만 정확한 주파수는 식별하기 어렵다. 저울의 다른 쪽 끝에서 1000ms 창은 주파수를 정확하게 볼 수 있게 하지만 주파수 사이의 시간은 흐릿하게 된다.

기타 예:

Gausian B.png

보통 (- t ) 를 가우스 함수 또는 가보르 함수로 부르고, 지금 당장은 단시간 푸리에 변환을 가보르 변환이라고 부른다.

설명

또한 샘플링 및 나이키스트 주파수를 참조하여 설명할 수 있다.

샘플링 속도 f에서s 임의의 실제 값 신호로부터 N 샘플의 윈도우를 취한다. 푸리에 변환을 취하면 N 복합 계수가 생성된다. 이러한 계수 중 오직 절반만이 유용하다(마지막 N/2는 역순으로 첫 번째 N/2의 복잡한 결합이며, 이는 실제 가치 있는 신호임).

이러한 N/2 계수는 0 ~ fs/2(나이키스트) 주파수를 나타내며, 2개의 연속 계수는 fs/N Hz로 간격을 두고 있다.

창의 주파수 분해능을 높이려면 계수의 주파수 간격을 줄여야 한다. 변수는 두 개뿐이지만 fs(그리고 N을 일정하게 유지)를 줄이면 창 크기가 증가하는데, 이는 단위 시간당 샘플 수가 줄어들기 때문이다. 또 다른 대안은 N을 늘리는 것이지만, 이것은 다시 창 크기를 증가시킨다. 따라서 주파수 분해능을 높이려는 시도는 윈도우 크기를 더 크게 하고 따라서 시간 분해능의 감소를 야기하며, 그 반대의 경우도 마찬가지다.

레일리 주파수

나이키스트 주파수는 의미 있게 분석할 수 있는 최대 주파수의 한계이므로, 레일리 주파수도 최소 주파수에 대한 제한이다.

Rayleigh 주파수는 유한 지속 시간 창에 의해 해결될 수 있는 최소 주파수다.[4][5]

τ초 길이의 타임 윈도우가 주어질 때, 해결할 수 있는 최소 주파수는 1/τ Hz이다.

레일리 주파수는 제한된 기록 길이의 신호에 대한 다른 고조파 분석 방법뿐만 아니라 짧은 시간 푸리에 변환(STFT)을 적용할 때 중요한 고려사항이다.[6][7]

적용

시간 경과에 따른 오디오 신호 분석에 사용되는 STFT

STFT는 물론 표준 푸리에 변환 및 기타 도구들이 음악을 분석하는 데 자주 사용된다. 예를 들어, 분광그램은 수평축에 주파수를 표시할 수 있으며, 가장 낮은 주파수는 왼쪽에, 가장 높은 주파수는 오른쪽에 표시할 수 있다. 각 막대의 높이(색상으로 증가)는 해당 대역 내에서 주파수의 진폭을 나타낸다. 깊이 치수는 시간을 나타내며, 여기서 각각의 새로운 막대는 별개의 변형이었다. 오디오 엔지니어는 예를 들어 특정 소음의 주파수(특히 주파수 분해능이 더 큰 경우)를 찾거나 신호가 녹음된 공간에서 더 많거나 덜 공명할 수 있는 주파수를 찾기 위해 이러한 종류의 비주얼을 사용한다. 이 정보는 평준화 또는 기타 오디오 효과 튜닝에 사용할 수 있다.

실행

원함수

이산형 형태로 변환:

라고 가정해 보자.

그러면 우리는 원래 기능을 에 쓸 수 있다.

직접 구현

제약

a. 나이키스트 기준(별칭 효과 회피):

< { 여기서 ( )의 대역폭이다

FFT 기반 방법

제약

a. t Δ = N 여기서 은 정수임

b. +

c. 나이키스트 기준(별칭 효과 회피):

< 1 {\ ( )( - )의이다.

재귀법

제약

a. t Δ = N 여기서 은 정수임

b. +

c. 나이키스트 기준(별칭 효과 회피):

< 1 {\ ( )( - )의이다.

d. 직사각형-STFT 구현 전용

직사각형 윈도우가 제약을 가함

대체에서 얻을 수 있는 이점:

n에 대한 변수 n-1의 변경:

FFT를 으로 X( t Δ ) X _를 계산하십시오.

어디에

t, )를 계산하기 위해 재귀 공식 적용

처프 Z 변환

제약

그렇게

구현 비교

방법 복잡성
직접 구현
FFT 기반
재귀적
처프 Z 변환

참고 항목

기타 시간 빈도 변환:

참조

  1. ^ Sejdić E.; Djurović I.; Jiang J. (2009). "Time-frequency feature representation using energy concentration: An overview of recent advances". Digital Signal Processing. 19 (1): 153–183. doi:10.1016/j.dsp.2007.12.004.
  2. ^ E. 제이콥슨과 R. Lyons, The Sliding DFT, Signal Processing Magazine vol. 20호(2003년 3월) 발행물 2, 페이지 74–80.
  3. ^ Jont B. Allen (June 1977). "Short Time Spectral Analysis, Synthesis, and Modification by Discrete Fourier Transform". IEEE Transactions on Acoustics, Speech, and Signal Processing. ASSP-25 (3): 235–238. doi:10.1109/TASSP.1977.1162950.
  4. ^ https://physics.ucsd.edu/neurophysics/publications/Cold%20Spring%20Harb%20Protoc-2014-Kleinfeld-pdb.top081075.pdf
  5. ^ "What does "padding not sufficient for requested frequency resolution" mean? – FieldTrip toolbox".
  6. ^ Zeitler M, Fries P, Gielen S (2008). "Biased competition through variations in amplitude of gamma-oscillations". J Comput Neurosci. 25 (1): 89–107. doi:10.1007/s10827-007-0066-2. PMC 2441488. PMID 18293071.
  7. ^ Wingerden, Marijn van; Vinck, Martin; Lankelma, Jan; Pennartz, Cyriel M. A. (2010-05-19). "Theta-Band Phase Locking of Orbitofrontal Neurons during Reward Expectancy". Journal of Neuroscience. 30 (20): 7078–7087. doi:10.1523/JNEUROSCI.3860-09.2010. ISSN 0270-6474. PMC 6632657. PMID 20484650.

외부 링크