스무딩

Smoothing

통계학화상 처리에서 데이터 세트를 매끄럽게 하는 것은 노이즈 또는 기타 미세 구조/급속 현상을 배제하면서 데이터 의 중요한 패턴을 포착하려고 시도하는 근사 함수를 만드는 것이다.평활화에서는 신호의 데이터점을 수정하여 인접한 점보다 높은 개별점(노이즈에 의한 것으로 추정)을 줄이고, 인접한 점보다 낮은 점을 증가시켜 보다 부드러운 신호로 한다.스무딩은 (1) 스무딩의 가정이 합리적이라면 데이터에서 더 많은 정보를 추출할 수 있고 (2) 유연하면서도 견고한 [1]분석을 제공할 수 있는 두 가지 중요한 방법으로 사용할 수 있다.스무딩에는 다양한 알고리즘이 사용됩니다.

스무딩은 다음과 같은 방법으로 관련되고 부분적으로 중복되는 곡선 피팅 개념과 구별할 수 있습니다.

  • 곡선 적합은 종종 결과에 대한 명시적 함수 형식을 사용하는 반면, 평활화의 직접적인 결과는 함수 형식이 있는 경우 나중에 사용되지 않는 "연결된" 값이다.
  • 평활화의 목적은 데이터 값의 근접 일치에 거의 주의를 기울이지 않고 비교적 느린 값의 변화에 대한 일반적인 아이디어를 제공하는 것이며, 곡선 피팅은 가능한 근접 일치에 초점을 맞춘다.
  • 평활 방법에는 종종 평활의 정도를 제어하는 데 사용되는 조정 모수가 연관되어 있습니다.곡선 피팅은 '최상의' 적합을 얻기 위해 기능의 매개변수를 조정합니다.

선형 평활기

평활값이 관측값의 선형 변환으로 기록될 수 있는 경우 평활 연산을 선형 평활기라고 하며 변환을 나타내는 행렬을 평활기 행렬 또는 해트 [citation needed]행렬이라고 합니다.

이러한 행렬 변환을 적용하는 연산을 컨볼루션이라고 합니다.따라서 행렬은 컨볼루션 매트릭스 또는 컨볼루션 커널이라고도 불립니다.(다차원 이미지가 아닌) 단순한 일련의 데이터 포인트의 경우, 컨볼루션 커널은 1차원 벡터입니다.

알고리즘

가장 일반적인 알고리즘 중 하나는 반복적인 통계 조사에서 중요한 추세를 포착하기 위해 종종 사용되는 "이동 평균"이다.이미지 처리컴퓨터 비전에서는 스케일 공간 표현에 스무딩 아이디어가 사용됩니다.가장 간단한 평활 알고리즘은 "직사각형" 또는 "무가중 슬라이딩 평균 평활"입니다.이 방법은 신호의 각 점을 "m" 인접 점의 평균으로 대체합니다. 여기서 "m"은 "평활폭"이라고 하는 양의 정수입니다.보통 m은 홀수입니다.삼각 평활은 가중 평활 [2]함수를 구현한다는 점을 제외하면 직사각형 평활과 같습니다.

일부 특정 스무딩 및 필터 유형 및 각각의 용도는 다음과 같습니다.

알고리즘. 개요와 용도 장점 단점
적층 평활 범주형 데이터를 평활하는 데 사용됩니다.
버터워스 필터 체비셰프 Type I/Type II 필터 또는 타원 필터보다 느린 롤오프
  • 통과 대역에서 체비셰프 유형 I/타입 II 및 타원 필터보다 더 선형적인 위상 응답을 달성할 수 있습니다.
  • 통과 대역에서 가능한 한 평평한 주파수 응답을 갖도록 설계되어 있습니다.
  • 특정 스톱밴드 사양을 실장하려면 높은 순서가 필요합니다.
체비셰프 필터 Butterworth 필터보다 더 가파른 롤오프와 더 많은 통과 대역 리플(타입 I) 또는 정지 대역 리플(타입 II)이 있습니다.
  • 필터 범위에 걸쳐 이상화된 필터 특성과 실제 필터 특성 간의 오차를 최소화합니다.
디지털 필터 샘플링이산 시간 신호에서 해당 신호의 특정 측면을 줄이거나 강화하기 위해 사용됩니다.
타원 필터
지수 평활
  • 시계열 데이터의 불규칙성(랜덤 변동)을 줄이기 위해 사용되며, 따라서 시계열의 실제 기본 동작을 보다 명확하게 볼 수 있습니다.
  • 또한 시계열의 미래 값을 예측하는 효과적인 수단을 제공합니다(예측).[3]
칼만 필터
  • 시간 경과에 따라 관측된 일련의 측정을 사용합니다. 각 시간대에 대한 변수에 대한 공동 확률 분포를 추정하여 통계 잡음 및 기타 부정확성을 포함합니다.
생성되는 미지의 변수의 추정치는 단일 측정치에 기반한 변수보다 더 정확한 경향이 있습니다.
커널 스무더
  • 인접 관측 데이터의 가중 평균으로 실제 값 함수를 추정하는 데 사용됩니다.
  • 예를 들어 데이터 시각화를 위해 예측 변수의 치수가 낮을 때(p < 3) 가장 적합하다.
추정된 기능은 매끄럽고, 매끄러운 수준은 단일 파라미터로 설정됩니다.
콜모고로프-주르벤코 필터
  • 견고하고 거의 최적
  • 부족한 데이터 환경, 특히 부족한 데이터가 공간적 희소성으로 인해 발생하는 문제를 일으킬 수 있는 다차원 시공간에서 뛰어난 성능을 발휘합니다.
  • 2개의 파라미터는 각각 다른 분야의 전문가에 의해 쉽게 채택될 수 있도록 명확한 해석을 가지고 있다.
  • 시계열, 종방향 및 공간 데이터를 위한 소프트웨어 구현은 다양한 영역에서 KZ 필터와 그 확장을 쉽게 사용할 수 있도록 인기 있는 통계 패키지 R로 개발되었다.
라플라시안 평활 폴리곤 [4][5]메쉬를 매끄럽게 하는 알고리즘입니다.
로컬 회귀는 "loess" 또는 "lowess"라고도 합니다. 이동 평균과 다항식 회귀일반화
  • 데이터 변동의 결정론적 부분을 설명하는 함수를 구축하기 위해 데이터의 국소화된 하위 집합에 간단한 모델을 적합시킨다.
  • 이 방법의 주요 장점 중 하나는 데이터 분석가가 데이터에 모델을 적합시키기 위해 모든 형태의 전역 함수를 지정할 필요가 없다는 것이다.
  • 계산의 향상.LOESS는 계산 부하가 높기 때문에 최소 제곱법이 개발되던 시대에는 실질적으로 사용이 불가능했을 것입니다.
로우패스 필터
이동평균
  • 전체 데이터 집합의 서로 다른 하위 집합에 대한 일련의 평균을 생성하여 데이터 점을 분석하기 위한 계산입니다.
  • 시계열의 장기 추세를 명확하게 [3]하는 데 사용되는 평활 기술.
  • 이동 평균의 첫 번째 요소는 수열의 초기 고정 부분 집합의 평균을 취함으로써 얻어진다.
  • 단기 변동을 완화하고 장기적인 추세 또는 주기를 강조하기 위해 시계열 데이터와 함께 일반적으로 사용됩니다.
  • 시계열의 계절 또는 주기적 구성요소를 허용하도록 조정되었습니다.
라메르-더글라스-퍼커 알고리즘 세그먼트로 구성된 원곡선을 점이 적은 유사한 원곡선으로 소멸시킵니다.
Savitzky-Golay 스무딩 필터
  • 데이터의 세그먼트에 대한 다항식의 최소 적합성에 근거해
스플라인 평활
스트레치 그리드 방식
  • 탄성 격자 거동에 관련될 수 있는 다양한 수학 및 공학적 문제의 대략적인 해결책을 찾기 위한 수치 기술
  • 기상학자들은 일기예보를 위해 스트레칭 그리드 방법을 사용한다
  • 엔지니어는 텐트 및 기타 인장 구조물을 설계하기 위해 스트레칭 그리드 방법을 사용합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Simonoff, Jeffrey S.(1998) 통계학 평활화 방법, 제2판.스프링거 ISBN978-0387947167[페이지 필요]
  2. ^ O'Haver, T. (January 2012). "Smoothing". terpconnect.umd.edu.
  3. ^ a b Easton, V. J.; & McColl, J. H. (1997년)시계열", STEPS 통계 용어집
  4. ^ 를 클릭합니다Herrmann, Leonard R. (1976), "Laplacian-isoparametric grid generation scheme", Journal of the Engineering Mechanics Division, 102 (5): 749–756.
  5. ^ Sorkine, O., Cohen-Or, D., Lipman, Y., Alexa, M., Rössl, C., Seidel, H.-P. (2004). "Laplacian Surface Editing". Proceedings of the 2004 Eurographics/ACM SIGGRAPH Symposium on Geometry Processing. SGP '04. Nice, France: ACM. pp. 175–184. doi:10.1145/1057432.1057456. ISBN 3-905673-13-4.{{cite book}}: CS1 maint: 여러 이름: 작성자 목록(링크)

추가 정보

  • Hastie, TJ 및 Tibshirani, R.J.(1990), Generalized Addition Models, New York: Chapman and Hall.