기능 상자 그림

Functional boxplot

통계 그래픽에서 기능 상자 그림은 기능 [1][2]데이터를 시각화하기 위해 제안된 유용한 탐색 도구입니다.일반적인 상자 그림과 유사하게 기능 상자 그림에 대한 기술 통계량은 50% 중앙 영역의 외피, 중위수 곡선 및 최대 비외피 외피입니다.

기능 상자 그림을 구성하려면 데이터 순서가 첫 번째 단계입니다.기능 데이터 분석에서 각 관측치는 실제 함수이며, 따라서 기능 상자 그림에서는 데이터가 단순히 가장 작은 표본 값에서 가장 큰 표본 값으로 정렬되는 기존의 상자 그림과는 다릅니다. 함수 상자 그림에서는 곡선 또는 이미지와 같은 기능 데이터가 밴드 깊이 또는 수정된 밴드 [3]깊이의 개념에 의해 정렬됩니다.중앙에서 바깥쪽으로 함수 데이터를 정렬할 수 있으므로 함수 분위수와 관측치의 중심성 또는 외곽성을 정의하는 측도가 도입됩니다.기능 데이터 순위가 있는 기능 상자 그림은 고전 상자 그림의 자연스러운 확장입니다.

건설

기존 상자 그림에서 상자 자체는 데이터의 중간 50%를 나타냅니다.함수 상자 그림의 데이터 순서가 중앙에서 바깥쪽으로 이동하기 때문에 50% 중앙 영역은 가장 깊은 관측치의 50% 또는 가장 중심 관측치로 구분된 밴드로 정의됩니다.50% 중앙 영역의 경계는 고전 상자 그림에서 상자를 나타내는 외피로 정의됩니다.따라서 이 50% 중심 영역은 "사분위간 범위"(IQR)와 유사하며 곡선의 50% 중심 확산에 대한 유용한 표시를 제공합니다.50% 중앙 영역은 특이치 또는 극단값의 영향을 받지 않고 곡선의 산포에 대한 치우침이 적은 시각화를 제공하기 때문에 이는 해석에 강력한 범위이다.상자의 관측치는 중앙값 또는 가장 중심적인 관측치를 나타내며, 이는 중앙값을 측정하는 강력한 통계량이기도 합니다.

상자 그림의 "수염"은 상자에서 연장된 그래프의 수직선으로 특이치를 제외한 데이터 집합의 최대 외피를 나타냅니다.

이상치 검출

기능 상자 그림에서 50% 중앙 영역 경험적 규칙의 1.5배(기존 상자 그림에 대한 1.5 IQR 경험적 규칙과 유사)로 특이치를 탐지할 수 있습니다.울타리는 50% 중앙 영역의 외피를 50% 중앙 영역의 1.5배 높이만큼 부풀려 얻습니다.울타리 밖의 모든 관측치는 잠재적 특이치로 플래그가 지정됩니다.각 관측치가 단순히 점일 경우 기능 상자 그림은 고전 상자 그림으로 퇴보하며 점 단위 상자 그림과는 다릅니다.

향상된 기능 상자 그림

중앙 영역의 개념을 도입함으로써 기능 상자 그림을 25% 및 75% 중앙 영역이 제공되는 향상된 기능 상자 그림으로 일반화할 수 있습니다.

표면 상자 그림

시공간 데이터는 각 공간 위치에서 시간 곡선으로 볼 수도 있고, 각 시점의 공간 표면으로 볼 수도 있다.후자의 경우 볼륨 기반 표면 밴드 깊이를 사용하여 샘플 표면을 정렬할 수 있으며, 기능 상자 그림과 유사한 특성을 가진 3차원 표면 상자 그림이 됩니다.마찬가지로 울타리는 중앙 50%의 1.5배 규칙에 의해 확보됩니다.울타리 밖의 모든 표면은 더 나은 후보로 지정됩니다.표면 상자 그림은 기능 상자 그림을 R로 자연스럽게3 확장한 것입니다.

통계코드

기능 상자 그림에 대한 명령 fbplot은 fda R [4]패키지에 있으며 MATLAB 코드도 사용할 수 있습니다.

Python 라이브러리 statsmodel은 fboxplot [5]함수를 통해 기능적인 상자 그림을 사용할 수 있도록 합니다.Scikit-FDA 패키지의[6] 박스 플롯 기능을 사용할 수도 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Hyndman, Rob J.; Shang, Han Lin (2010). "Rainbow Plots, Bagplots, and Boxplots for Functional Data" (PDF). Journal of Computational and Graphical Statistics. 19 (1): 29–45. doi:10.1198/jcgs.2009.08158.
  2. ^ Sun, Y.; Genton, M. G. (2011). "Functional boxplots". Journal of Computational and Graphical Statistics. 20 (2): 316–334. doi:10.1198/jcgs.2011.09224.
  3. ^ López-Pintado, S.; Romo, J. (2009). "On the Concept of Depth for Functional Data". Journal of the American Statistical Association. 104 (486): 718–734. CiteSeerX 10.1.1.596.7755. doi:10.1198/jasa.2009.0108.
  4. ^ https://cran.r-project.org/web/packages/fda/fda.pdf fbplot 도움말 파일.
  5. ^ https://www.statsmodels.org/stable/generated/statsmodels.graphics.functional.fboxplot.html statsmodels 매뉴얼
  6. ^ https://fda.readthedocs.io/en/latest/auto_examples/plot_boxplot.html skikit-fda 함수 상자 그림 예제