데이터수

Count data

통계학에서 계수 데이터는 계수 가능한 수량, 계수 숫자만 취할 수 있는 데이터, 이 아닌 정수 값 {0, 1, 2, 3, ...}, 그리고 이러한 정수가 순위가 아닌 계수에서 발생하는 위치를 설명하는 통계 데이터 유형입니다.카운트 데이터의 통계적 처리는 관측치가 보통 0과 1로 표현되는 두 개의 값만 취할 수 있는 이진 데이터 및 정수로 구성될 수 있지만 개별 값이 임의 척도에 속하고 상대 순위만 중요한 순서형 데이터와 구별된다.

변수 수

카운트 데이터의 개별 부분을 카운트 변수라고 부르는 경우가 많다.이러한 변수가 랜덤 변수로 처리되면 포아송, 이항의 이항 분포가 일반적으로 해당 분포를 나타내기 위해 사용됩니다.

그래픽 검사

계수 데이터의 그래픽 검사는 표본 분산을 안정화하는 특성을 가지도록 선택된 데이터 변환을 사용하여 도움이 될 수 있습니다.특히, 제곱근 변환은 데이터가 포아송 분포로 근사할 수 있는 경우(다른 변환의 특성이 약간 개선되었지만) 사용할 수 있는 경우, 반면 역 사인 변환은 이항 분포가 선호될 때 사용할 수 있습니다.

카운트 데이터를 다른 변수와 관련짓기

여기서 카운트 변수는 종속 변수로 취급됩니다.최소 제곱 및 분산 분석같은 통계 방법은 연속 종속 변수를 다루기 위해 설계되었습니다.이들은 제곱근 변환과 같은 데이터 변환을 사용하여 카운트 데이터를 처리하도록 조정할 수 있지만, 이러한 방법에는 몇 가지 단점이 있습니다. 기껏해야 근사치이며 해석하기 어려운 매개변수를 추정할 수 있습니다.

포아송 분포는 카운트 데이터의 일부 분석의 기준이 될 수 있으며 이 경우 포아송 회귀 분석을 사용할 수 있습니다.이것은 특히 카운트 값의 범위가 제한되거나 제한될 때 포아송 모델의 가정이 위반되는 이항 분포(이항 회귀, 로지스틱 회귀) 또는 음이항 분포를 사용할 수 있는 특정 형태의 모형을 포함하는 일반화 선형 모델의 특별한 경우입니다.과잉 분산이 존재하는 경우.

「 」를 참조해 주세요.

추가 정보

  • Cameron, A. C.; Trivedi, P. K. (2013). Regression Analysis of Count Data Book (Second ed.). Cambridge University Press. ISBN 978-1-107-66727-3.
  • Hilbe, Joseph M. (2011). Negative Binomial Regression (Second ed.). Cambridge University Press. ISBN 978-0-521-19815-8.
  • Winkelmann, Rainer (2008). Econometric Analysis of Count Data (Fifth ed.). Springer. doi:10.1007/978-3-540-78389-3. ISBN 978-3-540-77648-2.