데이터수
Count data통계학에서 계수 데이터는 계수 가능한 수량, 계수 숫자만 취할 수 있는 데이터, 음이 아닌 정수 값 {0, 1, 2, 3, ...}, 그리고 이러한 정수가 순위가 아닌 계수에서 발생하는 위치를 설명하는 통계 데이터 유형입니다.카운트 데이터의 통계적 처리는 관측치가 보통 0과 1로 표현되는 두 개의 값만 취할 수 있는 이진 데이터 및 정수로 구성될 수 있지만 개별 값이 임의 척도에 속하고 상대 순위만 중요한 순서형 데이터와 구별된다.
변수 수
카운트 데이터의 개별 부분을 카운트 변수라고 부르는 경우가 많다.이러한 변수가 랜덤 변수로 처리되면 포아송, 이항 및 음의 이항 분포가 일반적으로 해당 분포를 나타내기 위해 사용됩니다.
그래픽 검사
계수 데이터의 그래픽 검사는 표본 분산을 안정화하는 특성을 가지도록 선택된 데이터 변환을 사용하여 도움이 될 수 있습니다.특히, 제곱근 변환은 데이터가 포아송 분포로 근사할 수 있는 경우(다른 변환의 특성이 약간 개선되었지만) 사용할 수 있는 경우, 반면 역 사인 변환은 이항 분포가 선호될 때 사용할 수 있습니다.
카운트 데이터를 다른 변수와 관련짓기
여기서 카운트 변수는 종속 변수로 취급됩니다.최소 제곱 및 분산 분석과 같은 통계 방법은 연속 종속 변수를 다루기 위해 설계되었습니다.이들은 제곱근 변환과 같은 데이터 변환을 사용하여 카운트 데이터를 처리하도록 조정할 수 있지만, 이러한 방법에는 몇 가지 단점이 있습니다. 기껏해야 근사치이며 해석하기 어려운 매개변수를 추정할 수 있습니다.
포아송 분포는 카운트 데이터의 일부 분석의 기준이 될 수 있으며 이 경우 포아송 회귀 분석을 사용할 수 있습니다.이것은 특히 카운트 값의 범위가 제한되거나 제한될 때 포아송 모델의 가정이 위반되는 이항 분포(이항 회귀, 로지스틱 회귀) 또는 음이항 분포를 사용할 수 있는 특정 형태의 모형을 포함하는 일반화 선형 모델의 특별한 경우입니다.과잉 분산이 존재하는 경우.
「 」를 참조해 주세요.
추가 정보
![]() |
- Cameron, A. C.; Trivedi, P. K. (2013). Regression Analysis of Count Data Book (Second ed.). Cambridge University Press. ISBN 978-1-107-66727-3.
- Hilbe, Joseph M. (2011). Negative Binomial Regression (Second ed.). Cambridge University Press. ISBN 978-0-521-19815-8.
- Winkelmann, Rainer (2008). Econometric Analysis of Count Data (Fifth ed.). Springer. doi:10.1007/978-3-540-78389-3. ISBN 978-3-540-77648-2.