단면 데이터

Cross-sectional data

통계계량학에서 단면 데이터 또는 연구 집단의 단면 데이터는 한 시점 또는 기간에 여러 과목(개인, 기업, 국가 또는 지역 등)을 관찰하여 수집한 데이터의 한 유형이다. 또한 분석은 시간의 차이와 무관할 수 있다. 횡단면 데이터의 분석은 일반적으로 선택된 과목들 간의 차이를 비교하는 것으로 구성된다.

예를 들어, 한 모집단의 현재 비만 수준을 측정하려면 해당 모집단(또는 해당 모집단의 단면이라고도 함)에서 1,000명의 표본을 무작위로 추출하여 체중과 키를 측정하고 해당 표본의 몇 퍼센트가 비만으로 분류되는지 계산할 수 있다. 이 단면 표본은 우리에게 그 한 시점에 그 모집단의 스냅숏을 제공한다. 비만이 증가하거나 감소하는 경우 단면 표본 하나를 기초로 하여 알 수 없다는 점에 유의하십시오; 우리는 현재 비율만 설명할 수 있다.

단면 데이터는 시계열 데이터와 다르며, 이 데이터에서 생산 골재 도면요소와 동일한 소규모 척도가 다양한 시점에서 관찰된다. 또 다른 유형의 데이터인 패널 데이터(또는 종단 데이터)는 단면 및 시계열 데이터 아이디어를 결합하고 대상(firms, 개인 등)이 시계열에서 어떻게 변화하는지 살펴본다. 패널 데이터는 동일한 주제에 대한 관측치를 서로 다른 시간에 처리하는 반면, 다른 시간에 다른 피험자를 관찰하기 때문에 시간에 따라 합동 단면 데이터와는 다르다. 패널 분석은 패널 데이터를 사용하여 시간 경과에 따른 변수의 변화와 선택된 주제들 간의 변수 차이를 조사한다.

롤링 단면에서는 표본에 있는 개인의 존재와 표본에 포함된 시간이 모두 랜덤하게 결정된다. 예를 들어, 정치적 여론조사는 1000명의 개인들을 인터뷰하기로 결정할 수 있다. 먼저 전체 인구 중에서 무작위로 이들 개인을 선발한다. 그런 다음 각 개인에게 임의의 날짜를 할당한다. 이것은 개인이 인터뷰하게 되는 임의의 날짜로, 따라서 설문조사에 포함된다.[1]

단면 데이터는 단면 데이터의 회귀 분석인 단면 회귀 분석에 사용할 수 있다. 예를 들어, 고정된 달의 다양한 개인의 소비 지출은 소득, 누적된 재산 수준 및 다양한 인구통계학적 특징에 따라 후퇴하여 이러한 특징의 차이가 소비자의 행동의 차이로 어떻게 이어지는지를 알아낼 수 있다.

참조

  1. ^ Brady, Henry E.; Johnston, Richard (2008). "The Rolling Cross Section and Causal Distribution" (PDF). University of Michigan Press. Retrieved July 13, 2008. Cite 저널은 필요로 한다. journal= (도움말)

추가 읽기

  • Gujarati, Damodar N.; Porter, Dawn C. (2009). "The Nature and Sources of Data for Economic Analysis". Basic Econometrics (Fifth international ed.). New York: McGraw-Hill. pp. 22–28. ISBN 978-007-127625-2.