이바리산 데이터
Bivariate data이 글은 검증을 위해 인용구가 추가로 필요하다. – · · 책 · · (2009년 6월) (이 템플릿 |
통계에서 이변량 데이터는 두 변수의 각 변수에 대한 데이터로, 한 변수의 각 값이 다른 변수의 값과 쌍을 이룬다.[1] 일반적으로 두 변수 사이의 가능한 연관성을 조사하는 것이 관심사일 것이다.[2] 연관성은 표나 그래픽 표시 또는 추론에 사용될 수 있는 표본 통계를 통해 연구될 수 있다. 연관성을 조사하는 데 사용되는 방법은 변수의 측정 수준에 따라 달라진다.
두 정량적 변수(측정 수준의 중간 또는 비율)의 경우 산점도를 사용할 수 있으며 상관 계수 또는 회귀 모형을 사용하여 연관성을 정량화할 수 있다.[3] 두 가지 정성적 변수(측정 수준의 명목 또는 순서형)의 경우 데이터를 보기 위해 분할표를 사용할 수 있으며 연관성 측도 또는 독립성 검정을 사용할 수 있다.[3]
변수가 양적인 경우, 이 두 변수의 값 쌍은 산점도를 사용하여 평면에서 개별 점으로 표현되는 경우가 많다. 이것은 변수들 사이의 관계를 쉽게 볼 수 있도록 한다.[4] 예를 들어, 산점도의 이변량 데이터는 다리의 보폭 길이와 길이 사이의 관계를 연구하는 데 사용될 수 있다.
종속변수와 독립변수
이변수 데이터의 일부 사례에서는 한 변수가 두 번째 변수에 영향을 미치거나 결정한다고 판단되며, 두 가지 유형의 변수를 구별하기 위해 종속변수와 독립변수의 용어를 사용한다. 위의 예에서 사람의 다리 길이는 독립 변수다. 보폭 길이는 사람의 다리 길이에 따라 결정되므로 종속 변수다. 다리가 길다고 보폭은 늘어나지만 보폭을 늘린다고 해서 다리 길이가 늘어나지는 않는다.[5]
두 변수 사이의 상관관계는 강하거나 약한 상관관계로 결정되며 –1 ~ 1의 척도로 평가된다. 여기서 1은 완벽한 직접 상관관계, –1은 완벽한 역 상관관계, 0은 상관관계가 없다. 긴 다리와 장족의 경우 강한 직접적 상관관계가 있을 것이다.[6]
이변량 데이터 분석
이변량 데이터의 분석에서는 일반적으로 각 변수의 요약 통계량을 비교하거나 회귀 분석을 사용하여 변수 간의 특정 관계의 강도와 방향을 찾는다. 각 변수가 "남성" 또는 "여성" 또는 "좌손" 또는 "우손"과 같은 소수의 값 중 하나만 취할 수 있는 경우, 합동 주파수 분포를 분할표에 표시할 수 있으며, 이는 두 변수 사이의 관계의 강도를 분석할 수 있다.
참조
- ^ "Bivariate". Wolfram Research. Retrieved 2011-08-15.
- ^ Moore, David; McCabe, George (1999). Introduction to the Practice of Statistics (Third ed.). New York: W.H. Freeman and Company. p. 104.
- ^ a b Ott, Lyman; Longnecker, Michael (2010). An Introduction to Statistical Methods and Data Analysis (Sixth ed.). Belmont, CA: Brooks/Cole. pp. 102–112.
- ^ 전국 수학 교사 협의회. "통계 및 확률 문제" http://www.nctm.org/uploadedFiles/Statistics%20and%20Probability%20Problem%202.pdf#search=%22bivariate[permanent dead link] 데이터%22에서 2013년 8월 7일 검색
- ^ 국립 교육 통계 센터. "독립변수와 종속변수란 무엇인가? NCES 키즈존." http://nces.ed.gov/nceskids/help/user_guide/graph/variables.asp에서 2013년 8월 7일 검색
- ^ 피어스, 로드 (2013년 1월 4일) "상관". 수학은 재미있다. http://www.mathsisfun.com/data/correlation.html에서 2013년 8월 7일 검색