통계 정보

Statistics
매우 일반적인 확률 밀도인 정규 분포중심 한계 정리 때문에 유용합니다.
산란도는 기술 통계량에서 Iris데이터 세트를 사용하여 서로 다른 변수 사이의 관측된 관계를 보여주는 데 사용됩니다.

통계는 데이터의 [1][2][3]수집, 구성, 분석, 해석 및 제시와 관련된 분야입니다.과학적, 산업적 또는 사회적 문제에 통계를 적용할 때, 통계적 모집단 또는 연구 대상 통계모델로 시작하는 것이 관례이다.개체군은 "한 나라에 살고 있는 모든 사람들" 또는 "결정체를 구성하는 모든 원자"와 같은 다양한 집단 또는 물체일 수 있습니다.통계는 조사와 [4]실험설계 측면에서 데이터 수집 계획을 포함하여 데이터의 모든 측면을 다룬다.

인구조사 데이터를 수집할 수 없는 경우, 통계학자들은 특정 실험 설계와 조사 표본을 개발하여 데이터를 수집합니다.대표 표본 추출은 추론과 결론이 표본에서 모집단 전체로 합리적으로 확장될 수 있음을 보장한다.실험 연구에는 연구 대상 시스템의 측정을 수행하고 시스템을 조작한 다음 동일한 절차를 사용하여 추가 측정을 수행하여 조작이 측정값을 수정했는지 여부를 확인하는 작업이 포함됩니다.반대로 관측 연구는 실험 조작을 수반하지 않습니다.

데이터 분석에는 두 가지 주요 통계 방법, 즉 평균 또는 표준 편차와 같은 지표를 사용하여 표본의 데이터를 요약하는 기술 통계와 무작위 변동(예: 관측 오류, 표본 변동)[5]의 영향을 받는 데이터에서 결론을 도출하는 추리 통계 방법이 사용된다.기술 통계량은 분포의 두 가지 속성 집합(표본 또는 모집단)과 관련된 경우가 가장 많습니다. 즉, 중심 경향(또는 위치)은 분포의 중심 또는 일반적인 값을 특성화하는 반면, 분산(또는 변동성)은 분포의 구성원이 분포의 중심에서 서로 이탈하는 정도를 특성화합니다.수학 통계학에 대한 추론은 확률론의 틀에서 이루어지며, 확률론은 무작위 현상의 분석을 다룬다.

표준 통계 절차는 두 통계 데이터 세트 또는 이상화된 모델에서 도출된 데이터 세트 및 합성 데이터 간의 관계에 대한 테스트로 이어지는 데이터 수집을 포함한다.두 데이터 세트 간의 통계적 관계에 대한 가설이 제안되며, 이는 두 데이터 세트 간의 관계가 없다는 이상적인 귀무 가설의 대안으로 비교된다.귀무 가설을 기각하거나 반증하는 것은 검정에 사용되는 데이터를 고려할 때 귀무 가설을 거짓으로 입증할 수 있는 의미를 정량화하는 통계적 검정을 사용하여 수행됩니다.귀무 가설에서 작업하면 다음 두 가지 기본적인 형태의 오차가 인식됩니다.유형 I 오류(귀무 가설은 "거짓 양수"를 제공함)와 유형 II 오류(귀무 가설은 기각되지 않고 모집단 간의 실제 관계가 "거짓 음수"[6]를 제공함)입니다.충분한 표본 크기를 얻는 것에서부터 적절한 귀무 [5]가설을 지정하는 것까지, 이 프레임워크와 관련된 여러 문제가 생겨났다.

통계 데이터를 생성하는 측정 프로세스도 오류가 발생할 수 있습니다.이러한 오류의 대부분은 무작위(노이즈) 또는 체계적(바이어스)으로 분류되지만, 다른 유형의 오류(예: 분석가가 잘못된 단위를 보고하는 경우)도 발생할 수 있습니다.결측 데이터나 관측 중단이 있으면 편파 추정치가 발생할 수 있으며 이러한 문제를 해결하기 위해 특정 기법이 개발되었습니다.

서론

통계학(Statistics)은 데이터의 [7]수집, 분석, 해석 또는 설명, 표시와 관련된 수학[8]한 분야이다.어떤 사람들은 통계학을 수학의 한 분야라기보다는 별개의 수학 과학으로 여긴다.많은 과학적 조사가 데이터를 사용하는 반면,[9][10] 통계는 불확실성과 불확실성에 직면한 의사결정의 맥락에서 데이터 사용과 관련이 있다.

문제에 통계량을 적용할 때는 연구할 모집단 또는 공정에서 시작하는 것이 일반적입니다.인구는 "한 나라에 사는 모든 사람들" 또는 "결정체를 구성하는 모든 원자"와 같은 다양한 주제일 수 있습니다.이상적으로는 통계학자들이 전체 모집단에 대한 데이터를 수집한다(센서스라고 하는 작업).이는 정부 통계기관에 의해 조직될 수 있다.기술 통계량을 사용하여 모집단 데이터를 요약할 수 있습니다.수치 설명자에는 연속 데이터(소득 등)에 대한 평균 및 표준 편차가 포함되지만, 빈도 및 백분율은 범주형 데이터(교육 등)를 설명하는 데 더 유용합니다.

인구조사가 가능하지 않은 경우 표본이라 불리는 모집단의 선택된 하위집합이 연구된다.모집단을 대표하는 표본이 결정되면 표본 구성원에 대한 데이터가 관측 또는 실험 설정에서 수집됩니다.다시 기술 통계량을 사용하여 표본 데이터를 요약할 수 있습니다.그러나 표본을 그리는 것은 무작위성 요소를 포함하기 때문에 표본의 수치 기술자 또한 불확실성을 띠기 쉽다.전체 모집단에 대해 의미 있는 결론을 도출하기 위해서는 추리 통계가 필요하다.표본 데이터의 패턴을 사용하여 랜덤성을 설명하면서 표현되는 모집단에 대한 추론을 도출합니다.이러한 추론은 데이터에 대한 예/아니오 질문(hypothesis testing), 데이터의 수치 특성 추정(추정), 데이터 내 연관성 설명(상관), 데이터 내 관계 모델링(예: 회귀 분석 사용) 등의 형태를 취할 수 있습니다.추론은 연구 대상 모집단에서 또는 이와 관련된 관측되지 않은 값의 예측, 예측 및 추정으로 확장될 수 있다.여기에는 시계열 또는 공간 데이터의 추정보간, 데이터 마이닝이 포함될 수 있습니다.

수리통계학

수학 통계학은 통계학에 수학을 응용하는 것이다.이를 위해 사용되는 수학적 기술에는 수학적 분석, 선형 대수학, 확률적 분석, 미분 방정식, 측정 이론 확률 [11][12]이론이 포함됩니다.

역사

확률 수학의 선구자 Gerolamo Cardano.

통계적 추론에 대한 초기 기록은 8세기에서 13세기 사이의 이슬람 황금기 아랍 수학자암호학자거슬러 올라간다.알-칼릴 (717–786)은 모음 [13]포함 여부에 관계없이 가능한 모든 아랍어 단어들을 나열하기 위해 순열과 조합의 첫 번째 사용을 포함하는 암호 메시지 북을 썼습니다.알-킨디는 그의 저서 "암호 메시지 해독에 관한 원고"에서 암호화된 메시지를 해독하기 위해 주파수 분석을 사용하는 방법에 대한 자세한 설명을 했다.알-킨디는 또한 통계적 추론을 가장 먼저 사용했으며 그와 이후 아랍 암호학자들은 암호화된 메시지를 해독하기 위한 초기 통계 방법을 개발했다.Ibn Adlan (1187–1268)은 나중에 주파수 [13]분석에서 표본 크기를 사용하는 데 중요한 기여를 했다.

통계에 관한 최초의 유럽인들의 글은 1663년으로 거슬러 올라가며, 존 [14]그룬트사망률 고지서에 대한 자연적정치적 관찰을 출판했다.통계적 사고의 초기 적용은 인구통계학적 및 경제적 데이터에 기반한 정책, 즉 통계 어원을 중심으로 이루어졌다.통계의 규율 범위는 19세기 초에 데이터 수집과 분석을 포함하도록 확대되었다.오늘날 통계는 정부, 기업, 자연 및 사회과학 분야에서 널리 사용되고 있다.

현대 통계학의 수학적 토대는 17세기에 Gerolamo Cardano, Blaise Pascal, 그리고 Pierre de Fermat에 의한 확률론의 발전과 함께 놓였다.확률의 개념은 중세 법과 후안 카라무엘[15]같은 철학자들에 의해 이미 조사되었지만, 수학적 확률론은 우연의 게임에 대한 연구로부터 생겨났다.최소 제곱법은 1805년 Adrien-Marie Legendre에 의해 처음 기술되었다.

피어슨, 수학 통계학의 창시자

현대 통계학 분야는 19세기 후반과 20세기 초반에 [16]3단계로 나타났다.첫 번째 물결은 21세기 초에 프랜시스 골튼과 칼 피어슨의 연구에 의해 주도되었다. 그는 통계를 과학뿐만 아니라 산업과 정치에서도 분석에 사용되는 엄격한 수학 분야로 변화시켰다.Galton은 표준 편차, 상관 관계, 회귀 분석의 개념을 도입하고 키, 몸무게,[17] 속눈썹 길이와 같은 다양한 인간 특징 연구에 이러한 방법을 적용하는 것을 포함했습니다.Pearson은 다른 여러 가지 [19]사항들 중에서 Pearson의 곱-모멘트 [18]상관 계수, 즉 제품-모멘트로 정의되는 분포를 표본에 적합시키는 모멘트 방법 및 Pearson 분포를 개발했습니다.Galton과 Pearson은 Biometrika를 수학 통계학과 생물 통계학의 첫 번째 저널로 설립했고, Biometrika는 University College [20]London에 세계 최초의 대학 통계학과를 설립했습니다.

로널드 피셔는 "실험 과정에서 증명되거나 입증되지 않았지만 아마도 반증될 수 있는"[21][22] 차를 시음하는 레이디 실험 중에 귀무 가설이라는 용어만들었다.

1910년대와 20년대의 제2의 물결은 윌리엄 씰리 고셋에 의해 시작되었고, 전 세계 대학의 학문 규율을 정의하는 교과서를 로널드 피셔의 통찰력으로 절정에 달했다.피셔의 가장 중요한 출판물이 그의 1918년 세미나 자료 커뮤니티의 멘델의 상속(미국 통계 용어를 사용하는 차이 최초의 사람이었다)의 Supposition, 그의 고전적인 1925년 작업 통계적 콘텐츠 연구 근로자와 그의 1935년 디자인 Experiments,[23][24][25]중 엄격한 des 개발된에 친척들 사이에 있습니다.expe의 ignRims 모델.그는 충분성, 보조 통계, 피셔의 선형 판별기 [26]피셔 정보의 개념을 만들었다.그의 1930년 저서 자연선택의 유전학적 이론에서, 그는 피셔의 원칙[27] 같은 다양한 생물학적 개념에 통계를 적용했다. W. F. Edwards는 "아마 진화생물학에서 가장 유명한 논쟁"과 피셔 [28][29][30][31][32][33]가출이라고 불렀는데, 이는 진화에서 발견되는 긍정적인 피드백 폭주 효과에 대한 성적 선택 개념이다.

초기 개발의 개선과 확장을 주로 보았던 마지막 물결은 1930년대에 Egon Pearson과 Jerzy Neyman의 공동 작업으로부터 나타났다.그들은 "Type II" 오류, 테스트의 검정력 및 신뢰 구간의 개념을 도입했다.1934년 Jerzy Neyman은 계층화된 무작위 표본 추출이 일반적으로 목적([34]할당) 표본 추출보다 더 나은 추정 방법이라는 것을 보여주었다.

오늘날 통계적 방법은 수집된 데이터 본체에서 정확한 추론을 하고 통계적 방법론에 기초한 불확실성에 직면하여 의사결정을 하기 위해 의사결정을 수반하는 모든 분야에 적용된다.최신 컴퓨터의 사용으로 대규모 통계 연산이 가속화되었고 수동으로 수행하기에는 비현실적인 새로운 방법이 가능해졌습니다.통계는 빅데이터 [35]분석 방법에 대한 문제와 같은 활발한 연구 영역입니다.

통계자료

데이터 수집

샘플링

전체 인구조사 데이터를 수집할 수 없는 경우 통계학자는 특정 실험 설계와 조사 표본을 개발하여 표본 데이터를 수집합니다.통계 자체는 또한 통계 모델을 통한 예측 및 예측을 위한 도구를 제공한다.

표본을 전체 모집단에 대한 지침으로 사용하려면 표본이 전체 모집단을 나타내는 것이 중요합니다.대표 표본 추출은 추론과 결론이 표본에서 모집단 전체로 안전하게 확장될 수 있음을 보장한다.주요 문제는 선택된 표본이 실제로 대표되는 정도를 결정하는 데 있다.통계는 표본 및 데이터 수집 절차 내의 편향을 추정하고 수정할 수 있는 방법을 제공합니다.또한 연구를 시작할 때 이러한 문제를 줄여 모집단에 대한 진실을 식별할 수 있는 능력을 강화시킬 수 있는 실험용 실험 설계 방법도 있다.

표본 추출 이론은 확률 이론의 수학 분야 중 하나이다.확률은 수학 통계학에서 표본 통계의 표본 분포를 연구하기 위해 사용되며, 보다 일반적으로 통계 절차의 속성을 연구하기 위해 사용됩니다.통계적 방법의 사용은 고려대상 시스템 또는 모집단이 방법의 가정을 만족하는 경우에 유효하다.고전적인 확률론과 표본론 사이의 관점의 차이는 대략적으로 확률론이 표본과 관련된 확률을 추론하기 위해 총 모집단의 주어진 매개변수에서 출발한다는 것이다.그러나 통계적 추론은 반대 방향으로 이동한다. 즉, 표본에서 더 크거나 총 모집단의 매개변수로 유도적으로 추론한다.

실험 및 관찰 연구

통계연구 프로젝트의 공통 목표는 인과관계를 조사하는 것이며, 특히 예측 변수 또는 독립 변수의 값이 종속 변수에 미치는 영향에 대한 결론을 도출하는 것이다.인과통계연구에는 실험연구관찰연구의 두 가지 주요 유형이 있다.두 연구 유형 모두에서 독립 변수의 차이가 종속 변수의 동작에 미치는 영향이 관찰됩니다.두 유형의 차이는 연구가 실제로 어떻게 수행되느냐에 있습니다.각각 매우 효과적일 수 있습니다.실험 연구에는 연구 대상 시스템의 측정을 수행하고 시스템을 조작한 다음 동일한 절차를 사용하여 추가 측정을 수행하여 조작이 측정값을 수정했는지 여부를 확인하는 작업이 포함됩니다.반대로 관측 연구는 실험 조작을 수반하지 않습니다.대신 데이터가 수집되고 예측 변수와 반응 사이의 상관 관계가 조사됩니다.임의적인 연구에서 데이터에 자료 분석의 도구가 가장 효과, 그들은 또한data—like 자연 실험과 통계 학자( 많은 다른 것 중에서 예를 들어, 차이 차이점 추정과 악기 연주의 변수,)월은 수정된, 더 구조화된 추정 방법을 이용할 것이다 관찰 studies[36]—for의 다른 종류에 적용됩니다.에서일관된 추정치를 생성합니다.

실험

통계 실험의 기본 단계는 다음과 같습니다.

  1. 치료 효과의 크기에 대한 예비 추정치, 대립 가설추정된 실험 변동성 정보를 사용하여 연구의 반복 횟수 찾기를 포함한 연구 계획 수립실험대상 선정과 연구윤리에 대한 고려가 필요하다.통계학자들은 처리 효과의 차이를 편향되지 않게 추정할 수 있도록 최소한 하나의 새로운 처리를 표준 처리 또는 관리 기준과 비교할 것을 권장합니다.
  2. 실험 설계, 교란 변수의 영향을 줄이기 위해 블럭화를 사용하고 처리 효과와 실험 오류의 치우침 없는 추정치를 허용하기 위해 피실험자에 대한 처리의 랜덤화 할당.이 단계에서, 실험자와 통계학자는 실험의 성과를 안내하고 실험 데이터의 1차 분석을 규정하는 실험 프로토콜을 작성한다.
  3. 실험 프로토콜에 따라 실험을 수행하고 실험 프로토콜에 따라 데이터를 분석합니다.
  4. 향후 연구를 위한 새로운 가설을 제안하기 위해 2차 분석에서 데이터 세트를 추가로 검토한다.
  5. 연구 결과를 문서화하고 제시합니다.

인간의 행동에 대한 실험은 특별한 관심을 가지고 있다.유명한 Hawthorne 연구는 Western Electric Company의 Hawthorne 공장의 작업 환경의 변화를 조사했습니다.연구진은 조명이 증가하면 조립 라인 근로자들의 생산성이 향상될지 여부를 확인하는 데 관심이 있었습니다.연구진은 먼저 공장의 생산성을 측정한 뒤 공장 내 한 지역의 조명을 수정하고 조명의 변화가 생산성에 영향을 미치는지 확인했다.(실험 조건하에서) 생산성이 정말로 향상되었다는 것이 판명되었다.그러나, 이 연구는 오늘날 실험 절차의 오류, 특히 대조군부재와 맹목적인 문제로 큰 비난을 받고 있다.Hawthorne 효과는 관찰 자체에 의해 결과(이 경우, 근로자 생산성)가 변경되었음을 발견하는 것을 말합니다.Hawthorne 연구에 참여한 사람들은 조명이 바뀌어서가 아니라 [37]관찰되었기 때문에 더 생산적이 되었다.

관찰 연구

관찰 연구의 예는 흡연과 폐암의 연관성을 탐구하는 것이다.이러한 유형의 연구는 일반적으로 관심 영역에 대한 관측치를 수집하기 위해 조사를 사용한 다음 통계 분석을 수행합니다.이 경우, 연구자들은 코호트 연구를 통해 흡연자와 비흡연자 모두의 관찰 결과를 수집하고 각 그룹의 [38]폐암 환자 수를 찾을 것이다.환자-대조군 연구는 관심의 결과(예: 폐암)가 있거나 없는 사람들을 참여시키고 그들의 피폭 기록을 수집하는 또 다른 유형의 관찰 연구이다.

데이터의 종류

측정 수준의 분류법을 만들기 위해 다양한 시도가 있었다.정신물리학자인 스탠리 스미스 스티븐스는 명목, 서수, 간격, 비율 척도를 정의했다.공칭 측정에는 값 간의 의미 있는 순위 순서가 없으며, 일대일(주입형) 변환이 허용됩니다.순서형 측정에서는 연속된 값 간에 부정확한 차이가 있지만 이러한 값에는 의미 있는 순서가 있으며 순서 보존 변환이 가능합니다.간격 측정에는 정의된 측정 사이의 유의한 거리가 있지만 0 값은 임의이며(섭씨 또는 화씨로 경도 및 온도 측정의 경우) 선형 변환을 허용합니다.비율 측정에는 의미 있는 0 값과 정의된 서로 다른 측정 사이의 거리가 모두 있으며, 모든 재스케일링 변환을 허용합니다.

명목 또는 순서형 측정에만 적합한 변수는 수치적으로 측정할 수 없기 때문에 때로는 범주형 변수로 그룹화되는 반면 비율과 간격 측정은 수치적 특성으로 인해 이산형 또는 연속형 양적 변수로 그룹화된다.이러한 구별은 종종 컴퓨터 과학의 데이터 유형과 느슨하게 상관될 수 있다. 왜냐하면 이분법 범주형 변수는 부울 데이터 유형, 적분 데이터 유형에서 임의로 할당된 정수를 가진 폴리토머스 범주형 변수, 부동 소수점 산술과 관련된 실제 데이터 유형을 가진 연속형 변수로 표현될 수 있기 때문이다.꼼꼼하다. 그러나 컴퓨터 과학 데이터 유형과 통계 데이터 유형의 매핑은 후자의 어떤 분류가 구현되고 있는지에 따라 달라진다.

다른 분류가 제안되었다.예를 들어 Mosteller와 Tukey(1977)[39]는 등급, 순위, 계수 분수, 계수, 금액 및 잔액을 구분했다.넬더(1990)[40]는 연속 계수, 연속 비율, 계수 비율 및 범주형 데이터 모드를 설명했다.(「」도 참조해 주세요.Chrisman([41]1998), van den Berg(1991)[42]

서로 다른 종류의 측정 절차에서 얻은 데이터에 서로 다른 종류의 통계 방법을 적용하는 것이 적절한지의 문제는 변수의 변환과 연구 질문의 정확한 해석에 관한 문제로 복잡하다."데이터와 그들이 기술하는 것의 관계는 단지 특정 종류의 통계 진술이 일부 변형에서 변하지 않는 진실 값을 가질 수 있다는 사실을 반영한다.변혁을 고려하는 것이 현명한지 아닌지는 그 사람이 [43]: 82 대답하려는 질문에 달려 있습니다."

방법들

기술 통계

기술 통계량(카운트 명사 의미)은 정보 [44]집합의 특징을 정량적으로 기술하거나 요약하는 요약 통계량이며, 매스 명사 의미에서의 기술 통계량은 이러한 통계량을 사용하고 분석하는 과정이다.기술 통계량은 추정 통계량(또는 귀납 통계량)과 구별되는데, 이는 기술 통계량이 데이터를 사용하여 데이터의 표본이 나타내는 모집단에 대해 학습하는 것이 아니라 표본을 요약하는 것을 목적으로 한다는 것이다.

추리통계

통계적 추론은 데이터 분석을 사용하여 기본 확률 [45]분포의 속성을 추론하는 과정입니다.추리 통계 분석은 예를 들어 가설을 테스트하고 추정치를 도출함으로써 모집단의 속성을 추론한다.관측된 데이터 집합은 더 큰 모집단에서 추출된다고 가정합니다.추리 통계량은 기술 통계량과 대조될 수 있다.기술 통계량은 관측된 데이터의 속성에만 관련이 있으며 데이터가 더 큰 모집단에서 가져온다는 가정 하에 성립하지 않습니다.

추리통계학 용어 및 이론

통계, 추정치 및 중요한 수량

주어진 확률 분포를 갖는 독립적 동일분포(IID) 랜덤 변수를 고려해보자: 표준 통계 추론 및 추정 이론은 랜덤 표본을 이러한 IID [46]변수의 열 벡터에 의해 주어진 랜덤 벡터로 정의합니다.조사 대상 모집단은 모수를 알 수 없는 확률 분포로 설명됩니다.

통계량은 랜덤 표본의 함수이지만 알 수 없는 모수의 함수는 아닌 랜덤 변수입니다.그러나 통계량의 확률 분포에는 알 수 없는 모수가 있을 수 있습니다.이제 알 수 없는 모수의 함수를 살펴보겠습니다. 추정기는 이러한 함수를 추정하는 데 사용되는 통계량입니다.일반적으로 사용되는 추정 변수에는 표본 평균, 치우치지 않은 표본 분산 및 표본 공분산이 포함됩니다.

랜덤 표본과 미지의 모수의 함수이지만 확률 분포가 미지의 모수에 의존하지 않는 랜덤 변수를 추축량 또는 피벗이라고 합니다.널리 사용되는 피벗에는 z-점수, 카이 제곱 통계량 및 학생의 t-값이 포함됩니다.

주어진 모수의 두 추정치 중에서 평균 제곱 오차가 작은 추정치가 더 효율적이라고 합니다.또한 추정치는 그 기대치가 추정되는 미지의 파라미터의 참값과 같으면 치우치지 않고, 그 기대치가 그러한 파라미터의 참값으로 수렴하면 점근적으로 치우치지 않는다고 한다.

추정치에 대한 기타 바람직한 속성은 다음과 같습니다.추정할 수 있는 파라미터의 모든 가능한 값에 대해 가장 낮은 분산을 갖는 UMVUE 추정기(일반적으로 효율성보다 검증하기 쉬운 속성)와 그러한 파라미터의 실제 값으로 확률이 수렴되는 일관된 추정기.

이것은 여전히 주어진 상황에서 추정기를 얻고 계산을 수행하는 방법에 대한 의문을 남긴다. 모멘트 방법, 최대우도 방법, 최소 제곱 방법, 그리고 보다 최근의 방정식 추정 방법 등 여러 가지 방법이 제안되었다.

귀무 가설 및 대립 가설

통계정보의 해석은 일반적으로 변수 사이에 관계가 없거나 시간이 [47][48]지남에 따라 변화가 발생하지 않는다는 귀무 가설의 개발을 수반할 수 있다.

초보자에게 가장 좋은 예는 형사 재판에서 직면하는 곤경이다.귀무 가설인0 H는 피고인이 무죄라고 주장하는 반면, 대안 가설인1 H는 피고인이 유죄라고 주장한다.그 기소는 유죄에 대한 의심 때문에 이루어진다.H(현상유지)는0 H와1 반대이며 H가 "합리적인 의심을 넘어" 증거에 의해 뒷받침되지 않는1 한 유지된다.그러나 이 사건에서 "H를 거부하지0 못했다"는 것은 무죄를 의미하는 것이 아니라 단지 증거가 유죄를 선고하기에 불충분했다는 것을 의미한다.그래서 배심원들은 H를 반드시 받아들이지0 않지만 H를 기각하지는0 못한다.귀무 가설을 "증명"할 수는 없지만 유형 II 오류를 검정하는 검정력 검정을 통해 귀무 가설을 얼마나 참에 가까운지 검정할 수 있습니다.

통계학자들대립 가설이라고 부르는 것은 귀무 가설과 모순되는 가설일 뿐이다.

에러

귀무 가설에서 작업할 때, 두 가지 광범위한 범주의 오차가 인식됩니다.

  • 귀무 가설이 거짓으로 기각되어 "거짓 양수"가 되는 I형 오류입니다.
  • 귀무 가설이 기각되지 않고 모집단 간의 실제 차이가 누락되어 "거짓 음수"가 되는 유형 II 오류입니다.

표준 편차는 표본의 개별 관측치가 표본 또는 모집단 평균과 같은 중앙 값과 다른 정도를 의미하고 표준 오차는 표본 평균과 모집단 평균 간의 차이에 대한 추정치를 나타냅니다.

통계적 오류는 관측치가 기대치와 다른 양입니다.잔차는 관측치가 주어진 표본에 대해 예상 값의 추정자가 가정하는 값과 다른 양입니다(예측이라고도 함).

평균 제곱 오차는 널리 사용되는 추정치 클래스인 효율적인 추정치를 얻는 데 사용됩니다.루트 평균 제곱 오차는 단순히 평균 제곱 오차의 제곱근입니다.

최소 정사각형 적합치: 빨간색은 적합점을, 파란색은 적합선을 나타냅니다.

많은 통계적 방법은 잔차 제곱합을 최소화하려고 하며, 이러한 방법을 최소 절대 편차와 대조적으로 "최소 제곱법"이라고 합니다.후자는 작은 오류와 큰 오류에 동일한 가중치를 부여하고, 전자는 큰 오류에 더 많은 가중치를 부여합니다.잔차 제곱합도 미분 가능하므로 회귀 분석을 수행하는 데 유용한 속성을 제공합니다.선형 회귀 분석에 적용된 최소 제곱법을 일반 최소 제곱법이라고 하고 비선형 회귀 분석에 적용된 최소 제곱법을 비선형 최소 제곱법이라고 합니다.또한 선형 회귀 모형에서 모델의 비결정론적 부분을 오차항, 교란 또는 더 단순한 노이즈라고 합니다.선형 회귀와 비선형 회귀는 모두 다항식 최소 제곱으로 다루어지며, 독립 변수(x축)의 함수로서 종속 변수(y축)의 예측의 분산과 추정된(적합된) 곡선으로부터의 편차(오류, 잡음, 장애)를 설명한다.

통계 데이터를 생성하는 측정 프로세스도 오류가 발생할 수 있습니다.이러한 오류의 대부분은 무작위(소음) 또는 체계적(바이어스)으로 분류되지만, 다른 유형의 오류(예: 분석가가 잘못된 단위를 보고하는 경우)도 중요할 수 있다.결측 데이터나 관측 중단이 있으면 편파 추정치가 발생할 수 있으며 이러한 [49]문제를 해결하기 위해 특정 기법이 개발되었습니다.

구간 추정
신뢰 구간: 이 예제에서 빨간색 선은 평균에 대한 참 값이고 파란색 선은 100개 실현에 대한 랜덤 신뢰 구간입니다.

대부분의 연구는 모집단의 일부만을 표본으로 추출하기 때문에 결과가 전체 모집단을 완전히 나타내지는 않습니다.표본에서 얻은 추정치는 모집단 값과 비슷할 뿐입니다.신뢰 구간을 사용하면 표본 추정치가 전체 모집단의 실제 값과 얼마나 가까운지를 통계학자가 표현할 수 있습니다.종종 95% 신뢰 구간으로 표현됩니다.공식적으로, 값에 대한 95% 신뢰 구간은 동일한 조건(다른 데이터 집합을 산출함)에서 샘플링과 분석이 반복된 경우 간격에 모든 가능한 사례의 95%에 참(인구) 값이 포함되는 범위이다.이는 실제 값이 신뢰 구간에 있을 확률이 95%라는 것을 의미하지는 않습니다.빈도론자의 관점에서 보면, 진정한 값은 무작위 변수가 아니기 때문에 이러한 주장은 말이 되지 않는다.True 값이 지정된 간격 내에 있거나 없습니다.그러나 데이터가 샘플링되고 신뢰 구간을 구성하는 방법에 대한 계획이 주어지기 전에 아직 계산되지 않은 구간이 참 값을 포함할 확률은 95%입니다. 즉, 이 시점에서 구간의 한계는 아직 관측되지 않은 랜덤 변수입니다.참 값을 포함할 수 있는 주어진 확률을 갖는 것으로 해석될 수 있는 한 가지 접근방식은 베이지안 통계에서 신뢰할 수 있는 간격을 사용하는 것이다. 이 접근방식은 "확률"의미하는 바를 해석하는 다른 방법, 즉 베이지안 확률에 의존한다.

원칙적으로 신뢰 구간은 대칭 또는 비대칭일 수 있다.구간은 모수(왼쪽 구간 또는 오른쪽 구간)에 대한 하한 또는 상한으로 작동하기 때문에 비대칭적일 수 있지만, 두 측면 구간이 추정치 주변의 대칭을 위반하여 작성되기 때문에 비대칭일 수도 있습니다.때로는 신뢰 구간에 대한 한계가 점근적으로 도달하고 이러한 한계가 참 경계에 근사하는 데 사용됩니다.

중요성

통계학에서는 분석 대상 질문에 예/아니오 유형으로 간단히 대답하는 경우가 거의 없습니다.해석은 종종 숫자에 적용되는 통계적 유의성 수준으로 귀무 가설(p-값이라고도 함)을 정확하게 기각할 확률을 나타냅니다.

이 그래프에서 검은색 선은 검정 통계량에 대한 확률 분포이고, 임계 영역은 관측된 데이터 점(검정 통계량의 관측치)의 오른쪽에 있는 값 집합이며, p-값은 녹색 영역으로 표시됩니다.

표준[46] 접근법은 대립 가설에 대해 귀무 가설을 검정하는 것입니다.임계 영역은 귀무 가설을 반박하는 추정기의 값 집합입니다.따라서 유형 I 오류 확률은 귀무 가설이 참(통계적 유의성)일 때 추정기가 임계 영역에 속할 확률이고 유형 II 오류 확률은 대립 가설이 참일 때 추정기가 임계 영역에 속하지 않을 확률입니다.검정의 통계적 검정력은 귀무 가설이 거짓일 때 귀무 가설을 올바르게 기각할 확률입니다.

통계적 유의성을 언급하는 것이 반드시 전체 결과가 실제 측면에서 유의하다는 것을 의미하지는 않는다.예를 들어, 약물에 대한 대규모 연구에서 그 약은 통계적으로 유의하지만 매우 작은 유익성을 가지고 있다는 것을 보여줄 수 있으며, 따라서 그 약은 환자에게 눈에 띄게 도움이 될 것 같지 않다.

통계적 유의성의 허용 수준은 원칙적으로 논란의 대상이 될 수 있지만 유의 수준은 검정을 통해 귀무 가설을 기각할 수 있는 가장 큰 p-값입니다.이 검정은 p-값이 귀무 가설이 참이라고 가정할 때 최소한 검정 통계량만큼 극단적인 결과를 관측할 확률이라고 말하는 것과 논리적으로 동일합니다.따라서 유의 수준이 작을수록 유형 I 오류를 범할 확률이 낮아집니다.

일반적으로 일부 문제는 이 프레임워크와 관련되어 있습니다(가설 테스트에 대한 비판 참조).

  • 통계적으로 매우 유의한 차이는 여전히 실질적인 의미가 없을 수 있지만, 이를 설명하기 위해 검정을 적절하게 공식화할 수 있습니다.한 반응에는 유의 수준만 보고하는 것이 아니라 가설이 기각되거나 수용되는지 여부를 보고할 때 p-값을 포함하는 것이 포함됩니다.그러나 p-값은 관측된 효과의 크기나 중요성을 나타내지 않으며 대규모 연구에서 사소한 차이의 중요성을 과장하는 것처럼 보일 수도 있습니다.신뢰구간을 보고하는 것이 보다 우수하고 일반적인 접근법입니다.이들은 가설 검정 또는 p-값의 계산과 동일한 계산에서 생성되지만 효과의 크기와 주변 불확실성을 모두 설명한다.
  • 전치된 조건의 오류, 일명 검사의 오류: 가설 테스트 접근법이 하나의 가설(귀무 가설)을 선호하도록 강요하기 때문에 비판이 발생한다. 왜냐하면 평가되는 것은 귀무 가설이 주어진 관측 결과의 확률이 아니라 귀무 가설이 주어진 관측 결과의 확률이기 때문이다.이 접근법에 대한 대안은 베이지안 추론에 의해 제공되지만,[50] 이는 사전 확률을 확립해야 한다.
  • 귀무 가설을 기각한다고 해서 대립 가설이 자동으로 증명되는 것은 아닙니다.
  • 추리 통계의 모든 것은 표본 크기에 의존하므로, 두꺼운 꼬리 p-값에서 심각하게 [clarification needed]잘못 계산될 수 있습니다.
»

잘 알려진 통계 테스트 및 절차는 다음과 같습니다.

분석

탐색적 데이터 분석(EDA)은 데이터 세트를 분석하여 주요 특성을 요약하는 접근법이며, 종종 시각적 방법을 사용한다.통계 모델을 사용할 수도 있고 사용할 수도 없지만, 주로 EDA는 데이터가 공식적인 모델링 또는 가설 테스트 작업 이외에 무엇을 알려줄 수 있는지를 확인하기 위한 것입니다.

★★★

통계를 잘못 사용하면 기술 및 해석에 미묘하지만 심각한 오류가 발생할 수 있다. 경험 많은 전문가도 이러한 오류를 범한다는 점에서 문제가 되고, 엄청난 의사결정 오류를 초래할 수 있다는 점에서 문제가 된다.예를 들어, 사회 정책, 의료 관행 및 브리지와 같은 구조의 신뢰성은 모두 통계의 적절한 사용에 의존한다.

통계기법이 올바르게 적용되더라도 전문지식이 부족한 사람에게는 결과를 해석하기 어려울 수 있다.표본의 랜덤 변동에 의해 추세가 발생할 수 있는 정도를 측정하는 데이터 추세의 통계적 유의성은 그 유의성에 대한 직관적인 감각과 일치하거나 일치하지 않을 수 있다.사람들이 일상 생활에서 정보를 적절하게 다루는데 필요한 기본적인 통계 기술(및 회의론)을 통계적 읽고 쓰는 능력이라고 한다.

통계지식은 [51]발표자에게 유리한 데이터만 해석하는 방법을 찾아 고의적으로 오용되는 경우가 많다는 인식이 일반적이다.통계에 대한 불신과 오해는 "거짓말, 빌어먹을 거짓말, 통계의 가지 종류의 거짓말이 있다"는 인용과 관련이 있다.통계의 오용은 의도적이지도 않고 의도적인 것일 수 있으며, Darrell Huff책인 How to Lie with [51]Statistics는 다양한 고려 사항을 요약하고 있다.통계의 사용과 오남용을 조명하기 위해, 특정 분야에서 사용되는 통계 기법의 검토를 수행한다(예: 워른, 라조, 라모스, 리터(2012)).[52]

통계 오남용을 방지하는 방법으로는 적절한 도표를 사용하는 것과 편견을 [53]피하는 것이 있다.오남용은 결론이 지나치게 일반화되고 실제보다 더 많이 대표된다고 주장할 때 종종 의도적으로 또는 무의식적으로 표본 [54]추출 편견을 간과함으로써 발생할 수 있다.막대 그래프는 거의 틀림없이 사용하고 이해하기 가장 쉬운 도표이며 손으로 만들 수도 있고 간단한 컴퓨터 프로그램으로 [53]만들 수도 있습니다.안타깝게도 대부분의 사람들은 편견이나 오류를 찾지 않기 때문에 눈에 띄지 않습니다.그러므로, 사람들은 어떤 것이 잘 [54]표현되지 않더라도 종종 진실이라고 믿을 수 있다.통계에서 수집된 데이터를 신뢰할 수 있고 정확하게 만들려면 추출한 표본이 [55]전체를 대표해야 합니다.Huff에 따르면, "샘플의 신뢰성은 [바이어스]에 의해 파괴될 수 있습니다...어느 정도 회의적인 태도를 보이도록 해"[56]

통계의 이해를 돕기 위해 Huff는 각 [51]경우에 대해 다음과 같은 일련의 질문을 제안했다.

  • )))? ())/)))))))?)
  • 그/그녀는 어떻게 아는가? (사실을 어떻게 아는가?
  • 뭐가 빠졌나요? (완전한 그림을 보여주나요?)
  • 주제를 바꾼 사람이 있습니까? (잘못된 문제에 대한 정답을 제시합니까?)
  • 그게말이 되는 건가요?(약정을 체결 그리고 우리가 이미 알고 있는 것과 일관된 논리적이지?)(그/그녀의 결론은 논리적이고 우리가 이미 알고 있는것과 일치합니까?).
교란 변수 문제: X와 Y는 인과 관계가 있기 때문이 아니라 둘 다 세 번째 변수 Z에 의존하기 때문에 상관 관계가 있을 수 있습니다.Z를 교란 요인이라고 합니다.

Misinterpretation:correlation오역:상관 관계

상관관계의 개념은 그것이 야기할 수 있는 잠재적 혼란에 대해 특히 주목할 만하다.데이터 집합의 통계 분석 결과 고려 중인 모집단의 두 변수(속성)가 서로 연결된 것처럼 서로 다른 경향이 있는 것으로 드러나는 경우가 많다.예를 들어, 사망연령을 조사하는 연간 소득에 대한 연구는 가난한 사람들이 부유한 사람들보다 수명이 더 짧은 경향이 있다는 것을 발견할 수 있다.두 변수는 상관 관계가 있다고 하지만 서로 원인이 될 수도 있고 아닐 수도 있습니다.상관관계 현상은 잠복 변수 또는 교란 변수라고 불리는 이전에 검토되지 않은 세 번째 현상에 의해 발생할 수 있다.이 때문에 두 변수 사이에 인과관계가 존재한다고 당장 추론할 수 있는 방법은 없다.

프로그램

, 및

통계과학([57]Statistical Science)이라고도 하는 응용 통계는 기술 통계와 추리 [58][59]통계의 적용으로 구성된다.이론적 통계통계적 추론에 대한 접근법의 정당성을 뒷받침하는 논리적 논거와 수학 통계학을 포함한다.수학 통계는 추정 및 추론 방법과 관련된 결과를 도출하는 데 필요한 확률 분포의 조작뿐만 아니라 계산 통계와 실험 설계의 다양한 측면도 포함한다.

통계 컨설턴트는 특정 질문과 관련된 사내 전문 지식이 없는 조직 및 기업을 지원할 수 있습니다.

기계 학습 모델은 계산 알고리즘을 사용하여 데이터의 패턴을 포착하는 통계적 및 확률적 모델이다.

통계는 자연과학, 사회과학, 정부, 기업 등 다양한 학문 분야에 적용할 수 있다.비즈니스 통계는 서비스 개선 [60]및 마케팅 조사를 포함한 계량경제학, 감사, 생산 및 운영에 통계적 방법을 적용한다.열대 생물학의 두 저널에 대한 연구는 12개의 가장 빈번한 통계적 검정: 분산 분석(ANOVA), 카이-제곱 검정, 학생 T 검정, 선형 회귀, 피어슨 상관 계수, 맨-화이트니 U 검정, 크루스칼-월리스 검정, 섀넌의 Tukey 지수, 섀넌의 다양성 검정이라는 것을 발견했습니다.st주성분 분석.[61]

일반 통계 과정에서는 기술 통계량, 확률, 이항 분포정규 분포, 가설 및 신뢰 구간 검정, 선형 회귀 분석 및 [62]상관 관계를 다룹니다.학부생을 위한 최신 기초 통계 과정은 올바른 테스트 선택, 결과 해석 및 무료 통계 [61]소프트웨어의 사용에 초점을 맞추고 있습니다.

gretl, 오픈소스 통계 패키지의 예시

20세기 후반부터 시작된 컴퓨팅 파워의 빠르고 지속적인 증가는 통계과학의 실천에 상당한 영향을 미쳤다.초기 통계 모델은 거의 항상 선형 모델의 클래스였지만, 적절한 수치 알고리즘과 결합된 강력한 컴퓨터는 비선형 모델(신경망 등)과 일반화된 선형 모델 및 다단계 모델과 같은 새로운 유형의 생성에 대한 관심을 증가시켰다.

컴퓨팅 파워의 향상은 또한 치환 테스트와 부트스트랩과 같은 재샘플링을 기반으로 한 계산 집약적인 방법의 인기를 증가시켰으며, 깁스 샘플링과 같은 기술은 베이지안 모델의 사용을 더욱 실현 가능하게 만들었다.컴퓨터 혁명은 "실험적"과 "경험적" 통계를 새롭게 강조하면서 통계의 미래에 시사하는 바가 있다.현재 다수의 일반 및 특수 목적 통계 소프트웨어를 사용할 수 있다.복잡한 통계 계산이 가능한 소프트웨어의 예로는 Mathematica, SAS, SPSS 및 R 등의 프로그램이 있습니다.

통계

비즈니스에서 "통계"는 널리 사용되는 관리의사결정 지원 도구이다.특히 재무관리, 마케팅관리, 생산, 서비스,[63][64] 운영관리 에 적용되며, 통계는 관리회계감사에도 많이 사용된다.경영과학의 부문은 비즈니스에서 통계 및 기타 수학의 사용을 공식화한다. (경제학이란 경제관계에 경험적 내용을 제공하기 위해 경제데이터에 통계적 방법을 적용하는 것이다.)

전형적인"비즈니스 통계"과정 사업 이공계를, 그리고[65]기술 통계학, 확률(일반적으로 정상적인 이항 분포), 가정과 신뢰 구간 선형 회귀, 상관 관계의 시험(수집, 설명, 분석, 그리고 데이터의 요약)을 다룬다;(후속)과정 forec을 포함하고 있는 위한 것이다.asting, 시계열, 의사 결정 트리, 다중 선형 회귀 분석 및 기타 비즈니스 분석의 일반적인 주제.비즈니스 수학 » 대학 수준도 참조하십시오.CFA와 같은 전문 인증 프로그램은 종종 통계에 주제를 포함한다.

전통적으로 통계는 대부분의 [citation needed]과학에서 "필수 학습"이었던 반표준화된 방법론을 사용하여 추론을 도출하는 것과 관련이 있었다.이 전통은 비추론적인 맥락에서 통계를 사용함에 따라 바뀌었습니다.많은 분야에서 학위 요구로 받아들여졌던 건조한 과목이 이제는 열렬히 [according to whom?]검토되고 있다.처음에는 일부 수학 순수주의자들에 의해 조롱당했지만, 지금은 특정 분야에서 필수적인 방법론으로 간주되고 있다.

  • 수론에서, 분포 함수에 의해 생성된 데이터의 산란도는 기초 패턴을 밝히기 위해 통계에서 사용되는 친숙한 도구로 변환될 수 있으며, 이는 가설을 초래할 수 있다.
  • 카오스 이론과 프랙탈 기하학을 조합한 예측 통계의 예측 방법을 비디오 [66]작품을 만드는 데 사용할 수 있다.
  • 잭슨 폴록의 공정 예술은 자연 속 근본적인 분포가 예술적으로 [67]드러나는 예술적 실험에 의존했다.컴퓨터의 출현과 함께, 통계적 방법들이 이러한 유통 중심의 자연 과정을 공식화하여 움직이는 비디오 [citation needed]아트를 만들고 분석하기 위해 적용되었다.
  • 통계의 방법은 퍼포먼스 아트에서는 통계적 방법론을 사용하여 예측할 수 있는 마르코프 프로세스에 기초한 카드 트릭과 같이 전술적으로 사용될 수 있다.
  • 통계는 이아니스 크세나키스가 발명한 통계적 또는 확률적 음악에서와 같이 기술적으로 예술을 창조하는 데 사용될 수 있습니다. 여기서 음악은 연주에 특화되어 있습니다.이러한 유형의 예술성이 항상 예상대로 나오는 것은 아니지만 통계를 사용하여 예측 가능하고 조정 가능한 방식으로 작동합니다.

통계기법은 생물통계학, 컴퓨터생물학, 컴퓨터사회학, 네트워크생물학, 사회과학, 사회학, 사회학 등 다양한 유형의 과학 및 사회 연구에 사용된다.일부 조사 분야는 특수 용어를 사용할 정도로 응용 통계를 광범위하게 사용한다.이러한 분야에는 다음이 포함됩니다.

특정 의 통계 . 즉, 또, 자ologyologyologyologyology in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in in.

통계는 비즈니스 및 제조 분야에서도 중요한 기본 도구입니다.측정 시스템의 가변성, 제어 프로세스(통계 프로세스 제어(SPC)와 같은)를 이해하고 데이터를 요약하고 데이터 중심 결정을 내리는 데 사용됩니다.이러한 역할에서는 이것이 중요한 도구이며 아마도 유일한 신뢰할 수 있는 [citation needed]도구일 것입니다.

「」도 .

  1. ^ "Statistics". Oxford Reference. Oxford University Press. January 2008. ISBN 978-0-19-954145-4. Archived from the original on 2020-09-03. Retrieved 2019-08-14.
  2. ^ Romijn, Jan-Willem (2014). "Philosophy of statistics". Stanford Encyclopedia of Philosophy. Archived from the original on 2021-10-19. Retrieved 2016-11-03.
  3. ^ "Cambridge Dictionary". Archived from the original on 2020-11-22. Retrieved 2019-08-14.
  4. ^ Dodge, Y. (2006) 옥스퍼드 통계 용어 사전, 옥스퍼드 대학 출판부.ISBN 0-19-920613-9
  5. ^ a b Lund Research Ltd. "Descriptive and Inferential Statistics". statistics.laerd.com. Archived from the original on 2020-10-26. Retrieved 2014-03-23.
  6. ^ "What Is the Difference Between Type I and Type II Hypothesis Testing Errors?". About.com Education. Archived from the original on 2017-02-27. Retrieved 2015-11-27.
  7. ^ Moses, Lincoln E. (1986) 통계로 생각하고 설명한다, Adison-Wesley, ISBN 978-0-201-15619-5. 페이지 1-3
  8. ^ Hays, William Lee, (1973) 사회과학 통계, Holt, Rinehart and Winston, p.xii, ISBN 978-03-077945-9
  9. ^ Moore, David (1992). "Teaching Statistics as a Respectable Subject". In F. Gordon; S. Gordon (eds.). Statistics for the Twenty-First Century. Washington, DC: The Mathematical Association of America. pp. 14–25. ISBN 978-0-88385-078-7.
  10. ^ Chance, Beth L.; Rossman, Allan J. (2005). "Preface" (PDF). Investigating Statistical Concepts, Applications, and Methods. Duxbury Press. ISBN 978-0-495-05064-3. Archived (PDF) from the original on 2020-11-22. Retrieved 2009-12-06.
  11. ^ Lakshmikantham, D.; Kannan, V. (2002). Handbook of stochastic analysis and applications. New York: M. Dekker. ISBN 0824706609.
  12. ^ Schervish, Mark J. (1995). Theory of statistics (Corr. 2nd print. ed.). New York: Springer. ISBN 0387945466.
  13. ^ a b Broemeling, Lyle D. (1 November 2011). "An Account of Early Statistical Inference in Arab Cryptology". The American Statistician. 65 (4): 255–257. doi:10.1198/tas.2011.10191. S2CID 123537702.
  14. ^ 윌콕스, 월터(1938년) "통계학의 창시자"국제통계연구소 리뷰: 321~328.JSTOR 1400906
  15. ^ : J. : Pascal, Pr 2002Pascal, 2002년
  16. ^ Helen Mary Walker (1975). Studies in the history of statistical method. Arno Press. ISBN 9780405066283. Archived from the original on 2020-07-27. Retrieved 2015-06-27.
  17. ^ Galton, F (1877). "Typical laws of heredity". Nature. 15 (388): 492–553. Bibcode:1877Natur..15..492.. doi:10.1038/015492a0.
  18. ^ Stigler, S.M. (1989). "Francis Galton's Account of the Invention of Correlation". Statistical Science. 4 (2): 73–79. doi:10.1214/ss/1177012580.
  19. ^ Pearson, K. (1900). "On the Criterion that a given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it can be reasonably supposed to have arisen from Random Sampling". Philosophical Magazine. Series 5. 50 (302): 157–175. doi:10.1080/14786440009463897. Archived from the original on 2020-08-18. Retrieved 2019-06-27.
  20. ^ "Karl Pearson (1857–1936)". Department of Statistical Science – University College London. Archived from the original on 2008-09-25.
  21. ^ Fisher 1971 loc=Loc II.정신-물리 실험으로 설명되는 실험의 원리, 섹션 8.
  22. ^ OED 인용: 1935 R.A.Fisher, The Design of Experiments II. 19, "우리는 이 가설을 '늘 가설'이라고 말할 수 있으며, 귀무 가설은 실험 과정에서 증명되거나 확립되지 않았지만, 아마도 반증될 수 있다."
  23. ^ Box, JF (February 1980). "R.A. Fisher and the Design of Experiments, 1922–1926". The American Statistician. 34 (1): 1–7. doi:10.2307/2682986. JSTOR 2682986.
  24. ^ Yates, F (June 1964). "Sir Ronald Fisher and the Design of Experiments". Biometrics. 20 (2): 307–321. doi:10.2307/2528399. JSTOR 2528399.
  25. ^ Stanley, Julian C. (1966). "The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later". American Educational Research Journal. 3 (3): 223–229. doi:10.3102/00028312003003223. JSTOR 1161806. S2CID 145725524.
  26. ^ Agresti, Alan; David B. Hichcock (2005). "Bayesian Inference for Categorical Data Analysis" (PDF). Statistical Methods & Applications. 14 (3): 298. doi:10.1007/s10260-005-0121-y. S2CID 18896230. Archived (PDF) from the original on 2013-12-19. Retrieved 2013-12-19.
  27. ^ Edwards, A.W.F. (1998). "Natural Selection and the Sex Ratio: Fisher's Sources". American Naturalist. 151 (6): 564–569. doi:10.1086/286141. PMID 18811377. S2CID 40540426.
  28. ^ A.(1915년 R.A.(1915년) .성적 취향의 진화. (7) 184:192번
  29. ^ 피셔, R.A. (1930) 자연선택의 유전학 이론.ISBN 0-19-850440-3
  30. ^ Edwards, A.W.F. (2000): 유전학에 .유유에관관관 、 ,,,사사논논 。 (
  31. ^ Andersson, Malte (1994). Sexual Selection. Princeton University Press. ISBN 0-691-00057-3. Archived from the original on 2019-12-25. Retrieved 2019-09-19.
  32. ^ L.W. (2006년)는 M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. M. L. W. (2006). ( 、 、 、 생21 、 296:302
  33. ^ Gayon, J. (): 또 다른 .또른 Rendus 144 Comptes Rendus Biologies (333) 134:144
  34. ^ Neyman, J (1934). "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection". Journal of the Royal Statistical Society. 97 (4): 557–625. doi:10.2307/2342192. JSTOR 2342192.
  35. ^ "Science in a Complex World – Big Data: Opportunity or Threat?". Santa Fe Institute. Archived from the original on 2016-05-30. Retrieved 2014-10-13.
  36. ^ Freedman, D.A. (2005) 통계 모델: 이론과 실천, 케임브리지 대학 출판부.ISBN 978-0-521-67105-7
  37. ^ McCarney R, Warner J, Iliffe S, van Haselen R, Griffin M, Fisher P (2007). "The Hawthorne Effect: a randomised, controlled trial". BMC Med Res Methodol. 7 (1): 30. doi:10.1186/1471-2288-7-30. PMC 1936999. PMID 17608932.
  38. ^ Rothman, Kenneth J; Greenland, Sander; Lash, Timothy, eds. (2008). "7". Modern Epidemiology (3rd ed.). Lippincott Williams & Wilkins. p. 100. ISBN 9780781755641.
  39. ^ Mosteller, F.; Tukey, J.W (1977). Data analysis and regression. Boston: Addison-Wesley.
  40. ^ 넬더, J.A.(1990).통계정보의 분석과 해석을 전산화하는 데 필요한 지식.Expert 시스템과 인공지능: 데이터에 대한 정보의 필요성.Library Association Report, 런던, 3월 23-27일
  41. ^ Chrisman, Nicholas R (1998). "Rethinking Levels of Measurement for Cartography". Cartography and Geographic Information Science. 25 (4): 231–242. doi:10.1559/152304098782383043.
  42. ^ 반 덴 버그, G. (1991)분석 방법 선택.레이든: DSWO 프레스
  43. ^ 손, D.J. (2004)측정 이론 및 실천: 수량화를 통한 세계.런던:아놀드.
  44. ^ Mann, Prem S. (1995). Introductory Statistics (2nd ed.). Wiley. ISBN 0-471-31009-3.
  45. ^ Upton, G., Cook, I. (2008) 옥스포드 통계 사전, OUP. ISBN 978-0-19-954145-4.
  46. ^ a b Elio,e 2007 Piazzzza Elio, Probilita e Statistica, Esculapio 2007
  47. ^ Everitt, Brian (1998). The Cambridge Dictionary of Statistics. Cambridge, UK New York: Cambridge University Press. ISBN 0521593468.
  48. ^ "Cohen (1994) The Earth Is Round (p < .05)". YourStatsGuru.com. Archived from the original on 2015-09-05. Retrieved 2015-07-20.
  49. ^ Little J데이터를 , York:, Roderick J.A., Wiley 2002.
  50. ^ Ioannidis, J.P.A. (2005). "Why Most Published Research Findings Are False". PLOS Medicine. 2 (8): e124. doi:10.1371/journal.pmed.0020124. PMC 1182327. PMID 16060722.
  51. ^ a b c Huff, Darrell(1954) How to Lie with Statistics, WW Norton & Company, Inc.뉴욕.ISBN 0-393-31072-8
  52. ^ Warne, R. Lazo; Ramos, T.; Ritter, N. (2012). "Statistical Methods Used in Gifted Education Journals, 2006–2010". Gifted Child Quarterly. 56 (3): 134–149. doi:10.1177/0016986212444122. S2CID 144168910.
  53. ^ a b Drennan, Robert D. (2008). "Statistics in archaeology". In Pearsall, Deborah M. (ed.). Encyclopedia of Archaeology. Elsevier Inc. pp. 2093–2100. ISBN 978-0-12-373962-9.
  54. ^ a b Cohen, Jerome B. (December 1938). "Misuse of Statistics". Journal of the American Statistical Association. JSTOR. 33 (204): 657–674. doi:10.1080/01621459.1938.10502344.
  55. ^ Freund, J.E. (1988). "Modern Elementary Statistics". Credo Reference.
  56. ^ Huff, Darrell; Irving Geis (1954). How to Lie with Statistics. New York: Norton. The dependability of a sample can be destroyed by [bias]... allow yourself some degree of skepticism.
  57. ^ Nelder, John A. (1999). "From Statistics to Statistical Science". Journal of the Royal Statistical Society. Series D (The Statistician). 48 (2): 257–269. doi:10.1111/1467-9884.00187. ISSN 0039-0526. JSTOR 2681191. Archived from the original on 2022-01-15. Retrieved 2022-01-15.
  58. ^ Nikoletseas, M.M. (2014) "통계:개념과 예시"ISBN 978-1500815684
  59. ^ Anderson, D.R.; Sweeney, D.J.; Williams, T.A.(1994) 통계개론: 개념응용 프로그램, 페이지 5-9.웨스트 그룹ISBN 978-0-314-03309-3
  60. ^ "Journal of Business & Economic Statistics". Journal of Business & Economic Statistics. Taylor & Francis. Archived from the original on 27 July 2020. Retrieved 16 March 2020.
  61. ^ a b Natalia Loaiza Velásquez, María Isabel González Lutz & Julián Monge-Nájera (2011). "Which statistics should tropical biologists learn?" (PDF). Revista Biología Tropical. 59: 983–992. Archived (PDF) from the original on 2020-10-19. Retrieved 2020-04-26.
  62. ^ Pekoz, Erol (2009). The Manager's Guide to Statistics. Erol Pekoz. ISBN 9780979570438.
  63. ^ "Aims and scope". Journal of Business & Economic Statistics. Taylor & Francis. Archived from the original on 23 June 2021. Retrieved 16 March 2020.
  64. ^ "Journal of Business & Economic Statistics". Journal of Business & Economic Statistics. Taylor & Francis. Archived from the original on 27 July 2020. Retrieved 16 March 2020.
  65. ^ 수많은 .
    • 샤프, N. (2014년)비즈니스 통계, 피어슨.ISBN 978-0134705217
    • Wegner, T. (2010년)적용되는 비즈니스 통계: 메서드와 엑셀 기반의 어플리케이션, Juta Academic.ISBN 0702172863
    열려 있는 교재에는 다음 두 가지가 있습니다.
  66. ^ Cline, Graysen (2019). Nonparametric Statistical Methods Using R. EDTECH. ISBN 978-1-83947-325-8. OCLC 1132348139. Archived from the original on 2022-05-15. Retrieved 2021-09-16.
  67. ^ Palacios, Bernardo; Rosario, Alfonso; Wilhelmus, Monica M.; Zetina, Sandra; Zenit, Roberto (2019-10-30). "Pollock avoided hydrodynamic instabilities to paint with his dripping technique". PLOS ONE. 14 (10): e0223706. Bibcode:2019PLoSO..1423706P. doi:10.1371/journal.pone.0223706. ISSN 1932-6203. PMC 6821064. PMID 31665191.

읽기 ★★★★★★★★★★★★★★」

( )