데이터 분석

Data analysis

데이터 분석은 유용한 정보 발견, 결론 정보 제공 및 의사 [1]결정 지원을 목적으로 데이터를 검사, 정리, 변환모델링하는 프로세스입니다.데이터 분석은 다양한 이름으로 다양한 기술을 포괄하는 여러 측면과 접근방식을 가지고 있으며 다양한 비즈니스,[2] 과학 및 사회과학 영역에서 사용됩니다.오늘날의 비즈니스 세계에서 데이터 분석은 보다 과학적인 결정을 내리고 비즈니스의 [3]효율적인 운영을 지원하는 데 중요한 역할을 합니다.

데이터 마이닝은 단순한 서술적 목적이 아닌 예측적 목적을 위한 통계 모델링 및 지식 발견에 초점을 맞춘 특정 데이터 분석 기법이며, 비즈니스 인텔리전스는 주로 비즈니스 [4]정보에 초점을 맞춘 집계에 의존하는 데이터 분석을 포함합니다.통계 어플리케이션에서 데이터 분석은 기술 통계, 탐색 데이터 분석(EDA) 및 확인 데이터 분석(CDA)[5]으로 나눌 수 있다.EDA는 데이터에서 새로운 특징을 발견하는 데 초점을 맞추고 CDA는 기존 [6][7]가설을 확인하거나 위조하는 데 초점을 맞춥니다.예측 분석은 예측 예측 또는 분류를 위한 통계 모델의 적용에 초점을 맞추고, 텍스트 분석은 통계, 언어 및 구조 기법을 적용하여 비구조 데이터의 일종인 텍스트 소스에서 정보를 추출하고 분류합니다.위의 내용은 모두 다양한 데이터 [8]분석입니다.

데이터 통합은 데이터 분석의 전조이며 데이터 분석은 데이터 시각화 및 데이터 [9]배포와 밀접하게 관련되어 있습니다.

데이터 분석 프로세스

Doing Data Science의 데이터 과학 프로세스 흐름도 by Schutt & O'Neil (2013)

분석(Analysis)은 개별 [10]검사를 위해 전체를 개별 구성요소로 나누는 것을 말합니다.데이터 분석이란 원시 데이터를 취득하고 [1]이를 사용자의 의사결정에 유용한 정보로 변환하는 프로세스입니다.데이터는 질문에 대한 답변, 가설 테스트 또는 이론 [11]반증을 위해 수집 및 분석됩니다.

통계학자 John Tukey, 1961년 정의된 데이터 분석:

"데이터 분석을 위한 절차, 이러한 절차의 결과를 해석하는 기술, 데이터 분석을 보다 쉽고 정밀하게 또는 정확하게 하기 위한 데이터 수집을 계획하는 방법, 데이터 [12]분석에 적용되는 (수학적인) 통계의 모든 기계와 결과입니다.

아래 설명과 같이 몇 가지 단계를 구분할 수 있습니다.단계는 반복적이며, 이후 단계의 피드백은 이전 [13]단계의 추가 작업으로 이어질 수 있습니다.데이터 마이닝에 사용되는 CRISP 프레임워크도 비슷한 단계를 거칩니다.

data 요건

데이터는 분석을 지시하는 사람(또는 분석 [14][15]완제품을 사용할 고객)의 요건에 따라 지정된 분석에 대한 입력으로 필요합니다.데이터가 수집되는 일반적인 유형의 실체를 실험 단위(예: 사람 또는 인구)라고 한다.모집단과 관련된 특정 변수(예: 연령 및 소득)를 지정하고 얻을 수 있다.데이터는 숫자 또는 범주형(즉,[13] 숫자에 대한 텍스트 레이블)일 수 있습니다.

데이터 수집

데이터는 다양한 [16][17]소스로부터 수집됩니다.요건은 분석가가 데이터 관리인에게 전달할 수 있습니다(예: 조직 [18]정보기술 담당).데이터는 교통 카메라, 위성, 기록 장치 등을 포함한 환경의 센서로부터 수집될 수도 있습니다.인터뷰, 온라인 소스로부터의 다운로드 또는 [13]문서 열람을 통해서도 입수할 수 있습니다.

데이터 처리

원시 정보를 실행 가능한 인텔리전스 또는 지식으로 변환하는 데 사용되는 인텔리전스 사이클의 단계는 개념적으로 데이터 분석 단계와 유사합니다.

데이터를 처음 입수했을 때는 분석을 [19][20]위해 처리 또는 정리해야 합니다.예를 들어, 추가 분석을 위해 데이터를 표 형식(구조화 데이터라고 함)의 행과 열에 배치하는 경우가 종종 스프레드시트 또는 통계 [13]소프트웨어를 사용하여 발생할 수 있습니다.

데이터 클리닝

처리 및 구성되면 데이터가 불완전하거나 중복되거나 [21][22]오류가 발생할 수 있습니다.데이터 클리닝의 필요성은 데이터 입력 및 [21]저장 방식의 문제로 인해 발생합니다.데이터 클리닝은 이러한 오류를 방지하고 수정하는 프로세스입니다.일반적인 작업에는 레코드 일치, 데이터의 부정확성 식별, 기존 데이터의 전반적인 품질, 중복제거 및 열 [23]분할이 포함됩니다.이러한 데이터 문제는 다양한 분석 기법을 통해서도 확인할 수 있다.예를 들어, 재무정보를 사용하여 특정 변수의 합계를 신뢰할 [24][25]수 있다고 여겨지는 별도로 발표된 숫자와 비교할 수 있다.사전 설정된 임계값을 초과하거나 밑도는 비정상적인 금액도 검토될 수 있다.데이터 클리닝에는 전화번호, 이메일주소, 고용주 또는 기타 [26][27]값 등 세트의 데이터 유형에 따라 여러 가지 유형이 있습니다.특이치 탐지를 위한 정량적 데이터 방법을 사용하여 [28]잘못 입력될 가능성이 높은 데이터를 제거할 수 있습니다.텍스트 데이터 맞춤법 검사기를 사용하여 잘못 입력된 단어의 수를 줄일 수 있습니다.하지만 단어 자체가 [29]정확한지 말하기가 더 어렵다.

탐색적 데이터 분석

데이터셋을 정리하면 분석할 수 있습니다.분석가는 탐색적 데이터 분석이라고 하는 다양한 기법을 적용하여 얻은 [30]데이터에 포함된 메시지를 이해하기 시작할 수 있다.데이터 탐색 프로세스로 인해 데이터 삭제 또는 데이터 요청이 추가될 수 있습니다. 따라서 이 [31]섹션의 선두 단락에서 언급한 반복 단계의 초기화가 이루어집니다.데이터를 이해하는 데 도움이 되도록 평균 또는 중위수와 [32][33]같은 기술 통계량을 생성할 수 있습니다.데이터 시각화는 또한 분석가가 데이터 [13]내의 메시지에 대해 추가적인 통찰력을 얻기 위해 그래픽 형식으로 데이터를 검사할 수 있는 기법이다.

모델링 및 알고리즘

수학 공식 또는 모형(알고리즘으로 알려져 있음)은 변수 간의 관계를 식별하기 위해 데이터에 적용될 수 있습니다(예를 들어 상관 관계 또는 인과 [34][35]관계 사용).일반적으로, 구현된 모델의 정확도에 따라 일부 잔류 오차가 있는 데이터 세트에 포함된 다른 변수를 기반으로 특정 변수를 평가하기 위해 모델을 개발할 수 있다(예: 데이터 = 모델 + 오류).[36][11]

추리 통계에는 특정 [37]변수 간의 관계를 측정하는 기법을 사용하는 것이 포함됩니다.예를 들어, 회귀 분석을 사용하여 광고의 변화(독립 변수 X)가 매출 변동(의존 변수 Y)[38]에 대한 설명을 제공하는지 여부를 모형화할 수 있습니다.수학적으로 Y(판매)는 X(광고)[39]함수입니다.(Y = aX + b + 오차)로 설명할 수 있습니다. 여기서 모델은 [40]X의 주어진 범위에 대해 Y를 예측할 때 (a) 및 (b) 오차를 최소화하도록 설계됩니다.분석가는 분석을 단순화하고 [11]결과를 전달하기 위해 데이터를 설명하는 모델을 구축하려고 시도할 수도 있습니다.

데이터 제품

데이터 제품은 데이터 입력을 받고 출력을 생성하여 [41]환경에 데이터를 다시 공급하는 컴퓨터 애플리케이션입니다.모델 또는 알고리즘에 기반할 수 있습니다.예를 들어, 고객 구매 이력에 대한 데이터를 분석하고 그 결과를 사용하여 고객이 [42][13]즐길 수 있는 다른 구매를 추천하는 애플리케이션입니다.

의사소통

데이터 시각화는 데이터 분석 [43]후 결과를 이해하기 위해 사용됩니다.

데이터를 분석하면 분석 사용자에게 다양한 형식으로 보고하여 요구사항을 [44]지원할 수 있습니다.사용자에게 피드백이 있을 수 있으므로 추가 분석이 이루어집니다.따라서 분석 주기의 대부분은 [13]반복적이다.

분석가는 결과를 전달하는 방법을 결정할 때 [45]청중에게 메시지를 보다 명확하고 효율적으로 전달하는 데 도움이 되는 다양한 데이터 시각화 기술의 구현을 고려할 수 있습니다.데이터 시각화는 정보 표시(표, 차트 등)를 사용하여 [46]데이터에 포함된 주요 메시지를 쉽게 전달할 수 있습니다.는 사용자가 특정 숫자를 조회하고 초점을 맞출 수 있도록 하는 유용한 도구입니다. 그러나 차트(막대형 차트 또는 꺽은선형 차트 등)는 [47]데이터에 포함된 정량적 메시지를 설명하는 데 도움이 될 수 있습니다.

수량 메시지

시간 경과에 따른 미국 연방 지출 및 수익의 추세를 나타내는 선 그래프로 나타낸 시계열.
특정 시점에 측정된 두 변수(인플레이션과 실업) 간의 상관 관계를 나타내는 산점도입니다.

Stephen Few는 사용자가 일련의 데이터와 메시지 [48]전달에 도움이 되는 관련 그래프에서 이해하거나 전달하려고 시도할 수 있는 8가지 유형의 정량적 메시지를 설명했습니다.요건을 지정하는 고객 및 데이터 분석을 수행하는 분석가는 프로세스 [49]중에 이러한 메시지를 고려할 수 있습니다.

  1. 시계열:단일 변수는 10년 동안의 실업률과 같이 일정 기간 동안 캡처됩니다.선형 차트를 사용하여 추세를 나타낼 [50]수 있습니다.
  2. 순위 : [51]판매원별 판매실적(척도) 순위(판매원별, 판매원별 카테고리 구분) 등 카테고리 구분은 오름차순 또는 내림차순으로 매겨진다.막대 그래프는 판매원 [52]간의 비교를 보여주는 데 사용할 수 있습니다.
  3. 부품 대 전체: 범주형 분할은 전체에 대한 비율(100% 중 백분율)로 측정됩니다.파이 차트 또는 막대 그래프는 시장에서 [53]경쟁자가 나타내는 시장 점유율과 같은 비율의 비교를 보여줄 수 있습니다.
  4. 편차:범주형 세분화는 특정 기간 동안 기업의 여러 부서에 대한 실제 지출과 예산 지출의 비교와 같은 참조와 비교됩니다.막대 차트는 실제 양과 기준 [54]양의 비교를 보여줄 수 있습니다.
  5. 도수 분포:주식 시장 수익률이 0~10%, 11~20% 등과 같은 간격 사이에 있는 연수와 같은 특정 변수의 관측치 수를 표시합니다.이 분석에는 막대 차트의 일종인 [55]히스토그램을 사용할 수 있습니다.
  6. 상관 관계:두 변수(X,Y)로 표시되는 관측치 간의 비교로, 같은 방향으로 이동하는지 또는 반대 방향으로 이동하는지 확인합니다.예를 들어, 표본 개월 동안의 실업률(X)과 인플레이션(Y)을 표시합니다.이 메시지에는 일반적으로 [56]산점도(scatplot)가 사용됩니다.
  7. 명목비교 : 상품코드별 판매량 등 카테고리별 세분화 비교[57]비교에는 막대 차트를 사용할 수 있습니다.
  8. 지리적 또는 지리적 공간:지도 또는 레이아웃에 걸친 변수 비교(예: 주별 실업률 또는 건물의 다양한 층의 인구 수).차트 [58][59]그래프는 사용되는 일반적인 그래픽입니다.

정량 데이터 분석 기법

저자인 Jonathan Koomey는 정량적 [60]데이터를 이해하기 위한 일련의 모범 사례를 추천했습니다.여기에는 다음이 포함됩니다.

  • 분석을 수행하기 전에 Raw data의 이상 유무를 확인합니다.
  • 공식에 기초한 데이터 열을 검증하는 등 중요한 계산을 다시 수행합니다.
  • 주합계가 소합계의 합계인지 확인한다.
  • 시간 경과에 따른 비율과 같이 예측 가능한 방식으로 관련되어야 하는 숫자 간의 관계를 확인합니다.
  • 1인당 또는 GDP 대비 또는 기준연도에 대한 지수값 분석과 같이 쉽게 비교할 수 있도록 숫자를 정규화한다.
  • DuPont[25]자기자본이익률 분석과 같은 결과를 초래한 요인을 분석하여 문제를 컴포넌트 부품으로 나눕니다.

분석가는 일반적으로 조사 중인 변수의 경우 평균(평균), 중위수 및 표준 [61]편차와 같은 변수에 대한 기술 통계량을 얻습니다.또한 개별 값이 [62]평균 주위에 어떻게 군집되는지 확인하기 위해 주요 변수의 분포를 분석할 수도 있습니다.

데이터 분석에 사용되는 MECE 원칙의 그림.

McKinsey & Company의 컨설턴트들은 정량적 문제를 MECE [63]원리라고 불리는 부품으로 분해하는 기술을 명명했습니다.각 레이어는 그 컴포넌트로 분할할 수 있습니다.각 서브 컴포넌트는 서로 배타적이어야 하며 그 [64]위의 레이어에 집합적으로 가산되어야 합니다.이 관계를 "상호 배타적이고 일괄적으로 완전하다" 또는 MECE라고 부릅니다.예를 들어 정의상 이익은 총 수익과 총 비용으로 [65]나눌 수 있습니다.결과적으로, 총수입은 A, B, C의 수익(상호 배타적)과 같은 구성요소에 의해 분석될 수 있으며, 총수입(전체적으로 포괄적)[66]에 추가되어야 한다.

분석가는 강력한 통계 측정을 사용하여 특정 분석 [67]문제를 해결할 수 있습니다.가설 테스트는 분석가가 실제 상황에 대한 특정 가설을 만들고 해당 상황이 참인지 [68][69]거짓인지를 판단하기 위해 데이터를 수집할 때 사용됩니다.예를 들어, "실업은 인플레이션에 영향을 미치지 않는다"는 가설은 필립스 [70]곡선이라고 불리는 경제 개념과 관련이 있을 수 있다.가설 검정에는 데이터가 [71][72]가설을 수용하는지 또는 기각하는지 여부와 관련된 유형 I 및 유형 II 오류의 가능성을 고려하는 작업이 포함됩니다.

회귀 분석 사용할 수 있을 때 그 분석가 노력하고 판단하기에 독립 변수 X에 영향을 미친 의존이 변수 Y(예:"어느 정도까지 실업률(X)에 변화가 물가 상승률(Y)에 어떤 영향을 미칩니까?")[73] 노리고 있는 모델 맞는 또는 사람들은 방정식을 선이나 곡선에 데이터를 있는 것처럼 Y는 기능의 X[74][75]

필요한 조건 분석(국가 통수 기구)사용할 수 있을 때 그 분석가 노력하고 판단하기에 독립 변수 X할 수 있는 가변 Y(예:"어느 정도까지 특정한 물가 상승률(Y)는 특정 실업률(X)이 필수적인가요?")[73]는 반면에(다중)회귀 분석을 사용하여 첨가제 논리는 각 X-variable 수 있는을 생산했다. 그결과와 X가 서로 보상할 수 있다(충분하지만 [76]필요하지 않다).필요조건분석(NCA)은 필요논리를 사용한다.필요조건분석(NCA)은 하나 이상의 X변수가 결과를 존재하게 하지만 생성하지 않을 수 있다(필요하지만 충분하지 않다).각각의 필요한 조건이 존재해야 하며 보상은 [77]불가능합니다.

데이터 사용자의 분석 활동

사용자는 위에서 설명한 일반적인 메시지와 달리 데이터 세트 내에서 특정 데이터 포인트를 가질 수 있습니다.이러한 낮은 수준의 사용자 분석 활동은 다음 표에 제시되어 있습니다.분류법은 값 검색, 데이터 포인트 검색 및 데이터 [78][79][80][81]포인트 배열의 세 가지 활동 극으로 구성할 수도 있습니다.

# 작업 일반
묘사
프로포마
추상적인
1 값 가져오기 특정 케이스 세트를 지정하면 해당 케이스의 속성을 찾습니다. 특성 {X, Y, Z}의 값은 무엇입니까?데이터 케이스 {A, B, C, ...}에 }이(가) 있습니까? - 포드 몬데오의 갤런당 주행거리는?

- 영화 '바람과 함께 사라지다'는 얼마나 걸리나요?

2 필터 속성 값에 대한 몇 가지 구체적인 조건을 고려하여 해당 조건을 충족하는 데이터 케이스를 찾습니다. {A, B, C...} 조건을 충족하는 데이터 케이스는 무엇입니까? - 켈로그 시리얼 중 섬유질이 높은 것은?

- 어떤 코미디가 상을 받았나요?

- SP-500보다 실적이 낮은 펀드는?

3 파생 가치 계산 데이터 케이스 세트를 지정하면 해당 데이터 케이스의 집계 수치 표현을 계산합니다. 주어진 데이터 사례 집합 S에 대한 집계 함수 F의 가치는 무엇인가? ·포스트 시리얼의 평균 칼로리 함량은?

·전체 점포의 총수입은?

·자동차 메이커는 몇 개인가?

4 익스트림 찾기 데이터 집합 내에서 해당 범위에 걸쳐 속성의 극단 값을 가진 데이터 케이스를 찾습니다. 속성 A에 관한 상위/하위 N개의 데이터 케이스는 무엇입니까? - MPG가 가장 높은 차는 무엇입니까?

- 가장 많은 상을 받은 감독/영화는?

- 개봉일이 가장 최근인 마블 스튜디오 영화는?

5 종류 일련의 데이터 케이스를 지정하면 순서 메트릭에 따라 순위를 매깁니다. 속성 A의 값에 따라 데이터 케이스 집합 S의 정렬 순서는 어떻게 됩니까? - 무게에 따라 차를 주문합니다.

- 시리얼을 칼로리별로 순위를 매긴다.

6 범위 결정 데이터 케이스 세트와 관심 속성을 지정하면 세트 내에서 값의 범위를 찾습니다. 데이터 케이스 세트 S에서 속성 A의 값 범위는 어떻게 됩니까? ·필름 길이 범위는?

·자동차 마력의 범위는?

- 데이터 세트에는 어떤 여배우가 있나요?

7 배포의 특성화 데이터 케이스 집합과 관심 있는 정량적 속성이 주어진 경우 집합 전체에 걸쳐 해당 속성 값의 분포를 특성화합니다. 데이터 케이스 세트 S에서 속성 A의 값의 분포는 어떻게 됩니까? - 곡물 속 탄수화물의 분포는?

·쇼핑객의 연령 분포는?

8 이상 징후 검색 주어진 관계 또는 기대와 관련하여 주어진 데이터 사례 집합 내의 모든 이상 징후(예: 통계적 특이치)를 식별한다. 데이터 케이스 세트 S에서 예기치 않은/예외적인 값을 갖는 데이터 케이스는 무엇입니까? ·마력과 가속력과의 관계에는 예외가 있습니까?

·단백질에 특이점이 있습니까?

9 클러스터 데이터 케이스 세트가 주어지면 유사한 속성 값의 클러스터를 찾습니다. 데이터 케이스 집합 S에서 특성 {X, Y, Z, ...}의 값이 유사한 데이터 케이스는 무엇입니까? ·유사 지방/칼로리/설탕을 포함한 시리얼 그룹이 있는가?

- 일반적인 필름 길이의 클러스터가 있습니까?

10 상관 관계 데이터 케이스 세트와 2개의 Atribute를 지정하면 이들 Atribute 값 간의 유용한 관계를 결정합니다. 데이터 케이스의 특정 세트S에 대한 속성 X와 Y의 상관관계는 무엇입니까? 탄수화물과 지방 사이에 상관관계가 있는가.

- 원산지와 MPG는 상관관계가 있습니까?

·성별로 선호하는 결제수단이 있는가?

·연간 필름 길이가 증가하는 경향은 있습니까?

11 문맥화[81] 데이터 케이스 세트를 지정하면 사용자와 데이터의 문맥적 관련성을 찾습니다. 데이터 케이스 세트 S에서 어떤 데이터 케이스가 현재 사용자의 컨텍스트와 관련이 있는가? - 현재 칼로리 섭취량을 기준으로 음식을 제공하는 레스토랑 그룹이 있나요?

효과적인 분석에 대한 장벽

효과적인 분석에 대한 장벽은 데이터 분석을 수행하는 분석가 또는 대상자들 사이에 존재할 수 있습니다.사실과 의견을 구별하는 것, 인지적 편견, 그리고 무수한 것은 모두 소리 데이터 [82]분석의 과제이다.

혼란스러운 사실과 의견

당신은 자신의 의견을 가질 권리가 있지만, 자신의 사실을 가질 자격이 없습니다.

Daniel Patrick Moynihan

효과적인 분석을 위해서는 질문에 대한 답변, 결론 또는 공식적인 의견의 뒷받침 또는 [83][84]가설을 테스트하기 위한 관련 사실을 얻어야 합니다.사실의 정의는 반박할 수 없는 것이며, 이는 분석에 관련된 모든 사람이 사실에 [85]동의할 수 있어야 한다는 것을 의미한다.예를 들어 2010년 8월 의회예산국(CBO)은 부시 대통령의 2001년과 2003년 감세를 2011년부터 2020년까지 연장하면 [86]국가채무에 약 3조3000억달러가 추가될 것으로 추산했다.모두가 이것이 정말로 CBO가 보고한 것이라는 것에 동의할 수 있어야 한다; 그들은 모두 보고서를 검토할 수 있다.이게 사실이야.사람들이 CBO에 동의하는지 아닌지는 그들 자신의 [87]의견이다.

또 다른 예로서 공기업의 감사는 상장기업의 재무제표가 '모든 중요한 면에서 공정하게 기재되어 있는지'[88]에 대해 공식적인 의견을 구해야 한다.이를 위해서는 그들의 의견을 뒷받침하기 위해 사실 데이터와 증거에 대한 광범위한 분석이 필요하다.사실에서 의견으로 비약할 때, 의견이 [89]틀릴 가능성은 항상 있다.

인지적 편견

분석에 부정적인 영향을 미칠 수 있는 다양한 인지적 편견이 있습니다.를 들어, 확인 편향은 자신의 [90]선입견을 확인하는 방식으로 정보를 검색하거나 해석하는 경향이다.또한 개인은 자신의 [91]견해를 뒷받침하지 않는 정보의 신용을 떨어뜨릴 수 있다.

분석가는 이러한 편견과 그러한 [92]편견을 극복하는 방법을 인식하도록 특별히 훈련받을 수 있다.CIA의 은퇴한 분석가 리처드 호이어는 그의 저서 '지능 분석의 심리학'에서 분석가들이 그들의 가정과 추론의 사슬을 명확하게 설명하고 [93]결론에 관련된 불확실성의 정도와 출처를 명시해야 한다고 썼다.그는 대안적 [94]관점을 표면화하고 토론하는 데 도움이 되는 절차를 강조했다.

무수

효과적인 분석가는 일반적으로 다양한 수치 기술에 능숙합니다.그러나 청중들은 숫자나 숫자에 대한 읽고 쓰는 능력을 가지고 있지 않을 수 있다; 그들은 [95]무수하다고 한다.또한 데이터를 전달하는 사람은 의도적으로 나쁜 수치 [96]기법을 사용하여 오인 또는 잘못된 정보를 제공하려고 시도할 수 있다.

예를 들어, 수치가 상승하는지 하강하는지 여부가 핵심 요인이 아닐 수 있습니다.더 중요한 것은 경제규모(GDP)에 대한 정부수입의 규모나 지출 또는 [97]기업재무제표상 수익에 대한 비용액과 같은 다른 숫자에 대한 상대적인 숫자일 수 있다.이 수치 기법을 정규화[25] 또는 공통 크기 조정이라고 합니다.인플레이션 조정(실제 데이터와 명목 데이터 비교) 또는 인구 증가, 인구 통계 [98]등을 고려하든 분석가들이 채택한 많은 기법이 있다.분석가는 [99]위의 섹션에서 설명한 다양한 정량적 메시지에 대처하기 위해 다양한 기술을 적용합니다.

분석가는 다른 가정이나 시나리오에서 데이터를 분석할 수도 있습니다.예를 들어, 분석가들이 재무제표 분석을 수행할 때, 그들은 종종 미래현금흐름의 추정치에 도달하기 위해 서로 다른 가정 하에 재무제표를 재작성하고, 그 후 일부 이자율에 기초하여 현재가치를 할인하여 회사나 [100][101]주식의 가치를 결정한다.마찬가지로, CBO는 정부의 세입, 지출 및 적자에 대한 다양한 정책 옵션의 영향을 분석하여 주요 [102]조치에 대한 대체 미래 시나리오를 만든다.

기타 토픽

스마트 빌딩

데이터 분석 접근방식을 사용하여 [103]건물의 에너지 소비를 예측할 수 있습니다.스마트 빌딩을 실현하기 위해 데이터 분석 프로세스의 다양한 단계가 수행되며, 스마트 빌딩에서는 건물 사용자의 요구를 모방하고 에너지 및 [104]시간과 같은 자원을 최적화함으로써 난방, 환기, 에어컨, 조명 및 보안을 포함한 건물 관리 및 제어 작업이 자동으로 실현됩니다.

분석 및 비즈니스 인텔리전스

분석이란 "데이터, 통계 및 정량 분석, 설명 및 예측 모델, 사실에 기반한 관리 등을 광범위하게 사용하여 의사결정과 행동을 추진하는 것"입니다.비즈니스 인텔리전스의 서브셋입니다.이것은 데이터를 사용하여 비즈니스 성과를 이해하고 분석하여 의사결정을 [105]추진하는 일련의 테크놀로지 및 프로세스입니다.

교육

데이터 시각화 사용자의 분석 활동

교육에서는 대부분의 교육자가 학생 데이터를 [106]분석하기 위해 데이터 시스템에 액세스할 수 있습니다.이러한 데이터 시스템은 교육자의 데이터 [107]분석 정확도를 높이기 위해 처방전 없이 사용할 수 있는 데이터 형식(라벨, 보충 문서, 도움말 시스템 포함 및 주요 패키지/디스플레이 및 콘텐츠 결정)으로 교육자에게 데이터를 제공합니다.

실무자용 메모

이 섹션에는 실무자에게 도움이 될 수 있지만 위키피디아 [108]문서의 일반적인 범위를 벗어나는 다소 기술적인 설명이 포함되어 있습니다.

초기 데이터 분석

초기 데이터 분석 단계와 주요 분석 단계 간의 가장 중요한 차이점은 초기 데이터 분석 중에 원래 연구 [109]질문에 대한 답변을 목적으로 하는 분석을 자제한다는 것이다.첫 번째 데이터 분석 단계는 다음 [110]4가지 질문으로 구성됩니다.

데이터 품질

데이터의 품질은 가능한 한 빨리 확인해야 합니다.데이터 품질은 빈도 카운트, 기술 통계(평균, 표준 편차, 중위수), 정규성(경도, 첨도, 주파수 히스토그램),[111] 정규성 등 여러 가지 분석 유형을 사용하여 평가할 수 있습니다.

  • 극단적 관측치 분석: 데이터의 외곽 관측치가 분포를 방해하는 [112]것으로 보이는지 여부를 분석합니다.
  • 부호화 방식의 차이 비교 및 보정: 변수는 데이터 세트 외부의 변수 부호화 방식과 비교되며, 부호화 방식이 비교할 [113]수 없는 경우 수정될 수 있다.
  • 공통 방법 분산을 검정합니다.

초기 데이터 분석 단계에서 데이터 품질을 평가하기 위한 분석 선택은 주요 분석 [114]단계에서 수행되는 분석에 따라 달라집니다.

측정 품질

측정 기기의 품질은 연구의 초점 또는 [115][116]연구 질문이 아닌 초기 데이터 분석 단계에서만 확인해야 합니다.계측기의 구조가 문헌에 보고된 구조와 일치하는지 확인해야 한다.

측정 품질을 평가하는 두 가지 방법이 있습니다.

초기 변환

데이터와 측정의 품질을 평가한 후 [119]결측 데이터를 귀속하거나 주 분석 단계에서 하나 이상의 변수를 초기 변환하기로 결정할 수도 있습니다.
변수의 가능한 변환은 다음과 같습니다.[120]

  • 제곱근 변환(분포가 정규 분포와 중간 정도 다른 경우)
  • 로그 변환(분포가 정규 분포와 크게 다른 경우)
  • 역변환(분포가 정규 분포와 크게 다른 경우)
  • 범주형(정규 분포/이항 분포) 만들기(분포가 정규 분포와 크게 다르고 변환이 도움이 되지 않는 경우)

연구의 실행이 연구 설계의 목적을 충족하였는가?

예를 들어 배경변수와 실체변수가 그룹 [121]내 및 그룹 간에 균등하게 분포되어 있는지 여부를 확인하여 랜덤화 절차의 성공 여부를 확인해야 합니다.
연구에 랜덤화 절차가 필요하지 않거나 사용하지 않는 경우, 예를 들어 관심 모집단의 모든 부분군이 [122]표본에 표시되는지 여부를 확인하여 비랜덤 표본 추출의 성공 여부를 확인해야 합니다.
체크해야 할 기타 데이터 왜곡은 다음과 같습니다.

  • 드롭아웃(이는 최초 데이터 분석 단계에서 식별해야 합니다)
  • 항목 무응답(최초 데이터 분석 단계에서 랜덤인지 여부를 평가해야 함)
  • 처리 품질(조작 [123]검사 사용).

데이터 샘플의 특성

어떤 보고서나 기사에서도 샘플의 구조를 정확하게 [124][125]기술해야 한다.주 분석 [126]단계에서 부분군 분석을 수행할 때는 표본의 구조(특히 부분군의 크기)를 정확하게 결정하는 것이 특히 중요합니다.
데이터 샘플의 특성은 다음을 통해 평가할 수 있습니다.

  • 중요 변수의 기본 통계량
  • 산점도
  • 상관 관계 및 연관성
  • 크로스[127]

초기 데이터 분석의 최종 단계

최종 단계에서는 초기 데이터 분석 결과를 문서화하여 필요, 바람직 및 가능한 시정 조치를 [128]취한다.
또한 주요 데이터 분석의 원래 계획은 더 자세히 명시되거나 다시 [129][130]작성되어야 한다.
이를 위해 주요 데이터 분석에 대한 몇 가지 의사결정을 내릴 수 있으며, 해야 한다.

  • 비정규인 경우: 변수 하나를 변환해야 합니까? 변수를 범주형(정규형/정규형)으로 만들어야 합니까? 분석 방법을 수정해야 합니까?
  • 결손 데이터의 경우: 결손 데이터를 무시하거나 귀책해야 하며, 어떤 귀책 기술을 사용해야 합니까?
  • 특이치의 경우: 강력한 분석 기법을 사용해야 합니까?
  • 항목이 척도에 맞지 않는 경우: 항목을 생략하여 측정기를 조정해야 하는가? 아니면 다른 측정기(들)와의 비교 가능성을 보장해야 하는가?
  • (너무) 작은 부분군의 경우: 그룹 간 차이에 대한 가설을 폐기해야 합니까, 아니면 정확한 검정이나 부트스트래핑과 같은 작은 표본 기법을 사용해야 합니까?
  • 랜덤화 절차에 결함이 있는 것으로 보이는 경우: 성향 점수를 계산하여 주요 [131]분석에 공변량으로 포함시킬 수 있는가?

분석.

초기 데이터 분석 [132]단계에서는 다음과 같은 여러 분석을 사용할 수 있습니다.

  • 일변량 통계량(단일 변수)
  • 이변량 연관성(상관)
  • 그래픽 기법(산점도)

[133]수준에는 특수 통계 기법을 사용할 수 있으므로 분석을 위해 변수의 측정 수준을 고려하는 것이 중요하다.

  • 명목 변수 및 순서 변수
    • 주파수 카운트(수 및 비율)
    • 어소시에이션
      • 외주(외주)
      • 계층형 로그 선형 분석(최대 8개의 변수로 통합)
      • 로그 선형 분석(관련/중요 변수 및 가능한 교란 요인 식별)
    • 정확한 테스트 또는 부트스트랩(서브그룹이 작은 경우)
    • 새 변수 계산
  • 연속형 변수
    • 분배
      • 통계량(M, SD, 분산, 왜도, 첨도)
      • 줄기와 잎의 표시
      • 상자 그림

비선형 분석

비선형 시스템에서 데이터를 기록하는 경우 비선형 분석이 필요한 경우가 많습니다.비선형 시스템은 단순한 선형 방법으로는 분석할 수 없는 분기, 카오스, 고조파하위 고조파를 포함한 복잡한 동적 효과를 나타낼 수 있다.비선형 데이터 분석은 비선형 시스템 [134]식별과 밀접한 관련이 있습니다.

주요 데이터 분석

주요 분석 단계에서는 연구 질문에 대한 답변을 목적으로 한 분석과 연구 보고서의 [135]초안을 작성하기 위해 필요한 기타 관련 분석을 수행한다.

탐색적 및 확인적 접근법

주요 분석 단계에서는 탐색적 또는 확인적 접근법을 채택할 수 있다.일반적으로 접근 방식은 데이터를 [136]수집하기 전에 결정됩니다.탐색 분석에서는 데이터를 분석하기 전에 명확한 가설을 제시하지 않고 데이터를 [137]잘 설명하는 모델을 검색한다.확인 분석에서는 데이터에 대한 명확한 가설을 [138]테스트합니다.

탐색적 데이터 분석은 신중하게 해석되어야 한다.한 번에 여러 모형을 검정할 경우 하나 이상의 모형에서 유의한 모형을 찾을 가능성이 높지만, 이는 유형 1 [139]오류로 인해 발생할 수 있습니다.예를 들어 Bonferroni [140]보정을 사용하여 여러 모형을 검정할 때는 항상 유의 수준을 조정하는 것이 중요합니다.또한 동일한 데이터 [141]집합에서 확인 분석을 사용하여 탐색 분석을 추적해서는 안 된다.탐색적 분석은 이론을 위한 아이디어를 찾기 위해 사용되지만,[141] 그 이론을 테스트하기 위해서도 사용되지 않습니다.모델이 데이터셋에서 탐색적인 것으로 판명된 경우, 동일한 데이터셋에서 확인 분석을 통해 해당 분석을 추적하는 것은 확인 분석 결과가 [141]애초에 탐색 모델을 초래한 것과 동일한 유형 1 오류 때문이라는 것을 의미할 수 있습니다.따라서 확인 분석은 원래 탐색 [142]분석보다 더 유익하지 않을 것이다.

결과의 안정성

결과가 얼마나 일반화할 [143]수 있는지에 대한 지표를 얻는 것이 중요합니다.이는 종종 확인하기 어렵지만 결과의 안정성을 살펴볼 수 있습니다.결과는 신뢰할 수 있고 재현 가능한가?그것을 [144]하는 데는 크게 두 가지 방법이 있다.

  • 교차 검증데이터를 여러 부분으로 분할하면 데이터의 한 부분을 기반으로 한 분석(적합 모형 등)[145]이 데이터의 다른 부분에도 일반화되는지 확인할 수 있습니다.그러나 패널 데이터와 [146]같이 데이터 내에 상관 관계가 있는 경우 교차 검증은 일반적으로 부적절하다.따라서 다른 검증 방법을 사용해야 하는 경우가 있습니다.이 항목에 대한 자세한 내용은 통계 모델 [147]검증을 참조하십시오.
  • 감도 분석글로벌 파라미터가 (체계적으로) 변화할 때 시스템 또는 모델의 동작을 연구하는 절차입니다.이를 위한 한 가지 방법은 부트스트랩[148]사용하는 것입니다.

데이터 분석용 무료 소프트웨어

데이터 분석을 위한 주목할 만한 무료 소프트웨어는 다음과 같습니다.

  • DevInfo – 인간 [149]개발을 감시 및 분석하기 위해 유엔 개발 그룹이 승인한 데이터베이스 시스템.
  • ELKI – 데이터 마이닝 지향 시각화 기능을 갖춘 Java의 데이터 마이닝 프레임워크.
  • KNIME – Konstanz Information Miner, 사용자 친화적이고 포괄적인 데이터 분석 프레임워크.
  • 주황색 – 대화형 데이터 시각화 및 통계 데이터 분석, 데이터 마이닝 및 기계 학습을 위한 방법을 특징으로 하는 비주얼 프로그래밍 도구입니다.
  • Panda – 데이터 분석을 위한 Python 라이브러리.
  • PA – CERN에서 개발된 FORTRAN/C 데이터 분석 프레임워크.
  • R – 통계 컴퓨팅 및 [150]그래픽스용 프로그래밍 언어 및 소프트웨어 환경.
  • 루트 – CERN에서 개발된 C++ 데이터 분석 프레임워크.
  • SciPy – 데이터 분석용 Python 라이브러리.
  • Julia - 수치 분석 및 계산 과학에 적합한 프로그래밍 언어입니다.

국제 데이터 분석 대회

연구자의 데이터 활용을 장려하거나 데이터 [151][152]분석을 통해 특정 문제를 해결하기 위해 다양한 기업이나 조직이 데이터 분석 공모전을 개최하고 있습니다.유명한 국제 데이터 분석 콘테스트의 예는 다음과 같습니다.[153]

「 」를 참조해 주세요.

레퍼런스

인용문

  1. ^ a b "Transforming Unstructured Data into Useful Information", Big Data, Mining, and Analytics, Auerbach Publications, pp. 227–246, 2014-03-12, doi:10.1201/b16666-14, ISBN 978-0-429-09529-0, retrieved 2021-05-29
  2. ^ "The Multiple Facets of Correlation Functions", Data Analysis Techniques for Physical Scientists, Cambridge University Press, pp. 526–576, 2017, doi:10.1017/9781108241922.013, ISBN 978-1-108-41678-8, retrieved 2021-05-29
  3. ^ Xia, B.S., & Gong, P. (2015년)데이터 분석을 통한 비즈니스 인텔리전스 리뷰벤치마킹, 21(2), 300-311.doi:10.1108/BIJ-08-2012-0050
  4. ^ 데이터 분석 탐색
  5. ^ "Data Coding and Exploratory Analysis (EDA) Rules for Data Coding Exploratory Data Analysis (EDA) Statistical Assumptions", SPSS for Intermediate Statistics, Routledge, pp. 42–67, 2004-08-16, doi:10.4324/9781410611420-6, ISBN 978-1-4106-1142-0, retrieved 2021-05-29
  6. ^ Spie (2014-10-01). "New European ICT call focuses on PICs, lasers, data transfer". SPIE Professional. doi:10.1117/2.4201410.10. ISSN 1994-4403.
  7. ^ Samandar, Petersson; Svantesson, Sofia (2017). Skapandet av förtroende inom eWOM : En studie av profilbildens effekt ur ett könsperspektiv. Högskolan i Gävle, Företagsekonomi. OCLC 1233454128.
  8. ^ Goodnight, James (2011-01-13). "The forecast for predictive analytics: hot and getting hotter". Statistical Analysis and Data Mining: The ASA Data Science Journal. 4 (1): 9–10. doi:10.1002/sam.10106. ISSN 1932-1864. S2CID 38571193.
  9. ^ Sherman, Rick (4 November 2014). Business intelligence guidebook: from data integration to analytics. Amsterdam. ISBN 978-0-12-411528-6. OCLC 894555128.
  10. ^ Field, John (2009), "Dividing listening into its components", Listening in the Language Classroom, Cambridge: Cambridge University Press, pp. 96–109, doi:10.1017/cbo9780511575945.008, ISBN 978-0-511-57594-5, retrieved 2021-05-29
  11. ^ a b c Judd, Charles; McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBN 0-15-516765-0.
  12. ^ John Tukey - 데이터 분석의 미래 - 1961년 7월
  13. ^ a b c d e f g Schutt, Rachel; O'Neil, Cathy (2013). Doing Data Science. O'Reilly Media. ISBN 978-1-449-35865-5.
  14. ^ "USE OF THE DATA", Handbook of Petroleum Product Analysis, Hoboken, NJ: John Wiley & Sons, Inc, pp. 296–303, 2015-02-06, doi:10.1002/9781118986370.ch18, ISBN 978-1-118-98637-0, retrieved 2021-05-29
  15. ^ Ainsworth, Penne (20 May 2019). Introduction to accounting : an integrated approach. ISBN 978-1-119-60014-5. OCLC 1097366032.
  16. ^ Margo, Robert A. (2000). Wages and labor markets in the United States, 1820-1860. University of Chicago Press. ISBN 0-226-50507-3. OCLC 41285104.
  17. ^ Olusola, Johnson Adedeji; Shote, Adebola Adekunle; Ouigmane, Abdellah; Isaifan, Rima J. (7 May 2021). "Table 1: Data type and sources of data collected for this research". PeerJ. 9: e11387. doi:10.7717/peerj.11387/table-1. Retrieved 2021-05-29.
  18. ^ MacPherson, Derek (2019-10-16), "Information Technology Analysts' Perspectives", Data Strategy in Colleges and Universities, Routledge, pp. 168–183, doi:10.4324/9780429437564-12, ISBN 978-0-429-43756-4, S2CID 211738958, retrieved 2021-05-29
  19. ^ Nelson, Stephen L. (2014). Excel data analysis for dummies. Wiley. ISBN 978-1-118-89810-9. OCLC 877772392.
  20. ^ "Figure 3—source data 1. Raw and processed values obtained through qPCR". dx.doi.org. 30 August 2017. doi:10.7554/elife.28468.029. Retrieved 2021-05-29.
  21. ^ a b Bohannon, John (2016-02-24). "Many surveys, about one in five, may contain fraudulent data". Science. doi:10.1126/science.aaf4104. ISSN 0036-8075.
  22. ^ Jeannie Scruggs, Garber; Gross, Monty; Slonim, Anthony D. (2010). Avoiding common nursing errors. Wolters Kluwer Health/Lippincott Williams & Wilkins. ISBN 978-1-60547-087-0. OCLC 338288678.
  23. ^ "Data Cleaning". Microsoft Research. Retrieved 26 October 2013.
  24. ^ Hancock, R.G.V.; Carter, Tristan (February 2010). "How reliable are our published archaeometric analyses? Effects of analytical techniques through time on the elemental analysis of obsidians". Journal of Archaeological Science. 37 (2): 243–250. doi:10.1016/j.jas.2009.10.004. ISSN 0305-4403.
  25. ^ a b c Perceptive Edge-Jonathan Koomey 정량적 데이터 이해를 위한 모범 사례 - 2006년 2월 14일
  26. ^ Peleg, Roni; Avdalimov, Angelika; Freud, Tamar (2011-03-23). "Providing cell phone numbers and email addresses to Patients: the physician's perspective". BMC Research Notes. 4 (1): 76. doi:10.1186/1756-0500-4-76. ISSN 1756-0500. PMC 3076270. PMID 21426591.
  27. ^ Goodman, Lenn Evan (1998). Judaism, human rights, and human values. Oxford University Press. ISBN 0-585-24568-1. OCLC 45733915.
  28. ^ Hanzo, Lajos. "Blind joint maximum likelihood channel estimation and data detection for single-input multiple-output systems". dx.doi.org. doi:10.1049/iet-tv.44.786. Retrieved 2021-05-29.
  29. ^ Hellerstein, Joseph (27 February 2008). "Quantitative Data Cleaning for Large Databases" (PDF). EECS Computer Science Division: 3. Retrieved 26 October 2013.
  30. ^ Davis, Steve; Pettengill, James B.; Luo, Yan; Payne, Justin; Shpuntoff, Al; Rand, Hugh; Strain, Errol (26 August 2015). "CFSAN SNP Pipeline: An automated method for constructing SNP matrices from next-generation sequence data". PeerJ Computer Science. 1: e20. doi:10.7717/peerj-cs.20/supp-1. Retrieved 2021-05-31.
  31. ^ "FTC requests additional data". Pump Industry Analyst. 1999 (48): 12. December 1999. doi:10.1016/s1359-6128(99)90509-8. ISSN 1359-6128.
  32. ^ "Exploring your Data with Data Visualization & Descriptive Statistics: Common Descriptive Statistics for Quantitative Data". 2017. doi:10.4135/9781529732795. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  33. ^ Murray, Daniel G. (2013). Tableau your data! : fast and easy visual analysis with Tableau Software. J. Wiley & Sons. ISBN 978-1-118-61204-0. OCLC 873810654.
  34. ^ Ben-Ari, Mordechai (2012), "First-Order Logic: Formulas, Models, Tableaux", Mathematical Logic for Computer Science, London: Springer London, pp. 131–154, doi:10.1007/978-1-4471-4129-7_7, ISBN 978-1-4471-4128-0, retrieved 2021-05-31
  35. ^ Sosa, Ernest (2011). Causation. Oxford Univ. Press. ISBN 978-0-19-875094-9. OCLC 767569031.
  36. ^ Evans, Michelle V.; Dallas, Tad A.; Han, Barbara A.; Murdock, Courtney C.; Drake, John M. (28 February 2017). Brady, Oliver (ed.). "Figure 2. Variable importance by permutation, averaged over 25 models". eLife. 6: e22053. doi:10.7554/elife.22053.004. Retrieved 2021-05-31.
  37. ^ Watson, Kevin; Halperin, Israel; Aguilera-Castells, Joan; Iacono, Antonio Dello (12 November 2020). "Table 3: Descriptive (mean ± SD), inferential (95% CI) and qualitative statistics (ES) of all variables between self-selected and predetermined conditions". PeerJ. 8: e10361. doi:10.7717/peerj.10361/table-3. Retrieved 2021-05-31.
  38. ^ Cortés-Molino, Álvaro; Aulló-Maestro, Isabel; Fernandez-Luque, Ismael; Flores-Moya, Antonio; Carreira, José A.; Salvo, A. Enrique (22 October 2020). "Table 3: Best regression models between LIDAR data (independent variable) and field-based Forestereo data (dependent variable), used to map spatial distribution of the main forest structure variables". PeerJ. 8: e10158. doi:10.7717/peerj.10158/table-3. Retrieved 2021-05-31.
  39. ^ International Sales Terms, Beck/Hart, 2014, doi:10.5040/9781472561671.ch-003, ISBN 978-1-4725-6167-1, retrieved 2021-05-31
  40. ^ Nwabueze, JC (2008-05-21). "Performances of estimators of linear model with auto-correlated error terms when the independent variable is normal". Journal of the Nigerian Association of Mathematical Physics. 9 (1). doi:10.4314/jonamp.v9i1.40071. ISSN 1116-4336.
  41. ^ Conway, Steve (2012-07-04). "A Cautionary Note on Data Inputs and Visual Outputs in Social Network Analysis". British Journal of Management. 25 (1): 102–117. doi:10.1111/j.1467-8551.2012.00835.x. hdl:2381/36068. ISSN 1045-3172. S2CID 154347514.
  42. ^ "Customer Purchases and Other Repeated Events", Data Analysis Using SQL and Excel®, Indianapolis, Indiana: John Wiley & Sons, Inc., pp. 367–420, 2016-01-29, doi:10.1002/9781119183419.ch8, ISBN 978-1-119-18341-9, retrieved 2021-05-31
  43. ^ Grandjean, Martin (2014). "La connaissance est un réseau" (PDF). Les Cahiers du Numérique. 10 (3): 37–54. doi:10.3166/lcn.10.3.37-54.
  44. ^ Data requirements for semiconductor die. Exchange data formats and data dictionary, BSI British Standards, doi:10.3403/02271298, retrieved 2021-05-31
  45. ^ Yee, D. (1985-04-01). "How to Communicate Your Message to an Audience Effectively". The Gerontologist. 25 (2): 209. doi:10.1093/geront/25.2.209. ISSN 0016-9013.
  46. ^ Bemowska-Kałabun, Olga; Wąsowicz, Paweł; Napora-Rutkowski, Łukasz; Nowak-Życzyńska, Zuzanna; Wierzbicka, Małgorzata (11 June 2019). "Supplemental Information 1: Raw data for charts and tables". doi:10.7287/peerj.preprints.27793v1/supp-1. Retrieved 2021-05-31. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  47. ^ Visualizing Data About UK Museums: Bar Charts, Line Charts and Heat Maps. 2021. doi:10.4135/9781529768749. ISBN 9781529768749. S2CID 240967380.
  48. ^ Tunqui Neira, José Manuel (2019-09-19). "Thank you for your review. Please find in the attached pdf file a detailed response to the points you raised". dx.doi.org. doi:10.5194/hess-2019-325-ac2. S2CID 241041810. Retrieved 2021-06-01.
  49. ^ Brackett, John W. (1989), "Performing Requirements Analysis Project Courses for External Customers", Issues in Software Engineering Education, New York, NY: Springer New York, pp. 276–285, doi:10.1007/978-1-4613-9614-7_20, ISBN 978-1-4613-9616-1, retrieved 2021-06-03
  50. ^ Wyckhuys, Kris A. G.; Wongtiem, Prapit; Rauf, Aunu; Thancharoen, Anchana; Heimpel, George E.; Le, Nhung T. T.; Fanani, Muhammad Zainal; Gurr, Geoff M.; Lundgren, Jonathan G.; Burra, Dharani D.; Palao, Leo K.; Hyman, Glenn; Graziosi, Ignazio; Le, Vi X.; Cock, Matthew J. W.; Tscharntke, Teja; Wratten, Steve D.; Nguyen, Liem V.; You, Minsheng; Lu, Yanhui; Ketelaar, Johannes W.; Goergen, Georg; Neuenschwander, Peter (19 October 2018). "Figure 2: Bi-monthly mealybug population fluctuations in southern Vietnam, over a 2-year time period". PeerJ. 6: e5796. doi:10.7717/peerj.5796/fig-2. Retrieved 2021-06-03.
  51. ^ Riehl, Emily (2014), "A sampling of 2-categorical aspects of quasi-category theory", Categorical Homotopy Theory, Cambridge: Cambridge University Press, pp. 318–336, doi:10.1017/cbo9781107261457.019, ISBN 978-1-107-26145-7, retrieved 2021-06-03
  52. ^ "X-BAR CHART", SpringerReference, Berlin/Heidelberg: Springer-Verlag, 2011, doi:10.1007/springerreference_7402, retrieved 2021-06-03
  53. ^ "Chart C5.3. Percentage of 15-19 year-olds not in education, by labour market status (2012)". dx.doi.org. doi:10.1787/888933119055. Retrieved 2021-06-03.
  54. ^ "Chart 7: Households: final consumption expenditure versus actual individual consumption". dx.doi.org. doi:10.1787/665527077310. Retrieved 2021-06-03.
  55. ^ Chao, Luke H.; Jang, Jaebong; Johnson, Adam; Nguyen, Anthony; Gray, Nathanael S.; Yang, Priscilla L.; Harrison, Stephen C. (12 July 2018). Jahn, Reinhard; Schekman, Randy (eds.). "Figure 4. Frequency of hemifusion (measured as DiD fluorescence dequenching) as a function of number of bound Alexa-fluor-555/3-110-22 molecules". eLife. 7: e36461. doi:10.7554/elife.36461.006. Retrieved 2021-06-03.
  56. ^ Garnier, Elodie M.; Fouret, Nastasia; Descoins, Médéric (3 February 2020). "Table 2: Graph comparison between Scatter plot, Violin + Scatter plot, Heatmap and ViSiElse graph". PeerJ. 8: e8341. doi:10.7717/peerj.8341/table-2. Retrieved 2021-06-03.
  57. ^ "Product comparison chart: Wearables". PsycEXTRA Dataset. 2009. doi:10.1037/e539162010-006. Retrieved 2021-06-03.
  58. ^ Stephen Few-Perceptical Edge - 메시지에 적합한 그래프 선택 - 2004
  59. ^ Stephen Few-Perceptual Edge-Graph 선택 매트릭스
  60. ^ "Recommended Best Practices". dx.doi.org. 2008-10-01. doi:10.14217/9781848590151-8-en. Retrieved 2021-06-03.
  61. ^ Hobold, Edilson; Pires-Lopes, Vitor; Gómez-Campos, Rossana; Arruda, Miguel de; Andruske, Cynthia Lee; Pacheco-Carrillo, Jaime; Cossio-Bolaños, Marco Antonio (30 November 2017). "Table 1: Descriptive statistics (mean ± standard-deviation) for somatic variables and physical fitness ítems for males and females". PeerJ. 5: e4032. doi:10.7717/peerj.4032/table-1. Retrieved 2021-06-03.
  62. ^ Ablin, Jacob N.; Zohar, Ada H.; Zaraya-Blum, Reut; Buskila, Dan (13 September 2016). "Table 2: Cluster analysis presenting mean values of psychological variables per cluster group". PeerJ. 4: e2421. doi:10.7717/peerj.2421/table-2. Retrieved 2021-06-03.
  63. ^ "Consultants Employed by McKinsey & Company", Organizational Behavior 5, Routledge, pp. 77–82, 2008-07-30, doi:10.4324/9781315701974-15, ISBN 978-1-315-70197-4, retrieved 2021-06-03
  64. ^ Antiphanes (2007), Olson, S. Douglas (ed.), "H6 Antiphanes fr.172.1-4, from Women Who Looked Like Each Other or Men Who Looked Like Each Other", Broken Laughter: Select Fragments of Greek Comedy, Oxford University Press, doi:10.1093/oseo/instance.00232915, ISBN 978-0-19-928785-7, retrieved 2021-06-03
  65. ^ Carey, Malachy (November 1981). "On Mutually Exclusive and Collectively Exhaustive Properties of Demand Functions". Economica. 48 (192): 407–415. doi:10.2307/2553697. ISSN 0013-0427. JSTOR 2553697.
  66. ^ "Total tax revenue". dx.doi.org. doi:10.1787/352874835867. Retrieved 2021-06-03.
  67. ^ "Dual-use car may solve transportation problems". Chemical & Engineering News Archive. 46 (24): 44. 1968-06-03. doi:10.1021/cen-v046n024.p044. ISSN 0009-2347.
  68. ^ Heckman (1978). "Simple Statistical Models for Discrete Panel Data Developed and Applied to Test the Hypothesis of True State Dependence against the Hypothesis of Spurious State Dependence". Annales de l'inséé (30/31): 227–269. doi:10.2307/20075292. ISSN 0019-0209. JSTOR 20075292.
  69. ^ Koontz, Dean (2017). False Memory. Headline Book Publishing. ISBN 978-1-4722-4830-5. OCLC 966253202.
  70. ^ Munday, Stephen C. R. (1996), "Unemployment, Inflation and the Phillips Curve", Current Developments in Economics, London: Macmillan Education UK, pp. 186–218, doi:10.1007/978-1-349-24986-2_11, ISBN 978-0-333-64444-7, retrieved 2021-06-03
  71. ^ Louangrath, Paul I. (2013). "Alpha and Beta Tests for Type I and Type II Inferential Errors Determination in Hypothesis Testing". SSRN Electronic Journal. doi:10.2139/ssrn.2332756. ISSN 1556-5068.
  72. ^ Walko, Ann M. (2006). Rejecting the second generation hypothesis : maintaining Estonian ethnicity in Lakewood, New Jersey. AMS Press. ISBN 0-404-19454-0. OCLC 467107876.
  73. ^ a b Yanamandra, Venkataramana (September 2015). "Exchange rate changes and inflation in India: What is the extent of exchange rate pass-through to imports?". Economic Analysis and Policy. 47: 57–68. doi:10.1016/j.eap.2015.07.004. ISSN 0313-5926.
  74. ^ Mudiyanselage, Nawarathna; Nawarathna, Pubudu Manoj. Characterization of epigenetic changes and their connection to gene expression abnormalities in clear cell renal cell carcinoma. OCLC 1190697848.
  75. ^ Moreno Delgado, David; Møller, Thor C.; Ster, Jeanne; Giraldo, Jesús; Maurel, Damien; Rovira, Xavier; Scholler, Pauline; Zwier, Jurriaan M.; Perroy, Julie; Durroux, Thierry; Trinquet, Eric; Prezeau, Laurent; Rondard, Philippe; Pin, Jean-Philippe (29 June 2017). Chao, Moses V (ed.). "Appendix 1—figure 5. Curve data included in Appendix 1—table 4 (solid points) and the theoretical curve by using the Hill equation parameters of Appendix 1—table 5 (curve line)". eLife. 6: e25233. doi:10.7554/elife.25233.027. Retrieved 2021-06-03.
  76. ^ Feinmann, Jane. "How Can Engineers and Journalists Help Each Other?". dx.doi.org. doi:10.1049/iet-tv.48.859. Retrieved 2021-06-03.
  77. ^ Dul, Jan (2015). "Necessary Condition Analysis (NCA): Logic and Methodology of 'Necessary But Not Sufficient' Causality". SSRN Electronic Journal. doi:10.2139/ssrn.2588480. hdl:1765/77890. ISSN 1556-5068. S2CID 219380122.
  78. ^ Robert Amar, James Eagan 및 John Stasko(2005) "정보 시각화 분석 활동의 하위 구성요소"
  79. ^ 윌리엄 뉴먼(1994) "프로포마 추상화를 이용한 HCI 연구 산물의 예비 분석"
  80. ^ Mary Shaw (2002) "소프트웨어 엔지니어링에서 좋은 연구란 무엇인가?"
  81. ^ a b Yavari, Ali; Jayaraman, Prem Prakash; Georgakopoulos, Dimitrios; Nepal, Surya (2017). ConTaaS: An Approach to Internet-Scale Contextualisation for Developing Efficient Internet of Things Applications. ScholarSpace. Proceedings of the 50th Hawaii International Conference on System Sciences (2017). HICSS50. doi:10.24251/HICSS.2017.715. hdl:10125/41879. ISBN 9780998133102. Retrieved May 24, 2017.
  82. ^ "Connectivity tool transfers data among database and statistical products". Computational Statistics & Data Analysis. 8 (2): 224. July 1989. doi:10.1016/0167-9473(89)90021-2. ISSN 0167-9473.
  83. ^ "Information relevant to your job", Obtaining Information for Effective Management, Routledge, pp. 48–54, 2007-07-11, doi:10.4324/9780080544304-16, ISBN 978-0-08-054430-4, retrieved 2021-06-03
  84. ^ Lehmann, E. L. (2010). Testing statistical hypotheses. Springer. ISBN 978-1-4419-3178-8. OCLC 757477004.
  85. ^ Fielding, Henry (2008-08-14), "Consisting partly of facts, and partly of observations upon them", Tom Jones, Oxford University Press, doi:10.1093/owc/9780199536993.003.0193, ISBN 978-0-19-953699-3, retrieved 2021-06-03
  86. ^ "Congressional Budget Office-The Budget and Economic Outlook-August 2010-Table 1.7 on Page 24" (PDF). 18 August 2010. Retrieved 2011-03-31.
  87. ^ "Students' sense of belonging, by immigrant background". PISA 2015 Results (Volume III). PISA. 2017-04-19. doi:10.1787/9789264273856-table125-en. ISBN 9789264273818. ISSN 1996-3777.
  88. ^ Gordon, Roger (March 1990). "Do Publicly Traded Corporations Act in the Public Interest?". Cambridge, MA. doi:10.3386/w3303. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  89. ^ Minardi, Margot (2010-09-24), "Facts and Opinion", Making Slavery History, Oxford University Press, pp. 13–42, doi:10.1093/acprof:oso/9780195379372.003.0003, ISBN 978-0-19-537937-2, retrieved 2021-06-03
  90. ^ Rivard, Jillian R (2014). Confirmation bias in witness interviewing: Can interviewers ignore their preconceptions? (Thesis). Florida International University. doi:10.25148/etd.fi14071109.
  91. ^ Papineau, David (1988), "Does the Sociology of Science Discredit Science?", Relativism and Realism in Science, Dordrecht: Springer Netherlands, pp. 37–57, doi:10.1007/978-94-009-2877-0_2, ISBN 978-94-010-7795-8, retrieved 2021-06-03
  92. ^ Bromme, Rainer; Hesse, Friedrich W.; Spada, Hans, eds. (2005). Barriers and Biases in Computer-Mediated Knowledge Communication. doi:10.1007/b105100. ISBN 978-0-387-24317-7.
  93. ^ Heuer, Richards (2019-06-10). Heuer, Richards J (ed.). Quantitative Approaches to Political Intelligence. doi:10.4324/9780429303647. ISBN 9780429303647. S2CID 145675822.
  94. ^ "Introduction" (PDF). cia.gov.
  95. ^ "Figure 6.7. Differences in literacy scores across OECD countries generally mirror those in numeracy". dx.doi.org. doi:10.1787/888934081549. Retrieved 2021-06-03.
  96. ^ Bloomberg-Barry Ritholz-Insight에 합격하는 나쁜 수학 - 2014년 10월 28일
  97. ^ Gusnaini, Nuriska; Andesto, Rony; Ermawati (2020-12-15). "The Effect of Regional Government Size, Legislative Size, Number of Population, and Intergovernmental Revenue on The Financial Statements Disclosure". European Journal of Business and Management Research. 5 (6). doi:10.24018/ejbmr.2020.5.6.651. ISSN 2507-1076. S2CID 231675715.
  98. ^ Linsey, Julie S.; Becker, Blake (2011), "Effectiveness of Brainwriting Techniques: Comparing Nominal Groups to Real Teams", Design Creativity 2010, London: Springer London, pp. 165–171, doi:10.1007/978-0-85729-224-7_22, ISBN 978-0-85729-223-0, retrieved 2021-06-03
  99. ^ Lyon, J. (April 2006). "Purported Responsible Address in E-Mail Messages". doi:10.17487/rfc4407. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  100. ^ Stock, Eugene (10 June 2017). The History of the Church Missionary Society Its Environment, its Men and its Work. ISBN 978-3-337-18120-8. OCLC 1189626777.
  101. ^ Gross, William H. (July 1979). "Coupon Valuation and Interest Rate Cycles". Financial Analysts Journal. 35 (4): 68–71. doi:10.2469/faj.v35.n4.68. ISSN 0015-198X.
  102. ^ "25. General government total outlays". dx.doi.org. doi:10.1787/888932348795. Retrieved 2021-06-03.
  103. ^ González-Vidal, Aurora; Moreno-Cano, Victoria (2016). "Towards energy efficiency smart buildings models based on intelligent data analytics". Procedia Computer Science. 83 (Elsevier): 994–999. doi:10.1016/j.procs.2016.04.213.
  104. ^ "Low-Energy Air Conditioning and Lighting Control", Building Energy Management Systems, Routledge, pp. 406–439, 2013-07-04, doi:10.4324/9780203477342-18, ISBN 978-0-203-47734-2, retrieved 2021-06-03
  105. ^ Davenport, Thomas; Harris, Jeanne (2007). Competing on Analytics. O'Reilly. ISBN 978-1-4221-0332-6.
  106. ^ Aarons, D. (2009년)보고서는 학생 데이터 시스템을 구축하는 과정에서 상태를 찾습니다.교육 주간, 29(13), 6.
  107. ^ 랭킨, J. (2013년, 3월 28일)데이터 시스템 및 보고서가 데이터 분석 오류 확산과 어떻게 싸우거나 전파되는지, 교육 리더가 어떻게 도움을 줄 수 있는지.TICAL(Technology Information Center for Administrative Leadership) School Leadership Summit에서 개최Wayback Machine 프레젠테이션에서 아카이브 2019-03-26.
  108. ^ Brödermann, Eckart J. (2018), "Article 2.2.1 (Scope of the Section)", Commercial Law, Nomos Verlagsgesellschaft mbH & Co. KG, p. 525, doi:10.5771/9783845276564-525, ISBN 978-3-8452-7656-4, retrieved 2021-06-03
  109. ^ Jaech, J.L. (1960-04-21). "Analysis of dimensional distortion data from initial 24 quality certification tubes". doi:10.2172/10170345. S2CID 110058009. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  110. ^ 2008a 주소, 337페이지
  111. ^ Kjell, Oscar N. E.; Thompson, Sam (19 December 2013). "Descriptive statistics indicating the mean, standard deviation and frequency of missing values for each condition (N = number of participants), and for the dependent variables (DV)". PeerJ. 1: e231. doi:10.7717/peerj.231/table-1. Retrieved 2021-06-03.
  112. ^ Practice for Dealing With Outlying Observations, ASTM International, doi:10.1520/e0178-16a, retrieved 2021-06-03
  113. ^ "Alternative Coding Schemes for Dummy Variables", Regression with Dummy Variables, Newbury Park, CA: SAGE Publications, Inc., pp. 64–75, 1993, doi:10.4135/9781412985628.n5, ISBN 978-0-8039-5128-0, retrieved 2021-06-03
  114. ^ 주소 2008a, 페이지 338–341.
  115. ^ Danilyuk, P. M. (July 1960). "Computing the displacement of the initial contour of gears when they are checked by means of balls". Measurement Techniques. 3 (7): 585–587. doi:10.1007/bf00977716. ISSN 0543-1972. S2CID 121058145.
  116. ^ Newman, Isadore (1998). Qualitative-quantitative research methodology : exploring the interactive continuum. Southern Illinois University Press. ISBN 0-585-17889-5. OCLC 44962443.
  117. ^ Terwilliger, James S.; Lele, Kaustubh (June 1979). "Some Relationships Among Internal Consistency, Reproducibility, and Homogeneity". Journal of Educational Measurement. 16 (2): 101–108. doi:10.1111/j.1745-3984.1979.tb00091.x. ISSN 0022-0655.
  118. ^ 주소 2008a, 페이지 341–342.
  119. ^ 주소 2008a, 페이지 344
  120. ^ Tabachnick & Fidell, 2007, 87-88페이지.
  121. ^ Tchakarova, Kalina (October 2020). "2020/31 Comparing job descriptions is insufficient for checking whether work is equally valuable (BG)". European Employment Law Cases. 5 (3): 168–170. doi:10.5553/eelc/187791072020005003006. ISSN 1877-9107. S2CID 229008899.
  122. ^ Random sampling and randomization procedures, BSI British Standards, doi:10.3403/30137438, retrieved 2021-06-03
  123. ^ 주소 2008a, 페이지 344–345.
  124. ^ Sandberg, Margareta (June 2006). "Acupuncture Procedures Must be Accurately Described". Acupuncture in Medicine. 24 (2): 92–94. doi:10.1136/aim.24.2.92. ISSN 0964-5284. PMID 16783285. S2CID 30286074.
  125. ^ Jaarsma, C.F. Verkeer in een landelijk gebied: waarnemingen en analyse van het verkeer in zuidwest Friesland en ontwikkeling van een verkeersmodel. OCLC 1016575584.
  126. ^ Foth, Christian; Hedrick, Brandon P.; Ezcurra, Martin D. (18 January 2016). "Figure 4: Centroid size regression analyses for the main sample". PeerJ. 4: e1589. doi:10.7717/peerj.1589/fig-4. Retrieved 2021-06-03.
  127. ^ 2008a 주소, 345페이지
  128. ^ "The Final Years (1975-84)", The Road Not Taken, Boydell & Brewer, pp. 853–922, 2018-06-18, doi:10.2307/j.ctv6cfncp.26, ISBN 978-1-57647-332-0, S2CID 242072487, retrieved 2021-06-03
  129. ^ Fitzmaurice, Kathryn (17 March 2015). Destiny, rewritten. ISBN 978-0-06-162503-9. OCLC 905090570.
  130. ^ "Supplementary file 4. Raw data and R-based analyses". dx.doi.org. 7 March 2017. doi:10.7554/elife.24102.023. Retrieved 2021-06-03.
  131. ^ 주소 2008a, 페이지 345-346.
  132. ^ 주소 2008a, 페이지 346–347.
  133. ^ 주소 2008a, 페이지 349-353.
  134. ^ Billings S.A. "비선형 시스템 식별: 시간, 주파수 및 시공간 도메인에서의 NARMAX 메서드"Wiley, 2013년
  135. ^ 주소 2008b, 페이지 363
  136. ^ "Exploratory Data Analysis", Python® for R Users, Hoboken, NJ, USA: John Wiley & Sons, Inc., pp. 119–138, 2017-10-13, doi:10.1002/9781119126805.ch4, hdl:11380/971504, ISBN 978-1-119-12680-5, retrieved 2021-06-03
  137. ^ "Engaging in Exploratory Data Analysis, Visualization, and Hypothesis Testing ............................................................................................. Exploratory Data Analysis, Geovisualization, and Data", Spatial Analysis, CRC Press, pp. 106–139, 2015-07-28, doi:10.1201/b18808-8, ISBN 978-0-429-06936-9, S2CID 133412598, retrieved 2021-06-03
  138. ^ "Hypotheses About Categories", Starting Statistics: A Short, Clear Guide, London: SAGE Publications Ltd, pp. 138–151, 2010, doi:10.4135/9781446287873.n14, ISBN 978-1-84920-098-1, retrieved 2021-06-03
  139. ^ Sordo, Rachele Del; Sidoni, Angelo (December 2008). "MIB-1 Cell Membrane Reactivity: A Finding That Should be Interpreted Carefully". Applied Immunohistochemistry & Molecular Morphology. 16 (6): 568. doi:10.1097/pai.0b013e31817af2cf. ISSN 1541-2016. PMID 18800001.
  140. ^ Liquet, Benoit; Riou, Jérémie (2013-06-08). "Correction of the significance level when attempting multiple transformations of an explanatory variable in generalized linear models". BMC Medical Research Methodology. 13 (1): 75. doi:10.1186/1471-2288-13-75. ISSN 1471-2288. PMC 3699399. PMID 23758852.
  141. ^ a b c Mcardle, John J. (2008). "Some ethical issues in confirmatory versus exploratory analysis". PsycEXTRA Dataset. doi:10.1037/e503312008-001. Retrieved 2021-06-03.
  142. ^ 주소 2008b, 페이지 361-362.
  143. ^ 주소 2008b, 361-371페이지.
  144. ^ Truswell IV, William H., ed. (2009), "3 The Facelift: A Guide for Safe, Reliable, and Reproducible Results", Surgical Facial Rejuvenation, Stuttgart: Georg Thieme Verlag, doi:10.1055/b-0034-73436, ISBN 978-1-58890-491-1, retrieved 2021-06-03
  145. ^ "Supplementary file 1. Cross-validation schema". dx.doi.org. 6 December 2018. doi:10.7554/elife.40224.014. Retrieved 2021-06-03.
  146. ^ Hsiao, Cheng (2014), "Cross-Sectionally Dependent Panel Data", Analysis of Panel Data, Cambridge: Cambridge University Press, pp. 327–368, doi:10.1017/cbo9781139839327.012, ISBN 978-1-139-83932-7, retrieved 2021-06-03
  147. ^ Hjorth, J.S. Urban (2017-10-19), "Cross validation", Computer Intensive Statistical Methods, Chapman and Hall/CRC, pp. 24–56, doi:10.1201/9781315140056-3, ISBN 978-1-315-14005-6, retrieved 2021-06-03
  148. ^ Sheikholeslami, Razi; Razavi, Saman; Haghnegahdar, Amin (2019-10-10). "What should we do when a model crashes? Recommendations for global sensitivity analysis of Earth and environmental systems models". Geoscientific Model Development. 12 (10): 4275–4296. Bibcode:2019GMD....12.4275S. doi:10.5194/gmd-12-4275-2019. ISSN 1991-9603. S2CID 204900339.
  149. ^ "Human development composite indices". dx.doi.org. 2018-09-19. doi:10.18356/ce6f8e92-en. S2CID 240207510. Retrieved 2021-06-03.
  150. ^ Wiley, Matt; Wiley, Joshua F. (2019), "Multivariate Data Visualization", Advanced R Statistical Programming and Data Models, Berkeley, CA: Apress, pp. 33–59, doi:10.1007/978-1-4842-2872-2_2, ISBN 978-1-4842-2871-5, S2CID 86629516, retrieved 2021-06-03
  151. ^ Orduna-Malea, Enrique; Alonso-Arroyo, Adolfo (2018), "A cybermetric analysis model to measure private companies", Cybermetric Techniques to Evaluate Organizations Using Web-Based Data, Elsevier, pp. 63–76, doi:10.1016/b978-0-08-101877-4.00003-x, ISBN 978-0-08-101877-4, retrieved 2021-06-03
  152. ^ Leen, A.R. The consumer in Austrian economics and the Austrian perspective on consumer policy. ISBN 90-5808-102-8. OCLC 1016689036.
  153. ^ "Examples of Survival Data Analysis", Statistical Methods for Survival Data Analysis, Wiley Series in Probability and Statistics, Hoboken, NJ, USA: John Wiley & Sons, Inc., 2003-06-30, pp. 19–63, doi:10.1002/0471458546.ch3, ISBN 978-0-471-45854-8, retrieved 2021-06-03
  154. ^ "The machine learning community takes on the Higgs". Symmetry Magazine. July 15, 2014. Retrieved 14 January 2015.
  155. ^ Nehme, Jean (September 29, 2016). "LTPP International Data Analysis Contest". Federal Highway Administration. Retrieved October 22, 2017.
  156. ^ "Data.Gov:Long-Term Pavement Performance (LTPP)". May 26, 2016. Retrieved November 10, 2017.

참고 문헌

  • Adèr, Herman J. (2008a). "Chapter 14: Phases and initial steps in data analysis". In Adèr, Herman J.; Mellenbergh, Gideon J.; Hand, David J (eds.). Advising on research methods : a consultant's companion. Huizen, Netherlands: Johannes van Kessel Pub. pp. 333–356. ISBN 9789079418015. OCLC 905799857.
  • Adèr, Herman J. (2008b). "Chapter 15: The main analysis phase". In Adèr, Herman J.; Mellenbergh, Gideon J.; Hand, David J (eds.). Advising on research methods : a consultant's companion. Huizen, Netherlands: Johannes van Kessel Pub. pp. 357–386. ISBN 9789079418015. OCLC 905799857.
  • 타바치닉, B.G. & 피델, L.S. (2007년)4장: 행동을 바로잡는다.분석 전 데이터 선별B.G.에서.Tabachnick & L.피델(편집), 다변량 통계 사용, 제5판(60~116페이지)보스턴: 피어슨 교육사 / 앨런과 베이컨

추가 정보

  • Adér, H.J. & Mellenbergh, G.J. (D.J. Hand에 의한 기고) (2008년)조사 방법에 대한 조언: 컨설턴트의 동반자.네덜란드, Huizen: 요하네스 반 케셀 출판사.ISBN 978-90-79418-01-5
  • 챔버스, 존 M., 클리블랜드, 윌리엄 S., 클라이너, 비트, 터키, 폴 A.(1983년).데이터 분석을 위한 그래픽 방법, Wadsworth/Duxbury Press.ISBN 0-534-98052-X
  • 판당고, 아르만도(2017).Python Data Analysis, 제2판팩트 출판사ISBN 978-1787127487
  • Juran, Joseph M.; Godfrey, A. Blanton(1999년).주란의 품질 핸드북, 제5판뉴욕: 맥그로 힐.ISBN 0-07-034003-X
  • 루이스-벡, 마이클 S.(1995).데이터 분석: 개요, Sage Publications Inc, ISBN 0-8039-5772-6
  • NIST/SEMATECH(2008) 통계적 방법 핸드북,
  • Pyzdek, T, (2003)품질공학 핸드북, ISBN 0-8247-4614-7
  • 리처드 베리어드(1984년).실용적인 데이터 분석.옥스퍼드: 블랙웰 과학 출판물.ISBN 0-632-01311-7
  • 타바치닉, B.G.; 피델, L.S. (2007)다변량 통계량 사용, 5판.보스턴: 피어슨 교육 주식회사/앨린과 베이컨, ISBN 978-0-205-45938-4