데이터 시추
Data drilling이 글은 검증을 위해 인용구가 추가로 필요하다. – · · 책 · · (2021년 1월) (이 템플릿 하는 |
데이터 시추(시추)는 표, 관계 및 다차원 데이터에 대한 다양한 작업 및 변환을 가리킨다.이 용어는 다양한 맥락에서 널리 사용되지만, 주로 데이터 분석을 위해 특별히 설계된 전문 소프트웨어와 관련이 있다.
공통 데이터 드릴링 작업
데이터 천공을 허용하는 애플리케이션에 공통적으로 사용되는 특정 작업이 있다.그 중에는 다음과 같은 것들이 있다.
쿼리 작업:
- 표 형식의 질의
- 피벗 쿼리
표 형식 쿼리
표 형식 쿼리 연산은 데이터 테이블의 표준 연산으로 구성된다.
이러한 운영에는 다음이 포함된다.
- 샅샅이 뒤지다
- 분류하다
- 필터(값별)
- 필터(확장된 기능 또는 조건별)
- 변환(예: 열 추가 또는 제거)
다음 예를 고려해 보십시오.
Fred 및 Wilma 테이블(그림 001):
성별, fname, lname, home men, fred, shoppon, 폴란드 남성, fred, fland 남성, bedrock man, fred, bedrock man, wilma, flintrock man, rudolph, usa meman, wilma, web, fred, johnson미국
앞의 내용은 쉼표로 구분된 값으로 포맷된 간단한 플랫 파일 테이블의 예다.이 표에는 프레드 또는 윌마라는 이름을 가진 다양한 사람들의 이름, 성, 성별, 그리고 고국이 포함되어 있다.예를 이러한 방식으로 포맷할 수 있지만, 기본 포맷에 관계없이 표 형식의 쿼리 작업(모든 데이터 드릴링 작업뿐만 아니라)을 상상할 수 있는 모든 데이터 유형에 적용할 수 있다는 점을 강조하는 것이 중요하다.유일한 요건은 사용 중인 소프트웨어 애플리케이션에서 데이터를 읽을 수 있어야 한다는 것이다.
피벗 쿼리
피벗 쿼리는 서로 다른 차원에 따라 여러 개의 데이터 표시를 허용한다.이 쿼리 유형은 유연한 사용자 선택 계층 구조에 따라 데이터를 요약 형식으로 나타낼 수 있다는 점을 제외하면 표 형식의 쿼리와 유사하다.이 등급의 데이터 드릴링 작업은 십자형 쿼리, 피벗 테이블, 데이터 파일럿, 선택적 계층, 상호 연결성 등을 포함한 다른 이름으로 공식적으로(그리고 느슨하게) 알려져 있다.
피벗 쿼리 작업의 기본 사항을 설명하려면 Fred 및 Wilma 표(그림 001)를 고려하십시오.데이터를 빠르게 스캔하면 테이블이 중복된 정보를 가지고 있다는 것을 알 수 있다.이 중복성은 윤곽선이나 나무 구조 또는 다른 방법으로 통합될 수 있다.더욱이, 일단 통합되면, 데이터는 많은 다른 대체 레이아웃을 가질 수 있다.
간단한 텍스트 개요를 출력으로 사용하면 피벗 쿼리를 통해 다음과 같은 대체 레이아웃이 모두 가능하다.
성별에 따라 요약하십시오(그림 001).
여성 플린트스톤, 윌마 루돌프, 윌마 웹, 윌마 남성 쇼팽, 프레드 플린트스톤, 프레드 더스트, 존슨, 프레드(다이멘스 = 성별, 표의 필드 = lname, fname;)
집, 이름(그림 001)으로 요약하십시오.
암반 부싯돌 프레드 윌마 폴란드 쇼팽 프레드 우사... (치멘스 = 집, 이름, 표밭 = fname;)
사용하다
피벗 쿼리 연산은 여러 가지 방법으로 데이터의 말뭉치를 요약하는 데 유용하며, 따라서 동일한 기본 정보의 다른 표현을 나타낸다.이러한 유형의 작업은 스프레드시트와 데스크톱 데이터베이스 소프트웨어에서 두드러지게 나타나지만, 그 유연성은 거의 활용도가 낮다.데이터를 나타내기 위해 '고정' 계층만 허용하는 애플리케이션이 많은데, 이는 상당한 한계를 나타낸다.
드릴업
드릴업은 반대쪽 드릴다운이다.예를 들어, 한 제품의 매출을 확인하기 위해 드릴다운하는 경우 모든 제품의 수익을 보기 위해 드릴다운하는 것이 좋다.[1]
참조
- ^ "Drilling up and drilling down". IBM. Retrieved 2020-05-05.