데이터 평가

Data valuation

데이터 가치평가는 회계 및 정보경제 분야의 학문이다.[1] 조직에서 수집, 저장, 분석, 거래하는 데이터의 가치를 산정하는 방법에 관한 것이다.

역사

21세기에는 (무어의 법칙에 따라) 컴퓨팅 능력과 데이터 스토리지 기능의 기하급수적인 증가는 빅데이터, 머신러닝, 기타 데이터 분석 기법의 확산을 가져왔다. 기업은 데이터 중심 전략과 비즈니스 모델을 추구하기 위해 이러한 기술과 기술을 점점 더 채택하고 있다. 조직을 중시하기 위해 사용되는 전통적인 회계 기법은 대용량 데이터 수집과 분석이 보편화되기 이전 시대에 개발되었고, 데이터 자산을 무시한 유형 자산(기계, 장비, 자본, 재산, 재료 등)에 초점을 맞추었다. 결과적으로 회계 계산은 종종 데이터를 무시하고 그 가치를 조직의 대차대조표에 남긴다.[2] 특히 2001년 9·11 세계무역센터(WTC) 공격 이후 상당수 기업이 상당한 양의 데이터를 손실했다. 이들은 자신들이 보유한 보험사에 파기된 정보의 가치를 청구했지만 보험사는 정보가 재산으로 계산되지 않아 보험사의 보험가입이 아니라고 주장하며 이를 부인했다.[3]

이를 눈치채고 수많은 조직과 개인이 데이터 가치평가를 주제로 사고하고 발표하기 시작했다. Gartner의 부사장이자 저명한 분석가인 Doug Laney는 월스트리트의 가치 있는 기업들에 대한 연구를 수행했는데, 월스트리트는 데이터를 자산으로 취급하는 정보 중심적인 기업이 종종 표준보다 2~3배 높은 가치를 예약하는 시장을 가지고 있다는 것을 발견했다.[3][4] 이 주제에 대해 라니는 "정보화 시대의 한복판임에도 불구하고, 정보는 단순히 가치평가 사업에 종사하는 사람들에 의해 평가되지 않는다"라고 말했다. 그러나 향후 몇 년 동안 주식 분석가를 포함한 기업 투자를 평가하는 사업에 종사하는 사람들은 기업 자체의 가치를 적절하게 평가하는 데 있어서 기업의 풍부한 정보를 고려할 수밖에 없을 것으로 본다."[2] 2010년대 후반, 세계에서 가장 가치 있는 기업의 목록(기존에 석유와 에너지 회사가 지배하는 목록)은 마이크로소프트, 알파벳, 애플, 아마존, 페이스북 등 데이터 기업이 지배했다.[5][6]

지난 10년 동안 데이터 가치평가는 회계법인에 의해 널리 인정받아 왔다.[7][8] 이를 주도하는 추세로는 데이터 중심화의 가치를 이해하기 시작하는 조직, 데이터를 구매하거나 사용하도록 다른 조직으로부터 요청을 받는 조직, 디지털 비즈니스 모델과 인터넷 기술에서 새로운 수익 옵션을 찾는 조직, 기술 개선 및 비용 하락을 두려워하는 조직 등이 있다.주요 데이터 기반 경쟁업체로부터의 [7]회유

자산으로서의 데이터 특성

영국 케임브리지 대학의 Nuffield Institute에 의한 2020년 연구는 데이터의 특성을 경제적 특성과 정보적 특성의 두 범주로 나누었다.[9]

경제적 특성

  • 데이터는 비적격이다. 여러 사람이 고갈되거나 소모되지 않고 데이터를 사용할 수 있다.
  • 데이터는 배설 가능 여부에 따라 달라진다. 데이터는 어떤 유형의 정보를 포함하느냐에 따라 공공재 또는 클럽 재화가 될 수 있다. 일부 데이터는 접속을 원하는 모든 사람과 합리적으로 공유할 수 있다(예: 날씨 데이터). 기타 데이터는 특정 사용자 및 컨텍스트(예: 관리 데이터)로 제한된다.
  • 데이터는 외부성을 포함한다. 경제학에서 외부효과는 그 원가나 효익을 발생시키기로 선택하지 않은 제3자에게 영향을 미치는 원가나 효익이다. 데이터는 데이터가 누출되거나 침해되거나 잘못 사용될 수 있는 경우, 이미 존재하는 데이터와 결합하여 새로운 통찰력을 창출하고, 두 가지 모두의 가치를 증가시키며, 부정적인 외부 효과를 창출하는 것처럼 긍정적인 외부 효과를 창출할 수 있다.
  • 데이터는 수익률을 증가시키거나 감소시킬 수 있다. 때때로 더 많은 데이터를 수집하면 통찰력이나 가치가 증가하지만, 다른 때에는 단순히 사재기로 이어질 수 있다.
  • 데이터는 옵션 가치가 크다. 신기술과 데이터셋의 지속적인 발전으로 특정 데이터 자산의 가치가 어떻게 변화할지 예측하기 어렵다. 조직은 실제 현재 가치보다는 가능한 미래 가치를 예상하여 데이터를 저장할 수 있다.
  • 데이터 수집은 종종 높은 초기 비용과 낮은 한계 비용을 가지고 있다. 데이터를 수집하려면 기술 및 디지털화에 상당한 투자가 필요한 경우가 많다. 일단 이것들이 확립되면, 추가 데이터 수집 비용이 훨씬 더 적게 들 수 있다. 진입 장벽이 높으면 소규모 조직이 데이터를 수집하지 못할 수 있다.
  • 데이터 사용에는 보완 투자가 필요하다. 조직은 데이터로부터 가치를 실현하기 위해 소프트웨어, 하드웨어 및 인력에 투자해야 할 수 있다.

정보 특성

  • 주제. 데이터가 설명하는 사항과 도움이 될 수 있는 사항을 포함한다.
  • 일반성. 일부 데이터는 분석 범위에서 유용하며, 다른 데이터는 특정 경우에만 유용하다.
  • 시간적 범위, 데이터는 예측, 실시간, 역사 또는 백캐스트 가능. 이것들은 계획, 운영 및 과거 분석 목적으로 다르게 사용된다.
  • 퀄리티. 요구되는 품질은 사용량에 따라 다르지만, 일반적으로 높은 품질의 데이터는 불확실성과 위험을 감소시키기 때문에 더 가치가 있다. 데이터 수집의 자동화가 향상되면 품질이 향상되는 경향이 있다.
  • 감수성. 민감한 데이터는 피해를 주는 방법(예: 개인 데이터, 상업 데이터, 국가 보안 데이터)에 사용될 수 있는 데이터다. 민감한 데이터를 안전하게 유지하는 비용과 위험이 발생한다.
  • 상호운용성 호감성 - 상호운용성은 데이터를 나타낼 때 데이터 표준의 사용과 관련이 있으며, 이는 동일한 사물과 관련된 데이터를 쉽게 조합할 수 있음을 의미한다. 호감도는 한 데이터 집합의 레코드를 다른 데이터 집합의 추가 데이터에 연결할 수 있도록 하는 데이터 집합 내의 표준 식별자 사용과 관련이 있다.

데이터 값 드라이버

많은 동인은 데이터에서 미래 경제적 효익이 도출될 수 있는 정도에 영향을 미친다. 일부 동인은 데이터 품질과 관련되는 반면, 다른 동인은 데이터를 무가치하게 만들거나 데이터 소유자에게 독특하고 가치 있는 경쟁 우위를 창출할 수 있다.[7]

  • 배타성 – 데이터 자산에 대한 독점적인 액세스 권한을 갖는 것은 여러 라이센스 소유자가 액세스할 수 있는 것보다 더 가치를 높인다.
  • 적시성 – 많은 데이터의 경우 현재를 더 가깝게 반영할수록 현재에서 도출할 수 있는 결론은 더 신뢰할 수 있다. 최근 포착된 데이터는 역사적 자료보다 가치가 높다.
  • 정확성 – 데이터가 진리를 더 자세히 설명할수록 더 가치가 있다.
  • 완전성 – 데이터로 설명되는 특정 이벤트나 개체에 대한 변수가 많을수록 데이터의 가치가 높아진다.
  • 일관성 – 데이터 자산이 다른 유사한 데이터 자산과 일관될수록 가치가 더 높아진다(예: 고객이 어디에 거주하는지에 대한 불일치는 없다).
  • 사용 제한 – 사용을 위해 필요한 승인 없이 수집된 데이터(예: 마케팅 목적으로 개인 데이터)는 법적으로 사용할 수 없으므로 가치가 낮다.
  • 상호운용성/접근성 – 다른 조직 데이터와 데이터를 더 쉽고 효과적으로 결합하여 통찰력을 얻을 수 있을수록 더 가치가 있다.
  • 책임과 위험GDPR과 같은 데이터 규정을 위반할 경우 평판 결과 및 재정적 처벌이 심할 수 있다. 데이터 사용과 관련된 리스크가 클수록 그 가치는 낮아진다.

데이터에서 가치를 실현하는 프로세스는 데이터의 현재 상태와 용도가 매핑되는 데이터 평가, 데이터 가치를 측정하는 데이터 평가, 프로세스, 거버넌스 및 기반 데이터 기술 개선을 위해 자본이 투입되는 데이터 투자, 데이터가 사용되는 데이터 활용 등 여러 핵심 단계로 세분화될 수 있다.n 비즈니스 이니셔티브, 그리고 이전 단계를 검토하고 새로운 아이디어와 개선이 제안되는 데이터 반영.[10]

데이터 평가 방법

데이터 평가의 상대적 초기 단계뿐만 아니라 잠재적 데이터셋과 사용 사례의 범위가 넓기 때문에 방법에 대해 간단하거나 보편적으로 합의된 것은 없다. 높은 옵션 가치와 외부성은 데이터 가치가 예측할 수 없을 정도로 변동할 수 있다는 것을 의미하며, 가치가 없어 보이는 데이터는 지정되지 않은 미래에 갑자기 매우 가치 있게 될 수 있다.[9] 그럼에도 불구하고, 데이터 값을 계산하거나 추정하기 위한 많은 방법들이 제안되었다.

인포노믹스 평가 모델

Doug Laney는 데이터를 평가하기 위한 6가지 접근방식을 기초 모델과 재무 모델의 두 가지 범주로 구분한다. 기초 모델은 상대적인 정보 가치를 데이터에 할당하고, 재무 모델은 절대적인 경제적 가치를 할당한다.[11]

기초 모형

  • 정보의 내재가치(IVI)는 데이터의 정확성, 완전성, 배타성을 포함한 데이터 가치 동인을 측정하고 그에 따라 값을 할당한다.
  • BVI(Business Value of Information)는 데이터가 특정 비즈니스 목적에 얼마나 적합한지 측정한다(예: 이니셔티브 X는 매주 업데이트되는 80%의 정확한 데이터를 필요로 한다 - 데이터가 이 요구 사항과 얼마나 밀접하게 일치하는지).
  • PVI(Performance Value of Information)는 데이터 사용이 주요 비즈니스 동인과 KPI에 어떤 영향을 미치는지 측정하며, 종종 제어 그룹 연구를 사용한다.

금융모델

  • CVI(Cost Value of Information)는 데이터를 생산하고 저장하는 비용, 데이터를 대체하는 비용, 또는 손실되었을 경우 현금흐름에 미치는 영향을 측정한다.
  • MVI(Market Value of Information)는 데이터가 데이터 시장에서 거래될 실제 또는 추정 가치를 측정한다.
  • EVI(Economic Value of Information)는 데이터의 사용으로 인한 기대현금흐름, 수익 또는 절감액을 측정한다.

베넷 연구소 평가

베넷 연구소의 연구는 데이터의 가치를 추정하는 접근법을 시장 기반 가치와 비시장 기반 가치로 나눈다.[9]

시장기반가치평가

  • 주식 시장 평가는 데이터와 데이터 능력에 투자하는 조직들이 얻는 이점을 측정한다.
  • 소득 기반 평가는 데이터에서 도출된 현재 및 미래 소득을 측정하고자 한다. 이 접근방식은 더 넓은 비즈니스 또는 사회적 생태계에서 실현되는 가치를 측정할 수 없거나 데이터가 포함된 금융거래를 넘어서기 때문에 한계가 있다. 시장에서 데이터 거래를 통해 데이터 수입을 실현하는 경우, 시장은 데이터의 전체 옵션 가치를 설명하지 못하며, 일반적으로 데이터의 경제적 가치를 진정으로 반영하는 가격에 시장이 정착하기에 충분한 구매자와 판매자가 부족하기 때문에 추가적인 한계가 있다.
  • 비용 기반 평가는 데이터를 생성하고 유지하기 위한 비용을 측정한다. 이를 통해 실제 발생한 비용 또는 데이터를 교체해야 하는 경우 예상되는 비용을 확인할 수 있다.

비시장 기반 가치 평가

  • 개방형 데이터의 경제적 가치는 데이터를 호스팅하거나 관리하는 조직, 제품과 서비스를 생성하기 위해 데이터를 재사용하는 중간 조직 또는 개인, 이러한 제품과 서비스를 사용하는 조직 및 개인 등 개방적 또는 자유로운 데이터가 가치를 창출하는 방법을 검토한다.
  • 개인 데이터의 가치는 소비자에게 데이터 개인 정보 보호 서비스에 액세스하기 위해 얼마를 지불할 의향이 있는지 또는 개인 데이터에 액세스하기 위해 얼마를 지불할 것인지와 같은 질문을 함으로써 추정할 수 있다. 개인 데이터에 의존하는 기업의 이익(Facebook은 2018년 활성 사용자 1인당 10달러씩 창출)을 조사하고, 데이터 프라이버시나 기타 규정을 위반한 단체에 전달되는 벌금을 조사함으로써 가치도 추정할 수 있다.

기타 접근법

  • 변경된 원가가치 접근법은 원가 기반 가치평가 접근법으로 세분화할 것을 제안한다. 그것은 다음과 같은 수정을 제안한다: 중복 수집된 데이터는 이중 계수를 피하기 위해 값이 0인 것으로 간주되어야 한다. 미사용 데이터는 0인 것으로 간주되어야 한다(이는 데이터 사용 통계를 통해 확인할 수 있다), 데이터에 대한 사용자 수와 접근 횟수는 데이터의 값을 곱하기 위해 사용되어야 한다. allowing 실제 사용의 관점에서 수정해야 하는 정보의 역사적 원가, 정보의 계산된 "수명"에 근거하여 가치를 감가상각해야 하며, 허용 가능한 정확도로 간주되는 정보의 정확도에 비례하여 값을 수정해야 한다.[12]
  • 소비 기반 접근법은 데이터 사용자에게 조직에 기여하는 상대적 가치에 따라 다른 가중치를 할당함으로써 수정된 비용 가치 접근법의 원칙을 기반으로 한다. 이러한 가중치는 데이터 사용 통계 모델링에 포함되며 데이터의 측정값을 추가로 수정한다.[13]
  • 데이터 허브 평가는 개별 데이터셋의 비용을 측정하기보다는 대규모 데이터 저장소가 저장된 데이터 허브의 비용을 측정하는 비용 기반 접근방식을 사용한다. 그런 다음 소비 기반 및 수정된 비용 가치 접근법에서와 같이 데이터 허브 비용을 수정할 수 있다.[14] 또 다른 허브 가치평가 접근방식은 허브를 통한 데이터 접근에서 생산자의 데이터에 개별적으로 접근하는 것과 데이터 허브에 대한 접근을 위해 지불할 사용자의 의지를 측정함으로써 수정된 시장 가치 접근법을 사용한다.[15]
  • 이해관계자 접근법은 데이터가 외부 이해관계자가 자신들을 위한 가치를 창출하는 것으로 식별하는 활동을 어떻게 지원하는지를 검토하면서 핵심 이해관계자를 데이터 가치에 참여시킨다. 조직에서 창출한 총 가치, (외부 이해관계자가 정의한) 가치 창출 이니셔티브의 가중 목록, 데이터 자산의 재고 목록을 결합한 모델을 사용한다. 이 접근방식은 컨설팅 회사인 Anmut과 시장 가치, 소득 또는 경제 성과에 기반한 데이터 평가의 의미가 적은 공공 부문 기관인 Mways England가 협력하여 개발되었다. 이 접근법은 민간 부문에도 적용될 수 있다.[16][17]

참조

  1. ^ Allen, Beth (1990). "Information as an Economic Commodity". The American Economic Review. 80 (2): 268–273. JSTOR 2006582.
  2. ^ a b "Gartner Says Within Five Years, Organizations Will Be Valued on Their Information Portfolios".
  3. ^ a b "How Do You Value Information?".
  4. ^ "Applied Infonomics: Why and How to Measure the Value of Your Information Assets".
  5. ^ "The Value of Data".
  6. ^ "Most Valuable Companies in the World – 2020".
  7. ^ a b c "Putting a value on data" (PDF).
  8. ^ "Data valuation: Understanding the value of your data assets" (PDF).
  9. ^ a b c "The Value of Data Summary Report" (PDF).
  10. ^ "Data Valuation – What is Your Data Worth and How do You Value it?".
  11. ^ "Why and How to Measure the Value of your Information Assets".
  12. ^ "Measuring the Value of Information: An Asset Valuation Approach" (PDF).
  13. ^ "The Valuation of Data as an Asset" (PDF).
  14. ^ "Consumption-Based Method".
  15. ^ "Keeping Research Data Safe Method".
  16. ^ "Why you should be treating data as an asset".
  17. ^ "Data Valuation – Valuing the World's Greatest Asset".