빅데이터 윤리

Big data ethics

단순한 데이터 윤리로도 알려진 빅데이터 윤리데이터, 특히 개인 데이터와 관련하여 옳고 그른 행동의 개념을 체계화, 방어, 권고하는 것을 말한다.[1] 인터넷이 시작된 이래로 데이터의 순전히 양과 질은 급격히 증가했고 계속해서 기하급수적으로 증가하고 있다. 빅데이터는 기존의 데이터 처리 애플리케이션 소프트웨어가 이를 처리하기에 부적합할 정도로 방대한 양의 데이터를 기술하고 있다. 고투과 게놈 염기서열화, 고해상도 영상화, 전자 의료 환자 기록, 인터넷 연결 건강 장치 등 최근 의료 연구와 의료 분야의 혁신은 가까운 미래에 엑사바이트 범위에 이를 데이터 홍수를 촉발시켰다. 데이터 윤리는 영향의 규모 때문에 데이터의 양이 증가함에 따라 관련성이 증대된다.

빅데이터 윤리는 정보 윤리와는 다른데, 정보 윤리의 초점은 지적 재산의 문제와 사서, 기록가, 정보 전문가 등과 관련된 우려에 더 신경을 쓰는 반면, 빅데이터 윤리는 데이터와 같은 정형 또는 비정형 데이터의 수집가, 전파자에게 더 신경을 쓰기 때문이다.브로커, 정부, 대기업

원칙

데이터 윤리는 다음과 같은 원리와 관련이 있다.[original research?]

  1. 소유권 - 개인은 자신의 데이터를 소유한다.
  2. 트랜잭션 투명성 - 개인 데이터가 사용되는 경우, 집계 데이터 세트를 생성하는 데 사용되는 알고리즘 설계에 대한 투명한 액세스 권한이 있어야 함
  3. 동의 - 개인 또는 법인이 개인 데이터를 사용하고자 하는 경우, 개인 데이터가 누구, 언제, 어떤 목적으로 누구에게 이동하는지, 어떤 목적으로 이동하는지 알고 명시적으로 동의할 필요가 있다.
  4. 프라이버시 - 데이터 트랜잭션이 발생하는 경우 프라이버시를 보존하기 위해 모든 합리적인 노력을 기울여야 한다.
  5. 통화 - 개인은 개인 데이터의 사용과 이러한 거래의 규모에 따른 금융 거래를 알아야 한다.
  6. 개방성 - Aggregate 데이터 세트를 자유롭게 사용할 수 있어야 함

소유권

데이터 소유자는 누구인가? 소유권은 재산에 대한 권리와 의무를 결정하는 것을 포함한다. 데이터 소유의 개념은 자신의 데이터 공유를 통제하고 제한할 수 있는 능력과 연결되어 있다. 만약 한 사람이 그들의 관찰을 다른 사람에게 기록한다면, 그 관찰을 소유하는 사람은 누구인가? 관찰자인가 관찰자인가? 관찰자와 관찰자는 서로에 대해 어떤 책임을 가지고 있는가? 인터넷의 결과로서 사람들의 관찰과 그들의 생각의 거대한 규모와 체계화 이후, 이러한 질문들은 점점 더 중요하게 다뤄지고 있다. 한 개인의 소유권인 노예제도는 모든 공인된 국가에서 불법화된다. 개인 데이터 소유에 대한 문제는 기업 소유, 지적 재산, 노예 제도 사이의 미지의 영역으로 들어간다. 누가 디지털 아이덴티티를 소유하고 있는가?

유럽의 법률인 General Data Protection Regulation은 개인이 자신의 개인 데이터를 소유한다고 명시하고 있다. [2]

개인 데이터는 물리적 속성에서 선호도 및 행동에 이르는 사람을 설명하는 데이터 세트를 가리킨다. 개인 데이터의 예는 다음과 같다. 게놈 데이터, GPS 위치, 서면 통신, 구두 통신, 연락처 목록, 인터넷 검색 습관, 금융 거래, 슈퍼마켓 지출, 세금 납부, 범죄 기록, 노트북 및 휴대폰 카메라 렌즈 녹음, 장치 마이크 녹음, 카 트랙커를 통한 운전 습관, 모바일 및 건강 기록, 피트니스 활동, 영양, 물질 사용, 심장 박동, 수면 패턴 및 기타 활력징후. 한 개인의 개인 데이터의 집합은 디지털 아이덴티티를 형성한다(또는 아마도 디지털 분신이 더 적합할 것이다. 디지털 아이덴티티는 우리의 물리적, 이념적 자아를 표현하고 연결하며 우리의 모든 개인 데이터를 포함한다. 데이터 범주의 구별이 항상 명확한 것은 아니다. 예를 들어 행동과 생활방식은 은행 데이터를 통해 유추할 수 있고 만성질환의 위험을 예측하는 데 매우 가치가 있기 때문에 건강 데이터와 은행 데이터가 서로 얽혀 있다. 따라서 은행 데이터도 건강 데이터다. 건강 데이터는 개인이 의료에 얼마를 지출하는지 나타낼 수 있으므로 건강 데이터도 은행 데이터다. 이러한 중복은 위치 데이터, 인터넷 검색 데이터 등 다른 데이터 범주 간에도 존재하며 세금 데이터는 위치 데이터, 인터넷 검색 데이터 등 다른 데이터 범주 사이에 존재한다.

개인의 도덕적 권리의 보호는 개인 데이터가 개인의 인격의 직접적인 표현이라는 견해에 근거한다: 그러므로 도덕적 권리는 개인에게 개인적이며 개인이 사망했을 때 증언에 의해서 외에는 다른 사람에게 양도될 수 없다. 도덕적 권리는 데이터의 출처로 식별될 권리와 그 또는 그녀의 명예나 평판에 해를 끼칠 수 있는 데이터의 왜곡이나 훼손에 대해 이의를 제기할 권리를 포함한다. 개인 데이터에 대한 이러한 도덕적 권리는 영구적이다.

개인 데이터 소유의 주요 구성요소는 고유하고 통제된 접근성(예: 예외성)이다. 소유권은 특히 아이디어나 데이터 포인트와 같은 추상적인 개념에 배타성을 내포하고 있다. 단순히 자신의 자료를 복사하는 것만으로는 충분하지 않다. 다른 사람들은 자신의 것이 아닌 것에 대한 접근을 제한해야 한다. 다른 사람들이 어떤 데이터를 가지고 있는지 아는 것은 거의 불가능한 일이다. 더 간단한 접근법은 터무니없는 정보에 자신을 숨기는 것일 것이다. 기업이나 기관이 복사본을 보유하지 않도록 하기 위해, 보유하고 있는 데이터를 혼동하기 위해 잡음을 보내는 것이 가능하다. 예를 들어, 로봇은 보통 검색 엔진에서 얻은 데이터를 혼동을 통해 쓸모 없게 만드는 용어를 무작위로 검색할 수 있다(Track Me Not by New York University 참조).

소유권은 데이터를 한 서비스에서 다른 서비스로 편리하게 이동할 수 있는 기능, 즉 휴대성을 강조한다. 개인 데이터가 개인에 의해 소유되었을 때, 그들은 단순히 개인 데이터를 제거하고 서비스에 만족하지 않을 경우 다른 사이트로 가져갈 수 있는 선택권을 갖는다. 개인들은 높은 수준의 편리한 휴대성을 제공받아야 하며, 제품 선호도와 개인적인 대화를 기술한 역사적 자료들을 잃어버리지 않고 대체품으로 전환할 수 있어야 한다. 예를 들어, 다른 메시징 앱으로 전환하는 것을 선택할 수 있으며, 이것은 이전의 대화와 연락처의 기록을 잃지 않고 가능해야 한다. 개인에게 과거 데이터를 잃어버리는 불편함 없이 서비스를 전환할 수 있는 선택권을 준다는 것은 서비스가 대안과의 비호환성 수단으로 고객을 가두기 보다는 좋은 서비스를 제공함으로써 고객을 행복하게 해 줄 필요가 있다는 것을 의미한다.

휴대성을 위해 데이터 표현은 이러한 일이 원활하게 일어날 수 있도록 표준화되어야 한다. 예를 들어, 이 단위를 "kg"이 아닌 "킬로그램"으로 기술한다는 것은 로봇들이 비록 그것들이 같기는 하지만 다른 것으로 인식한다는 것을 의미한다. 이러한 작은 변화로 인해 데이터를 인식할 수 없는 새로운 시스템으로 쉽게 결합하거나 전송할 수 없는 지저분한 데이터가 발생할 수 있다. 현재 애플은 개인정보보호 서비스를 제공한다고 밝히고 있지만 애플 시스템에서는 데이터를 추출하기 어려워 대안으로 마이그레이션하기 어렵다. 개인 데이터 거래 프레임워크에서 데이터 표현식은 버튼 클릭 한 번으로 쉽게 휴대할 수 있도록 표준화될 것이다. 표준화는 또한 데이터의 품질을 검증하는 점검과 균형을 설치하는 데 필요한 데이터를 청소하는 메커니즘의 설정을 촉진할 수 있다. 여러 출처를 결합하면 잘못 입력되었거나 잘못 입력된 데이터를 식별할 수 있을 것이다.

현재 데이터 소유자는 누구인가? 오늘날 데이터는 통제되고 있고, 따라서 센서 소유자가 소유하고 있다. 기록을 하는 개인이나 센서를 소유하는 기업은 기본적으로 해당 데이터에 일어나는 일을 통제한다. 예를 들어 은행은 은행 데이터를, 연구자는 연구 데이터를, 병원은 건강 기록 데이터를 통제한다. 역사적 이유로 인해, 현재의 시나리오는 연구 기관들이 개인의 일부를 기술하는 데이터 조각에 관한 자료를 보유하는 것이다. 유럽의 건강 연구 데이터는 다른 기관들에 의해 통제되는 단편적인 방식으로 존재한다. 데이터 범주는 종종 데이터가 설명하고 있거나 적용될 수 있는 응용 프로그램보다는 누가 데이터를 제어하고 어디에 저장하는지 더 많이 설명한다. 인터넷은 누구의 소유도 아니지만, 기업들은 개인 데이터의 많은 부분을 통제하게 되었고, 데이터 수집, 검색 엔진, 통신 도구를 이용하여 가치를 창출하게 되었다.[3] 기본적으로, 인터넷 도구를 구성하는 지적 재산권을 소유하는 것의 부작용으로서, 이들 기업들은 이윤을 내고 다른 회사에 제공하는 서비스의 원료로서 우리의 디지털 아이덴티티를 수집해 왔다. 인터넷 서비스를 통해 수집되는 데이터의 대부분은 개인을 기술하는 개인 데이터다. 전통적으로, 의학은 건강의 이해를 가능하게 하기 때문에 개인 주위에 데이터를 조직한다. 역학을 연구할 때, 집단의 데이터는 여전히 개인을 중심으로 조직된다. 더 효율적으로 만들어지고 있는 많은 프로세스들은 개인과 그룹의 역학관계에 관한 것이다. 그러나 데이터가 반드시 개별적인 주위로 구성되는 것은 아니며, 오히려 데이터가 센서 소유자에 의해 제어되고 있다.

중국에서는 정부가 주로 데이터를 소유하고 있다. 중국의 한 지방에서는 무단횡단, 공중화장실에서 사용되는 화장지 양과 같은 온·오프라인 개인 행태에 근거하여 1인당 사회적 지수 점수를 산출하는데 데이터가 사용되었다. 사회지표가 특정 공공서비스에 대한 접근을 결정한다.

거래투명성

편견이 알고리즘 설계에 어떻게 통합돼 체계적인 억압을 받을 수 있는지에 대한 우려가 제기돼 왔다.[4] 알고리즘 설계는 투명하게 공개되어야 한다. 모든 합리적인 노력은 평등함을 잃지 않고 개인과 집단의 차이를 고려하도록 해야 한다. 알고리즘 설계는 포함되어야 한다.

거버넌스 측면에서 빅데이터 윤리는 알고리즘 등 빅데이터 기술을 활용해 어떤 유형의 추론과 예측을 해야 하는지가 관심사다.[5]

예측 거버넌스는 예측 분석을 사용하여 가능한 미래 행동을 평가하는 관행이다.[6] 왜냐하면 이것은 능력 예를 들어 편견과 discrimination[6]를 장려할 수 있어 특정 집단과 장소들을 표적으로 삼는 것을 바라볼 수 있다 이 윤리적 의미를 갖습니다. 예측 치안을 강조하는 특정 그룹이나 더 흡사하게 이러한 면에서는 더 많은 제재로 이어지고 밀착 감시를 항의라도 감시되어야 합니다 이웃.r 제재 대상자와 동일한 프로파일에 맞는 [3]사람들

"제어 크리프"란 특정 목적을 염두에 두고 생성되었으나 용도변경된 데이터를 말한다.[6] 이러한 관행은 공항의 보안 위험을 프로파일링하고 관리하기 위해 용도가 변경된 항공 산업 데이터를 통해 확인된다.[6]

개인 데이터에 대해 개인은 다음을 알 권리가 있다.

  1. 데이터가 수집되는 이유
  2. 어떻게 사용될 것인가?
  3. 보관 기간은?
  4. 그것은 어떻게 관련 개인에 의해 수정될 수 있는가?

데이터 트랜잭션의 윤리적 사용의 예는 다음과 같다.

  • 법적 목적: 국가에 의한 모든 개인 데이터의 수집과 사용은 완전히 투명해야 하며 데이터 수집에 앞서 협상된 정식 면허에 의해 보호되어야 한다. 개인과 책임 당국 간의 이 민사 계약은 상기 투명성 원칙에 따라 개인이 책임 기관에 자신의 데이터 사용을 허가하는 조건을 규정한다.
  • 사회적 목적: 사회적 목적을 위한 개별 데이터의 모든 사용은 옵트인이 아니라 옵트인이어야 한다. 그들은 투명성 원칙을 준수해야 한다.
  • 범죄: 범죄 예방을 위해 개인 데이터의 수집 및 사용에 대한 일련의 명시적인 일반 원칙이 수립되고 널리 공개되어야 한다. 국가 통치 기구는 이러한 원칙을 고려하고 승인해야 한다.
  • 상거래: 상업적 목적으로 사용되는 개인 데이터는 개인에 속하며, 허용된 모든 사용을 규정한 개인의 면허 없이 사용할 수 없다. 여기에는 모든 웹사이트에서 수집된 데이터, 페이지 방문, 사이트 간 이동 및 기타 인터넷 활동이 포함된다. 개인은 자신의 개인 데이터가 상업적 목적으로 사용되는 방법과 장소, 여부를 사례별 또는 범주별로 결정할 권리가 있다.
  • 연구: 연구 목적으로 사용되는 개인 데이터는 개인에 속하며, 위에서 설명한 모든 투명성 원칙을 충족하는 개인 동의서의 조건에 따라 사용자로부터 허가를 받아야 한다.
  • 특별법적 목적: 개인 데이터는 권리 소유자의 명시적인 사전 동의를 얻어야만 초법적 목적으로 사용할 수 있다.

동의하다

개인 또는 법인이 개인 데이터를 사용하고자 하는 경우, 개인 데이터가 누구, 언제, 어떤 목적으로 이동하는지 정보를 제공하고 명시적으로 동의할 필요가 있다. 정보의 주체는 그들의 데이터가 어떻게 사용되었는지 알 권리가 있다.

예를 들어, 친척과 연락을 시도하면서 마케팅 권고사항을 개선하는 등 데이터 거래를 관련성이 없거나 불필요한 동의 문제에 대한 협상 카드로 사용할 수 없다. 데이터 공유가 필요한 서비스가 있지만, 이러한 거래는 과장되어서는 안 되며 맥락 안에서 이루어져야 한다. 예를 들어 적절한 의료 권고를 받기 위해서는 개인이 데이터를 공유할 필요가 있지만 의료 데이터가 자동으로 의료보험 제공자에게 전달될 필요는 없다. 그들의 데이터에 대한 결정을 내리는 것은 궁극적으로 개인에게 달려있다. 이것들은 이와 같이 취급되어야 하는 별도의 데이터 트랜잭션이다. 채팅 애플리케이션이 사용되기 때문에 데이터 소유권 이전에 대한 묵시적 동의는 유효하지 않은 것으로 간주된다.

거래의 전체 범위와 범위는 그들이 관여하고 싶은지 여부를 평가하는 과정에 관여할 수 있는 합리적인 기회를 주어야 하는 개인에게 명시적으로 상세해질 필요가 있다. 타이밍이 중요해, 그러니까.. 이러한 문제들은 긴급한 구매가 이루어지거나 의료 비상사태가 발생하는 그 순간에서가 아니라, 반영할 시간과 함께 차분한 순간에 다루어져야 한다.

허가는 묵시적이 아닌 명시적인 형식으로 할 필요가 있다. 채팅하기 위해 어플리케이션을 선택했다고 해서 연락처 목록에 대한 액세스가 필요한 것은 아니다. 권한을 부여하기 위해 클릭하는 버튼은 자동 동작이 선택되는 방식으로 설계되지 않아야 한다. 예를 들어 바이너리 선택에서 한 버튼이 다른 버튼보다 작거나, 한 버튼이 설계에 숨겨져 있고 다른 버튼이 튀어나오는 경우 또는 한 버튼이 여러 번의 클릭을 필요로 하는 경우 다른 버튼은 한 번의 클릭으로 선택된다.

사람은 일반적인 주제에 대해 지속적으로 동의할 수 있지만, 미래 거래에 대한 허가를 철회하는 것은 항상 가능해야 한다. 마찬가지로 성행위에 대한 동의를 위해서는 과거 데이터 거래에 대한 동의를 철회하는 것이 가능하지 않다. 예를 들어, 추후 통지가 있을 때까지 심혈관 질환 치료를 진전시키는 어떤 원인에 대해서도 개인 데이터를 사용하는 것에 동의하는 것이 가능할 것이다. 인간이 마음을 바꿀 때까지 이러한 거래는 인간의 개입 없이 계속 원활하게 이루어질 수 있다.

보건 및 유전체 연구의 맥락에서 동적 동의는 위에서 설명한 문제 측면에서 일회성 또는 광범위한 정보에 근거한 동의보다 더 적절한 동의 접근방식을 제공할 수 있다.

프라이버시

데이터 거래가 발생할 경우 프라이버시를 보존하기 위해 모든 합리적인 노력을 기울여야 한다.

"아무도 사생활, 가족, 가정, 통신에 대한 자의적인 간섭을 받지 않으며, 명예와 평판에 대한 공격도 받을 수 없다. 모든 사람은 그러한 간섭이나 공격에 대해 법의 보호를 받을 권리가 있다." - 유엔 인권 선언 제12조

프라이버시가 왜 중요한가? 데이터는 시스템을 보다 효율적으로 만드는 데 유용하지만, 이 효율성의 최종 목표를 정의하는 것은 윤리적인 데이터 사용 방법을 평가하는 데 필수적이다.

정부가 시민을 관찰하기 위해 데이터 모니터링을 이용하려면 적절한 사법 절차에 의한 명시적 인가가 필요하다. 아마도 상대적으로 많은 인구를 추적하기보다는 상대적으로 적은 수의 범죄자를 수동으로 관찰하는 것이 훨씬 더 효율적일 것이다. 국가 정부와 기업이 주민들을 포괄적으로 관찰하는 것은 오웰리아식 통치방식의 미끄러운 경사다. 프라이버시는 비밀을 지키는 것이 아니라 선택, 인권, 자유, 자유에 관한 것이다. 예를 들어, 의료 데이터를 의료진이 다른 의사에게 공개하더라도 건강 증진에 사용될 것이라는 이해 아래 의사와 공유하는 것은 윤리적으로 건전하다. 그러나 영국 국가 보건 시스템 및 구글의 딥마인드 인공지능 회사와 방금 일어난 것과 동일한 데이터가 마케팅 대행사와 공유될 때 윤리적 함의는 더욱 불확실하다(줄리아 포울스와 할 호손의 알고리즘 시대의 구글 딥마인드와 헬스케어). 프라이버시는 문맥을 선택하는 것이다; 어떤 데이터가 공유되는지, 누구와 누가, 어떤 목적을 위해 그리고 언제 공유되는지. 사생활은 그렇게 하지 않음으로써 얻는 개인의 힘과 부가 민간 기업과 정부 모두에게 혐오감으로 작용하고 있기 때문에 가능한 현재 실행되지 않고 있다. 또한, 실제 사회적 영향을 측정하기 위해 데이터를 사용하는 것은 관련 정치인이나 기업의 주장에 불편할 수 있는 비효율성을 드러낼 수 있다.

프라이버시에 대한 공개적인 논쟁은 프라이버시와 과학적인 진보 사이에서 지나치게 단순화된 이진법으로 부당하게 가려지는 경우가 많다. 마케팅 캠페인은 심지어 중앙집중식 데이터 수집에 대한 비평가들이 진척에 저항하고 과거를 고수하고 있다고 일축했다. 그러나, 데이터를 통한 과학적 진보의 이점은 역사적으로 역학 연구에서 그랬던 것처럼 프라이버시 가치와 일치하는 방식으로 달성될 수 있다. ID 프라이버시를 훼손하지 않고 데이터에서 가치를 추출하는 것은 기술적으로 확실히 가능하다. 예를 들어, 역 엔지니어링을 어렵게 하는 동형 암호화 및 알고리즘 설계를 활용함으로써 말이다.

동형 암호화는 데이터를 각 서비스에 노출시키지 않고 서로 다른 서비스의 체인을 결합할 수 있게 한다. 소프트웨어 작업을 하는 소프트웨어 엔지니어도 사용자를 무시할 수 없을 것이다. 동형 암호화 체계는 처리된 데이터의 기밀성을 보장하면서 클라우드 컴퓨팅 환경에서 사용할 수 있다는 의미로 설계에 의해 변형될 수 있다. 이 기법은 암호 텍스트에서 분석 연산을 수행할 수 있도록 하여 암호화된 결과를 생성하며, 암호 해독 시 일반 텍스트로 수행된 연산 결과와 일치한다.

분석 결과는 신원 프라이버시를 훼손하지 않고 목적에 적합하도록 제시할 수 있다. 예를 들어, "암스테르담의 20%가 아침 식사로 뮤즐리를 먹는다"고 명시한 데이터 판매는 프라이버시를 침해하지 않고 데이터의 분석적 가치를 전달하는 반면, "아나가 아침 식사로 뮤즐리를 먹는다"고 말하는 것은 프라이버시를 유지하지 못할 것이다. 알고리즘 설계와 표본 그룹의 크기는 통계를 역설계하고 목표한 개인을 추적할 수 있는 용량을 최소화하는데 매우 중요하다. 집계 지표의 엔지니어링을 역전시키는 한 가지 기술적 해결책은 최종 결과를 바꾸지 않는, 예를 들어 뮤즐리를 먹는 집단의 비율과 같은 구성원에 관한 가짜 데이터 포인트를 도입하는 것이다.

사생활은 또한 비윤리적인 것으로 여겨질 수 있는 데이터 사용에 대한 제한으로 제시되어 왔다.[7] 예를 들어, 건강관리 데이터의 공유는 질병의 원인과 치료의 효과를 조명할 수 있으며, an은 개인의 필요에 따라 맞춤형 분석을 할 수 있다.[7] 이는 빅데이터 윤리 분야에서 윤리적으로 중요한데, 많은 이들이 프라이버시를 중시하지만, 데이터 공유의 가치 또한 개인의 프라이버시 개념과 모순될 수 있기 때문이다. 데이터 공유에 대한 태도는 데이터에 대한 통제력의 상실과 개인 데이터의 이용에 대한 두려움에 근거할 수 있다.[7] 그러나 프라이버시를 훼손하지 않고 데이터의 가치를 추출하는 것은 가능하다.

Jonathan H. King과 Neil M과 같은 몇몇 학자들은 리차드는 프라이버시의 전통적인 의미를 재정의하고 있으며, 다른 사람들은 프라이버시가 여전히 존재하는지 여부를 의심하고 있다.[5] Wake Forest Law Review 2014년 기사에서 킹과 리차드는 디지털 시대의 사생활은 비밀의 관점에서가 아니라 개인정보의 사용을 통제하고 통제하는 규제의 측면에서 이해될 수 있다고 주장한다.[5] 유럽연합(EU)에서 잊혀질 권리(Right to Forget to Forget)는 정보가 부적절하거나 오래된 것으로 간주될 경우 개인의 요청에 따라 데이터베이스에서 개인 데이터를 삭제하거나 링크를 해제하도록 EU 국가에 권한을 부여한다.[8] 앤드류 호스킨스에 따르면, 이 법은 EU 회원들이 인식한 사생활의 손실과 디지털 시대에 개인 데이터를 통제할 수 있는 능력에 대한 도덕적 공황을 보여준다.[9] 미국에서는 시민들이 자발적으로 제출한 자료를 삭제할 권리가 있다.[8] 빅데이터 기술과 플랫폼을 이용해 생산한 데이터의 상당 부분이 자발적으로 제출되지 않기 때문에 '잊혀질 권리'와는 크게 다른 것이다.[8]

통화

거대 기술 기업을 이끄는 비즈니스 모델들은 인간의 정체성을 소비할 수 있는 제품으로 만들 가능성을 밝혀냈다. 검색엔진, 통신채널, 지도 등 기술서비스가 무료로 제공되는 반면 이 과정에서 드러난 새로운 화폐는 개인 데이터다.

개인 데이터에 접근하는 대가로 돈을 받는 것이 윤리적인지에 대한 의견이 분분하다. 헌혈 사이에 유사점이 그려졌는데, 헌혈자의 재정거래가 없을 때 헌혈되는 전염성 혈액의 비율이 감소한다. 데이터 트랜잭션의 수익을 누가 받아야 하는지에 대한 추가 질문이 제기됨

데이터의 가치는 얼마나 되는가?

개인 데이터를 돈으로 환산하면 환율이 어떻게 되는지요? 데이터는 사용자가 시행착오를 이용해 추측하거나 조작할 때보다 더 효율적으로 행동할 수 있도록 해주기 때문에 가치가 있다. 데이터에는 트렌드와 실시간이라는 두 가지 요소가 있다. 과거 데이터의 축적을 통해 우리는 추세를 바탕으로 미래의 예측을 할 수 있다. 실시간 데이터는 즉각적인 조치가 가능하기 때문에 가치를 부여한다.

검색 엔진, 통신 채널, 디지털 지도와 같은 기술 서비스의 실제 가치는 얼마인가? 기술기업이 촉진하는 서비스와 이들 기술기업의 지분가치의 차이는 시민에게 제공하는 환율의 차이와 그 데이터의 가치의 '시장금리'이다. 과학적으로 이러한 초보적인 계산에서 선택할 수 있는 많은 구멍이 있다: 탈세 기업의 재무 수치는 신뢰할 수 없고, 수익이나 이익이 더 적절할 것인가, 사용자가 어떻게 정의되는가, 데이터가 가치 있게 되려면 많은 수의 개인이 필요하다, 서로 다른 공동의 다른 사람들에게 계층화된 가격이 있는가.모든 구글 수익이 Gmail 등에서 나오는 것은 아니다. 비록 이러한 계산이 부인할 수 없이 조잡하지만, 이 연습은 데이터의 금전적 가치를 보다 가시적으로 만드는 역할을 한다. 또 다른 접근법은 암시장에서 데이터 거래율을 찾는 것이다. RSA는 이러한 접근 방식을 채택한 사이버 보안 쇼핑 목록을 매년 발표한다.[10] 주어진 예는 특정 사례만을 다루지만, 만약 우리가 데이터 판매에서 얻는 이익을 의료와 같은 다른 분야로 확대한다면, 개인당 월 이익은 증가할 것이다.

이는 개인 데이터와 교환하는 무료 기술 서비스가 소비자를 위한 가치 있는 암묵적 교환인지에 대한 경제적인 문제를 제기한다. 개인 데이터 거래 모델에서는 데이터를 판매하는 기업이 아닌 소유자가 개인 데이터를 팔아 수익을 유지할 수 있다.[11] 개인 데이터 거래는 개인에게 자신의 디지털 아이덴티티를 소유할 수 있는 능력을 부여하고 인터넷을 통해 세분화된 데이터 공유 계약을 체결할 수 있는 프레임워크다. 개인 데이터 거래에서 개인 데이터를 영리 목적으로 판매하는 기업을 용인하는 현행 모델보다는 개인이 원하는 알려진 당사자에게 개인 데이터를 판매하고 수익을 유지하는 방식을 택했다. 핵심은 인터넷의 재분권화 노력이다. 개인 데이터를 영리 목적으로 판매하는 기업을 용인하는 현재의 모델보다는 개인 데이터 거래에서 개인 인류가 직접 자신의 개인 데이터를 소유하고 의식적으로 자신이 선택한 알려진 당사자에게 판매하여 수익을 유지하게 된다. 개인 데이터 거래는 네 번째 부의 분배 메커니즘을 추가하며, 나머지 세 가지는 일자리, 재산 소유, 회사 소유를 통한 급여를 추가한다. 개인 데이터 거래 모델의 궁극적인 목표는 보다 공평한 글로벌 자원 분배와 보다 균형 잡힌 글로벌 자원 배분이다. 제안된 프레임워크에서 개인에 의한 개인 데이터 거래는 인구 사이에 분산된 이익을 초래할 수 있지만 사회 권력 구조에 근본적인 영향을 미칠 수도 있다. 현재 중앙집중화된 데이터 설계가 이념적 반향의 회의실을 악화시키고 선거와 같은 외견상 관련이 없어 보이는 의사결정 과정에 광범위한 영향을 미친다는 것은 현재 널리 인정되고 있다. 데이터 환율은 화폐적일 뿐만 아니라 이념적이다. 자유롭게 수집된 개인 데이터에 의해 안내되는 통신 도구의 중앙 집중화된 사용에 의해 기관 프로세스가 손상되어야 하는가?

초기에는 데이터가 돈과 거래될 것이라고 가정하는 것이 현실적이지만, 데이터가 데이터와 거래될 미래를 상상하는 것은 가능하다. "내 것을 보여 주면 네 것을 보여주겠다"는 시나리오가 돈을 완전히 대체할 수도 있다. 중요한 것은 이것이 미래의 시나리오고 첫 번째 단계는 개인 데이터를 기존 통화와 교환하는 데 초점을 맞추는 것이다.

개방성

공개 데이터의 개념은 데이터를 자유롭게 이용할 수 있어야 하며 저작권법과 같이 데이터의 사용을 금지할 수 있는 제한을 두어서는 안 된다는 주장을 중심으로 한다. 2014년 현재 많은 정부는 투명성과 책임성을 목적으로 공개 데이터셋을 발행하는 방향으로 나아가기 시작했다.[12] 이러한 움직임은 "개방형 데이터 활동가"를 통해 설득력을 얻었으며, 이들은 시민 스스로 데이터로부터 의미를 추출하고 견제와 균형을 수행할 수 있도록 데이터 세트를 제공할 것을 정부에 요구해왔다.[12][5] 킹과 리차드는 투명성에 대한 요구가 개방성과 비밀 사이의 긴장을 포함하고 있다고 주장해왔다.[5]

활동가들과 학자들은 또한 이러한 오픈 소스의 데이터 평가 모델은 자발적인 참여에 기초하기 때문에 오픈 데이터셋의 가용성은 사회에 민주화된 영향을 미침으로써 시민 누구나 참여할 수 있다고 주장해왔다.[13] 어떤 사람들에게는 특정 유형의 데이터의 가용성이 시민 기관의 권리와 필수적인 부분으로 보여진다.[13]

오픈 지식 재단(OKF)은 정부가 진정으로 개방하기 위해 제공해야 할 몇 가지 데이터셋 유형을 나열한다.[14] OFK에는 정부의 개방성을 측정하기 위한 군중 소싱 조사인 GODI(Global Open Data Index)라는 도구가 있다.[14] GODI의 목적은 정부에게 오픈 데이터셋의 품질에 대한 중요한 피드백을 제공하기 위한 도구를 제공하는 것이다.[15]

데이터를 공유하려는 의지는 사람마다 다르다. 데이터 공유 의지의 결정요인에 대한 예비 연구가 실시되었다. 예를 들어 베이비붐 세대가 밀레니얼 세대보다 데이터 공유 의지가 낮다는 의견이 나왔다.[16]

기관의 역할

국가

데이터 주권은 국가 내에서 생성되고 수집되는 데이터에 대해 정부가 통제하는 것을 말한다.[17] 데이터 주권 문제는 에드워드 스노든이 미국 정부가 감시하고 있던 다수의 정부와 개인에 대한 미국 정부 정보를 유출하면서 불거졌다.[17] 이것은 많은 정부들이 데이터 주권에 대한 접근법과 시민들의 데이터의 보안을 재고하도록 자극했다.[17]

J. De Jong-Chen은 데이터 흐름의 제약이 어떻게 많은 개발도상국들에게 불리하게 과학적 발견을 방해할 수 있는지 지적한다.[17] 이는 사이버 보안과 글로벌 개발이라는 두 가지 중요한 이슈 사이의 긴장감 때문에 빅데이터 윤리에 상당한 관심사다.

은행

그 은행들은 사회에서 가치관의 위치를 차지하고 있다. 그들의 데이터 정책은 가치관으로서의 고객과의 신뢰 관계를 손상시켜서는 안 된다. 예를 들어, 은행에서는 한 도살자와 다른 도살자에 대한 데이터를 공유하는데, 이것은 경쟁자들에게 데이터가 노출되어 그들의 신뢰 관계를 손상시킬 수 있다.

데이터 윤리에 대한 관련 뉴스 항목

2013년 6월 5일 에드워드 스노든 폭로가 데이터 윤리 공론화의 전환점을 맞았다. 현재 유출된 문서들의 출판은 미국 NSA가 파이브 아이즈 파트너들 중 세 곳과 긴밀히 협조하여 운영한 세계 감시 기구의 알려지지 않은 세부 사항들을 밝혀냈다. 호주의 ASD, 영국의 GCHQ, 캐나다의 CSEC.

네덜란드에서 ING 은행은 데이터 사용에 대한 그들의 의도에 대해 공식 성명을 발표했다.

Facebook-Cambridge Analytica 데이터 스캔들은 유권자들의 의견에 영향을 미치려는 시도로 최대 8700만 명의 페이스북 사용자들의 개인 데이터를 수집하는 것을 포함한다. 2016년 브렉시트 투표와 2015/6년 미국 정치인 도널드 트럼프와 테드 크루즈의 선거운동 모두 캠브리지 애널리티카에게 데이터 침해 정보를 이용해 유권자들의 의견에 영향을 끼쳤다.

데이터 윤리에 대한 관련 법률

2001년 10월 26일, 미국인들이 9.11 테러로부터 느낀 광범위한 우려에 대응하여 애국자법이 미국에서 시행되었다. 대체로 말해서 애국자법은 보안군이 테러행위에 연루된 것으로 의심되는 시민들을 감시할 수 있는 길을 열었다.

2018년 5월 25일 일반 데이터 보호 규정 2016/679(GDPR)가 유럽연합 전역에서 발효되었다. GDPR은 데이터 제어기에서 개인에 대한 투명성 문제(데이터 주제라 칭함)와 데이터 주체의 개인 데이터 취급 허가의 필요성을 다룬다.

참고 항목

각주

  1. ^ Kitchin, Rob (August 18, 2014). The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences. SAGE. p. 27. ISBN 9781473908253.
  2. ^ van Ooijen, I.; Vrabec, Helena U. (December 11, 2018). "Does the GDPR Enhance Consumers' Control over Personal Data? An Analysis from a Behavioural Perspective". Journal of Consumer Policy. 42 (1): 91–107. doi:10.1007/s10603-018-9399-7. ISSN 0168-7034. S2CID 158945891.
  3. ^ a b Zwitter, A. (2014). "Big Data Ethics". Big Data & Society. 1 (2): 4. doi:10.1177/2053951714559253.
  4. ^ O'Neil, Cathy (2016). Weapons of Math Destruction. Crown Books. ISBN 978-0553418811.
  5. ^ a b c d e Richards and King, N. M. and J. H. (2014). "Big data ethics". Wake Forest Law Review. 49: 393–432. SSRN 2384174.
  6. ^ a b c d Kitchin, Rob (2014). The Data Revolution: Big Data, Open Data Infrastructure and Their Consequences. SAGE Publications. pp. 178–179.
  7. ^ a b c Kostkova, Patty; Brewer, Helen; de Lusignan, Simon; Fottrell, Edward; Goldacre, Ben; Hart, Graham; Koczan, Phil; Knight, Peter; Marsolier, Corinne; McKendry, Rachel A.; Ross, Emma; Sasse, Angela; Sullivan, Ralph; Chaytor, Sarah; Stevenson, Olivia; Velho, Raquel; Tooke, John (February 17, 2016). "Who Owns the Data? Open Data for Healthcare". Frontiers in Public Health. 4: 7. doi:10.3389/fpubh.2016.00007. PMC 4756607. PMID 26925395.
  8. ^ a b c Walker, R. K. (2012). "The Right to be Forgotten". Hastings Law Journal. 64: 257–261.
  9. ^ Hoskins, Andrew (November 4, 2014). "Digital Memory Studies ". memorystudies-frankfurt.com. Retrieved November 28, 2017.
  10. ^ RSA (2018). "2018 Cybersecurity Shopping List" (PDF).
  11. ^ László, Mitzi (November 1, 2017). "Personal Data trading Application to the New Shape Prize of the Global Challenges Foundation". online: Global Challenges Foundation. p. 27. Archived from the original on June 20, 2018. Retrieved June 20, 2018.
  12. ^ a b Kalin, Ian (2014). "Open Data Policy Improves Democracy". SAIS Review of International Affairs. 34 (1): 59–70. doi:10.1353/sais.2014.0006. S2CID 154068669.
  13. ^ a b Baack, Stefan (December 27, 2015). "Datafication and empowerment: How the open data movement re-articulates notions of democracy, participation, and journalism". Big Data & Society. 2 (2): 205395171559463. doi:10.1177/2053951715594634. S2CID 55542891.
  14. ^ a b Knowledge, Open. "Methodology - Global Open Data Index". index.okfn.org. Retrieved November 23, 2017.
  15. ^ Knowledge, Open. "About - Global Open Data Index". index.okfn.org. Retrieved November 23, 2017.
  16. ^ Emerce. "Babyboomers willen gegevens niet delen". emerce.nl. Retrieved May 12, 2016.
  17. ^ a b c d de Jong-Chen, J. (2015). "Data Sovereignty, Cybersecurity, and Challenges for Globalization". Georgetown Journal of International Affairs: 112–115. ProQuest 1832800533.

참조