위키백과:자동화된 절제

Wikipedia:

위키백과의 자동적 절제위키백과의 사용이다:공유 위키 환경에서 좋은 행동을 촉진하기 위한 .

2001년부터 2019년까지 위키피디아의 봇들은 대부분 인간의 지시에 따라 간단한 명령을 실행했다.이러한 명령의 대부분은 위키피디아의 내용에 초점을 맞추기 위한 사설이었고, 봇 운영자들은 종종 봇들에게 인간의 행동에 개입하도록 지시하지 않았다.

데이터 과학의 진보와 위키피디아에서의 인간 활동에 관한 20년 가까운 데이터로, 봇들이 다양한 종류의 위법행위를 탐지하기 위해 위키피디아를 순찰하는 것이 가능해졌다.예를 들어, 사람들이 위키피디아를 적용한 예는 다음과 같다.사용자의 비행에 대한 정책을 차단하는 봇은 기계 학습을 사용하여 과거 사례의 비행을 식별한 후 인간이 아직 평가하지 않은 상황에 그들이 배운 것을 적용할 수 있다.이것은 "자동화된 절제"이다.

자동화된 절제는 인간의 평가를 대신해서는 안 되며, 다만 그것을 보완해야 한다.위키백과 커뮤니티는 그 모든 절제 속에서 인간 중심적이 되도록 배려해야 하며, 판단과 위키백과 커뮤니티 과정에서 항상 투명성을 중시하고 요구해야 한다.

프로젝트

위키트러스트

2007년부터 2011년까지 위키 트러스트 프로젝트는 자동화된 절제를 사용하여 위키피디아 순찰에 인간을 지원할 것을 제안했다.당시 문제에는 높은 연산비용, 일반 소프트웨어 부족, 위키미디어 데이터 구조화 어려움, 지역사회 지원과 이해 부족 등이 있었다.이 프로젝트와 관련된 기술적 문제와 이런 종류의 프로그램을 운영하는 데 드는 비용은 2019년을 기점으로 크게 떨어졌다.이 프로젝트의 통찰력은 다음 단계를 계획하는 데 유용해야 한다.

직쏘 적용

직소는 2017년 위키백과에서 위법행위를 찾아내기 위해 연구 프로젝트를 수행한 구글 기업이다.프로젝트의 좋은 부분에는 위키피디아와 연구를 자동화된 온도로 가져왔으며, 추가 연구를 위한 유용한 데이터 세트를 만들어 공유했으며, 연구 논문을 발표했다는 내용이 포함되어 있었다.프로젝트의 유용성이 떨어진 부분은 연구팀이 위키백과 커뮤니티와 니즈에 대해 접촉하지 않았고, 프로젝트는 일회성 이벤트였으며, 커뮤니티 토론이나 사용자 상호작용이 누락된 사물의 기술적 측면에 초점을 맞췄다는 점이다.

구글은 초강대국이고 그들의 관심을 갖는 것은 정부로부터 인정받거나 신의 개입을 받는 것과 같다.구글 고마워, 사회적으로 소통하는 게 이상할 때도 하고 싶은 걸 해.

ORES 순위

Wikimedia Foundation에는 데이터 마이닝(mw:ORES, "오레" 채굴을 위한 말장난.

2017년 5월부터 2019년까지 ORES 프로젝트는 기계 학습을 사용하여 개별 편집의 가능한 유용성 순위를 매겼다.이렇게 하면 편집별로 중용을 허용하고, 계정과 관련된 동작의 추세를 검색하는 데 다른 사용자가 사용할 수 있는 편집에 대한 데이터 집합을 만들 수 있다.

ORES는 영어 위키백과를 포함한 다양한 위키미디어 프로젝트에서 실행되는 능동적인 자동 조정 프로그램이다.

오토모드 @ U 오브 버지니아

2018-19년 버지니아 대학의 위키백과 연구소는 영어 위키백과에서 사용자 블록을 검사하기 위해 머신러닝을 적용한 프로젝트인 '온라인 오용의 자동 검출'을 발표했다.

이 연구는 두 가지 중요한 발견을 했다. 하나는 이용 가능한 기술과 데이터로 우리는 충분히 낮은 비용으로 훌륭한 자동화된 중간 도구를 개발할 수 있다는 것이고, 두 번째는 이러한 도구를 적용하기 위한 사회 기반 구조가 기술보다 개발 비용이 더 많이 들 것이고 또한 서두를 수 없다는 것이었다.이 프로젝트는 자동화된 절제에 대한 접근성이 훨씬 더 쉽고 더 낮은 것을 기대하여 지역사회 대화와 정책 개발을 지금 권고한다.

누구나 참여할 수 있다.

일반 Wikimedia 콘텐츠 개발

자동화된 중용을 이해하는 데 있어 필수적인 부분은 동일한 기술적, 사회적 측면에 대한 일반적인 참조 정보에 접근하는 것이다.이 위키백과 기사들을 고려해 보십시오.커뮤니티 그룹과 모든 분야의 대학생들이 일반적인 위키 과정으로 편집하도록 장려한다.

전문적
사회적

정책 추천

커스터디티 ipsos 커스터드?(누가 감시원을 감시할 것인가?)위키 공동체는 봇이 무엇을 하고 누구라도 그들과 어떻게 상호작용해야 하는지에 대한 정책을 세우기 위해 주의를 기울여야 한다.

봇은 일상적인 업무에서 엄청난 양의 인간 노동을 절약할 것을 약속하지만 또한 그들 스스로 반복적이고 신속하게 나쁜 판단을 내릴 수 있다.조심스럽게 테스트하고, 주의 깊게 사용하고, 일상적으로 그들이 무엇을 하고 있는지 확인한다.봇이 어떻게 작동하고 누가 그것을 작동시키는지에 대한 투명성을 높이는 위키백과 정책을 유지하라.

기술은 신뢰의 속도로 발전한다 - 위키 공동체가 가능한 기술에 걸맞게 문화를 바꾸고 신뢰를 높여야 한다는 그 누구도 용납하지 않는다.

이념 정책 페이지는 절제 정책을 안내하는 위키미디어 커뮤니티의 합의를 대표할 수 있는 최고 권위자일 수 있다.그러한 가이드 중 일부는 다음과 같다.

봇 권장 사항 평가

봇은 보고서를 생성한다.우리는 인간이 봇 활동을 정확하고, 부정확하거나, 불확실하다고 평가하도록 함으로써 더 나은 봇을 만든다.

봇 활동에 대한 인간 평가에 참여하는 것을 고려하라.위키백과 커뮤니티에 이런 종류의 노동을 요청하는 사람이 있다면, 그들은 인간/봇 상호 작용 정책에 맞추어 그렇게 해야 한다.봇은 봇에게 주의를 기울이는 모든 인간에게 엄청난 양의 인간 노동을 요구하고 있으며, 봇 운영자의 어떤 평가 요청도 그들이 얼마만큼의 인간 노동력, 시간, 평가를 수집하고자 하는지, 그리고 어떤 목적으로 수집하고자 하는지에 대한 자체 보고된 추정치를 가지고 와야 한다.

타겟에 대한 위법 행위

프록시 편집

위키피디아는 공개 프록시 IP 주소로 편집하는 데 제한이 있다.문제 있는 프록시 편집에는 크게 두 종류가 있다. 하나는 위키피디아에 의한 것이다.IP 사용자 및 다른 하나는 프록시에서 생성된 등록된 Wikimedia 계정을 사용하는 경우.

User:ProcseeBot은 알려진 프록시에 대해 IP 주소를 스캔하여 차단한다.이것은 일상적이고, 논란의 대상이 되지 않았고, 다른 어떤 과정보다 더 많은 영어 위키백과 블록을 낳았다.

현재 잘 문서화되지 않았거나 많은 관심의 대상이 아니지만, 영어 위키백과의 블록을 이해하려면 프록시를 이해하는 것이 필수적이다.블록과 부정행위에 대한 머신러닝 연구는 차단된 수많은 대리 계정을 탐지할 것이며 이것들의 중요성을 해석해야 한다.

미공개 유료 편집

기업이 위키백과 내용을 조작하기 위해 홍보 전문가를 고용할 때와 같이 공개되지 않은 유료 편집은 우리 위키백과 용어에도 어긋나고 영어 위키백과에서는 심각한 사회적 금기 사항에도 어긋난다.

다양한 커뮤니티 그룹들이 이러한 특정한 종류의 위법행위를 식별하기 위해 머신러닝을 사용할 것을 예상하고 인간 노동력을 이용하여 미공개 유료 편집을 식별하는 데이터 세트를 개발하기 위해 조직했다.

위키백과 커뮤니티에는 공개되지 않은 유료 편집을 탐지하는 것이 자동화된 프로세스를 통해 탐지하기 쉬운 위법 행위 중 하나일 수 있다는 희망과 이해가 있다.

스팸 발송

일반적인 스팸 행동에는 위키백과 공간에 링크나 키워드를 부적절하게 게시하는 것이 포함될 수 있다.

괴롭힘

괴롭힘은 합리적인 관찰자에게 특정인이나 특정인을 의도적으로 겨냥하기 위해 나타나는 반복적인 공격행위의 패턴이다.보통(그러나 항상은 아니지만) 목표는 대상을 위협하거나 위협적으로 느끼게 하는 것이며, 그 결과는 대상에게 위키백과 편집을 불쾌하게 하거나, 대상자를 약화시키거나, 겁을 주거나, 또는 편집하지 못하게 하는 것일 수 있다.괴롭힘은 또한 학대, 호통, 슬픔, 트롤링, 무례, 그리고 다른 사회적인 부정행위라고도 불릴 수 있다.

양말농사

양말농사는 악한 조직에 의해 그 자체가 봇이나 꼭두각시인 많은 위키백과 계정을 대량으로 만들고, 유용한 새로운 사용자 행동의 외관을 개발하기 위해 이들 계정 각각에 저가치 선 또는 중립적인 편집을 지시하는 일련의 활동이다.필요할 때, 이 악한 조직은 이러한 양식된 계정 중 하나를 수집하여 전략적 위법행위를 저지르게 되며, 위키백과 편집에 선행 공적이 있다는 선의의 혜택을 얻는다.