위키백과:터니틴
Wikipedia| 턴인 콜라보레이션 페이지 |
|---|
| 활동. |
|
- 주의: 이 페이지는 대부분 구식입니다.프로포절과 계획된 RFC는 2012년입니다.이 페이지의 일부(대체 정보 포함)는 때때로 업데이트되었습니다.
- '주의: 이 기능을 만들기 위해 https://copypatrol.toolforge.org/en/가 도입되었습니다.
| 이 페이지의 개요:표절 탐지 회사인 Turnitin은 알고리즘과 콘텐츠 데이터베이스를 통해 비공식적이고 배타적이지 않은 방식으로 모든 영어 위키피디아를 무료로 체크하는 데 관심이 있다.그 후, Turnitin 리포트가 있는 위키피디아 이외의 페이지에 대한 귀속 정보를 받아 위키피디아와 협력했다고 공개적으로 말할 수 있는 능력을 갖기를 원합니다.Turnitin은 Wikipedia 전용으로 소프트웨어를 조정하고, 파일럿 프로그램으로 그 유효성을 테스트하고, 서버에의 액세스를 계속적으로 제공할 용의가 있습니다.지역사회는 이 아이디어를 논의해야 하고 궁극적으로 그것을 추구할지 말아야 할지를 결정해야 한다.Turnitin의 소프트웨어 평가판을 실행할 수 있는지 여부를 판단하려면 의견 요청을 참조하십시오. |
- 참고: 위의 요약은 2012년 상태를 설명합니다.계획된 RfC는 발생하지 않았습니다.
터니틴은 아이패러딕스가 운영하는 인터넷 표절 탐지 서비스다.대학, 학교, 전문 연구자 및 작가들이 Turnitin의 웹사이트에 문서를 제출하고, 이 웹사이트는 포괄적인 인터넷 크롤러, 독점 콘텐츠 데이터베이스 및 이전 제출물에 대해 글의 독창성을 검사합니다.저작권이 있는 콘텐츠를 관리하는 것은 위키피디아의 주요 초점이자 문제입니다.이 페이지는, Wikipedia의 컨텐츠 감시에 관한 주요한 문제를 개선 또는 해결하기 위한 방법으로, Turnitin과의 잠재적인 콜라보레이션의 개념을 설명하는 것을 목적으로 하고 있습니다.
토크 페이지에서 코멘트는 환영입니다.
배경:터니틴
- Turnitin은 수백만 개의 논문을 확인하고 보관하며 데이터베이스와 알고리즘을 사용하여 표절된 [1]자료를 식별합니다.
- 원고 수령에 17억 웹 페이지, 200만 학생들, 그리고 컨텐츠 출판사에서 도서관 데이터베이스, 교과서, 디지털 참조 컬렉션,subscription-based 출판물, 숙제 도우미 사이트와 책 100만 추가 기사에 비교된다.[2](Turnitin의 웹 지수 현재 25억 페이지로 한다고 한다).
- 세계적으로 Turnitin은 연간 약 4000만 건의 논문을 평가하고 있습니다.최종 시험 기간 동안 사이트에서는 [1]초당 400건의 신규 제출을 처리합니다.
- 2012년 현재 Turnitin은 126개국 [1]13개 언어로 약 10,000개의 기관을 운영하고 있습니다.
- 상위 100개 대학 중 69%(U.S. News and World Report Best Colleges 목록)[3]를 포함해 2500개 이상의 고등교육기관이 터니틴을 사용하고 있다.
- 상위 100개 고등학교의 56%를 포함하여 거의 5,000개의 중고등학교가 [4]터니틴을 사용하고 있다.
- 콜로라도에서 Turnitin은 중등교육과 고등교육 모두 100개 학교와 200,000명 이상의 [1]학생들이 사용하고 있습니다.
- 100개 이상의 대학들이 지원서 [5]에세이에서 표절을 발견하기 위해 터니틴을 사용한다.
- Turnitin의 모회사인 iParadigms는 거의 100명의 직원을 고용하고 있다.그것은 사모펀드 회사인 Warburg Pincus의 지원을 받는다.그것은 거의 130개국에 서비스를 제공하는 8개의 국제 사무소를 가지고 있다.본사는 캘리포니아 [6]오클랜드에 있습니다.
배경:위키피디아 저작권 조사
Wikipedia의 저작권에 관한 대처는 다음과 같습니다.
- CorenSearchBot – 현재 사용하고 있는 가장 고도의 툴입니다.새로운 Wikipedia 문서를 체크하고 콘텐츠를 웹 검색과 대조하여 적절한 메시지로 태그하고 관련 저작권 포럼에 경고합니다.Coren의 봇에는 제한이 있다: 기존 Wikipedia 콘텐츠를 확인하지 않고 콘텐츠 데이터베이스가 아닌 웹 페이지만 확인하며 이전에 제출한 내용의 말뭉치가 없다.코렌의 알고리즘은 Turnitin의 독점 코드만큼 개발되지 않았을 수 있습니다.Coren의 봇은 5초당 1개의 체크를 실행하도록 제한되어 있으며, 연간 600만 건 이상의 기사를 체크할 수 있다.그것은 영어 위키피디아를 거의 두 번 커버하기에 충분한 양이지만, 그 수준의 조작이 가능한지는 확실치 않다.Coren의 봇은 항목별 보고서를 생성하지 않습니다.이 보고서를 통해 편집자는 표절된 섹션을 실제로 보고 비교할 수 있습니다(최근 Coren의 봇 보고서에 대해서는 사용자:CorenSearchBot/수동).Turnitin과의 콜라보레이션을 검토할 때 필요한 질문은 Coren의 봇이 충분한지, Turnitin의 시스템에 추월당하지 않고 확장해야 하는지 여부이다.또한 두 가지가 서로 보완할 수 있는 시너지 영역도 있습니다.예를 들어, 코렌의 검색 봇은 Turnitin의 저작권 검출에서 높은 점수를 받은 기사에 태그를 붙일 수 있다.또한 Wikipedia 미러를 포함한 봇의 '제외' 사이트 목록도 관심 대상입니다. 이 목록은 Turnitin이 위키피디아에 알고리즘을 최적화하는 데 도움이 될 수 있습니다(참조:위키백과:미러 및 포크, 미러 필터).현재(2011년 12월 31일 이후) Corn은 활성화되지 않았으며, 해당 봇은 미러링되어 사용자로 대체되었습니다.매드맨봇
- Duplication Detector(복제 검출기)– 이 툴포지는 2개의 웹 페이지를 직접 비교하여 중복 영역을 식별합니다.자동으로 실행되거나 데이터베이스를 쿼리하지 않습니다.
- Wikipedia를 위해 작성된 기여 평가관:영어 위키피디아에 대한 기여자 저작권 조사 도구인 이 도구는 저작권 위반 이력을 가진 사용자의 기여 내용을 분석합니다.저작권 위반 가능성이 가장 높은 투고를 분리하여 순위를 매깁니다.위반 가능성이 아닌 크기별로 기여도를 나열하기 때문에 가장 큰 범죄의 우선 순위를 매기는 데 도움이 되지만 위반의 실제 가능성을 강조하여 그렇게 하지는 않습니다.
- Copyvio 디텍터 - 저작권 위반을 탐지하는 다른 도구입니다.
- Wiki Project Copyright Investigations – 이 온Wikipedia 그룹은 다수의 대규모 저작권 위반을 조사하고 수정합니다.그들의 중요한 일은 대부분 수작업으로 이루어지며 일반적으로 지루하다.
- 위키백과:저작권 문제, 단일 또는 소규모 저작권 문제를 조사하기 위한 도움말 페이지입니다.
배경:기업 콜라보레이션
- 기업과의 비공식 관계라는 개념은 아직 비교적 새로운 것이지만 전례가 없는 것은 아니다.2010년과 2011년에 Credo Reference는 400개의 무료 "Credo 250" 계정을 Wikipedia 편집자(프로젝트 페이지)에게 기부했으며, 2012년에는 HighBeam Research가 편집자에게 최대 1000개의 무료 1년 계정을 제공했습니다(프로젝트 페이지).
- 위키피디아는 거대하고 귀중한 글로벌 자산이다.중립성을 훼손하는 것으로 인식되는 어떠한 행위도 가볍게 또는 전혀 수행해서는 안 된다.Wikipedia는 상업적인 프로젝트가 아닙니다.또한 명백히 비상업적인 프로젝트이기 때문에 맹렬하게 그렇습니다.위키피디아에 로고나 브랜드 연합을 남기는 것을 좋아하는 수천 개의 회사가 있지만, 위키피디아의 독립성은 주요 관심사입니다.많은 면에서 그것은 단순히 협상할 수 없다.
- 위키피디아는 운영에서 엄격한 중립성과 독립성을 유지하고 있지만 기업과의 협업을 통해 백과사전의 핵심 사명을 강화할 수 있습니다.올바르게 실시하면, Wikipedia의 객관성을 해치지 않고, 어떠한 기업에도 부당한 특권을 주지 않고, 사이트 운용의 주요 분야에 임할 수 있어 유익하고 실용적입니다.
개요
원칙
- 저작권을 존중하는 것은 위키피디아에 대한 핵심 정책일 뿐만 아니라 법률에 의해 요구되며, 이는 모든 사람이 사용, 수정, 용도 변경, 심지어 판매를 할 수 있는 진정한 무료 저작물이 되는 것을 목표로 하기 때문이다.
- 현재 저작권 위반을 식별하는 도구는 제한적이며, 때로는 수동이거나 포괄적이지 않으며 비효율적입니다.
- Turnitin은 위키피디아인들이 그들의 저작권 위반 조사뿐만 아니라 그들의 정규 콘텐츠 작업에 유용하다고 생각하는 포괄적인 저작권 및 표절 데이터베이스에 대한 유료 액세스를 제공합니다.
- Turnitin은 비싸지 않고 백과사전에 종사하는 대다수의 자원봉사 편집자들에게는 감당할 수 없을 것이다.
- Turnitin과 Wikipedia 간의 협업이 상호 이익이 될 것입니다.
Wikipedia에는 어떤 이점이 있습니까?
- 표절 및 저작권 탐지를 위한 주요 서비스 접근
- 저작권 침해에 대처하기 위한 효율성 및 확장성 향상
- 저작권 조사와 청소의 우선순위를 부여하고 감독할 수 있는 능력
- 고도의 알고리즘을 사용하여 모든 위키피디아 기사를 분석할 수 있는 기회.이것에 의해, 컨텐츠의 관리 방법에 일대 변혁이 일어날 가능성이 있습니다.
- 교육 자원 제공업체와의 커뮤니티 관계 강화
- 커뮤니티 및 편집자의 가방에 있는 다른 툴로 기사를 감시하고 개선합니다.
터니틴에게 이득이 되는 게 뭐야?
- 업계 표준으로서의 소프트웨어 지위를 공고히 하는 높은 수준의 콜라보도
- 피드백을 제공하는 것으로 알려진 커뮤니티에서 엄청난 양의 사용자 피드백이 제공됨
- 세계 최대의 백과사전의 내용을 개선할 기회
- 사이트 운영의 중요한 측면을 지원하는 커뮤니티 내 가시성
- 정책에 따라 커뮤니티 전체에서 이 콜라보레이션의 추진
- 토론 보류 중, Turnitin의 오프 위키피디아 보고서에 대한 속성
- Turnitin이 존재하여 유용한 서비스를 제공한다는 것을 편집자에게 인식시킵니다.
- Turnitin이 Wikipedia를 확인하는 데 사용됨을 광고할 가능성
아닌 것
- 정식 파트너십 또는 계약 관계
- Turnitin에 대한 다른 유사하고 경쟁적인 서비스와의 비교 보증
- 동등한 소프트웨어의 무료, 경쟁 소프트웨어 또는 오픈 소스 버전을 이용할 수 있는 경우 Turnitin의 서비스를 계속 사용하는 계약
작업 계획
- Turnitin 보고서는 토크 페이지(토크 페이지에는 Turnitin이라는 이름이 언급되지 않음)에 일반적이고 익명으로 링크되어 커뮤니티가 유용하다고 결정한 일정 수준의 텍스트 매칭을 충족합니다.
- Turnitin의 보고서 페이지는 "Wikipedia Check"와 같이 브랜드가 변경됩니다.
- Turnitin의 보고서 하단에는 "Powered by Itenticate"라고 적힌 작은 아이콘이 있을 것이다. 이 아이콘은 Turnitin의 모회사이다.
- Turnitin의 보고서는 새로운 봇 또는 기존 봇과 통합되어 있으며, 비수기 시간에 정기적으로 Turnitin 데이터베이스를 쿼리하여 기사 토크 페이지 또는 하위 페이지에 보고서를 씁니다.
- 중앙 페이지 프로젝트 페이지, 토크 페이지 또는 기사 페이지를 결과 또는 적절한 태그로 업데이트할 수 있습니다.
귀속
중요한 문제 중 하나는 Turnitin이 제공하는 서비스에 대한 속성 또는 신용을 부여할 것인지 여부, 방법 및 시기입니다.다음은 기사 토크 페이지에 게시할 수 있는 알림/배너의 예입니다.
| 본 기사는 2012년 3월 24일에 다른 웹사이트 및 기사와 텍스트 매치를 확인하였습니다.보고서를 보려면 여기를 클릭하십시오.이것은 잠재적인 저작권이나 표절 문제에 대한 조사의 시작점에 불과합니다. |
- 기타 귀속 가능성
- 커뮤니티 포럼, 각종 저작권 프로젝트, 기사 콘텐츠 작성, 기사 리뷰 센터 연계 추진
- Wikimedia Foundation 프레스 릴리즈
- 턴어틴 프레스 릴리즈
- Turnitin의 웹사이트에서 사전 승인된 제한된 언급 및 이 공동 작업에 대한 홍보 자료
주요 이의에 대한 대응
- 우수성:위키피디아는 현재 모든 새로운 페이지를 구글의 데이터베이스와 대조하는 매드먼봇이라고 불리는 봇을 실행하고 있다.이것은 말하자면 '경쟁'이며, Turnitin이 보다 효과적이고 포괄적이며 정교한 접근 방식을 가지고 있다는 것을 증명할 필요가 있다(Madman Bot은 Turnitin의 데이터베이스에 대한 쿼리, 페이지 위반 및 포스트를 위한 수단이 될 수 있기 때문에 Turnitin을 보완하는 중요한 린치핀이 될 수도 있다.Wikipedia에 대한 보고서를 작성합니다.다양한 무료 경쟁 유료 서비스도 있다.왜 이 질문들 위에 터니틴을 사용해야 하는지가 답해야 할 필수 질문입니다.
- false positive 회피:Turnitin은 위키피디아의 거울이나 복사본 페이지와 일치하는 것을 피할 수 있다는 것을 보여줘야 할 것이다.그것을 기술적으로 실장하는 것이 콜라보레이션의 열쇠입니다.
- 속성:현재 가장 접근하기 쉬운 아이디어는 모든 기사의 맨 위에 직접 링크된 기사 Talk 페이지에는 Turnitin과 Turnitin 리포트에 링크된 배너가 있다는 것이다.이게 공평하고, 과도하고, 충분한가요?
- 독점성:과거에는 기업의 협업이 명백히 비배타적이었기 때문에 위키피디아는 어떠한 이유로든 경쟁사의 서비스를 사용하거나 협업을 중단할 수 있었습니다.위키피디아는 대부분 선의로 운영되고 상호 이익은 비배타성 기준을 크게 약화시켰다.그러나 Turnitin은 상당한 자원, 계획, 시간 및 에너지를 이 파트너십에 할애할 것을 고려하고 있기 때문에 우리는 일정 기간 동안 어떠한 배타적 합의가 바람직한지, 필요한지, 허용되는지를 고려해야 한다.
관계자
사인온:
- Ocaasi t c 2012년 3월 25일 (UTC) 16:(
- 앤드류 G. West, Wiki 보안을 연구하는 UPenn의 컴퓨터 공학 박사과정 학생
- Doc James (talk · contributes · email ) (내 페이지 회신에 쓰는 경우) 2014년 5월 8일 01:01 (UTC)
- Fuhghett aboutit (talk) 저작권 위반에 대한 오랜 경험, 검출, 역방향 복사 및 관련 문제 조사 그 아이디어가 마음에 들고 내가 도울 수 있다면 기꺼이 도와줄게. 그러나 나는 프로그래밍 기술이 없기 때문에 그런 부분에서는 쓸모가 없을 것이다.
봇 프로그래머:
확인 완료:
- Wikimedia Foundation 커뮤니티 라이슨 Maggie Dennis 씨
- Philippe Beaudette, Wikimedia Foundation 커뮤니티 옹호 디렉터
- Derek Coetzee, UC Berkeley 관리 및 컴퓨터 공학 박사과정 학생
- 코어(Marc A). Pelletier), CorenSearchBot 관리자 및 운영자
- Madmanbot의 관리자 겸 운영자인 Madman(CorenSearchBot의 대체 제품)
대체 표절 도구
- 공짜
- 지불하다
「 」를 참조해 주세요.
레퍼런스
- ^ a b c d Kevin Simpson. "Rise in student plagiarism cases attributed to blurred lines of digital world". The Denver Post. Retrieved 2012-03-25.
- ^ "Products : Turnitin for Educators : Content". Turnitin. Retrieved 2012-03-29.
- ^ "Customers : College & University". Turnitin. Retrieved 2012-03-29.
- ^ "Customers : Middle & High School". Turnitin. Retrieved 2012-03-29.
- ^ "Colleges use Turnitin to turn away plagiarists – Los Angeles Times". Articles.latimes.com. 2010-07-22. Retrieved 2012-03-25.
- ^ "About Us : Our Company". Turnitin. Retrieved 2012-04-01.