위키백과:제안된 도구
Wikipedia:![]() | 이 페이지는 현재 비활성 상태이며 기록 참조용으로 보존되어 있다. 그 페이지는 더 이상 관련성이 없거나 그 목적에 대한 합의가 불분명해졌다.토론을 되살리려면 마을 펌프와 같은 포럼을 통해 보다 폭넓은 의견을 구하십시오. |
봇, 반자동 편집 및 관리 도구, 위키백과 데이터베이스에 대한 접근 권한을 가진 툴서버 도구와 같은 도구는 일상 업무를 완전히 자동화하거나 워크플로우를 능률화하여 필요한 곳에만 사람이 입력하는 것을 포함하여 정기적으로 처리하도록 돕는다.그들은 일반적인 웹사이트 기능을 사용하여 불가능하거나 너무 지루해서 비용 효율적이기 어려운 특정한 유형의 작업을 가능하게 할 수 있다.
그러나 도구 설계는 현재 공개 토론이 제한된 많은 개인들 사이에서 단편화되어 있다.그 결과 설계는 실행 전에 잘 검토되지 않는 경우가 많고, 복잡한 도구 개발 노력을 위한 개발자를 모집하기 어렵고, 도구 아이디어를 가진 창의적 기여자들은 자신의 아이디어를 현실화할 수 있는 기술을 가진 사람을 찾는 데 어려움을 겪을 수 있다.이 페이지의 목적은 새로운 도구 아이디어를 제안하고, 그들의 높은 수준의 요구사항과 디자인을 구체화하며, 관심 있는 개발자를 모집하는 것이다.
도구 아이디어가 어떻게 작동할지 잘 모르더라도 과감하게 피드백을 요청하십시오. 이 포럼은 공동 포럼이며 좋은 디자인을 만들기 위해 모두 함께 노력할 수 있다.
새 도구를 제안하는 방법
- 제안된 도구에 대한 간단한 이름 또는 간단한 설명을 제공하십시오.
- 새 하위 페이지 위키백과 작성:제안된 도구/사용자의 도구 이름.
- 다음 템플릿 wikitext를 하위 페이지에 복사하고 각 필드를 입력하십시오.질문에 대한 답을 모르면 비워 두십시오.
- 이 페이지 하단에서 {{Wikipedia:제안된 도구/사용자 이름}}.
- 새로운 하위 페이지의 토론 페이지로 질문, 의견 불일치 및 예약을 지시하십시오.
미래에 제안된 도구는 필요에 따라 추가로 분류되고 구조화될 수 있다.
== 도구의 이름 ==(도구 개발 웹 사이트 링크가 있는 경우 도구 설명)======= 문제======(이 도구의 동기를 부여하는 문제의 설명)==== 요건=======(여기서는 도구가 무엇을 해야 하는가?)= 인터페이스 설계===(여기서는 구현에 대한 세부사항을 포함하지 마십시오)== (u를 어떻게 상상하는지 설명하십시오.ser 인터페이스는 웹 기반, GUI 기반, 콘솔 기반 또는 원하는 것이 될 수 있다. === 관심 있는 개발자 목록 ======= == 고급 아키텍처 ====(개발자가 채울 대상: 도구는 어떤 구성요소를 가질 것이며, 어떻게 상호작용할 것인가?)==== 구현 세부사항 ===(개발자가 작성해야 할 사항, 툴은 어떻게 구현될 것인가?어떤 기술을 사용할 것이며 어떤 구현 문제를 예상하십니까?)===진행률 ==(툴이 개발됨에 따라 얼마나 진행 중이고 어떤 문제가 발생하는지 여기에 기술하십시오.)
Cvcheck
웹에서 복사한 텍스트를 확인하는 저작권 도구.
문제
AFAIK는 현재 웹에서 복사한 텍스트의 존재를 확인하기 위해 두 개의 WP 도구만 사용할 수 있다.둘 다 한계가 있다.
사용자:CorenSearchBot은 새로 생성된 아티클에 대한 백그라운드 태스크로 실행된다.특정 기사는 또한 그 이름을 큐에 추가함으로써 그것을 통해 실행될 수 있는데, 그것은 봇이 자유 시간이 있을 때 어떤 기사를 실행할 것이라고 말한다.자동화된 작업이라 구글이나 GBook을 검색할 수 없다는 게 큰 한계다.
사용자:이어위그의 공구 [1]는 수동으로 호출된다.그것은 구글을 검색하지만 Gbook은 검색하지 않는다.최근의 플랩[2]을 일으킨 소재를 잡아내지 못했을 것이다(CSbot도 잡았을지 모른다).이 책의 저자는 알고리즘을 개선할 시간이 없을 것이라고 말한 학생이다.영구적인 출력을 생성하지 않는다(유지관리 문제를 일으킬 수 있다는 것을 알고 있다.)확실하지는 않지만, 코드[3]를 보면 일치하는 것을 찾으면 해당 URL을 제외 목록에 추가한다고 생각한다.만약 사실이라면, 이것은 기사를 정리하려고 노력할 사람이 웹사이트의 나머지 부분을 기사와 수동으로 비교해야 한다는 것을 의미한다. 모든 경기를 보는 것이 훨씬 더 효율적일 것이다.
요구사항
기사 문장을 확인하여 웹 사이트(알려진 WP 미러 및 공용 도메인 제외) 및 Gprint의 책자에서 말 그대로 복사되었는지 또는 말 그대로 말 그대로 복사되었는지 확인하십시오.출력 만들기: 각 일치 항목: 기사 섹션 제목, 일치하는 문장 또는 좋은 크기의 문장 조각, url.선택적이지만 유용할 수 있다. 일반적인 WP 미러가 자동으로 제외되더라도 종종 WP를 스크랩한 임의 사이트를 보기 때문에 사용자가 일부 매치 웹사이트를 제외할 수 있는 확인란이 있는 두 번째 패스 옵션이다.
개발 중에 있거나, 또는 실행된 후에도 검색 문자열을 어딘가에 버리면 된다. 그러면 왜 우리가 예상할 수 있는 일치점을 찾지 못했는지 생각해 보고 알고리즘을 더 개선할 수 있는 방법을 생각해 볼 수 있다.노비카스 (대화) 2010년 11월 5일 (UTC) 15:23[
- 나는 토크 페이지에서 이 아이디어에 대한 열렬한 지지를 추가했다.만약 이것이 기술적으로 실현 가능하다면, 구글 북스를 검색하는 것이 특히 도움이 될 것이다.체크박스 아이디어도 유용할 것이다. 보고서를 관리할 수 있도록 나는 여기서 한 가지 차이점을 제안한다. 즉, 완전한 결과를 나열한 다음 특정 결과가 제외되는 체크박스와 함께 두 번째 통과를 하는 것이 아니라, 완전한 결과를 제시하는 두 번째 통과를 허용하는 체크박스와 함께 간단한 결과 페이지를 제안한다.(나는 또한 누군가가 두 개의 URL을 직접 비교할 수 있는 도구를 만들 수 있는 날을 꿈꾸고 있다. 오래된 기사 개정과 현재 기사, 두 개의 다른 위키백과 기사, 위키백과 기사 및 확인된 외부 출처 등을 포함한다.)--Moonedgirl 11:31, 2010년 11월 6일 (UTC)[
인터페이스 설계
이어위그의 도구와 같은 콘솔 기반.
관심 개발자 목록
- Dcoetzee 01:08, 2010년 11월 7일 (UTC)[
- 플랫스캔(토크) 나는 MediaWiki API와 자바스크립트 경험을 가지고 있지만, 부업으로 도움을 줄 수 있을지도 모른다.05:48, 2010년 11월 8일 (UTC)[ 하라
- 버노위트니 18:17, 2010년 11월 8일 (UTC)[
고급 아키텍처
(개발자가 작성해야 할 사항; 도구는 어떤 구성요소를 가질 것이며, 어떻게 상호작용할 것인가?)
이행내역
(개발자가 작성해야 할 사항, 툴은 어떻게 구현될 것인가?어떤 기술을 사용할 것이며 어떤 구현 문제를 예상하십니까?)
진행
바로 오늘 아침 나는 이것의 기본적인 프로토타입을 구현했는데, 그것은 꽤 효과가 있는 것 같다.그것은 아직 가까운 패러프레이징을 탐지하거나 일반적인 구절이나 적절한 이름을 삭제하는 것과 같은 많은 것을 설명하지는 않지만, 몇몇 사람들이 시도해보고 좋은 피드백을 주었다.참조:
- Toolserver의 Detector 도구 복제
- 시연: [4]
- PDF와 비교: [5]
그것은 단순한 n그램 검색 알고리즘을 기반으로 하고, 웹 페이지는 텍스트로 분해되고, 일련의 단어로 분할되며, 그 중 하나의 단어로 색인 데이터 구조가 만들어진다. 각 단어의 쌍에 대한 모든 위치를 수집함으로써 단어 쌍에 대한 색인 데이터 구조가 만들어진다.그런 다음 다른 문서의 단어 순서를 넘어가고 각 위치에서 다른 문서에서 쌍이 발생하는 각 위치와 현재 쌍을 일치시켜 가능한 한 확장한다.마지막으로, 최종 목록 중에는 단어 수를 역순으로 정렬하고, 이미 나열된 검색 결과의 하위 문자열인 검색 결과를 삭제한다.PDF는 기존 pdftotext 도구를 통해 먼저 필터링된다.Dcoetzee 17:23, 2011년 3월 21일 (UTC)[