사용자:그래스풀/범주란 무엇인가?

이것은 MediaWikiland: 카테고리 정책의 문제에 대한 미니 에세이 입니다. 그것은 처음에 위키EN-l에서 논의되었다.

N.B. 위키백과 강연에서 이전에 논의된 내용을 알고 있다.분류. 이 에세이는 이 문제에 대해 좀 더 철저하고 방어할 수 있는 논문으로, 이전의 많은 주장의 오류를 부각시킨다.

2005년 6월 4일 업데이트: 여기서 제안된 규칙 "범주는 나무가 아니라 세트/그래프"는 현재 정책 =)에 수록되어 있다.

소개

카테고리란 무엇인가? 아무도 모른다. 범주가 무엇인지에 대한 합의가 이루어지지 않는다(Webedia talk:분류). 모든 분류가 "a" 관계를 나타내는 계층 트리인가? 아니면 단지 한 세트, 즉 하나 이상의 다른 세트 안에 속할 수 있는 관련 기사들의 그룹인가?

이것은 중요한 질문이다 - 위키피디아만 보십시오:삭제할 카테고리. 범주에 대한 변경은 기사의 변경보다 더 광범위한 영향을 미치고, 편집자들의 성가신 영향이 더 크다.

나는 범주가 계층이 아니라 집합이고, 집합이어야 한다고 믿는다.

범주가 집합임

범주의 원래 목적

분류 체계의 원래 목적은 무엇이었습니까? 세계지식의 분류법 개발? 개발자들이 그렇게 멍청하다고는 생각하지 않는다(아래로 확대하겠다). AFAIK는 관련 기사의 일종의 자동 목록 생성기였다. 목록은 계층 구조가 아니라 집합이다. "관련 기사" 목록은 계층 구조가 아니라 집합이다.

현재 소프트웨어

소프트웨어에서 범주가 개발된 방법은 범주가 세트라는 생각을 뒷받침한다. 누구도 그런 식으로 범주를 사용하는 것을 막을 수 있는 것이 없기 때문에 범주를 세트로서 암묵적인 지원이 있다. 범주 소프트웨어에는 계층적 시스템의 제한이 없다. 이러한 소프트웨어는 계층적 범주의 아이디어를 집행하는 가장 좋은 방법이며, 구현하기 쉬울 것이다(예: 범주의 임의적 양육을 허용하지 않음).

정책이 결정될 때까지(그리고 이를 지원하기 위해 업그레이드된 소프트웨어를 선호) 범주는 계속 세트로 사용될 것이다. 세트는 계층을 포함하지만 계층에는 집합이 포함되지 않기 때문에 현재 분류 시스템은 집합 중 하나이다.

범주는 설정되어야 함

범주는 본질적으로 POV이다.

분류 체계는 세계관이다. 따라서 범주가 NPOV가 되는 것은 매우 어렵다. 클레이 셜키로부터 다음과 같은 인용구가 확장된다.

기업 대 기업 시장이나 웹 서비스 같은 것들을 포함한 많은 네트워크 프로젝트들은 모든 사람들이 같은 방식으로 사물을 설명하면 의사소통이 더 쉬울 것이라는 명백한 가설에서 출발했다. 거기서부터, 통일 서술의 특정 브랜드가 그러므로 광범위하고 신속하게 채택될 것이라고 결론짓는 것은 짧지만 치명적인 비약이다. ("이것은 그랬으면 좋았을 것이기 때문에 효과가 있을 것이다")
메타 데이터가 세계관을 설명하기 때문에, 글로벌 온톨로지에 대한 어떠한 시도도 실패할 것이다. 소련 도서관의 분류 체계 설계자들은 "마르크스-레닌주의의 고전 작가들의 작품"이라는 첫 번째 범주를 만들 때 세계에 대한 주장을 펴고 있었다. Melvil Dewey는 세계에 대한 주장을 하고 있었는데, 그가 기독교인이 아닌 종교에 관한 모든 책들을 종교에 관한 책들 중 가장 마지막에 열거된 하나의 범주로 묶었다. 이 두 시스템을 서로 또는 다른 분류 체계로 깔끔하게 매핑하는 것은 불가능하다. 그것들은 서로 다른 종류의 세계를 묘사한다.
메타 데이터는 세계관을 설명하기 때문에, 비호환성은 활발한 논쟁의 필연적인 부산물이다. 예를 들어, 유전자에 대한 설명을 XML로 인코딩하는 것은 비교적 쉽겠지만, 생물학자들이 유전자가 실제로 무엇인지에 대해 여전히 논쟁하고 있기 때문에 그러한 설명에 대한 보편적인 표준을 얻는 것은 불가능할 것이다. 유전자 정보를 기술하는 데는 몇 가지 경쟁적인 기준이 있으며, 의미적 차이는 생물학자들 사이의 실제 대화의 공예품이다. 합의가 있을 때까지는 기준을 얻을 수 없고, 실제로 존재하지 않는 곳에 합의를 강요할 수 없다.
더욱이, 우리가 인간 상황에 의미론을 적용하려는 시도를 볼 때, 그것은 의미론을 약화시키고, 오히려 연결을 더 유익하게 만든다. Friendster나 LinkedIn과 같은 소셜 네트워킹 서비스는 사람들이 서로에 대한 링크를 깊은 연관성의 외부 신호로 취급할 것이라고 가정하여 소프트웨어로 대표되는 소셜 메쉬가 실제 세계의 정확한 모델이 될 것이다. 사실, 친구라는 개념, 또는 심지어 당신이 누군가를 안다고 말하는 데 필요한 연결의 종류와 깊이는 상당히 미끌미끌하며, 그 결과, 프렌드스터에 있는 사람들 사이의 연결고리는 그들의 의도된 의미 중 많은 부분을 지우고 있다. 암묵적이고 흐릿한 관계를 명시적이고 날카롭게 표현하려고 하는 것은 의미를 명확히 하지 않고, 그것을 파괴한다.

모든 것을 포괄하는 계층적 범주 시스템의 전체 개념은 위키백과의 정신에 반한다. 그것은 표기한 (범주화된) 기사에 대한 모든 것을 아우르는 세계관, 또는 가치의 귀속이다.

"범주는 계층" 아이디어는 많은 사람들이 모든 것을 포괄하는 신념 체계, 현실성이 전혀 없는 우스꽝스러운 개념, 많은 IT 메타데이터 프로젝트에서 잘못된 경험으로 나타난 개념에 동의하는 것이 가능하다고 가정한다.

범주, 특히 계층적 범주는 "우리의 방식이 옳으니 모두가 그것을 따라야 한다"고 암묵적으로 말하는 한 특정한 세계관의 추종자들에 관한 것이다. 모든 면에서 하나의 특별한 세계관을 따르는 사람들의 비율은 매우 작다는 것에 주목하라.

세트가 POV보다 훨씬 적다.

세트별 분류는 확실히 POV가 적다. 기사는 직접적으로든, 또는 기사의 범주(또는 조상)의 여러 부모를 통해든, 공동체가 속해야 한다고 생각하는 만큼의 집합에 속할 수 있다.

결론

계층적 분류의 이점

  1. 중복 감소
  2. 쉬운 탐색("올바른" 세계관을 가진 소수자를 위한)

그 비용보다 더 비싸다.

  1. 공동체는 그 제도에 대해 결코 합의하지 않을 것이다.
  2. 더 어려운 탐색(기사가 예상하는 곳에 기사를 찾지 못하는 대다수의 경우)
  3. 정확성 감소(실제 세계는 큰 계층 구조에 있지 않고 단지 다른 사람들이 적용하는 메타데이터 세트를 가지고 있을 뿐)

이 에세이는 다수의 상속과 심지어 상속 루프까지 허용함으로써 세트가 충분히 활용되고, 기사나 범주가 단지 한두 가지가 아닌 여러 범주로 주어지도록 장려하는 것으로 가정한다.