불확실한 추론
Uncertain inference불확실한 추론은 정보 검색에서 질의와 문서 관계를 공식적으로 정의하는[1] 방법으로 C. J. 반 리즈베르겐에 의해 처음 설명되었다.이러한 공식화는 불확실성의 척도를 부가한 논리적 함축이다.null
정의들
Rijsbergen은 질의에 대한 문서 d의 불확실성의 측정이 논리적인 함축의 확률이라고 제안한다.null
사용자의 질의는 원하는 문서에 대한 일련의 주장으로 해석될 수 있다.쿼리 주장이 사실이라면 특정 문서를 유추하는 것이 시스템의 과제다.만약 그렇다면, 그 문서는 회수된다.많은 경우에 문서의 내용이 질의에 동의하기에 충분하지 않다.사실과 규칙의 지식 기반이 필요하지만, 추론을 위해 그것들을 사용하는 것과 관련된 가능성이 있을 수 있기 때문에 그 중 일부는 불확실할 수 있다.따라서 이것을 타당한 추론이라고도 할 수 있다.추론 → 의 타당성은 각 질의 어설션의 타당성의 함수다.쿼리와 정확히 일치하는 문서를 검색하기보다는 해당 쿼리에 대한 신뢰성에 따라 문서의 순위를 매겨야 한다.d와 q는 모두 사용자에 의해 생성되기 때문에 오류가 발생하기 쉬우므로 → 은(는) 불확실하다.이것은 주어진 질의의 타당성에 영향을 미칠 것이다.null
이를 통해 다음 두 가지를 달성할 수 있다.
- 확률 수정 프로세스와 논리 분리
- 관련성 처리와 요청 처리 구분
멀티미디어 문서는 이미지나 비디오와 같이 데이터 유형별로 서로 다른 추론 속성을 가지고 있다.또한 텍스트 문서 속성과는 다르다.그럴듯한 추론의 틀은 우리가 이러한 다른 특성에서 오는 확률을 측정하고 결합할 수 있게 해준다.null
불확실한 추론은 진리 값이 알려져 있거나 알려지지 않은 자동 인식 논리의 개념을 일반화하며, 알려지면 진리 또는 거짓이다.null
예
양식에 대한 질의가 있는 경우:
여기서 A, B, C는 질의 어설션이며, 문서 D의 경우 우리는 다음과 같은 확률을 원한다.
이것을 조건부 P(( ) P로 변환하고 쿼리 주장이 독립적이면 개별 주장 확률의 산물로서 함축의 전체 확률을 계산할 수 있다.null
추가 작업
크로프트와 크로베츠는[2] ORMER라고 불리는 사무용 문서에 대한 정보 검색 시스템에 불확실한 추론을 적용했다.사무용 문서에서는 쿼리가 개별 속성에 초점을 맞추므로 독립성 가정이 유효하다.문서의 내용을 분석하는 것 외에도, 예를 들어, 작성자, 크기, 주제 또는 수집에 대해 질의할 수 있다.그들은 문서와 질의 속성을 비교하고, 그 타당성을 추론하고, 그것을 각 문서에 대한 전체적인 등급으로 결합하는 방법을 고안했다.그 외에도 문서와 질의 콘텐츠의 불확실성도 다루어져야 했다.null
확률론적 논리 네트워크는 불확실한 추론을 수행하기 위한 시스템이다; 명백한 참/거짓 진실 값은 확률뿐만 아니라 신뢰도 수준으로 대체되어 확률의 확실성을 나타낸다.null
마르코프 논리 네트워크는 불확실한 추론을 수행하도록 허용한다. 불확실성은 마르코프 체인이 유한 상태 기계의 불확실성을 설명하는 방식과 유사하게 최대 엔트로피 원리를 사용하여 계산된다.null
참고 항목
참조
- ^ C. J. van Rijsbergen (1986), A non-classical logic for information retrieval (PDF), The Computer Journal, pp. 481–485
- ^ W. B. Croft; R. Krovetz (1988), "Interactive retrieval office documents", Conference Sponsored by ACM SIGOIS and IEEECS TC-OA on Office information systems -, pp. 228–235, doi:10.1145/45410.45435, ISBN 0897912616