확률적 관련성 모형
Probabilistic relevance model확률론적 관련성 모델은[1][2] 앞으로 나올 확률론적 모델들의 틀로서 스티븐 로버슨과 캐런 스파르크 존스에 의해 고안되었다.검색엔진과 웹 검색엔진이 사용하는 순위설정 기능을 도출해 주어진 검색 질의와 관련성에 따라 일치 문서의 순위를 매기는 데 유용한 정보검색 형식주의다.null
문서 d가j 질의 q와 관련될 확률을 추정하는 이론적 모델이다.모델은 이 관련성이 있는 확률은 질의와 문서 표현에 따라 다르다고 가정한다.또한, 질의 q에 대해 설정된 답변으로서 사용자가 선호하는 모든 문서의 일부가 있다고 가정한다. 이러한 이상적인 답변 세트를 R이라고 하며, 해당 사용자에 대한 전체적인 관련 가능성을 극대화해야 한다.예측은 이 집합 R에 있는 문서는 질의와 관련이 있지만 집합에 없는 문서는 관련이 없다는 것이다.null
관련 모델
이 프레임워크에는 추가 개발로 해결해야 할 몇 가지 제한사항이 있다.
- 첫 번째 런 확률에 대한 정확한 추정치가 없음
- 지수 항이 가중되지 않음
- 조건은 상호 독립적이라고 가정한다.
이러한 우려와 다른 우려를 해결하기 위해, 다른 모델들은 확률론적 관련성 프레임워크로부터 개발되었으며, 그 중에서도 동일한 저자의 바이너리 독립성 모델이다.이 프레임워크에서 가장 잘 알려진 파생상품은 Okapi(BM25) 가중치와 함께 BM25F의 변경이다.null
참조
- ^ Robertson, S. E.; Jones, K. Spärck (May 1976). "Relevance weighting of search terms". Journal of the American Society for Information Science. 27 (3): 129–146. doi:10.1002/asi.4630270302.
- ^ Robertson, Stephen; Zaragoza, Hugo (2009). "The Probabilistic Relevance Framework: BM25 and Beyond". Foundations and Trends in Information Retrieval. 3 (4): 333–389. CiteSeerX 10.1.1.156.5282. doi:10.1561/1500000019.