멀티모달 검색

Multimodal search

멀티모달 검색은 관련 결과를 얻기 위해 다른 방법을 사용하는 검색 유형이다.그들은 모든 종류의 검색, 키워드별 검색, 개념별 검색, 예시별 검색 등을 사용할 수 있다.

소개

다중모드 검색 엔진은 인간의 마음이 어떻게 작동하는지 유연성과 민첩성을 모방하여 관련 없는 생각을 만들고 처리하며 거부하도록 설계되었다.그래서 검색엔진의 입력에 비교할 요소가 많을수록 그 결과는 더욱 정확해질 수 있다.다중모달 검색엔진은 검색의 입력 요소를 모두 합쳐서 결과를 조합할 수 있는 가능성과 동시에 서로 다른 성격의 입력과 검색 방법을 사용한다.사용자의 평가와 함께 결과에 대한 피드백을 사용하여 보다 적절하고 관련성 있는 검색을 수행할 수 있는 엔진도 있다.

단순 검색 스키마

요즘은 인터넷GPS 연결 덕분에 언제 어디서나 무한한 기능을 수행할 수 있을 정도로 모바일 기기가 발달했다.터치 스크린, 모션 센서, 음성 인식스마트폰이라는 모바일 기기에 탑재되고 있다.모든 특징과 기능을 통해 세계 어느 곳에서든 언제든지 멀티모달 검색을 실행할 수 있다.

검색 요소

텍스트의 사용은 멀티미디어 검색, 이미지, 비디오, 오디오, 음성 검색뿐만 아니라 옵션이다.사용자의 위치조차도 검색 엔진이 모든 상황에 적응할 수 있는 보다 효과적인 검색을 수행하도록 도울 수 있다.요즘에는 검색의 입력 요소와 얻은 결과의 다양성 측면에서 검색 엔진과 상호작용하는 다른 방법이 발견되고 있다.

개인 컨텍스트

모바일의 많은 쿼리는 사용자의 위치를 응용 프로그램과 상호 작용하기 위해 사용하는 위치 기반(LBS)이다.이용 가능한 경우, 브라우저는 기기 GPS를 사용하거나, 다운로드에 있는 어플리케이션과 자신의 위치를 공유하는데 동의해야 하는 사용자의 허락을 받아 셀 타워 삼각측량을 기반으로 대략적인 위치를 계산한다.따라서 다중모드 검색은 사용자가 직접 제공하는 시청각 콘텐츠뿐만 아니라 사용자가 자신의 위치, 언어, 현재 시간, 사용자가 서핑하고 있는 웹 사이트나 문서, 또는 모든 상황에서 검색의 개선에 도움이 될 수 있는 다른 요소 등 사용자가 있는 컨텍스트를 이용한다.Example of Contextual Query

결과 분류

다중모드 검색 엔진은 병렬로 작동하면서 동시에 직간접적으로 도입된 모든 요소(개인적 맥락)의 관련성을 더 많이 또는 적게 검색한다.그 후에, 그것은 모든 결과의 조합을 제공하며, 모든 요소와 모든 설명자의 관련 가중치를 결합한다.

엔진은 모든 요소를 분석하여 태그를 지정하므로 태그의 비교는 데이터베이스의 기존 인덱스 정보로 만들 수 있다.결과의 분류는 보다 목적적합한 결과에서 더 적은 연관성으로 표시하기 위해 진행된다.

멀티모달 검색의 틀

모든 입력 요소의 중요성을 정의할 필요가 있다.자동으로 이렇게 하는 검색 엔진도 있지만 사용자가 수동으로 할 수 있는 엔진도 있어 검색의 모든 요소에 다소 비중을 두고 있다.또한 사용자가 검색을 위해 적절하고 필수적인 정보를 제공하는 것이 중요하다; 너무 많은 정보는 시스템을 혼란스럽게 하고 만족스럽지 못한 결과를 제공할 수 있다.다중 모드 검색을 통해 사용자는 단순한 검색보다 더 나은 결과를 얻을 수 있지만 다중 모드 검색은 더 많은 입력 정보를 처리해야 한다.그것은 또한 그것을 처리하는 데 더 많은 시간을 할애할 수 있고 더 많은 기억 공간을 필요로 한다.

효율적인 검색 엔진은 사용자의 질의를 해석하고, 그의 의도를 실현하며, 적절한 검색을 사용하는 전략을 적용한다. 즉, 엔진은 모든 입력 질의에 적응하며 요소와 방법의 조합에도 적응한다.

적용들

요즘은 기존의 다중모드 검색엔진이 그리 복잡하지 않고, 그 중 일부는 실험 단계에 있다.보다 간단한 엔진으로는 구글 이미지[1] 또는 Bing[2]이 있는데, 출력에서 이미지를 찾기 위해 텍스트와 이미지를 입력으로 사용하는 웹 인터페이스가 있다.

MMRetrieval [3]은 웹 인터페이스를 통해 다국어 및 멀티미디어 정보를 사용하는 복합 실험 검색 엔진이다.엔진은 서로 다른 입력을 병렬로 검색하고 모든 결과를 선택한 다른 방법으로 병합한다.엔진은 또한 검색의 모든 다른 단계를 비교할 수 있는 단일 텍스트 색인 기준뿐만 아니라 다른 다단계 검색을 제공한다.

모바일 기기 어플리케이션은 기본 위치 서비스처럼 사용자의 컨텍스트를 이용하고 사용자가 현재 또는 저장된 파일과 함께 제공하는 텍스트, 이미지, 오디오 또는 비디오를 사용하거나 심지어 음성과 상호작용하는 것이 많다.

참조

  • 멀티모달 검색을 위한 쿼리-어댑티브 퓨전, 린든 케네디, 학생 회원 IEEE, 시후 장, 동료 IEEE 및 아포톨 나체프 [4]
  • 멀티모달 검색엔진, 조나스 에졸드, 아르노우드 브루소, 폴 그림 및 토마스 스타이너에 대한 상황 인식 쿼리 [5]
  • 디지털 비디오 라이브러리에서 다중모달 검색 및 관련성 피드백 적용 [6]
  • Aplicacioica d'internet per la consulta imatteri al imatteri al videos de la commonacio catalana de mitjans 시청각, 라몬 살라, Politechnica de Catalunya [7]

외부 링크