개인화된 검색

Personalized search

개인화된 검색은 제공된 특정 질의를 넘어 개인에 대한 정보를 통합함으로써 개인의 이익에 특별히 맞춘 웹 검색 결과물이다. 검색 결과를 개인화하는 데에는 사용자의 쿼리를 수정하고 검색 결과를 다시 정렬하는 두 가지 일반적인 방법이 있다.[1]

역사

구글은 2004년 개인 맞춤형 검색을 도입했고 2005년 구글 검색에 구현됐다. 구글은 구글 계정을 가진 사용자들뿐만 아니라 모든 사용자들을 위해 개인화된 검색을 구현했다. 구글이 그들의 검색을 정확히 개인화하는 방법에 대한 정보는 많지 않지만, 그들은 사용자 언어, 위치, 그리고기록을 사용하는 것으로 여겨진다.[2]

구글이나 알타비스타와 같은 초기 검색 엔진들은 단지 주요 단어들을 기반으로 한 결과들을 발견했다. 구글이 개척한 대로 개인화된 검색은 '뜻을 정확히 이해하고 원하는 것을 정확히 주겠다'[3]는 목표와 함께 훨씬 더 복잡해졌다. 수학 알고리즘을 사용하여, 검색 엔진은 이제 사이트로 연결되는 링크 수와 사이트로부터 오는 링크 수에 근거하여 결과를 반환할 수 있다; 사이트가 더 많은 링크를 가질수록 페이지에 더 높게 배치된다.[3] 검색 엔진은 얕은 전문가와 깊은 전문가라는 두 가지 수준의 전문성을 가지고 있다. 가장 얕은 정도에서 온 전문가는 주어진 사건에 대한 어떤 구체적인 정보를 아는 증인 역할을 한다. 반면에, 심층 전문가는 각 개별 질문자와 관련된 고유한 정보를 전달할 수 있는 능력을 제공하는 이해할 수 있는 지식을 가지고 있다.[4] 만약 어떤 사람이 자신이 원하는 것을 안다면, 검색 엔진은 얕은 전문가 역할을 할 것이고 단순히 그 정보를 찾을 것이다. 그러나 검색 엔진은 또한 아래보다 위쪽에 가까운 검색 엔진들이 사용자의 요구에 더 관련이 있다는 것을 나타내는 결과의 순위를 매긴다는 점에서 깊은 전문성을 가질 수 있다.[4]

많은 검색 엔진들이 일반적으로 사람들에 대한 정보나 특정 그룹의 사람들에 대한 정보를 이용하는 반면, 개인화된 검색은 개인 고유의 사용자 프로파일에 따라 달라진다. 검색 결과를 개인화하는 연구 시스템은 다른 방식으로 사용자를 모델링한다. 어떤 사람들은 자신의 관심사를 명시적으로 명시하는 사용자나 인구통계학적/인지적 특성에 의존한다.[5][6] 그러나 사용자가 제공한 정보는 수집하고 최신 상태를 유지하기 어려울 수 있다. 다른 이들은 사용자가 읽은 콘텐츠 또는 웹 페이지와의 상호 작용 이력에 기초하여 암묵적인 사용자 모델을 구축하였다.[7][8][9][10][11]

웹 검색 결과를 개인화하기 위해 공개적으로 사용할 수 있는 몇 가지 시스템(예: Google 개인 설정 검색Bing의 검색 결과 개인[12] 설정)이 있다. 그러나 이러한 상업적 시스템의 기술적 세부사항과 평가는 독점적이다. 구글이 사용자 검색을 개인화하기 위해 사용하는 한 가지 기술은 로그인 시간과 사용자가 자신의 브라우저에서 웹 기록을 사용 가능으로 설정했는지 추적하는 것이다. 사용자가 구글의 검색 결과를 통해 같은 사이트에 여러 번 접속하면 그 페이지가 마음에 든다고 본다. 그래서 사용자들이 특정한 검색을 수행할 때 구글의 개인화된 검색 알고리즘은 페이지를 위로 이동시키면서 힘을 준다. 사용자가 로그아웃되더라도 구글은 특정 웹 브라우저가 검색한 내용을 180일 동안 기록하여 브라우저의 쿠키에 연결하기 때문에 그들의 결과를 개인화할 수 있다.[13]

페이스북이나 링크드인과 같은 소셜 네트워킹 플랫폼의 검색 엔진에서는 검색자와 결과 사이의 동질감을 이용하여 개인화를 달성할 수 있다.[14] 예를 들어, 피플 검색에서, 검색자들은 종종 같은 사회, 산업 또는 회사에 있는 사람들에게 관심을 가진다. 잡 검색에서 검색자들은 보통 비슷한 회사의 일자리, 가까운 곳의 일자리, 자신과 유사한 전문지식이 필요한 일자리에 관심이 많다.

사용자에게 개인화된 검색 결과가 어떻게 제공되고 있는지 더 잘 이해하기 위해, 노스이스트 대학교의 한 연구자들은 로그인한 사용자의 검색 집합과 대조군 그룹을 비교했다. 연구팀은 11.7%의 결과가 개인화에 따른 차이를 보였지만, 이는 검색 질의와 결과 순위 위치에 따라 크게 차이가 난다는 것을 발견했다.[15] 테스트한 다양한 요인 중 측정 가능한 영향을 미치는 두 가지 요인은 구글 계정과 검색 사용자의 IP 주소로 로그인하고 있었다. 개인화 수준이 높은 결과에는 기업과 정치가 포함된다는 점도 유의해야 한다. 개인화를 추진하는 요인 중 하나는 결과의 국산화인데, 회사 쿼리는 사용자의 위치와 관련된 스토어 위치를 보여준다. 그래서 예를 들어 사용자가 " 중고차 판매"를 검색하면 구글은 해당 지역의 현지 자동차 대리점에 대한 결과를 산출할 수 있다. 반면에 개인화의 양이 가장 적은 질의는 사실적 질의("무엇인가")와 상태를 포함한다.[15]

개인 설정을 측정할 때는 배경 잡음을 제거하는 것이 중요하다. 이러한 맥락에서, 한 가지 유형의 배경 잡음은 이월 효과다. 이월 효과는 다음과 같이 정의할 수 있다:사용자가 검색을 수행하고 후속 검색으로 이를 따를 때, 2차 검색의 결과는 1차 검색의 영향을 받는다. 주목할 점은 상위권 URL이 개인화에 따라 변경될 가능성이 적다는 점이며, 대부분의 개인화는 하위권에서 발생한다는 점이다. 이는 최근 검색 이력을 바탕으로 한 개인화 방식이지만 10분이 지나면 현상이 시간 초과되기 때문에 개인화의 일관된 요소가 아니라는 게 연구진의 설명이다.[15]

필터 버블

개인화된 검색에 대한 몇 가지 우려가 제기되었다. 사용자가 이미 찾아낸 것에 대한 검색 결과를 편중시켜 새로운 정보를 찾을 가능성을 줄인다. 그것은 사용자가 자신의 검색 결과가 개인화된 것을 알지 못할 수 있는 잠재적인 사생활 문제를 소개하며, 왜 그들이 관심 있는 것들이 그렇게 관련이 있는지 궁금해 한다. 이 같은 문제는 작가 일라이 파리에의 필터 버블(filter bubble)이라는 신조어가 생겼다. 그는 사람들이 주요 웹사이트들이 개인에 대해 수집한 방대한 양의 데이터를 바탕으로 그들의 운명을 좌우하고 결정을 내리도록 내버려두고 있다고 주장한다. 이는 '친근한 세계 신드롬'의 결과물인 '필터 버블'이나 원하는 정보만 보는 '필터 버블'에 사용자를 고립시킬 수 있다. 그 결과, 사람들은 개발도상국의 문제에 대해 훨씬 덜 알게 되고, 이로 인해 북한 (선진국)과 남한 (개발국)의 격차가 더욱 벌어질 수 있다.[16]

개인화 방법, 그리고 같은 커뮤니티에서 같은 생각을 가진 사람들에 의한 검색에서 규칙적으로 나타나고 있는 특정 결과를 "추진"하는 것이 얼마나 유용한가. 개인화 방식은 필터 거품이 어떻게 생성되는지 매우 쉽게 이해할 수 있게 한다. 어떤 결과들이 개인에 의해 더 많이 부딪히고 관찰되면서, 그들이 선호하지 않는 다른 결과들은 무명으로 밀려난다. 이것은 공동체 차원 차원에서 일어나면서, 의식적이든 아니든, 지역사회가 사건에 대한 왜곡된 관점을 공유하게 된다.[17] 필터 버블은 검색 결과에서 더 빈번하게 발생했으며, 보다 구체적으로 온라인 소셜 미디어에서 정보 흐름의 차질을 예상한다.[18]

세계 일부 지역에서 특히 우려되는 부분은 특정 정보(선택적 노출)만을 주어 검색을 활용하는 사람들에 대한 통제 수단으로 개인화된 검색을 사용하는 것이다. 이것은 총기 규제와 같은 고도로 화제가 된 주제들에 대해 특별한 영향력을 주거나 심지어 사람들이 다른 나라의 특정 정치 정권에 편들도록 하는 데 사용될 수 있다.[16] 개인화된 검색만으로 특정 정부에 의한 완전한 통제는 과도하지만, 검색에서 쉽게 구할 수 있는 정보에 대한 통제는 가장 부유한 기업들에 의해 쉽게 통제될 수 있다. 기업이 정보를 통제하는 가장 큰 예는 구글이다. 구글은 그들이 원하는 정보를 당신에게 제공할 뿐만 아니라 때때로 당신의 개인화된 검색을 이용하여 당신의 회사나 계열사로 당신을 안내한다. 이로 인해 웹의 여러 부분을 완전히 장악하고 구글 맵스가 어떻게 지도와 방향 산업을 크게 장악했는가 등 경쟁사들을 밀어내면서 맵퀘스트 등이 뒷전으로 밀리게 되었다.[19]

많은 검색 엔진은 사용자가 관심이 높은 주제만 도출하는 개념 기반 사용자 프로파일링 전략을 사용하지만 최상의 결과를 위해서는 긍정적인 선호와 부정적인 선호 둘 다를 고려해야 한다고 Wai-Tin과 Dik Lun 연구원은 말했다. 부정적이고 긍정적인 선호를 적용하는 그러한 프로파일은 유사하지 않은 질의와 유사한 질의를 분리함으로써 최고 품질과 가장 목적적합한 결과를 초래한다. 예를 들어, 'apple'을 입력하면 과일이나 매킨토시 컴퓨터를 참조할 수 있으며, 두 가지 선호도를 모두 제공하면 사용자가 클릭된 링크를 기반으로 어떤 사과를 진정으로 찾고 있는지 알 수 있는 검색 엔진의 능력을 보조할 수 있다. 연구원들이 개인화된 검색을 개선하고 긍정적이고 부정적인 선호를 모두 산출하기 위해 고안한 한 가지 개념 전략은 클릭 기반 방법이다. 이 방법은 클릭하지 않은 링크를 다운그레이드하는 동시에 결과 목록에서 클릭하는 링크를 기반으로 사용자의 관심을 포착한다.[20]

검색 결과가 더 이상 모든 사용자에게 동일한 방식으로 순위가 매겨지지 않기 때문에 이 기능은 검색 엔진 최적화 업계에도 깊은 영향을 미친다.[21] 일라이 파리에르의 필터 버블(The Filter Bubble)에서 두 명의 친구가 구글 검색창에 'BP'를 타이핑하도록 한 예가 발견된다. 한 친구는 멕시코만의 BP 석유 유출에 관한 정보를 발견했고 다른 친구는 투자 정보를 검색했다.[16] 검색엔진 최적화를 이용할 때 정보 과부하 측면도 만연하다. 그러나 정보 과부하를 관리하는 한 가지 방법은 개별 사용자별로 수집, 처리, 필터링 및 개인화된 정보인 부가가치 정보에 액세스하는 것이다.[22] 예를 들어, 구글은 위치, 이전 검색 키워드, 최근 사용자의 소셜 네트워크에서 연락처를 포함한 검색을 개인화하기 위해 다양한 '신호'를 사용하는 반면, 페이스북은 사용자의 다른 사용자와의 상호 작용, 이른바 '소셜 제스처'[22]를 등록한다. 이 경우 사회적 제스처에는 사용 like, share, subscribe, comment 등이 포함된다. 사용자가 일련의 정보를 소비함으로써 시스템과 상호작용할 때, 시스템은 사용자 상호작용과 이력을 등록한다. 이 상호 작용 이력에 기초하여 나중에 중요한 정보가 필터링된다. 여기에는 일부 친구들이 제작한 콘텐츠가 사용자로부터 숨겨져 있을 수 있다. 사용자가 주어진 시간 동안 배제된 친구들과 교류하지 않았기 때문이다. 사회적 제스처 내에서는 사진과 동영상이 정규적인 지위나 기타 관련 게시물보다 높은 순위를 받는다는 점도 유념해야 한다.[22]

필터 버블은 건강정보 검색에 큰 영향을 미쳤다. 검색이력, 소셜네트워크, 개인 선호도 등 검색결과가 미치는 영향과 함께 잘못된 정보가 예방접종률 하락에 큰 기여를 했다. 2014/15년에 미국에서 홍역이 발생했고, 그 기간 동안 644명의 환자가 보고되었다. 이번 발병의 주요 원인으로는 당시 백신에 대한 공포를 확산시키고 있던 반백신 단체와 공인들이 있었다.[23]

일부에서는 개인화된 검색 결과가 사용자의 검색 결과를 사용자 정의하는 데 도움이 될 뿐만 아니라 광고에도 도움이 된다는 점에 주목했다. 이것은 사생활 침해라는 비판을 받아왔다.[24]

구글의 경우

검색 개인화의 중요한 예는 구글이다. 구글 어플리케이션들이 많은데, 이 모든 것들이 구글 계정의 도움으로 개인화되고 통합될 수 있다. 검색을 개인화하려면 계정이 필요하지 않다. 그러나 구글 계정이 있어야 유용한 구글 제품이 많이 나오기 때문에 선택의 여지가 거의 없다. 2009년 도입된 구글 대시보드는 지메일, 캘린더, 독스, 유튜브 [25]등 20여 개 제품 및 서비스를 자신의 이름으로 직접 추적하는 서비스다. 무료 구글 커스텀 서치는 개인과 대기업이 모두 이용할 수 있으며, 개별 웹사이트에 검색 기능을 제공하고 뉴욕 타임즈와 같은 기업 사이트에 전원을 공급한다. 구글과 함께 이용 가능한 높은 수준의 개인화는 세계에서 가장 인기 있는 검색 엔진으로 남을 수 있도록 돕는 데 중요한 역할을 했다.

구글이 검색을 개인화 할 수 있는 능력의 한 예는 구글 뉴스를 이용하는 것이다. 구글은 모든 사람들에게 흥미로울 수 있는 비슷한 기사를 몇 개 보여 주기 위해 뉴스를 준비했지만, 사용자가 스크롤을 내리자마자 뉴스 기사가 달라지기 시작하는 것을 볼 수 있다. 구글은 현지 뉴스가 먼저 검색되도록 하기 위해 사용자의 위치뿐만 아니라 과거 검색도 고려한다. 이것은 검색이 훨씬 더 쉬워지고 원하는 정보를 찾기 위해 모든 뉴스를 통과하는 시간이 줄어들 수 있다. 그러나 매우 중요한 정보는 프로그램이 특정 사용자에 대해 설정한 기준과 일치하지 않기 때문에 보류될 수 있다는 것이 우려된다. 이것은 앞에서 설명한 "필터 버블"을 만들 수 있다.[16]

개인화에 대해 종종 간과되는 흥미로운 점은 사생활과 개인화 싸움이다. 두 사람이 상호 배타적일 필요는 없지만, 한 사람이 더 부각될수록 다른 한 사람을 타협하는 경우가 많다. 구글은 사람들에게 많은 서비스를 제공하고 있으며, 이러한 서비스들 중 다수는 사용자 정의가 가능하기 위해 한 사람에 대한 정보를 수집할 필요가 없다. 이러한 서비스에는 사생활 침해의 위협이 없기 때문에, 검색에 관한 한, 사생활보다 개인화를 선호하도록 잔액이 귀속되었다. 사람들은 그들의 다른 구글 서비스를 사용자 정의함으로써 편리함의 보상을 얻기 때문에, 개인 정보를 희생하더라도 더 나은 검색 결과를 원한다. 정보 대 검색 결과 사이의 경계를 어디에 둘 것인가가 새로운 영역이고 구글은 그러한 결정을 하게 된다. 사람들이 자신에 대해 수집되고 있는 정보를 통제할 수 있는 힘을 얻을 때까지, 구글은 진정으로 사생활을 보호하지 못하고 있다. 구글이 검색엔진과 인터넷 브라우저로 인기를 끌면서 많은 힘을 얻게 됐다. 그들의 인기는 수백만 명의 사용자 이름을 만들어냈고, 이것은 개인에 대한 방대한 양의 정보를 수집하는 데 사용되었다. 구글은 전통, 사회, 지리, IP 주소, 브라우저, 쿠키, 하루 중 시간, 행동, 질의 이력, 책갈피 등 다양한 개인화 방법을 사용할 수 있다. 구글이 사용자들이 이전에 검색한 것을 바탕으로 검색 결과를 개인화하도록 하는 것은 장점이 있을 수 있지만, 그것과 함께 오는 부정적인 측면도 있다.[26][27] 구글은 이 정보로 동영상, 문서 공유, 쇼핑, 지도 등 자신이 소유한 다른 분야로 진출하기로 결정했다. 구글은 검색자들이 맵퀘스트와 같은 다른 서비스들과 반대로 제공되는 그들만의 서비스를 이용함으로써 이것을 해냈다.

검색 개인화를 통해 구글은 비디오 시장 점유율을 약 80%로 두 배로 늘렸다. 독점의 법적 정의는 기업이 시장의 70~80%의 지배력을 획득하는 것이다. 구글은 자체 서비스를 보여주기 위해 검색 결과를 조작하는 등 진입 장벽을 크게 만들어 이 독점을 강화했다. 이는 대부분의 검색에서 구글 맵이 가장 먼저 표시되는 것을 보면 분명히 알 수 있다.

분석 회사인 Experian Hitwise는 2007년부터 맵퀘스트가 이것 때문에 트래픽이 반으로 줄었다고 말했다. 비슷한 시기에 나온 다른 통계로는 포토부켓이 20%에서 3%로, 마이스페이스가 12%에서 1% 미만으로, ESPN이 8%에서 4%로 시장점유율을 보이고 있다. 이미지 측면에서 포토부켓은 2007년 31%에서 2010년 10%로, 야후이미지는 12%[28]에서 7%로 각각 상승했다. 이들 기업의 감소는 구글이 2007년 43%에서 2009년 약 55%로 시장 점유율을 늘린 데 따른 것으로 보인다.[28]

더 나은 서비스를 제공하기 때문에 구글이 더 우세하다고 할 수 있다. 그러나 Experian Hitwise는 또한 15개의 다른 회사의 시장 점유율을 한 번에 보여주는 그래프를 만들었다. 이것은 사진, 비디오, 제품 검색 등의 시장 점유율을 위해 모든 카테고리에 대해 수행되었다. 상품 검색용 그래프는 구글이 한 달 만에 130만 명의 고유 방문자에서 11.9명의 고유 방문자까지 증가했기 때문에 구글의 영향력을 충분히 보여주는 증거다. 그러한 성장은 과정의 변화와 함께만 올 수 있다.

결국 이 모든 그래프에는 두 가지 공통의 테마가 있다. 첫 번째는 구글의 시장점유율이 선두 경쟁사들의 시장점유율과 정반대의 관계를 맺고 있다는 점이다. 두 번째는 이러한 직접적인 역적 관계가 2007년경부터 시작되었는데, 이는 구글이 '유니버설 검색' 방식을 사용하기 시작한 무렵이다.[29]

혜택들

개인화된 검색이 갖는 가장 중요한 이점 중 하나는 소비자들이 내리는 결정의 질을 향상시키는 것이다. 인터넷은 정보를 얻는 거래 비용을 그 어느 때보다도 현저히 낮게 만들었다. 그러나 인간의 정보처리 능력은 크게 확대되지 않았다.[30] 엄청난 양의 정보에 직면했을 때, 소비자들은 그들이 높은 품질의 결정을 할 수 있도록 도와주는 정교한 도구가 필요하다. 두 연구에서는 개인화된 선별과 주문 도구의 효과를 조사했으며, 결과는 개인화된 검색과 소비자 결정의 품질 사이에 긍정적인 상관관계를 보여준다.

첫 번째 연구는 사우스 캐롤라이나 대학의 크리스틴 딜에 의해 수행되었다. 그녀의 연구는 검색 비용을 줄인 것이 질적인 선택으로 이어진다는 것을 발견했다. 이러한 발견의 배경에는 '소비자들은 낮은 검색 비용으로 인해 열등한 선택권을 고려하게 되기 때문에 더 나쁜 선택을 한다'는 것이 있었다. 또 소비자들이 특정한 목표를 염두에 둔다면 검색 범위를 넓혀 더 나쁜 결정을 내릴 것이라는 점도 보여줬다.[30] 알버타 대학의 제럴드 하우블과 마스트리히트 대학의 베네딕트 G.C. 델라르트의 연구는 주로 추천제도에 초점을 맞췄다. 두 연구 모두 개인화된 검색 및 추천 시스템을 통해 소비자의 의사결정 품질이 크게 향상되고 검사 제품 수가 감소했다고 결론지었다.[30]

또한 개인화된 검색에서 필터 버블을 사용하는 것도 사용자에게 여러 가지 이점을 가져다 주었다. 예를 들어 필터 버블은 같은 생각을 가진 시민들이 모여 그들의 신념을 강화함으로써 의견의 다양성을 높일 수 있는 잠재력을 가지고 있다. 이것은 또한 사용자를 신뢰할 수 있고 검증 가능한 정보의 거품 속에 숨겨서 가짜 컨텐츠와 극단주의 컨텐츠로부터 보호하는 데 도움이 된다.[31] 필터 버블은 사용자에게 더 많은 선택권을 제공함으로써 정보 자유의 중요한 요소가 될 수 있다.[31]

개인별 맞춤 검색도 정보 검색 결과를 개선한다는 점에서 이용자의 이익에 효과가 있는 것으로 입증됐다. 개인화된 검색 꼬리는 사용자가 원하는 것과 과거 검색 이력을 일치시킨다는 점에서 사용자의 필요에 따라 검색 결과를 조정한다.[32] 이는 또한 관련 없는 정보의 양을 줄이는 데 도움이 되며 또한 사용자가 정보를 검색하는 데 소비하는 시간을 줄이는 데에도 도움이 된다. 예를 들어, 구글에서는 사용자의 검색 내역이 유지되고 사용자의 다음 검색에서 사용자 질의와 일치한다. 구글은 세 가지 중요한 기술을 통해 이것을 달성한다. 세 가지 기법은 (i) 추가 지식을 이용한 질의 개혁, 즉 질의의 확대나 정제, (ii) 검색된 문서의 사후 필터링 또는 재서열화(사용자 프로파일이나 맥락에 근거), (iii) IR 모델의 개선 등이다.[32]

모델

개인화된 검색은 보다 목적 적합한 정보에 대한 수요와 대부분의 사람들이 개인화된 검색 이득과 같은 개인 정보를 실제로 사용할 수 있다는 사실 때문에 인기를 얻는다. 연구에 따르면 주요 검색 엔진 중 관련 결과를 제공하는 데 성공률이 낮은 것으로 나타났다. 2만 건의 질의 중 52%에서 검색자들은 구글이 반환한 문서에서 관련 결과를 찾지 못했다.[33] 개인화된 검색은 검색 품질을 크게 향상시킬 수 있으며 주로 이 목표를 달성하기 위한 두 가지 방법이 있다.

이용 가능한 첫 번째 모델은 사용자의 과거 검색 및 검색 위치를 기반으로 한다. 사람들은 종종 현재 위치와 이전 검색을 반영하는 결과를 발견하기 때문에 이 모델에 익숙할 것이다.

검색 결과를 개인화하는 또 다른 방법이 있다. 브라차 샤피라와 보아즈 자바의 '개인화된 검색: 협업과 소셜 네트워크 통합'에서 샤피라와 자바는 추천 시스템을 활용한 모델에 초점을 맞췄다.[34] 이 모델은 유사한 키워드를 검색한 다른 사용자의 결과를 보여준다. 저자들은 소셜네트워크가 별도로 작동하는 키워드 검색, 추천제, 추천제 등을 살펴 검색품질 측면에서 결과를 비교했다. 그 결과 추천 시스템을 갖춘 개인 맞춤형 검색엔진은 표준 검색엔진보다 우수한 품질의 결과를 내고, 소셜네트워크를 갖춘 추천시스템은 더욱 개선되는 것으로 나타났다.

최근 논문 '임베딩이 있는 검색 개인화'는 사용자가 주제 관심 공간에 임베딩된 검색 개인화를 위한 새로운 임베딩 모델이 강력한 학습 대 순위 모델보다 더 나은 검색 결과를 만들어 낸다는 것을 보여준다.

단점들

검색 개인화 구현의 문서화된 이점은 있지만, 검색 개인화의 사용에 반대하는 주장도 있다. 그것의 사용에 반대하는 이 주장의 근거는 인터넷 사용자의 검색 엔진 결과를 사용자의 흥미와 이력에 맞는 자료로 한정하기 때문이다. 사용자의 검색 질의와 관련이 있을 만한 자료에 노출될 수 있는 능력을 제한하지만, 이 자료의 일부가 사용자의 관심사 및 이력과 다르기 때문에 해당 자료는 사용자에게 표시되지 않는다. 검색 개인화는 검색 엔진의 객관성을 빼앗아 엔진을 손상시킨다. "객관성은 당신이 찾고 있는 것을 알 때 거의 중요하지 않지만, 그렇지 않을 때 그것의 부족은 문제가 있다.[35] 검색 개인화에 대한 또 다른 비판은 웹의 핵심 기능인 정보의 수집과 공유를 제한한다는 것이다. 검색 개인화는 사용자가 특정 검색 쿼리에 사용할 수 있는 모든 가능한 정보에 쉽게 접근하지 못하게 한다. 검색 개인화는 사용자의 검색 질의에 편향을 추가한다. 사용자가 특정한 관심사나 인터넷 이력을 가지고 있고 웹을 사용하여 논란이 되는 이슈를 연구한다면, 사용자의 검색 결과는 그것을 반영할 것이다. 사용자의 관심이 한쪽으로 쏠리거나 다른 쪽으로 쏠릴 경우 사용자는 문제의 양쪽 측면을 모두 보여주지 못할 수 있으며 잠재적으로 중요한 정보를 놓칠 수 있다. 구글 뉴스에서 검색 개인화와 검색 결과에 미치는 영향에 대한 연구는 각 사용자가 동일한 검색 질의에 입력했음에도 불구하고 다른 사용자들에 의해 뉴스 스토리가 생성되는 순서를 다르게 만들었다. 베이츠에 따르면, "검색자 중 12%만이 동일한 3개의 층을 같은 순서로 가지고 있었다. 이것은 여과가 진행되고 있다는 명백한 증거다"[36]라고 말했다. 검색 개인화가 활성화되지 않았다면 이론상 모든 결과는 동일한 순서의 동일한 이야기였어야 했다.

검색 개인화의 또 다른 단점은 구글과 같은 인터넷 회사들이 사용자들의 인터넷 관심사와 이력을 모아 잠재적으로 다른 회사에 팔고 있다는 것이다. 이는 사람들이 동의나 지식 없이 자신의 인터넷 정보를 수집하고 판매하는 것에 대해 사람들이 편한지 여부에 관한 사생활 문제를 제기한다. 많은 웹 사용자들은 검색 개인화의 사용을 알지 못하고 있으며 사용자 데이터가 인터넷 회사들에게 귀중한 물품이라는 것을 아는 사람은 훨씬 적다.

사용하는 사이트

필터 버블의 저자인 E. Pariser는 검색 개인화가 페이스북과 구글에서 어떻게 다른지 설명한다. 페이스북은 사람들이 공유하는 것의 양과 그들이 "좋아하는 페이지"에 관해서 개인화를 구현한다. 프로필이 가장 많이 방문하는 개인의 사회적 상호작용, 메시지나 채팅은 모두 페이스북이 개인화를 사용할 때 사용되는 지표들이다. 구글은 사람들이 공유하는 것이 무엇이 걸러지는지 보여주는 지표라기 보다는 검색에서 나오는 것을 걸러내기 위해 우리가 클릭하는 것을 고려한다. 게다가, 페이스북 검색이 반드시 구글 검색만큼 사적인 것은 아니다. 페이스북은 더 많은 공공의 자아를 이용하고 사용자들은 다른 사람들이 보고 싶어하는 것을 공유한다. 페이스북은 사진에 태그를 붙이는 동안에도 자동으로 이름을 대면할 수 있는 개인화와 얼굴 인식을 사용한다. 페이스북의 like 버튼은 사용자들이 웹사이트를 위해 그들만의 개인화를 하도록 이용한다. 사용자가 댓글을 달거나 좋아하는 것은 페이스북에 어떤 종류의 게시물에 관심을 가질지 알려준다. 이 외에도, 그것은 그들이 "앞으로 어떤 종류의 게시물에 댓글을 달거나, 공유하고,[37] 스팸을 보낼지 예측하는 데 도움이 된다. 예측은 페이스북이 당신에게 보여줄 것과 걸러낼 것을 결정하는 데 도움이 되는 관련성 점수를 만들기 위해 결합된다.[37] 2016년 페이스북은 게시물을 좋아하는 것 외에도 리액션(사랑, 감사, 하하, 와우, 슬픈, 분노)을 소개했다.[38] 페이스북은 게시물에 남겨진 어떤 리액션(Reaction)도 사용자가 다른 어떤 '좋다'는 게시물보다 해당 게시물에 더 많은 관심을 갖고 있음을 보여주는 강력한 지표라는 사실을 알게 됐다.[38] 페이스북은 반응에 대해 좋아하는 것과 같은 무게를 두기 시작하고 있다. 그래서 '앵그리' 반응을 게시물에 남기더라도 페이스북은 사용자가 관심을 보였기 때문에 사용자의 피드에 게시물을 보여줄 것이다.[38]

구글의 관점에서, 사용자들은 그들이 처음 클릭하는 것에 근거하여 유사한 웹사이트와 자원을 제공한다. 심지어 사용자 선호도를 더 잘 준수하기 위해 필터 전술을 사용하는 다른 웹사이트들도 있다. 예를 들어 넷플릭스의 심사위원들도 미래에 관심을 가질 만한 영화를 제안하기 위해 역사를 검색한다. 아마존과 같은 사이트들이 있고 개인 쇼핑 사이트들도 그들의 이익을 더 잘 제공하기 위해 다른 사람들의 역사를 사용한다. 트위터는 또한 다른 사람들에게 팔로우하도록 "제안"함으로써 개인화를 이용한다. 또한 트위터는 누가 "팔로우", "트위트", "리트위트"를 하는지 기준으로 사용자와 가장 관련이 있는 제안들을 걸러낸다. LinkedIn은 검색 결과를 두 단계로 개인화한다.[14] LinkedIn 연합 검색은 수직 순서를 개인화하려는 사용자 의도를 악용한다. 예를 들어, "소프트웨어 엔지니어"와 같은 질의에 대해, 검색자가 채용 또는 구직 의사를 가지고 있는지에 따라, 그 또는 그녀는 1차 수직적 업무로서 사람 또는 일자리와 함께 제공된다. 예를 들어, 각 수직적 안에서, 검색자와 결과 사이의 유사성과 사회적 관계를 고려하여 결과 순위를 개인화한다. 페이스북의 설립자인 마크 저커버그는 사람들은 오직 하나의 정체성만을 가지고 있다고 믿었다. E. Pariser는 그것이 완전히 거짓이며 검색 개인화는 사실이 아니라는 것을 증명하는 또 다른 방법일 뿐이라고 주장한다. 개인화된 검색이 도움이 되는 것처럼 보일 수 있지만, 그것은 어떤 사람에 대한 그리 정확한 표현은 아니다. 사람들이 스스로 더 멋져 보이기 위해 사물을 검색하고 공유하는 사례도 있다. 예를 들어, 누군가가 정치적인 기사들과 다른 지적 기사들을 찾아 공유할 수도 있다. 다른 목적으로 사용되고 있는 사이트들이 많고, 사람의 신원을 전혀 구성하지 않고 대신 거짓 표현을 제공하는 사이트들이 많다.[16]

온라인 쇼핑

구글과 야후 같은 검색 엔진은 개인화된 검색을 이용하여 그들의 예상 욕구에 맞는 상품으로 가능한 고객들을 끌어모으고 있다. 개인의 웹클릭에서 수집된 대량의 데이터를 기반으로 검색엔진은 개인 맞춤형 검색을 이용해 개인의 흥미를 자극할 수 있는 광고를 게재할 수 있다. 개인화된 검색을 활용하면 소비자들이 원하는 것을 더 빨리 찾을 수 있을 뿐만 아니라 보다 전문화된 또는 틈새 시장 내의 개인과 제품 및 서비스를 일치시킬 수 있도록 도울 수 있다. 개인화된 온라인 결과를 통해 판매되는 이러한 제품이나 서비스 중 다수는 일반 상점에서 판매하기 어려울 것이다. 이런 종류의 상품과 서비스를 롱테일 아이템이라고 부른다.[39] 개인화된 검색을 사용하면 소비자를 위한 제품 및 서비스 검색 속도를 높일 수 있으며, 이러한 소비자에게 도달하기 위해 필요한 광고 비용을 줄일 수 있다. 또한, 개인화된 검색을 활용하면 기업이 제품 및/또는 서비스에 온라인 쿠폰 코드를 제공해야 할 개인을 결정하는 데 도움이 될 수 있다. 개인이 자신의 웹사이트를 이용했는지, 아이템 구매를 고려했는지 또는 이전에 구매했는지 추적함으로써, 회사는 다른 웹사이트에 광고를 게시하여 특정 소비자에게 구매를 하도록 할 수 있다.

소비자와 기업이 서로를 찾는 것을 돕는 것 외에도, 개인 맞춤형 검색을 제공하는 검색 엔진은 큰 혜택을 준다. 개인에 대한 데이터가 많이 수집될수록 개인화된 결과가 더 많아질 것이다. 결과적으로, 이것은 검색 엔진이 더 많은 광고를 팔 수 있게 한다. 왜냐하면 회사들은 그들이 중, 저, 중, 중, 저, 중, 중, 중, 중, 중, 중, 중, 중, 중, 중, 중, 중, 중, 중, 저, 중, 중, 중, 중, 중, 중 개인화된 검색의 이러한 측면은 윌리엄 바드케나 일라이 파리와 같은 많은 학자들을 화나게 하는데, 그들은 개인화된 검색이 광고 수익을 증가시키려는 욕구에 의해 추진된다고 믿기 때문이다. 또한, 그들은 개인별 맞춤형 검색 결과가 특정 검색 엔진 회사나 다른 회사가 그들과 제휴하여 제공하는 제품과 서비스를 개인이 사용하도록 동요시키기 위해 자주 이용된다고 믿는다. 예를 들어, 구글은 적어도 하나의 벽돌로 위치를 가진 어떤 회사라도 검색하면 구글 지도 서비스를 이용하여 가장 가까운 회사 위치를 묘사한 지도가 질의의 첫 번째 결과로 제공될 것이다.[40] MapQuest와 같은 다른 매핑 서비스를 사용하기 위해서는 사용자가 그 결과를 더 깊이 파고들어야 할 것이다. 또 다른 예는 더 모호한 질의에 관한 것이다. 구글 검색엔진을 이용해 '신발'이라는 단어를 검색하면 소비자 질의에 첫 번째 결과로 구글에 웹사이트를 연결하기 위해 돈을 지불하는 신발 회사에 여러 개의 광고를 제공할 것이다.

참조

  1. ^ Pitokow, James; Hinrich Schütze; Todd Cass; Rob Cooley; Don Turnbull; Andy Edmonds; Eytan Adar; Thomas Breuel (2002). "Personalized search". Communications of the ACM. 45 (9): 50–55. doi:10.1145/567498.567526. S2CID 5687181.
  2. ^ Aniko Hannak; Piotr Sapiezynski; Arash Molavi Kakhki; Balachander Krishnamurthy; David Lazer; Alan Mislove; Christo Wilson (2013). Measuring Personalization of Web Search (PDF). Archived from the original (PDF) on April 25, 2013.
  3. ^ a b Remerowski, Ted (2013). National Geographic: Inside Google.
  4. ^ a b Simpson, Thomas (2012). "Evaluating Google as an epistemic tool". Metaphilosophy. 43 (4): 969–982. doi:10.1111/j.1467-9973.2012.01759.x.
  5. ^ Ma, Z.; Pant, G.; Sheng, O. (2007). "Interest-based personalized search". ACM Transactions on Information Systems. 25 (5): 5–es. CiteSeerX 10.1.1.105.9203. doi:10.1145/1198296.1198301. S2CID 10797495.
  6. ^ Frias-Martinez, E.; Chen, S.Y.; Liu, X. (2007). "Automatic cognitive style identification of digital library users for personalization". Journal of the Association for Information Science and Technology. 58 (2): 237–251. CiteSeerX 10.1.1.163.6533. doi:10.1002/asi.20477.
  7. ^ Chirita, P.; Firan, C.; Nejdl, W. (2006). "Summarizing local context to personalize global Web search". SIGIR: 287–296.
  8. ^ Dou, Z.; Song, R.; Wen, J.R. (2007). A large-scale evaluation and analysis of personalized search strategies. WWW. pp. 581–590. CiteSeerX 10.1.1.604.1047. doi:10.1145/1242572.1242651. ISBN 9781595936547. S2CID 1257668.
  9. ^ Shen, X.; Tan, B.; Zhai, C.X. (2005). "Implicit user modeling for personalized search". CIKM: 824–831.
  10. ^ Sugiyama, K.; Hatano, K.; Yoshikawa, M. (2004). "Adaptive web search based on user profile constructed without any effort from the user". WWW: 675–684.
  11. ^ Teevan, J.; Dumais, S.T.; Horvitz, E. (2005). "Personalizing search via automated analysis of interests and activities" (PDF). SIGIR: 415–422.
  12. ^ Crook, Aidan, and Sanaz Ahari. "Making search yours". Bing. Retrieved 14 March 2011.
  13. ^ Sullivan, Danny (2012-11-09). "Of "Magic Keywords" and Flavors Of Personalized Search At Google". Retrieved 21 April 2014.
  14. ^ a b Ha-Thuc, Viet; Sinha, Shakti (2016). Learning to Rank Personalized Search Results in Professional Networks. Sigir 2016. ACM. pp. 461–462. arXiv:1605.04624. doi:10.1145/2911451.2927018. ISBN 9781450340694. S2CID 14924141.
  15. ^ a b c Briggs, Justin (24 June 2013). "A Better Understanding of Personalized Search". Retrieved 21 April 2014.
  16. ^ a b c d e E. Pariser (2011). The Filter Bubble (PDF). Archived from the original (PDF) on December 28, 2013.
  17. ^ Smyth, B. (2007). "Adaptive Information Access:: Personalization And Privacy". International Journal of Pattern Recognition & Artificial Intelligence. 21 (2): 183–205. doi:10.1142/S0218001407005363.
  18. ^ Bruns, Axel (2019-11-29). "Filter bubble". Internet Policy Review. 8 (4). doi:10.14763/2019.4.1426. ISSN 2197-6775. S2CID 211483210.
  19. ^ "Traffic Report: How Google is squeezing out competitors and muscling into new markets" (PDF). Consumer Watchdog. 2 June 2010. Retrieved 27 April 2014.
  20. ^ Wai-Tin, Kenneth; Dik Lun, L (2010). "Deriving concept-based user profiles from search engine logs". IEEE Transactions on Knowledge and Data Engineering. 22 (7): 969–982. CiteSeerX 10.1.1.150.1496. doi:10.1109/tkde.2009.144. S2CID 1115478.
  21. ^ "Google 맞춤형 결과 검색나쁠 수 있음" 웨이백 머신에 2012-05-18 보관 네트워크 월드. 2010년 7월 12일 검색됨
  22. ^ a b c Bozdag, Engin (2013-09-01). "Bias in algorithmic filtering and personalization". Ethics and Information Technology. 15 (3): 209–227. doi:10.1007/s10676-013-9321-6. ISSN 1572-8439. S2CID 14970635.
  23. ^ Hussein, Molla Rashied; Shams, Abdullah Bin; Rahman, Ashiqur; Raihan, Mohsin Sarker; Mostari, Shabnam; Siddika, Nazeeba; Kabir, Russell; Apu, Ehsanul Hoque (2021-10-08). "Real-time credible online health information inquiring: a novel search engine misinformation notifier extension (SEMiNExt) during COVID-19-like disease outbreak". {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)
  24. ^ "Search Engines and Customized Results Based on Your Internet History". SEO Optimizers. 2009-03-04. Retrieved 27 February 2013.
  25. ^ Mattison, D. (2010). "Time, Space, And Google: Toward A Real-Time, Synchronous, Personalized, Collaborative Web". Searcher: 20–31.
  26. ^ Jackson, Mark (2008-11-18). "The Future of Google's Search Personalization". Retrieved 29 April 2014.
  27. ^ Harry, David (2011-10-19). "Search Personalization and the User Experience". Retrieved 29 April 2014.
  28. ^ a b GOOGLE (2010). "TRAFFIC REPORT: HOW GOOGLE IS SQUEEZING OUT COMPETITORS AND MUSCLING INTO NEW MARKETS" (PDF). {{cite journal}}: Cite 저널 요구 (도움말); 일반 이름 (도움말)
  29. ^ "Traffic Report: How Google is Squeezing out Competitors and Muscling into New Markets" (PDF). ConsumerWatchDog.org. Retrieved 29 April 2014.
  30. ^ a b c Diehl, K. (2003). "Personalization and Decision Support Tools: Effects on Search and Consumer Decision Making". Advances in Consumer Research. 30 (1): 166–169.
  31. ^ a b Makhortykh, Mykola; Wijermars, Mariëlle (2021-09-15). "Can Filter Bubbles Protect Information Freedom? Discussions of Algorithmic News Recommenders in Eastern Europe". Digital Journalism: 1–25. doi:10.1080/21670811.2021.1970601. ISSN 2167-0811. S2CID 239186570.
  32. ^ a b Bouadjenek, Mohamed Reda; Hacid, Hakim; Bouzeghoub, Mokrane; Vakali, Athena (2016-11-10). "PerSaDoR: Personalized social document representation for improving web search". Information Sciences. 369: 614–633. doi:10.1016/j.ins.2016.07.046. ISSN 0020-0255.
  33. ^ Coyle, M. & Smyth, B. (2007). "Information recovery and discovery in collaborative web search". Advances in Information Retrieval. Lecture Notes in Computer Science. pp. 356–367. doi:10.1007/978-3-540-71496-5_33. ISBN 978-3-540-71494-1.
  34. ^ Shapira, B. & Zabar, B. (2011). "Personalized search: Integrating collaboration and social networks". Journal of the American Society for Information Science and Technology. 62 (1): 146–160. doi:10.1002/asi.21446.
  35. ^ Simpson, Thomas W. (2012). "Evaluating Google As An Epistemic Tool". Metaphilosophy. 43 (4): 426–445. doi:10.1111/j.1467-9973.2012.01759.x.
  36. ^ Bates, Mary Ellen (2011). "Is Google Hiding My News?". Online. 35 (6): 64.
  37. ^ a b "You Have Reached a 404 Page". Slate. 2013-09-22. ISSN 1091-2339. Retrieved 2017-05-24.
  38. ^ a b c "Facebook News Feed Algorithm History 2017 Update Wallaroo Media". wallaroomedia.com. Retrieved 2017-05-24.
  39. ^ Badke, William (February 2012). "Personalization and Information Literacy". Online. 36 (1): 47.
  40. ^ "Consumer Watchdog