세션(웹 분석)
Session (web analytics)웹 분석에서 세션 또는 방문은 일정 기간 내에 또는 작업 완료와 관련하여 취한 사용자의 조치를 측정하는 단위다. 세션은 운영 분석 및 사용자별 권장사항 제공에도 사용된다. 세션을 정의하기 위해 사용되는 두 가지 주요 방법이 있다: 사용자 활동의 연속성에 기반한 시간 지향적 접근법과 요청된 페이지의 연속성에 기반한 항법 기반 접근법이다.
정의
"세션"의 정의는 특히 검색 엔진에 적용될 때 다양하다.[1] 일반적으로 세션은 "특정 사이트를 방문하는 동안 단일 최종 사용자가 수행한 일련의 요청"[2]으로 구성된다. 검색 엔진의 맥락에서, "세션"과 "쿼리 세션"은 적어도 두 개의 정의를 가지고 있다.[1] 세션 또는 질의 세션은 특정 기간[3] 동안 사용자가 수행한 모든 질의일 수도 있고, 일관된 기본 사용자 요구를 가진 일련의 질의일 수도 있다.[4][5]
사용하다
사용자당 세션은 웹사이트 사용의 측정으로 사용될 수 있다.[6][7] 연구와 응용 웹 분석에서 사용되는 다른 지표에는 세션 길이와 [8]세션당 사용자 작업이 포함된다.[9] 세션 길이는 페이지 뷰를 측정하는 것보다 더 정확한 대안으로 간주된다.[10]
재구성된 세션은 위키피디아를 구성하는 데 걸리는 노동 시간의 수를 측정하는 것을 포함하여 총 사용자 입력을 측정하는 데도 사용되었다.[11] 세션은 운영 분석, 데이터 익명화, 네트워킹 이상 징후 파악, 인위적인 트래픽이 있는 서버를 위한 가상 워크로드 생성에도 사용된다.[12][13]
세션 재구성
웹 분석에서 세션의 사용에 있어 필수적인 것은 세션의 식별 능력이다. 이것은 "세션 재구성"이라고 알려져 있다. 세션 재구성에 대한 접근방식은 시간지향적 접근방식과 항법지향적 접근방식의 두 가지 주요 범주로 나눌 수 있다.[14]
시간 지향적 접근 방식
세션 재구성에 대한 시간 지향적 접근방식은 일반적으로 "비활동 임계값"이라고 불리는 사용자 비활동 기간을 찾는다. 일단 이 비활동 기간에 도달하면 사용자는 사이트를 떠났거나 브라우저 사용을 완전히 중지하고 세션이 종료된 것으로 가정한다. 동일한 사용자의 추가 요청은 두 번째 세션으로 간주된다. 비활성 임계값에 대한 공통 값은 30분이며 때로는 산업 표준으로 설명되기도 한다.[15][16] 일부는 30분의 문턱이 자연적으로 긴 세션 주변에서 유물을 생성하며 다른 임계값으로 실험을 했다고 주장해왔다.[17][18] 다른 이들은 간단히 다음과 같이 말하고 있다: "어떤 시간 임계값도 [세션][19]을 식별하는 데 효과적이지 않다.
제안된 한 가지 대안은 전체 데이터 세트에 대해 단일 글로벌 임계값보다는 사용자별 임계값을 사용하는 것이다.[20][21] 이는 임계값이 양방향 분포를 따른다고 가정하는 문제가 있으며, 장기간에 걸친 데이터 집합에는 적합하지 않다.[17]
네비게이션 지향적 접근법은 웹사이트의 구조를 이용하는데, 특히 하이퍼링크의 존재와 사용자가 브라우저에 전체 URL을 입력하는 것이 아니라, 하이퍼링크를 클릭함으로써 동일한 웹사이트의 페이지 사이를 탐색하는 경향을 이용한다.[14] 이 데이터를 보고 세션을 식별하는 한 가지 방법은 웹 사이트의 지도를 작성하는 것이다: 사용자의 첫 페이지를 식별할 수 있는 경우, 이전에 액세스한 페이지 중 어떤 페이지에서도 액세스할 수 없는 페이지에 도달할 때까지 작업의 "세션"이 지속된다. 이는 사용자가 새 페이지를 열기 전에 자신의 단계를 역추적하는 역추적을 고려한다.[22] 역추적을 고려하지 않는 더 간단한 접근법은 각 요청의 HTTP referer를 단순히 세션에 이미 있는 페이지라고 요구하는 것이다. 그렇지 않으면 새 세션이 생성된다.[23] 이 등급의 휴리스틱스는 프레임셋이 포함된 웹사이트에서 "매우 저조한 성능을 보여준다"고 한다.[24]
참조
- ^ a b Gayo-Aveelo 2009, 페이지 1824.
- ^ 알릿 2000, 페이지 2
- ^ 도나토 2010, 페이지 324.
- ^ Gayo-Aveelo 2009, 페이지 1825.
- ^ 램 2007, 페이지 147.
- ^ Weischdel 2006, 페이지 464.
- ^ Catrege 1995, 페이지 5. (
- ^ 얀센 2006, 페이지 10. (
- ^ 얀센 2000, 페이지 12. (
- ^ Khoo 2008, 페이지 377.
- ^ 가이거 2014, 페이지 1.
- ^ Meiss 2009, 페이지 177. (
- ^ 알릿 2000, 페이지 8.
- ^ a b Spiliopou 2003, 페이지 176.
- ^ 오르테가 2010, 페이지 332.
- ^ 2014년 Eickhoff 2014, 페이지 3. CITREFEeckhoff (
- ^ a b 메어자디 2012, 페이지 3. 2012
- ^ 2002년, 페이지 733.
- ^ Jones 2008, 페이지 2. 없음:
- ^ Murray 2006, 페이지 3.
- ^ 메어자디 2012, 페이지 1. 2012
- ^ Cooley 1999, 페이지 19.
- ^ Cooley 1999, 페이지 23.
- ^ Berrendt 2003, 페이지 179.
참고 문헌 목록
- Arlitt, Martin (2000). "Characterizing Web User Sessions" (PDF). SIGMETRICS Performance Evaluation Review. 28 (2): 50–63. doi:10.1145/362883.362920. S2CID 2946044.
- Berendt, Bettina; Mobasher, Bamshad; Nakagawa, Miki; Spiliopoulou, Myra (2003). "The Impact of Site Structure and User Environment on Session Reconstruction in Web Usage Analysis" (PDF). WEBKDD 2002 - Mining Web Data for Discovering Usage Patterns and Profiles. WEBKDD. Springer. doi:10.1007/978-3-540-39663-5_10. ISBN 978-3-540-39663-5.
- Catledge, L.; Pitkow, J. (1995). "Characterizing browsing strategies in the world-wide web" (PDF). Proceedings of the Third International World-Wide Web Conference on Technology, Tools and Applications. 27 (6): 1065–1073. doi:10.1016/0169-7552(95)00043-7.
- Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep (1999). "Data Preparation for Mining World Wide Web Browsing Patterns" (PDF). Knowledge and Information Systems. 1 (1): 5–32. CiteSeerX 10.1.1.33.2792. doi:10.1007/BF03325089. ISSN 0219-3116. S2CID 1165622.
- Donato, Debora; Bonchi, Francesco; Chi, Tom (2010). "Do you want to take notes?: identifying research missions in Yahoo! search pad" (PDF). Proceedings of the 19th International Conference on World Wide Web. ACM. doi:10.1145/1772690.1772724. S2CID 6951065.
- Eickhoff, Carsten; Teevan, Jaime; White, Ryen; Dumais, Susan. (2014). Lessons from the Journey: A Query Log Analysis of Within-Session Learning (PDF). Proceedings of the Seventh International Conference on Web Search and Web Data Mining. ACM. pp. 223–232. doi:10.1145/2556195.2556217. ISBN 9781450323512. S2CID 14666769.
- Gayo-Avello, Daniel (2009). "A survey on session detection methods in query logs and a proposal for future evaluation" (PDF). Information Sciences. 179 (12): 1822–1843. doi:10.1016/j.ins.2009.01.026. hdl:10651/8686. ISSN 0020-0255.{{데드링크}일자=2017년 1월}
- Geiger, R.S.; Halfaker, A. (2014). Using Edit Sessions to Measure Participation in Wikipedia (PDF). Proceedings of the 2013 ACM Conference on Computer Supported Cooperative Work. ACM. p. 861. doi:10.1145/2441776.2441873. ISBN 9781450313315. S2CID 7166943.
- He, Daqing; Goker, Ayse; Harper, David J. (2002). "Combining evidence for automatic Web session identification". Information Processing and Management. 38 (5): 727–742. doi:10.1016/S0306-4573(01)00060-7. ISSN 0306-4573.
- Heer, Jeffrey; Chi, Ed H. (2002). "Separating the swarm: categorization methods for user sessions on the web" (PDF). Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. ACM. 4 (1). doi:10.1145/503376.503420. S2CID 14018957.
- Huang, Chien‐Kang; Chien, Lee‐Feng; Oyang, Yen‐Jen (2003). "Relevant term suggestion in interactive web search based on contextual information in query session logs". Journal of the American Society for Information Science and Technology. 54 (7): 638–649. CiteSeerX 10.1.1.105.5584. doi:10.1002/asi.10256.
- Jansen, Bernard J.; Spink, Amanda; Saracevic, Tefko (2000). "Real life, real users, and real needs: a study and analysis of user queries on the web" (PDF). Information Processing and Management. 36 (2): 207–227. CiteSeerX 10.1.1.155.1383. doi:10.1016/S0306-4573(99)00056-4. ISSN 0306-4573.
- Jansen, Bernard J.; Spink, Amanda (2006). "How are we searching the world wide web? A comparison of nine search engine transaction logs" (PDF). Information Processing and Management. 42 (1): 248–263. doi:10.1016/j.ipm.2004.10.007. ISSN 0306-4573.
- Jones, Rosie; Klinkner, Kristina Lisa (2008). Beyond the Session Timeout: Automatic Hierarchical Segmentation of Search Topics in Query Logs (PDF). Cikm 08. ACM. p. 699. doi:10.1145/1458082.1458176. ISBN 9781595939913. S2CID 6548724.
- Khoo, Michael; Pagano, Joe; Washington, Anne L.; Recker, Mimi; Palmer, Bart; Donahue, Robert A. (2008). "Using Web Metrics to Analyze Digital Libraries" (PDF). Proceedings of the 8th ACM/IEEE-CS Joint Conference on Digital Libraries. ACM.
- Lam, Heidi; =Russell, Daniel; Tang, Diane (2007). "Session viewer: Visual exploratory analysis of web session logs". IEEE Symposium on Visual Analytics Science and Technology. IEEE.
- Mehrzadi, David; Feitelson, Dror G. (2012). "On Extracting Session Data from Activity Logs" (PDF). Proceedings of the 5th Annual International Systems and Storage Conference. SYSTOR '12. ACM. CiteSeerX 10.1.1.381.1956. doi:10.1145/2367589.2367592. ISBN 978-1-4503-1448-0. S2CID 8820623.
- Meiss, Mark; Duncan, John; Gonçalves, Bruno; Ramasco, José J.; Menczer, Filippo (2009). "What's in a Session: Tracking Individual Behavior on the Web" (PDF). Proceedings of the 20th ACM Conference on Hypertext and Hypermedia. ACM. arXiv:1003.5325. doi:10.1145/1557914.1557946. S2CID 6564335.
- Menascé, Daniel A.; Almeida, V.; Fonseca, R.; Mendes, M. (1999). "A Methodology for Workload Characterization of E-commerce Sites" (PDF). Proceedings of ACM Conference on Electronic Commerce. ACM: 119–128. doi:10.1145/336992.337024. ISBN 1581131763. S2CID 7239612.
- Murray, G. Craig; Lin, Jimmy; Chowdhury, Abdur (2006). "Identification of User Sessions with Hierarchical Agglomerative Clustering" (PDF). Proceedings of the American Society for Information Science and Technology. 43 (1): 1–9. doi:10.1002/meet.14504301312.
- Ortega, J.L.; Aguillo, I. (2010). "Differences Between Web Sessions According to the Origin of their Visits" (PDF). Journal of Informetrics. 4 (3): 331–337. doi:10.1016/j.joi.2010.02.001. ISSN 1751-1577.
- Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki (2003). "A framework for the evaluation of session reconstruction heuristics in web-usage analysis" (PDF). INFORMS Journal on Computing. 15 (2): 171–190. CiteSeerX 10.1.1.621.3037. doi:10.1287/ijoc.15.2.171.14445. ISSN 1526-5528.
- Weischdel, Birgit; Huizingh, Eelko K. R. E. (2006). Website optimization with web metrics: a case study (PDF). Proceedings of the 8th International Conference on Electronic Commerce. p. 463. doi:10.1145/1151454.1151525. ISBN 978-1595933928. S2CID 2965255.