친화도 분석
Affinity analysis친화도 분석은 데이터 집합의 공동 발생에 따라 서로 다른 개체 간의 의미 있는 상관관계를 나타내는 데이터 마이닝의 총칭에 해당된다.거의 모든 시스템과 프로세스에서 친화도 분석의 적용은 예상치 못한 추세에 대한 유의미한 지식을 추출할 수 있다.실제로 친화도 분석은 연관성 규칙 생성을 통해 빅데이터의 숨겨진 패튼을 밝혀내는 데 도움이 되는 함께 가는 속성의 연구 장점을 활용한다.연결 규칙 마이닝 절차는 두 가지로 구분된다. 첫째, 데이터 집합에서 모든 빈도 속성을 찾은 다음 몇 가지 사전 정의된 기준, 지원 및 신뢰도를 충족하는 연결 규칙을 생성하여 빈번한 항목 집합에서 가장 중요한 관계를 식별한다.이 프로세스의 첫 번째 단계는 데이터 집합에서 속성의 동시 발생을 계산하는 것이다.다음으로, 빈번한 항목 집합이라고 불리는 하위 집합이 생성된다.연결 규칙 마이닝은 조건이나 형상(A)이 존재하는 경우 다른 조건이나 형상(B)이 존재하는 형태를 취한다.첫 번째 조건이나 특징(A)은 선행 조건이라고 하고, 후자(B)는 결과라고 한다.이 과정은 빈번한 항목 집합을 추가로 찾을 때까지 반복된다.연결 규칙 마이닝 기법을 수행하기 위한 두 가지 중요한 지표가 있다: 지지와 자신감.또한 문제의 검색 공간을 줄이기 위해 priori 알고리즘을 사용한다.[1]
연결 규칙 학습 알고리즘의 지원 메트릭은 데이터 집합에 함께 나타나는 선행 또는 결과의 빈도로 정의된다.더욱이 신뢰도는 A와 B를 모두 포함하는 데이터 기록의 비율에 의해 결정되는 연관 규칙의 신뢰도로 표현된다.지지와 신뢰에 대한 최소 임계값은 모델에 대한 입력값이다.위에서 언급한 모든 정의를 고려하여 친화도 분석은 다른 사건의 발생을 기반으로 사건의 발생을 예측하는 규칙을 개발할 수 있다.이 데이터 마이닝 방법은 질병 진단, 시장 바스켓 분석, 소매업, 고등교육, 재무 분석 등 다양한 분야에서 탐구되어 왔다.소매업에서는 선호도 분석을 사용하여 시장 바구니 분석을 수행하는데, 소매업자는 고객의 구매 행동을 이해하려고 한다.이 정보는 판매 프로모션, 로열티 프로그램, 매장 설계 및 할인 계획에 영향을 미칠 뿐만 아니라 교차 판매 및 상향 판매 목적으로 사용될 수 있다.[2]
소매상에서의 친화도 분석 기법의 적용
시장 바스켓 분석은 소매업자에게 고객이 샴푸와 컨디셔너를 함께 구매하는 경우가 많으므로 두 품목을 동시에 프로모션에 참여시키는 것은 매출의 큰 증가를 초래하지 않을 것이며, 두 품목 중 하나만 포함된 프로모션이 다른 품목의 판매를 촉진할 수 있다.
시장 바구니 분석은 소매업자에게 구매자의 구매 행동을 이해할 수 있는 정보를 제공할 수 있다.이 정보를 통해 소매업체는 구매자의 요구를 이해하고 그에 따라 매장 배치를 다시 작성하거나 교차 프로모션 프로그램을 개발하거나 새로운 구매자를 확보할 수 있게 된다(크로스 판매 개념과 유사함).한 슈퍼마켓 체인은 분석 결과 기저귀를 산 남성 고객들도 맥주를 자주 구매하고, 기저귀를 맥주 쿨러에 바짝 붙여 매출이 크게 늘었다는 사실을 밝혀냈다.비록 이 도시 전설은 교수들이 학생들에게 그 개념을 설명하기 위해 사용하는 예에 불과하지만, 이 상상 현상의 설명은 기저귀를 사기 위해 내보낸 아버지들도 종종 보상으로 맥주를 산다는 것일 수도 있다.[3]이러한 종류의 분석은 아마도 데이터 마이닝의 이용의 예일 것이다.시장 바스켓 분석과 함께 웹상에서 교차판매하는 사례로 널리 쓰이는 것은 아마존닷컴이 'A책을 산 사람도 B책을 샀다'는 등 '포르투갈의 역사를 읽는 사람들도 해군사에 관심이 있었다'는 등의 용어로 쓰였다.
시장 바구니 분석은 고객을 그룹으로 나누는 데 사용될 수 있다.회사는 사람들이 달걀과 함께 어떤 다른 물건을 구입하는지 살펴보고, 케이크를 굽거나( 밀가루, 설탕과 함께 계란을 산다면), 오믈렛을 만드는 것으로 분류할 수 있다(베이컨, 치즈와 함께 계란을 산다면).이 식별 정보는 다른 프로그램을 구동하는 데 사용될 수 있다.마찬가지로, 제품을 자연 그룹으로 나누는 데 사용할 수 있다.기업은 어떤 제품이 가장 자주 함께 판매되는지를 살펴보고 이러한 집단을 중심으로 카테고리 관리를 조정할 수 있다.[4]
시장 바스켓 분석의 사업용도는 전자 판매 시점 도입 이후 크게 증가했다.[2]아마존은 같은 상품을 구매한 사람들의 구매 이력과 구매 이력을 바탕으로 사람들에게 상품을 추천할 때 교차 판매에 친화력 분석을 사용한다.패밀리 달러는 시장 바스켓 분석을 통해 매출 성장세를 유지하는 동시에 수익성이 낮은 소비재 재고로 전환할 계획이다.[5]
임상 진단 시 친화도 분석 기법의 적용
친화도 분석의 중요한 임상 적용은 연관 규칙을 생성하기 위해 의료 환자 기록에 대해 수행될 수 있다는 것이다.획득한 연관성 규칙은 큰 정보 블록에서 일치하는 다른 조건과 특징을 찾기 위해 추가로 평가할 수 있다.[6]효과적인 예방적 또는 치료적 개입을 수행할 수 있는 조건에 기여하는 서로 다른 요인 사이에 연관성이 있는지 여부를 이해하는 것이 중요하다.증거 기반 의학에서, 종양이나 암의 발병과 관련된 증상들의 공동 발생을 발견하는 것은 그 병의 초기 단계에서 진단하는 데 도움을 줄 수 있다.[7]특정 질병과 관련된 환자의 다른 증상들 사이의 연관성을 탐색하는 것 외에도, 다른 상태에 기여하는 다양한 질병들 간의 가능한 상관관계를 친화도 분석을 통해 확인할 수 있다.[8]
참고 항목
참조
- ^ Larose, Daniel T.; Larose, Chantal D. (2014-06-23). Discovering Knowledge in Data: An Introduction to Data Mining. Hoboken, NJ, USA: John Wiley & Sons, Inc. doi:10.1002/9781118874059. ISBN 978-1-118-87405-9.
- ^ a b "Demystifying Market Basket Analysi". Retrieved 28 December 2018.
- ^ "The parable of the beer and diapers". The Register. Retrieved 3 September 2009.
- ^ Wayback Machine Forte Consultancy Group에 보관된 제품 네트워크 분석 2018-11-18
- ^ "Family Dollar Supports Merchandising with IT". Archived from the original on 6 May 2010. Retrieved 3 November 2009.
- ^ Sanida, Theodora; Varlamis, Iraklis (June 2017). "Application of Affinity Analysis Techniques on Diagnosis and Prescription Data". 2017 IEEE 30th International Symposium on Computer-Based Medical Systems (CBMS). Thessaloniki: IEEE: 403–408. doi:10.1109/CBMS.2017.114. ISBN 978-1-5386-1710-6.
- ^ Dept. of Biotechnology & Bioinformatics, Jaypee University of Information Technology, Waknaghat, Solan, H.P., India; Sengupta, Dipankar; Sood, Meemansa; Vijayvargia, Poorvika; Hota, Sunil; Naik, Pradeep K (2013-06-29). "Association rule mining based study for identification of clinical parameters akin to occurrence of brain tumor". Bioinformation. 9 (11): 555–559. doi:10.6026/97320630009555. PMC 3717182. PMID 23888095.
{{cite journal}}: CS1 maint : 복수이름 : 작성자 목록(링크) - ^ Lakshmi, K.S; Vadivu, G. (2017). "Extracting Association Rules from Medical Health Records Using Multi-Criteria Decision Analysis". Procedia Computer Science. 115: 290–295. doi:10.1016/j.procs.2017.09.137.
추가 읽기
- J. Han 등, 2006년, 데이터 마이닝: ISBN 978-1-55860-901-3
- V. Kumar 등 2005 데이터 마이닝 ISBN 978-0-321-32136-7 소개
- U. Fayyad 외 1996 지식 검색 및 데이터 마이닝 분야의 진보 ISBN 978-0-262-56097-9
