본문 바로가기
Certificates/ADsP

[ADsP] 연관 분석

by Air’s Big Data 2020. 8. 15.

1. 데이터 이해 
1-1. 데이터의 이해 
1-2. 데이터의 가치와 미래 
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 

2. 데이터 분석 기획 
2-1. 데이터 분석 기획의 이해 
2-2. 분석 마스터 플랜 

3. 데이터 분석 
3-1. R 기초와 데이터 마트 
3-2. 통계분석 
3-3. 정형 데이터 마이닝 
  3-3-1. 데이터 마이닝 개요 
  3-3-2. 분류 분석 
  3-3-3. 군집 분석 
  3-3-4. 연관 분석

 

 

연관 분석

 

#연관규칙의 개념

 - 항목들간의 조건-결과 식으로 표현되는 유용한 패턴

 - 상품의 구매, 서비스 등 일련의 거래·사건들 간의 규칙을 발견하기 위해 적용. 

 

 

#연관분석

 - 연관규칙을 발견해 내는 것을 연관분석(Association Analysis)이라고 하고, 흔히 장바구니 분석이라고 함.
 - 장바구니 분석 : 장바구니에 무엇이 같이 들어 있는지에 대한 분석
 - 서열분석 : A를 산 다음에 B를 산다
 - 조건과 반응의 형태 : 아메리카노를 마시는 손님 중 10%가 브라우니 먹는다.

 

Association rule learning, wikipedia



#연관분석의 측도 3가지 ★

 (1) 지지도

  - 전체 거래 중 항목 A, B를 동시에 포함하는 거래의 비율

  - P(A ∩ B) : A와 B가 동시에 포함된 거래 수 / 전체 거래 수
 (2) 신뢰도

  - 항목 A를 포함한 거래 중에서 항목 A, B가 같이 포함될 확률

  - P(A ∩ B) / P(A) : A와 B가 동시에 포함된 거래 수 / A가 포함된 거래 수

 (3) 향상도

  - A가 주어지지 않았을 때 품목 B의 확률에 비해 A가 주어졌을 때의 품목 B의 확률의 증가 비율

  - P(A ∩ B) / P(A) × P (B)  = P(B | A) / P(B) : A와 B가 동시에 일어난 횟수 / A와 B가 독립사건일 때, A와 B가 동시에 일어날 확률 

  - A와 B 사이에 아무런 상호관계가 없으면 향상도는 1

  - 향상도가 1보다 높을 수록 연관성이 높다.

  - 즉, 향상도가 1보다 크면 B를 구매할 확률보다 A를 구매한 후 B를 구매할 확률이 더 높다는 의미

 


#Apriori 알고리즘 분석 절차
 - 최소지지도를 설정
 - 개별품목 중에서 최소 지지도를 넘는 모든 품목을 찾음
 - 찾은 개별 품목만을 이용하여 최소 지지도를 넘는 두 가지 품목 집합을 찾음
 - 찾은 품목 집합을 결합하여 최소 지지도를 넘는 세 가지 품목 집합을 찾음
 - 반복적으로 수행하여 최소 지지도가 넘는 빈발품목을 찾음

연관규칙의 장점 연관규칙의 단점
- 조건반응으로 표현되는 연관분석의 결과를 이해하기 쉬움
- 강력한 비목적성 분석기법
- 사용 편리한 분석 데이터 분석
- 계산의 용이성
- 분석 품목의 수가 증가하면 분석 계산이 기하급수적으로 증가
- 너무 세부화된 품목으로 연관규칙을 찾으려면 의미 없는 결과가 도출
- 상대적으로 거래량이 적으면 규칙 발견 시 제외되기 쉬움


#순차패턴
- 시간(구매시점)이라는 개념 포함시켜 순차적으로 구매 가능성이 큰 상품군을 찾아냄

 


#연관성분석 활용방안
 - 장바구니 분석의 경우 실시간 상품추천을 통한 교차판매에 응용
 - 시차분석은 상품 추천하는 교차판매 캠페인에 사용
 - 상품의 연관성을 분석하여 매장지열, 패키지 상품개발, 교차판매 전략의 수립에 활용
 

 

(참고 사이트)

https://blog.naver.com/liberty264/221014962510

http://dorimriverst000.blogspot.com/2018/07/adsp-iii_49.html

'Certificates > ADsP' 카테고리의 다른 글

[ADsP] 확률 및 확률분포  (0) 2020.08.17
[ADsP] 통계 분석 개요  (0) 2020.08.17
[ADsP] 결측값 처리와 이상값 검색  (0) 2020.08.15
[ADsP] 회귀분석  (0) 2020.08.12
[ADsP] 분류 모형 평가  (0) 2020.08.10

댓글