1. 데이터 이해
1-1. 데이터의 이해
1-2. 데이터의 가치와 미래
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트
2. 데이터 분석 기획
2-1. 데이터 분석 기획의 이해
2-2. 분석 마스터 플랜
3. 데이터 분석
3-1. R 기초와 데이터 마트
3-2. 통계분석
3-3. 정형 데이터 마이닝
3-3-1. 데이터 마이닝 개요
3-3-2. 분류 분석
3-3-3. 군집 분석
3-3-4. 연관 분석
연관 분석
#연관규칙의 개념
- 항목들간의 조건-결과 식으로 표현되는 유용한 패턴
- 상품의 구매, 서비스 등 일련의 거래·사건들 간의 규칙을 발견하기 위해 적용.
#연관분석
- 연관규칙을 발견해 내는 것을 연관분석(Association Analysis)이라고 하고, 흔히 장바구니 분석이라고 함.
- 장바구니 분석 : 장바구니에 무엇이 같이 들어 있는지에 대한 분석
- 서열분석 : A를 산 다음에 B를 산다
- 조건과 반응의 형태 : 아메리카노를 마시는 손님 중 10%가 브라우니 먹는다.
#연관분석의 측도 3가지 ★
(1) 지지도
- 전체 거래 중 항목 A, B를 동시에 포함하는 거래의 비율
- P(A ∩ B) : A와 B가 동시에 포함된 거래 수 / 전체 거래 수
(2) 신뢰도
- 항목 A를 포함한 거래 중에서 항목 A, B가 같이 포함될 확률
- P(A ∩ B) / P(A) : A와 B가 동시에 포함된 거래 수 / A가 포함된 거래 수
(3) 향상도
- A가 주어지지 않았을 때 품목 B의 확률에 비해 A가 주어졌을 때의 품목 B의 확률의 증가 비율
- P(A ∩ B) / P(A) × P (B) = P(B | A) / P(B) : A와 B가 동시에 일어난 횟수 / A와 B가 독립사건일 때, A와 B가 동시에 일어날 확률
- A와 B 사이에 아무런 상호관계가 없으면 향상도는 1
- 향상도가 1보다 높을 수록 연관성이 높다.
- 즉, 향상도가 1보다 크면 B를 구매할 확률보다 A를 구매한 후 B를 구매할 확률이 더 높다는 의미
#Apriori 알고리즘 분석 절차
- 최소지지도를 설정
- 개별품목 중에서 최소 지지도를 넘는 모든 품목을 찾음
- 찾은 개별 품목만을 이용하여 최소 지지도를 넘는 두 가지 품목 집합을 찾음
- 찾은 품목 집합을 결합하여 최소 지지도를 넘는 세 가지 품목 집합을 찾음
- 반복적으로 수행하여 최소 지지도가 넘는 빈발품목을 찾음
연관규칙의 장점 | 연관규칙의 단점 |
- 조건반응으로 표현되는 연관분석의 결과를 이해하기 쉬움 - 강력한 비목적성 분석기법 - 사용 편리한 분석 데이터 분석 - 계산의 용이성 |
- 분석 품목의 수가 증가하면 분석 계산이 기하급수적으로 증가 - 너무 세부화된 품목으로 연관규칙을 찾으려면 의미 없는 결과가 도출 - 상대적으로 거래량이 적으면 규칙 발견 시 제외되기 쉬움 |
#순차패턴
- 시간(구매시점)이라는 개념 포함시켜 순차적으로 구매 가능성이 큰 상품군을 찾아냄
#연관성분석 활용방안
- 장바구니 분석의 경우 실시간 상품추천을 통한 교차판매에 응용
- 시차분석은 상품 추천하는 교차판매 캠페인에 사용
- 상품의 연관성을 분석하여 매장지열, 패키지 상품개발, 교차판매 전략의 수립에 활용
(참고 사이트)
https://blog.naver.com/liberty264/221014962510
http://dorimriverst000.blogspot.com/2018/07/adsp-iii_49.html
'Certificates > ADsP' 카테고리의 다른 글
[ADsP] 확률 및 확률분포 (0) | 2020.08.17 |
---|---|
[ADsP] 통계 분석 개요 (0) | 2020.08.17 |
[ADsP] 결측값 처리와 이상값 검색 (0) | 2020.08.15 |
[ADsP] 회귀분석 (0) | 2020.08.12 |
[ADsP] 분류 모형 평가 (0) | 2020.08.10 |
댓글