본문 바로가기
Certificates/ADsP

[ADsP] 군집 분석 - SOM (Self-Organizing Maps, 자기조직화지도)

by Air’s Big Data 2020. 8. 3.

1. 데이터 이해 
1-1. 데이터의 이해 
1-2. 데이터의 가치와 미래 
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 

2. 데이터 분석 기획 
2-1. 데이터 분석 기획의 이해 
2-2. 분석 마스터 플랜 

3. 데이터 분석 
3-1. R 기초와 데이터 마트 
3-2. 통계분석 
3-3. 정형 데이터 마이닝 
  3-3-1. 데이터 마이닝 개요 
  3-3-2. 분류 분석 
  3-3-3. 군집 분석 
  3-3-4. 연관 분석

 

 

군집 분석

계층적 군집

비계층적 군집 (K-means)

혼합 분포 군집 (EM 알고리즘)

SOM

 

SOM(Self-Organizing Maps, 자기조직화지도)

#SOM의 정의 및 특징

 - 비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬해 지도의 형태 형상화하는 것으로 입력 변수의 위치 관계를 그대로 보존한다는 특징이 있다.

 - 시각적인 이해가 쉽고, 실제 데이터가 유사하면 지도상에서 가깝게 표현돼 패턴 발견, 이미지 분석 등에서 뛰어난 성능을 보임

 

 

(An illustration of the training of a self-organizing map, Wikipedia)

#SOM의 활용

- Find structures in data(구조 탐색) : 데이터의 특징을 파악하여 유사 데이터를 군집
- Dimension Reduction(차원 축소) & Visualization(시각화) : 차원을 축소하여 통상 2차원 그리드에 매핑하여 시각적으로 이해시킴

 

#SOM의 과정

- SOM 맵의 노드에 대한 연결 강도로 초기화
- 입력 벡터와 *경쟁층 노드간의 유클리드 거리를 계산하여 입력 벡터와 가장 짧은 노드를 선택
    *경쟁층(competitive layer): 입력 벡터의 특성에 따라 입력 벡터가 한 점으로 클러스터링되는 층
- 선택된 노드와 이웃 노드의 가중치를 수정
- 단계를 반복하면서 연결 강도는 입력 패턴과 가장 유사한 경쟁층 뉴런이 승자가 됨
- 승자 독식 구조로 인해 경쟁층에서는 승자 뉴런만이 나타남

(Training process of SOM on two-dimensional data set, Wikipedia)

 

 

#SOM vs 신경망 모형

- 신경망 모형은 연속적인 층으로 구성된 반면, SOM은 2차원의 그리드로 구성
- 신경망 모형은 에러 수정을 학습하는 반면, SOM은 경쟁 학습을 시킴
- 신경망 모형은 역전파 알고리즘이지만, SOM은 전방패스를 사용하여 속도가 매우 빠름
- SOM은 비지도학습

 

 

(참고 사이트)

http://dorimriverst000.blogspot.com/2018/07/adsp-iii_29.html

댓글