본문 바로가기
Certificates/ADsP

[ADsP] 다차원 척도법

by Air’s Big Data 2020. 8. 22.

1. 데이터 이해 
1-1. 데이터의 이해 
1-2. 데이터의 가치와 미래 
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 

2. 데이터 분석 기획 
2-1. 데이터 분석 기획의 이해 
2-2. 분석 마스터 플랜 

3. 데이터 분석 
3-1. R 기초와 데이터 마트 

3-2. 통계분석 

  3-2-1. 통계학 개론

  3-2-2. 기초 통계분석

  3-2-3. 다변량 분석

  3-2-4. 시계열 에측

  3-2-5. 다차원 척도법

 

 

다차원 척도법

#다차원척도법 정의  

- 객체간 근접성을 시각화하는 통계기법이다.

- 군집분석과 같이 개체들을  대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다.

- 개체들 2차원 또는 3차원 공간 상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석 방법이다.

 

 

#다차원척도법 목적

- 데이터 속에 잠재해 있는 패턴과 구조를 찾아낸다.

- 그 구조를 소수 차원의 공간에 기하학적으로 표현한다.

- 데티어 축소의 목적으로 다차원척도법을 이용한다. 즉, 데이터에 포함되는 정보를 끄집어내기 위해서 다차원척도법을 탐색수단으로써 사용한다.

- 다차원적도법에 의해서 얻은 결과를, 데이터가 만들어진 현상이나 과정에 고유의 구조로서 의미를 부여한다. 

 

 

#다차원척도법 방법

- 개체들의 거리 계산에는 유클리드 거리행렬을 활용한다.

- 관측대상들의 상대적 거리의 정확도를 높이기 위해 적합 정도를 스트레스 값으로 나타낸다.

-  각 개체들을 공간상에 표현하기 위한 방법은 부적합도 기준으로 STRESS나 S-STRESS를 사용한다.

- 최적모형의 적합은 부적합도를 최소를 하는 반복알고리즘을 이용하며, 이 값이 일정 수준 이하가 될 때 최종적으로 적합된 모형으로 제시한다.

-최적모형의 적합은 부적합도를 최소로 하는 방법으로 일정 수준 이하로 될때까지 반복해서 수행한다.

    STRESS 0: 완벽

    STRESS 0.05 이내: 

    STRESS 0.5~0.10: 만족 

    STRESS 0.10~0.15: 보통 

    STRESS 0.15이상: 나쁨

 

 

#다차원척도법 종류

(1) 계량적 MDS (Metric MDS)

  - 데이터가 구간척도나 비율척도인 경우 활용한다.

(2) 비계량적 MDS (Monmetric MDS)

 - 데이터가 순서척도인 경우 활용한다. 개체들간의 거리가 순서로 주어진 경우에는 순서척도를 거리의 속성과 같도록 변환하여 거리를 생성한 후 적용한다.

 

(출처: https://wikidocs.net/48110)

 

(참고 사이트)

https://dlsdn73.tistory.com/1152

 

댓글