본문 바로가기

Certificates/ADsP32

[ADsP] 결측값 처리와 이상값 검색 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-1-1. R 기초 3-1-2. 데이터 마트 3-1-3. 결측값 처리와 이상값 검색 3-2. 통계분석 3-3. 정형 데이터 마이닝 결측값 처리와 이상값 검색 #결측치 인식 - 결측값: 표기되지 않은 값, 존재하지 않는 값 - 결측값은 NA, 9999999, ' '(공백), Unknown, Not Answer 등으로 표현됨. - 결측값 자체에 의미가 있는 경우 : 아주 부자나 가난한 사람은 자신의 정보를 잘 채워넣지 않는다. #결측치 처리 - .. 2020. 8. 15.
[ADsP] 회귀분석 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-2-1. 통계학 개론 3-2-2. 기초 통계 분석 3-2-3. 다변량 분석 3-2-4. 시계열 예측 3-2-5. 주성분 분석 3-3. 정형 데이터 마이닝 회귀분석(Regression Analysis) #회귀 분석의 정의 및 목적 - 변수와 변수 사이의 관계를 알아보기 위한 통계적 방법 - 독립변수의 값에 의하여 종속변수의 값을 예측하기 위함 독립변수(independent variable) : 종속변수에 영향을 미치는 변수 .. 2020. 8. 12.
[ADsP] 분류 모형 평가 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 분류 모형 평가 #분류 모형 평가 - 구축된 모형이 임의의 모형보다 더 우수한 분류 성과를 보이는지, 고려된 모형들 중 어느 것이 가장 우수한지 등을 비교 분석하는 과정 #모형 평가 기준 (1) 일반화의 가능성 .. 2020. 8. 10.
[ADsP] 앙상블 모형 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 앙상블 모형 #앙상블 모형의 정의와 특징 - 여러 개의 분류모형에 의한 결과를 종합하여 분류의 정확도를 높이는 방법 - 분리 분석의 과적합을 줄이기 위해 개발 - 적절한 표본추출법으로 여러 개의 훈련용 데이터를 .. 2020. 8. 7.
[ADsP] 신경망 모형 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 - 데이터의 실체가 어떤 그룹에 속하는지 예측하는데 사용되는 기법 - 분류 모델링: 신용 평가 모형(우량, 불량), 사기방지모형(사기, 정상), 이탈모형(이탈, 유지) - 분류 vs 예측 구분 분류 예측 공통점 .. 2020. 8. 7.
[ADsP] 데이터 마이닝 개요 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 #데이터 마이닝의 정의 - 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정 - 기업이 보유한 고객, 거래, 상품데이터 등과 이외의 기타 외부 데이터를 기반으로 감춰진 지식, 새로운 규칙 등을 발견하고 이를 비즈니스 의사결정 등에 활용하는 일련의 작업 #데이터 마이닝의 기능.. 2020. 8. 6.
[ADsP] 분류 분석 - 로지스틱 회귀모형 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 - 알려진 다변량 자료를 이용하여 모형을 구축하고, 이를 통해 새로운 자료에 대한 예측 및 분류 수행이 목적 - *반응변수가 범주형인 경우 → 새로운 자료에 대한 분류가 주목적 - 반응변수가 연속형인 경우 → 새로운 자료에 대한 예측이 주목적 (*반응변수 = 종속변수) 로지스틱 회귀모형 .. 2020. 8. 6.
[ADsP] 군집 분석 - SOM (Self-Organizing Maps, 자기조직화지도) 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 군집 분석 계층적 군집 비계층적 군집 (K-means) 혼합 분포 군집 (EM 알고리즘) SOM SOM(Self-Organizing Maps, 자기조직화지도) #SOM의 정의 및 특징 - 비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬해 지도의 형태로 형상화하는 것으로 입력.. 2020. 8. 3.
[ADsP] 군집 분석 - 혼합 분포 군집 (EM 알고리즘) 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 군집 분석 - 군집 분석은 관측값들을 유사한 성격을 가지는 몇 개의 군집으로 집단화하고, 군집의 특성을 파악하여 군집사이의 관계를 분석하는 다변량분석 기법이다. - 군집 분석 종류 : 계층적 군집 비계층적 군집 (K-means) 혼합 분포 군집 (EM 알고리즘) SOM 혼합 분포 군집 #혼합 분포의.. 2020. 8. 3.
[ADsP] 군집 분석 - 비계층적 군집 (K-평균 군집 분석) 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 군집 분석 계층적 군집 비계층적 군집 (K-means) 혼합 분포 군집 (EM 알고리즘) SOM 비계층적 군집방법 #비계층적 군집방법의 정의 및 특징 - n개의 개체를 g개의 군집으로 나눌 수 있는 모든 방법을 점검해 최적화한 군집을 형성 - 자료의 크기에 제약이 없음 #비계층적 군집방법의 장점과 .. 2020. 8. 3.