Certificates34 [ADsP] 통계 분석 개요 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-2-1. 통계학 개론 3-2-2. 기초 통계분석 3-2-3. 다변량 분석 3-2-4. 시계열 에측 3-3. 정형 데이터 마이닝 통계학 개론 통계 분석 개요 확률 및 확률분포 추정과 가설검정 비모수 검정 통계 분석 개요 #통계학의 정의 - 자료로부터 유용한 정보를 이끌어 내는 학문, 유용한 정보를 이끌어내는 작업에는 자료의 수집과 정리, 그리고 이를 해석하는 방법 모두 포함 #모집단과 표본 - 모딥단은 유한 모집단과 무한 모.. 2020. 8. 17. [ADsP] 연관 분석 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 연관 분석 #연관규칙의 개념 - 항목들간의 조건-결과 식으로 표현되는 유용한 패턴 - 상품의 구매, 서비스 등 일련의 거래·사건들 간의 규칙을 발견하기 위해 적용. #연관분석 - 연관규칙을 발견해 내는 것을 연관분석(Association Analysis)이라고 하고, 흔히 장바구니 분석이라고 함. .. 2020. 8. 15. [ADsP] 결측값 처리와 이상값 검색 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-1-1. R 기초 3-1-2. 데이터 마트 3-1-3. 결측값 처리와 이상값 검색 3-2. 통계분석 3-3. 정형 데이터 마이닝 결측값 처리와 이상값 검색 #결측치 인식 - 결측값: 표기되지 않은 값, 존재하지 않는 값 - 결측값은 NA, 9999999, ' '(공백), Unknown, Not Answer 등으로 표현됨. - 결측값 자체에 의미가 있는 경우 : 아주 부자나 가난한 사람은 자신의 정보를 잘 채워넣지 않는다. #결측치 처리 - .. 2020. 8. 15. [ADsP] 회귀분석 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-2-1. 통계학 개론 3-2-2. 기초 통계 분석 3-2-3. 다변량 분석 3-2-4. 시계열 예측 3-2-5. 주성분 분석 3-3. 정형 데이터 마이닝 회귀분석(Regression Analysis) #회귀 분석의 정의 및 목적 - 변수와 변수 사이의 관계를 알아보기 위한 통계적 방법 - 독립변수의 값에 의하여 종속변수의 값을 예측하기 위함 독립변수(independent variable) : 종속변수에 영향을 미치는 변수 .. 2020. 8. 12. [ADsP] 분류 모형 평가 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 분류 모형 평가 #분류 모형 평가 - 구축된 모형이 임의의 모형보다 더 우수한 분류 성과를 보이는지, 고려된 모형들 중 어느 것이 가장 우수한지 등을 비교 분석하는 과정 #모형 평가 기준 (1) 일반화의 가능성 .. 2020. 8. 10. [ADsP] 앙상블 모형 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 앙상블 모형 #앙상블 모형의 정의와 특징 - 여러 개의 분류모형에 의한 결과를 종합하여 분류의 정확도를 높이는 방법 - 분리 분석의 과적합을 줄이기 위해 개발 - 적절한 표본추출법으로 여러 개의 훈련용 데이터를 .. 2020. 8. 7. [ADsP] 신경망 모형 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 - 데이터의 실체가 어떤 그룹에 속하는지 예측하는데 사용되는 기법 - 분류 모델링: 신용 평가 모형(우량, 불량), 사기방지모형(사기, 정상), 이탈모형(이탈, 유지) - 분류 vs 예측 구분 분류 예측 공통점 .. 2020. 8. 7. [ADsP] 데이터 마이닝 개요 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 #데이터 마이닝의 정의 - 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정 - 기업이 보유한 고객, 거래, 상품데이터 등과 이외의 기타 외부 데이터를 기반으로 감춰진 지식, 새로운 규칙 등을 발견하고 이를 비즈니스 의사결정 등에 활용하는 일련의 작업 #데이터 마이닝의 기능.. 2020. 8. 6. [ADsP] 분류 분석 - 로지스틱 회귀모형 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 - 알려진 다변량 자료를 이용하여 모형을 구축하고, 이를 통해 새로운 자료에 대한 예측 및 분류 수행이 목적 - *반응변수가 범주형인 경우 → 새로운 자료에 대한 분류가 주목적 - 반응변수가 연속형인 경우 → 새로운 자료에 대한 예측이 주목적 (*반응변수 = 종속변수) 로지스틱 회귀모형 .. 2020. 8. 6. [ADsP] 군집 분석 - SOM (Self-Organizing Maps, 자기조직화지도) 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 군집 분석 계층적 군집 비계층적 군집 (K-means) 혼합 분포 군집 (EM 알고리즘) SOM SOM(Self-Organizing Maps, 자기조직화지도) #SOM의 정의 및 특징 - 비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬해 지도의 형태로 형상화하는 것으로 입력.. 2020. 8. 3. 이전 1 2 3 4 다음