본문 바로가기

분류 전체보기174

[ADsP] 추정과 가설검정 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-2-1. 통계학 개론 3-2-2. 기초 통계분석 3-2-3. 다변량 분석 3-2-4. 시계열 에측 3-3. 정형 데이터 마이닝 통계학 개론 통계 분석 개요 확률 및 확률분포 추정과 가설검정 모수 검정 추정과 가설검정 #추정과 가설검정 통계적 추론 (1) 추정 (2) 가설검정 점추정 구간추정 - 모수: 통계적 방법론을 통해 알고자하는 대상은 모집단의 확률분포 . 모집단의 특징을 표현하는 값 (예: 평균, 분산, 표준편차, 백.. 2020. 8. 17.
[ADsP] 확률 및 확률분포 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-2-1. 통계학 개론 3-2-2. 기초 통계분석 3-2-3. 다변량 분석 3-2-4. 시계열 에측 3-3. 정형 데이터 마이닝 통계학 개론 통계 분석 개요 확률 및 확률분포 추정과 가설검정 모수 검정 확률 및 확률분포 #확률의 정의 - 특정 사건이 일어날 가능성의 척도 (1) 모든 사건 E의 확률값은 0과 1사이에 있다. 0 2020. 8. 17.
[ADsP] 통계 분석 개요 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-2-1. 통계학 개론 3-2-2. 기초 통계분석 3-2-3. 다변량 분석 3-2-4. 시계열 에측 3-3. 정형 데이터 마이닝 통계학 개론 통계 분석 개요 확률 및 확률분포 추정과 가설검정 비모수 검정 통계 분석 개요 #통계학의 정의 - 자료로부터 유용한 정보를 이끌어 내는 학문, 유용한 정보를 이끌어내는 작업에는 자료의 수집과 정리, 그리고 이를 해석하는 방법 모두 포함 #모집단과 표본 - 모딥단은 유한 모집단과 무한 모.. 2020. 8. 17.
LeetCode 283. Move Zeroes - Python LeetCode 283. Move Zeroes - Python Given an array nums, write a function to move all 0's to the end of it while maintaining the relative order of the non-zero elements. Example: Input: [0,1,0,3,12] Output: [1,3,12,0,0] Solution : #[::-1]는 처음부터 끝까지 -1칸 간격으로 ( == 역순으로) #pop()는 리스트에서 주어진 위치에 있는 항목을 삭제하고, 그 항목을 돌려줌 class Solution: def moveZeroes(self, nums): for i in range(len(nums))[::-1]: if nums[.. 2020. 8. 16.
[ADsP] 연관 분석 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 연관 분석 #연관규칙의 개념 - 항목들간의 조건-결과 식으로 표현되는 유용한 패턴 - 상품의 구매, 서비스 등 일련의 거래·사건들 간의 규칙을 발견하기 위해 적용. #연관분석 - 연관규칙을 발견해 내는 것을 연관분석(Association Analysis)이라고 하고, 흔히 장바구니 분석이라고 함. .. 2020. 8. 15.
[ADsP] 결측값 처리와 이상값 검색 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-1-1. R 기초 3-1-2. 데이터 마트 3-1-3. 결측값 처리와 이상값 검색 3-2. 통계분석 3-3. 정형 데이터 마이닝 결측값 처리와 이상값 검색 #결측치 인식 - 결측값: 표기되지 않은 값, 존재하지 않는 값 - 결측값은 NA, 9999999, ' '(공백), Unknown, Not Answer 등으로 표현됨. - 결측값 자체에 의미가 있는 경우 : 아주 부자나 가난한 사람은 자신의 정보를 잘 채워넣지 않는다. #결측치 처리 - .. 2020. 8. 15.
LeetCode 169. Majority Element - Python LeetCode 169. Majority Element - Python Given an array of size n, find the majority element. The majority element is the element that appears more than ⌊ n/2 ⌋ times. You may assume that the array is non-empty and the majority element always exist in the array. Example 1: Input: [3,2,3] Output: 3 Example 2: Input: [2,2,1,1,1,2,2] Output: 2 Solution 1: #Boyer–Moore majority vote algorithm 사용 clas.. 2020. 8. 13.
[ADsP] 회귀분석 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-2-1. 통계학 개론 3-2-2. 기초 통계 분석 3-2-3. 다변량 분석 3-2-4. 시계열 예측 3-2-5. 주성분 분석 3-3. 정형 데이터 마이닝 회귀분석(Regression Analysis) #회귀 분석의 정의 및 목적 - 변수와 변수 사이의 관계를 알아보기 위한 통계적 방법 - 독립변수의 값에 의하여 종속변수의 값을 예측하기 위함 독립변수(independent variable) : 종속변수에 영향을 미치는 변수 .. 2020. 8. 12.
LeetCode 206. Reverse Linked List - Python LeetCode 206. Reverse Linked List - Python Reverse a singly linked list. Example: Input: 1->2->3->4->5->NULL Output: 5->4->3->2->1->NULL Solution: class Solution(object): def reverseList(self, head): prev = None curr = head while curr!= None: tmp = curr.next curr.next = prev prev = curr curr = tmp return prev (참고 사이트) 링크드리스트 역순 재배열 : https://www.youtube.com/watch?v=gf_BiXt4YlQ 2020. 8. 11.
[ADsP] 분류 모형 평가 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 3-2. 통계분석 3-3. 정형 데이터 마이닝 3-3-1. 데이터 마이닝 개요 3-3-2. 분류 분석 3-3-3. 군집 분석 3-3-4. 연관 분석 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 분류 모형 평가 #분류 모형 평가 - 구축된 모형이 임의의 모형보다 더 우수한 분류 성과를 보이는지, 고려된 모형들 중 어느 것이 가장 우수한지 등을 비교 분석하는 과정 #모형 평가 기준 (1) 일반화의 가능성 .. 2020. 8. 10.