본문 바로가기
[ML/DL] 수포자가 이해한 2-Layer Neural Net의 vector form *본 포스팅은 중학교때 수학을 놓아버린 수포자가 기계학습을 이해하기 위해 만든 자료이오니 정확한 정보가 아닐 수 있습니다. Python으로 2층 신경망 구현 과제를 하면서 score 계산을 위한 Dimension과 Neural Net의 vector form의 이해가 필요하여 복습을 진행하였습니다. 이 글에서 이해하고자 하는 2층 신경망의 구조는 아래 같으며, Dx1, MxD 등과 같은 vector가 무엇을 의미하는지 살펴봅시다. 먼저 vector derivatives와 matrix multiplication에 대해 알아봅시다. Vector Derivatives (벡터 도함수) Scalar to Scalar: scalar 형태인 x가 조금씩 변할 때 scalar 형태인 y가 얼마나 바뀔까? → Regula.. 2021. 1. 5.
[ML/DL] MNIST 손글씨 데이터 인식하기 이전 글에서 언급했듯이 이번 글에서는 '신경망 첫걸음(타리트 라시드)'의 MNIST 손글씨 데이터 인식하기 실습을 수행하고자 한다. 먼저 데이터셋을 다운 받아야 하는데 경로는 적절히 선택하면 되겠다. 제공되는 Dataset와 Code MNIST train data: http://www.pjreddie.com/media/files/mnist_train.csv MNIST test data: http://www.pjreddie.com/media/files/mnist_test.csv MNIST train data (100개): https://git.io/vySZ1 MNIST test data (10개): https://git.io/vySZP part2_neural_network_mnist_data.ipynb 아.. 2020. 12. 31.
[ML/DL] 파이썬으로 인공 신경망 만들기 대학원 2학기가 종강했지만, 기계학습 수업에서의 MLP 과제를 다시 해보기 위해 '신경망 첫걸음(타리트 라시드)'란 책을 읽고 있다. 이 책의 Chapter 20부터는 Python 실습 내용인데 이를 블로그에 정리해보며 내재화하려 한다. 그렇다면 인공 신경망의 뼈대 코드부터 단계별로 코드를 쌓아보자. COLAB Link : https://colab.research.google.com/drive/1Vjvf9uUW2bbwGFn0SzYL-nlzor7nb_0K?usp=sharing 뼈대 코드 만들기 신경망은 적어도 다음 세 가지 기능을 가져야 한다. 아래 코드에 살을 붙여 나갈 것이다. 초기화: 입력, 은닉, 출력 노드의 수 설정 학습: 학습 데이터들을 통해 학습하고 잉 따라 가중치를 업데이트 질의: 입력을 받.. 2020. 12. 29.
제 27회 ADsP 합격 (feat. 턱걸이) ADsP 턱걸이 합격했습니다 :) GAIQ 이후 첫 데이터 관련 자격증이네요. 다음에는 SQL이나 LinkedIn에 올릴 수 있는 국제적(?) 자격증을 취득해볼까 합니다. 2020. 12. 29.
[ML 기초] 수포자가 이해한 미분과 편미분 (feat. 경사하강법) *본 포스팅은 중학교 때 수학을 놓아버린 수포자가 기계학습을 이해하기 위해 정리한 것이므로 정확한 정보가 아닐 수 있습니다. 잘못된 정보는 댓글로 알려주시면 감사하겠습니다. 미분은 왜 하며 무엇일까? 미분을 하는 이유는 해당 곡선의 기울기(slope)를 알기 위해서 한다. 미분의 정의는 아래와 같으며 △x대신 'h'를 사용하기도 한다. 'f(x)를 미분하라'는 뜻은 아래 의미를 내포하고 있다. → 입력변수 x미세하게 변할 때, 함수 f가 얼마나 변하는지 알 수 있는 식을 구하라. → 함수f(x)는 입력 x의 미세한 변화에 얼마나 민감하게 반응하는지 알 수 있느 식을 구하라. 위 그림을 보면 기울기가 (+)이면 녹색이 되고 (-)이면 빨간색이 된다. 기울기가 0이면 검정색이 된다. 기울기는 변화율을 활용하.. 2020. 12. 5.
[SQLD] 개념 정리 1. 데이터 모델링의 이해 1-1. 데이터 모델링의 이해 1-1-1. 데이터 모델의 이해 1-1-2. 엔터티 1-1-3. 속성 1-1-4. 관계 1-1-5. 식별자 1-2. 데이터 모델과 성능 1-2-1. 성능 데이터 모델링의 개요 1-2-2. 정규화와 성능 1-2-3. 반정규화와 성능 1-2-4. 대량 데이터에 따른 성능 1-2-5. 데이터베이스 구조와 성능 1-2-6. 분산 데이터베이스와 성능 2. SQL 기본 및 활용 2-1. SQL 기본 2-1-1. 관계형 데이터베이스 개요 2-1-2. DDL 2-1-3. DML 2-1-4. TCL 2-1-5. WHERE 절 2-1-6. 함수 2-1-7. GROUP BY, HAVING 절 2-1-8. ORDER BY 절 2-1-9. 조인 2-2. SQL 활용 2-.. 2020. 11. 29.
[ADsP] 1과목~3과목 개념 정리 ★ : 기출 Contents 1. 데이터 이해 1-1. 데이터의 이해 1-2. 데이터의 가치와 미래 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 2. 데이터 분석 기획 2-1. 데이터 분석 기획의 이해 2-2. 분석 마스터 플랜 3. 데이터 분석 3-1. R 기초와 데이터 마트 R프로그래밍 기초 데이터 마트 3-2. 통계분석 통계학 개론 통계 분석 개요 확률 및 확률분포 추정과 가설검정 모수 검정 기초 통계 분석 다변량 분석 시계열 예측 다차원 척도법 주성분 분석 3-3. 정형 데이터 마이닝 데이터 마이닝 개요 분류 분석 로지스틱 회귀모형 신경망 모형 의사결정나무 모형 앙상블 모형 분류 모형 평가 군집 분석 계층적 군집 비계층적 군집 (K-means) 혼합 분포 군집 (EM 알고리즘) SO.. 2020. 11. 18.
[ADsP D-20] 연습 문제 풀이 (21회) 1. 빅데이터가 만들어 내는 본질적인 변화 - 사전처리에서 시대로: 필요한 정보만 수집하고 필요하지 않은 정보는 버리는 시스템에서 가능한 한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아낸다. - ____에서 전수조사로: 표본을 조사하는 기존의 지식 발견 방식이 데이터 수집 비용의 감소와 클라우드 컴퓨팅 기술의 발전으로 인해 전수조사로 변화하게 된다. 이에 따라 샘플링이 주지 못하는 패턴이나 정보를 찾을 수 있게 된다. - 질보다 양으로: 데이터가 지속적으로 추가될 때 양질의 정보가 오류보다 많아져 전체적으로 좋은 결과 산출에 긍정적인 영향을 미친다는 추론에 바탕을 두고 변화된다. - 인과관계에서 _____로: 상관관계를 통해 특정 현상의 발생 가능성이 포착되고, 그에 상응하.. 2020. 11. 4.
실패율 : 코딩테스트 연습 / Python / Programmers / Level1 실패율 문제는 제목 링크에서 확인이 가능하며, 입출력의 예시는 아래와 같다. N: 스테이지 개수 stages: stage의 길이 (User의 명 수, 각 User가 어느 Stage까지 도달했는지) Stage No. 2 1 2 6 2 4 3 3 실패율 1 Clear X Clear Clear Clear Clear Clear Clear 1/8 (13%) 2 X - X Clear X Clear Clear Clear 3/7 (43%) 3 - - - Clear - Clear X X 2/4 (50%) 4 - - - Clear - X - - 1/2 (50%) 5 - - - Clear - - - - 0/1 (0%) N+1 마지막 스테이지까지 클리어 스테지 실패율 높은 순 : (실패율이 같은 스테이지가 있다면 작은 번호의.. 2020. 11. 3.
[ADsP] 연습 문제 풀이 (19회) 1-1. 다음 중 암묵지가 아닌 것은? ① 김장김치 담그기의 노하우 ② 암묵지는 개인에서 체화되기 되어 있기 때문에 공유하기 어렵다. ③ 현장작업과 같은 경험을 통해 획득할 수 있는 지식 ④ 회계, 재무 관련 대차대조표에 요구되는 지식의 매뉴얼 등이 암묵지이다. 더보기 정답: ④ 1-2. 다음은 어떤 기업내부 데이터베이스 솔루션에 대한 설명인가? [제조업을 포함한 다양한 비즈니스 분야에서 생산, 구매, 재고, 주문, 공급자와의 거래, 고객서비스 제공 등 주요 프로세스 관리를 돕는 여러 모듈로 구성된 통합애플리케이션] ① ERP ② CRM ③ SCM ④ KMS 더보기 정답: ① 1-3. 아래는 용어와 의미를 서로 연결한 것이다. 다음 중 용어 - 의미가 잘못 연결된 것을 모두 나열한 것은? OLTP - 다.. 2020. 11. 1.
LeetCode 1342. Number of Steps to Reduce a Number to Zero - Python LeetCode 1342. Number of Steps to Reduce a Number to Zero Given a non-negative integer num, return the number of steps to reduce it to zero. If the current number is even, you have to divide it by 2, otherwise, you have to subtract 1 from it. Example : Input: num = 14 Output: 6 Explanation: Step 1) 14 is even; divide by 2 and obtain 7. Step 2) 7 is odd; subtract 1 and obtain 6. Step 3) 6 is even.. 2020. 10. 25.
[머신러닝 기초] NumPy Tutorial - Python #NumPy란? - NumPy는 Numerical Python의 줄임 말로써 고성능의 수치 계산을 하기 위해 만들어진 python package - 파이썬을 이용한 데이터 분석을 하기 위해서는 pandas 뿐만 아니라 numpy를 익혀야만 효율적인 데이터 분석이 가능 #Github Arrays Array Indexing Datatypes Array Math Broadcasting #Arrays #Array Indexing #Datatypes #Array Math #Broadcasting 위 내용은 Stanford의 CS231: Convolutional Neural Networks for Visual Recognition 수업 내용을 참고했습니다. 2020. 10. 24.