본문 바로가기
2021년 업데이트 (feat. 이직) 너무 오랜기간 블로그를 쉬고 업데이트를 하게 되네요. 정말 운 좋게 카카오 계열사에 기획 직무로 이직을 하게 되었습니다. 원하던 데이터 관련 직무는 아니지만 가고 싶던 기업인데 이렇게 큰 행운이 찾아올 것이라고 생각도 못했었죠. 저만 긴장했던 수습 기간이 지나고, 운동도 하고 살도 빼고 하니 벌써 2월이네요. 올해 초 목표였던 석사 졸업은 올해 8월로 미뤘습니다. 훌륭한 분들 사이에 있으니 욕심이 커지는 것은 어쩔 수 없더라구요. 목표가 커진 만큼 성장하겠죠? 그리고 영어 블로그를 시작해볼까 해서 2개를 팠습니다. 여기서는 좀더 연구자/개발자 적인 글을 남겨볼까 하는데 아직 프스트는 없습니다. 언젠가 영어를 자유롭게 쓰는 그날을 기대하며 매주 1회 이상을 써보려고 해요. Medium: https://m.. 2022. 2. 17.
SQLD 합격✔️✔️ 1년 1개 이상 자격증 취득이 목표인데 올해 목표 중 하나도 이렇게 이뤄냈네요! :D 2021. 6. 29.
[Python] JSON Data 읽고 쓰기 여러가지 구현을 해보면서 COCO dataset을 비롯해 다양한 오픈된 데이터셋의 annotation이 JSON data 형식인 것을 알게 되었습니다. 그래서 이번 포스팅에서는 JSON이란 무엇이며 어떻게 사용하는 것인지 알아보고자 합니다. JSON이란? JSON은 JavaScript Object Notation의 약자로 XML, YAML 과 함께 효율적으로 데이터를 저장하고 교환(exchange data)하는데 사용하는 텍스트 데이터 포맷 중의 하나입니다. JSON은 사람이 읽고 쓰기에 쉬우며, 또한 기계가 파싱하고 생성하기도에 쉽습니다. JSON은 2가지의 구조로 이뤄져 있습니다. - name/value pairs의 collection : object, record, dictionary, hash t.. 2021. 4. 7.
Eager Few Shot Object Detection (RetinaNet) 이번 실험에서는 pre-trained COCO checkpoint를 받아온 뒤 RetinaNet architecture의 TF2에 맞게 fine tuning을 하여 example에 적용해보도록 하겠습니다. 이 실험은 Colab에서 구현했으며 GPU를 사용하면 5분 이하로 걸릴 것입니다. Imports 먼저 tensorflow를 설치합니다. !pip install -U --pre tensorflow=="2.2.0" Tensorflow Object Detection API를 다운로드합니다. import os import pathlib #tensorflow model repository를 clone하기 if "models" in pathlib.Path.cwd().parts: while "models" in p.. 2021. 4. 4.
[Object Detection] Tensorflow Hub 활용하기 (inception resnet V2) Tensorflow Hub 에 있는 object detection model을 어떻게 사용하는지 알아보기 위해 간단한 구현을 하려고 합니다. 해당 코드는 CoLab에서도 확인 가능합니다. - Tensorflow Hub에서 object detection model 찾아보기 - 나의 workspace에 models load하기 - Inference를 위해 image를 preprocess하기 - models에 inference하고 output을 inspect하기 Imports import tensorflow as tf import tensorflow_hub as hub from PIL import Image from PIL import ImageOps import tempfile from six.moves.u.. 2021. 3. 31.
[CNN] Convolution으로 Accuracy 높이기 (Fashion MNIST, TensorFlow) Fashion MNIST는 70,000개의 28x28의 greyscale 이미지로 구성이 되어 있습니다. Fashion MNIST Dataset를 활용해 Convolution가 없을 때와 있을 때를 비교하고 모델에 살짝씩 변화를 주며 파라미터, 레이어가 어떤 역할을 하는지 알아봤습니다. Fashion MNIST Dataset를 활용해 Convolution으로 Accuracy 높이기 먼저 Convolution이 없는 DNN(Deep Neural Network)로 accuracy를 확인해봅니다. import tensorflow as tf mnist = tf.keras.datasets.fashion_mnist (training_images, training_labels), (test_images, test_l.. 2021. 3. 28.
[Coursera 수료 ✅ ] DeepLearning.AI TensorFlow Developer 모델 구현 과정에서 실력의 빈 틈이 너무 많은 것 같아 Coursera에서 제공하는 DeepLearning.AI TensorFlow Developer 과정을 수료했습니다. 총 4개의 코스가 있는데 이미지 분야만 공부하다가 NLP나 Sequence 같은 분야도 접하게 되어 흥미로웠습니다 :) 2021. 3. 25.
[논문 리뷰] StyleGAN: A Style-Based Generator Architecture for GANs 이번에 소개해 드릴 논문은 A Style-Based Generator Architecture for Generative Adversarial Networks으로 StyleGAN으로 자연스러운 고해상도 이미지를 만들면서 많이 알려지게 된 논문입니다. 해당 논문은 NVDIA 팀이 CVPR 2019에서 발표한 논문입니다. 이 글은 나동빈 님의 유튜브 영상과 루닛의 블로그 글을 참고하여 작성했습니다. Introduction 최근 GAN을 기반으로 한 이미지 합성 기술은 PGGAN 등을 포함하여 지속적으로 발전하고 있습니다. 그러나 Generator를 통한 이미지 합성 과정은 여전히 block box로 여겨지며, 이로 인해 합성되는 이미지의 attribute (성별, 연령, 헤어스타일 등) 을 조절하기가 매우 어.. 2021. 3. 25.
[논문 리뷰] Multiple-Clothing Detection and Fashion Landmark Estimation Using a Single-Stage Detector 안녕하세요. 이번에 리뷰할 논문은 중앙대팀에서 IEEE Access 2021에 publish한 Multiple-Clothing Detection and Fashion Landmark Estimation Using a Single-Stage Detector입니다. IDENX INTRODUCTION PROPOSED METHOD EXPERIMENTS RESULTS CONCLUSION INTRODUCTION Fashion dataset에 대한 기존 model들을 High computational requirements이 필요했습니다. 그러나 본 논문에서 제안 제안한 모델은 아래와 같은 contribution을 가지고 있습니다. Contribution (1) low-power devices에 적합하도록 accur.. 2021. 3. 13.
[ML 기초] 배치(batch)와 에포크(epoch) 차이 Batch size: 전체 트레이닝 데이터 셋을 여러 작은 그룹을 나누었을 때 batch size는 하나의 소그룹에 속하는 데이터 수 Epoch: 전체 트레이닝 셋이 신경망을 통과한 횟수 Iteration: iteration은 1 epoch를 마치는데 필요한 미니배치 갯수 2021. 3. 11.
용어 구분 - 인공지능, 기계학습, 데이터과학, 빅데이터, 데이터마이닝, 에이전트 1. 인공지능 의사결정, 판단, 추론, 학습, 예측 등 인간의 지능적인 행위를 컴퓨팅 모델로 만드는 것이다. 기계학습보다는 포괄적인 의미이다. 2. 기계학습 인공 지능의 한 부분으로 인간의 학습, 예측, 판단 등의 지능적 행위를 컴퓨팅 모델로 수행하는 것이다. 3. 데이터과학 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야이다. 데이터과학은 데이터마이닝보다 다학제적(interdisciplinary)이고 전방위적으로 비지니스, 기술, 오퍼레이션등 거의 모든 분야에 연결된 분야라고 볼수 있다. 4. 빅데이터 기존의 시스템으로는 처리하기 어려운 엄청난 양의 데이터를 말한다. 크기(Volume), 속도(Velocity).. 2021. 3. 9.
[논문 리뷰] EfficientDet: Scalable and Efficient Object Detection Review 안녕하세요! 오늘은 랩미팅 중 교수님께서 추천해주신 모델인 EfficientDet 을 리뷰해볼려고 합니다. Google Brain팀에서 publish한 논문이며, Code도 사용할 수 있도록 GitHub에 올려있습니다. Introduction EfficientDet은 이름만큼이나 현재 DataseObject Detection on COCO minival dataset에서 Extra Traning data 없이 성능 측정한 모델 중 1위를 차지할 정도로 적은 연산량(FLOPS)과 정확도를 모두 잡은 Efficient한 Network인데요. 위 single-model single-scale로 진행한 성능 비교 실험에서도 1위 mAP를 달성하며 SOTA 를 갱신했다고 합니다. Challenges Challen.. 2021. 3. 6.