본문 바로가기
Certificates/ADsP

[ADsP] 데이터의 이해

by Air’s Big Data 2020. 8. 20.

1. 데이터 이해 
1-1. 데이터의 이해 
1-2. 데이터의 가치와 미래 
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 

2. 데이터 분석 기획 
2-1. 데이터 분석 기획의 이해 
2-2. 분석 마스터 플랜 

3. 데이터 분석 
3-1. R 기초와 데이터 마트 

3-2. 통계분석 

3-3. 정형 데이터 마이닝 

 

데이터의 이해

데이터와 정보

데이터베이스 정의와 특징

데이터베이스 활용

 

 

데이터와 정보

#데이터의 정의

- 데이터는 추론과 추정의 근거를 이루는 사실

- 단순한 객체로서의 가치 뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 가지는 것으로 설명되고 있다.

 

 

#데이터의 특성

- 존재적 특성: 객관적 사실
- 당위적 특성: 추론·예측·전망·추정을 위한 근거

 

 

#데이터의 유형

 - 정성적(qualitative) 데이터: 그 형태와 형식이 정해져 있지 않아서 저장, 검색, 분석하는데 많은 비용과 기술적 투자가 수반된다.

    예) 언어, 문자 등

 - 정량적(quantitative) 데이터: 데이터의 양이 크게 증가하더라도 저장, 검색, 분석하여 활용하기 용이하다.

    예) 수치

 

#지식경영의 핵심 이슈

- 데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 있어 중요한 역할을 한다.

구분

의미

암묵지

학습과 경험을 통해
개인에게 체화되어 있지만
겉으로 드러나지 않는 지식

김치 담그기
자전거타기

형식지

문서나 매뉴얼처럼
형상화된 지식

교과서
비디오
DB

- 암묵지는 사회적으로 중요하지만 다른 사람에게 공유되기 어렵다. 개인에게 축적된 내면화된 지식이 조직의 지식으로 공통화 된다.

- 형식지는 전달과 공유가 용이하다. 언어, 기호, 숫자로 표준화된 지식이 개인의 지식으로 연결화

 

 

#DIKW 피라미드

(DIKW pyramid, Wikipedia)

구분

의미

데이터

개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실.
존재형식을 불문하고, 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호를 의미

A는 100원,

B는 200원에

연필을 판매

정보

데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가
도출된 것.

데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고
그 의미를 부여한 데이터

A마트의
연필이 더 싸다

지식

데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것.

상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과

상대적으로

저렴한 A마트에서 연필을 사야겠다

지혜

지식의 축적과 아이디어가 결합된 창의적인 산물.

근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어

A마트의 다른 상품들도 B마트보다 더 쌀 것이라고 판단한다.

 

데이터베이스 정의와 특징

#데이터베이스의 정의
- 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위해 일정한 구조에 따라서 편성된 데이터의 집합

- 관련된 레코드의 집합, 소프트웨어로는 데이터베이스 관리 시스템(DBMS)을 의미

- 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의해 체계적으로 수집·축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체

 

 

#데이터베이스의 특징
- 통합된 데이터(integrated data): 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미. 데이터 중복은 관리상의 복잡한 부작용을 초래

- 저장된 데이터(stored data): 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미. 데이터베이스는 기본적으로 컴퓨터 기술을 바탕으로 한 것

- 공용 데이터(shared data): 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미. 대용량화 되고 구조가 복잡

- 변화되는 데이터(changeable data): 데이터베이스에 저장된 내용은 곧 데이터베이스의 현 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 현재의 정확한 데이터를 유지해야 함

 

 

데이터베이스 활용

#OLTP (On-Line Transaction Processing)

 - 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나이다. 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스하고 바로 처리 결과를 돌려보내는 형태를 말한다. 데이터베이스의 데이터를 수시로 갱신하는 프로세싱을 의미한다.
 - (예) 주문 입력 시스템, 재고 관리 시스템 등

 

 

#OLAP (On-Line Analytical Processing)

 - 정보 위주의 분석 처리를 의미하며, 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻게 해주는 시스템이다.

 

 

#CRM (Customer Relationship Management)

 - 기업이 고객과 관련된 내·외부 자료를 분석·통합해 고객 중심 자원을 극대화하고 이를 토대로 고객 특성에 맞게 마케팅 활동을 계획·지원·평가하는 과정이다.

 

 

#SCM (Supply Chain Management)

 - 기업에서 원재료의 생산·유통 등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공하는 "공급망 관리"를 뜻한다.

 

 

#ERP (Enterprise Resource Planning)

 - 인사·재무·생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리시스템의 경영자원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신기법을 의미한다.

 

 

#BI (Business Intelligence)

 - 기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스를 말한다. 즉, 기업의 사용자가 더 좋은 의사결정을 하도록 데이터 수집, 저장, 분석, 접근을 지원하는 응용시스템과 기술인 것이다.

 

(참고 사이트)

https://0utlier.tistory.com/39

댓글