DIVERSITY IS GOOD
DIVERSITY IS GOOD

테크/Data Analysis

ADsP 1과목 데이터 이해 - 1장 데이터의 이해 정리

diversity is good 2025. 2. 13. 04:54
반응형

01 데이터와 정보

 

1. 데이터의 정의

 

데이터 : 있는 그대로의 사실, 가공되지 않은 자료

정보 : 가공된 자료

 

데이터의 특성
존재적 특성 데이터는 있는 그대로의 객관적 사실
당위적 특성 데이터는 추론, 예측, 전망, 추정을 위한 근거

 

 

 

2. 데이터의 유형

 

정성적 데이터 주관적이거나 서술적인 데이터 언어, 문자 등
정량적 데이터 기준이 명확해 객관적 평가가 가능한 데이터 수치, 도형, 기호 등
정형 데이터 정형화된 틀이 있고 연산이 가능 CSV, 엑셀 스프레드 시트 등
반정형 데이터 정형화된 틀이 없고 연산이 불가능 *로그*, XML, JSON, 센서 데이터 등
비정형 데이터 형태는 있지만 연산이 불가능 소셜 데이터, 댓글, 영상, 음성 등

 

 

암묵지와 형식지

 

암묵지 : 개인에게 습득되어 있지만 겉으로 드러나지 않은 상태의 지식

형식지 : 암묵지가 문서나 매뉴얼처럼 외부로 표출돼 공유할 수 있는 지식

 

암묵지와 형식지의 상호작용

공통화 암묵지 지식을 다른 사람에게 알려주는 것
표출화 암묵지 지식을 매뉴얼이나 문서로 전환하는 것
연결화 교재, 매뉴얼에 새로운 지식을 추가하는 것
내면화 만들어진 교재, 매뉴얼에서 다른 사람의 암묵지를 터득하는 것

 

 

3. 데이터와 정보

 

DIKW 피라미드
데이터 의미가 중요하지 않은 객관적 사실
정보 데이터에서 의미가 도출된 것
지식 정보를 구조화하여 패턴을 통해 고유의 정보로 내재화되거나 예측된 것
지혜 지식과 아이디어가 결합된 창의적 산물

 

bit 와 byte

 

bit : 0과 1로 나타내는 최소 단위

byte : 8개의 비트로 이루어진 데이터의 양을 나타내는 단위

Kilo Mega Giga Tera Peta Exa Zetta Yotta
KB MB GB TB PB EB ZB YB
2^10 2^20 2^30 2^40 2^50 2^60 2^70 2^80

 

 

02 데이터 베이스

1. 데이터 베이스 개요

 

데이터베이스의 정의

 

DB : 정보의 집합체

DBMS : 이용자가 쉽계 데이터베이스를 구축, 유지할 수 있게 하는 관리 소프트웨어

 

데이터베이스의 특징
공용 데이터 여러 사용자가 공유 가능
통합된 데이터 동일한 내용의 데이터가 중복되어 있지 않다
저장된 데이터 저장 매체에 저장되어 있다
변화하는 데이터 최신의 정확한 데이터로 변경해 유지한다

 

데이터베이스 활용

 

OLTP : 데이터를 수시로 갱신 (거래단위)
OLAP : 다차원 데이터를 대화식으로 분석
CRM : 고객 관련 자료 분석, 마케팅 활용
SCM : 공급망 연결 최적화
ERP : 기업 경영 자원을 효율화
BI : 기업 보유 데이터 정리, 분석하여 리포트 중심 도구
BA :통계 기반 비즈니스 통찰력
Block Chain : 네트워크 참여한 모든 사용자가 정보를 분산, 저장
KMS : 기업의 모든 지식을 포함

 

데이터베이스의 종류

 

관계형 데이터베이스(RDB)

NoSQL : 비관계형 데이터베이스

계층형 DBMS

네트워크형 DBMS

분산형 DBMS

객체지향 DBMS

반응형