반응형
01 데이터와 정보
1. 데이터의 정의
데이터 : 있는 그대로의 사실, 가공되지 않은 자료
정보 : 가공된 자료
데이터의 특성
존재적 특성 | 데이터는 있는 그대로의 객관적 사실 |
당위적 특성 | 데이터는 추론, 예측, 전망, 추정을 위한 근거 |
2. 데이터의 유형
정성적 데이터 | 주관적이거나 서술적인 데이터 | 언어, 문자 등 |
정량적 데이터 | 기준이 명확해 객관적 평가가 가능한 데이터 | 수치, 도형, 기호 등 |
정형 데이터 | 정형화된 틀이 있고 연산이 가능 | CSV, 엑셀 스프레드 시트 등 |
반정형 데이터 | 정형화된 틀이 없고 연산이 불가능 | *로그*, XML, JSON, 센서 데이터 등 |
비정형 데이터 | 형태는 있지만 연산이 불가능 | 소셜 데이터, 댓글, 영상, 음성 등 |
암묵지와 형식지
암묵지 : 개인에게 습득되어 있지만 겉으로 드러나지 않은 상태의 지식
형식지 : 암묵지가 문서나 매뉴얼처럼 외부로 표출돼 공유할 수 있는 지식
암묵지와 형식지의 상호작용
공통화 | 암묵지 지식을 다른 사람에게 알려주는 것 |
표출화 | 암묵지 지식을 매뉴얼이나 문서로 전환하는 것 |
연결화 | 교재, 매뉴얼에 새로운 지식을 추가하는 것 |
내면화 | 만들어진 교재, 매뉴얼에서 다른 사람의 암묵지를 터득하는 것 |
3. 데이터와 정보
DIKW 피라미드
데이터 | 의미가 중요하지 않은 객관적 사실 |
정보 | 데이터에서 의미가 도출된 것 |
지식 | 정보를 구조화하여 패턴을 통해 고유의 정보로 내재화되거나 예측된 것 |
지혜 | 지식과 아이디어가 결합된 창의적 산물 |
bit 와 byte
bit : 0과 1로 나타내는 최소 단위
byte : 8개의 비트로 이루어진 데이터의 양을 나타내는 단위
Kilo | Mega | Giga | Tera | Peta | Exa | Zetta | Yotta |
KB | MB | GB | TB | PB | EB | ZB | YB |
2^10 | 2^20 | 2^30 | 2^40 | 2^50 | 2^60 | 2^70 | 2^80 |
02 데이터 베이스
1. 데이터 베이스 개요
데이터베이스의 정의
DB : 정보의 집합체
DBMS : 이용자가 쉽계 데이터베이스를 구축, 유지할 수 있게 하는 관리 소프트웨어
데이터베이스의 특징
공용 데이터 | 여러 사용자가 공유 가능 |
통합된 데이터 | 동일한 내용의 데이터가 중복되어 있지 않다 |
저장된 데이터 | 저장 매체에 저장되어 있다 |
변화하는 데이터 | 최신의 정확한 데이터로 변경해 유지한다 |
데이터베이스 활용
OLTP : 데이터를 수시로 갱신 (거래단위)
OLAP : 다차원 데이터를 대화식으로 분석
CRM : 고객 관련 자료 분석, 마케팅 활용
SCM : 공급망 연결 최적화
ERP : 기업 경영 자원을 효율화
BI : 기업 보유 데이터 정리, 분석하여 리포트 중심 도구
BA :통계 기반 비즈니스 통찰력
Block Chain : 네트워크 참여한 모든 사용자가 정보를 분산, 저장
KMS : 기업의 모든 지식을 포함
데이터베이스의 종류
관계형 데이터베이스(RDB)
NoSQL : 비관계형 데이터베이스
계층형 DBMS
네트워크형 DBMS
분산형 DBMS
객체지향 DBMS
반응형
'테크 > Data Analysis' 카테고리의 다른 글
ADsP 2단원 데이터 분석 기획 1장 데이터 분석 기획 정리 (1) | 2025.02.15 |
---|---|
ADsP 1과목 데이터 이해 2장 빅데이터의 이해 정리 (0) | 2025.02.13 |
KPI란? (Key Performance Indicator의 개념과 중요성) (0) | 2025.01.31 |
Tableau desktop specialist /certified data analyst 신청 방법 (0) | 2025.01.10 |
[데이터 분석] EDA의 개념 (0) | 2024.08.14 |