DIVERSITY IS GOOD
DIVERSITY IS GOOD
반응형

ADsP 14

ADsP 2단원 데이터 분석 기획 1장 데이터 분석 기획 정리

1. 분석 기획 분석 기획의 정의 실제 분석을 수행하기 전 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 것 분석 주제 분석 대상분석 방법발견XX통찰XO솔루션OX최적화OO 분석 기획 시 고려사항 1) 가용 데이터 고려2) 적절한 활용 방안과 유스케이스의 탐색3) 장애요소에 대한 사전 계획 수립  분석 방법론 주어진 과제를 해결하기 위해 조직이 어떠한 절차로 작업을 수행할 것인지 일련의 절차를 정의 분석 방법론 구성 요소 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물 분석 방법론 모델 폭포수 모델프로토타입 모델나선형 모델계층적 프로세스 모델 KDD 분석 방법론 데이터셋 선택 → 데이터 전처리 → 데이터 변환 → 데이터 마이닝 → 데이터 마이닝 평가 C..

ADsP 1과목 데이터 이해 2장 빅데이터의 이해 정리

1. 빅데이터의 이해 빅데이터의 정의 큰 용량과 복잡성으로 기존 툴로는 다루기 어려운 데이터셋의 집합 빅데이터의 특징 3V + 4V3V : 양(Volume), 유형(Variety), 증가(Velocity)4V : 가치(Value), 정확성(Veracity), 시각화(Visualization), 가변성(Variablility) 빅데이터의 출현 배경 과학기술의 발달과 스마트폰의 보급, 클라우드 환경과 분산 컴퓨팅을 통한 비용 절감, 산업계와 학계의 발전과 변화 빅데이터의 기능 및 기대 비유 21세기 원유, 렌즈, 플랫폼 빅데이터가 만들어내는 변화전후표본조사전수조사사전처리사후처리질양인과관계상관관계 빅데이터 가치 산정이 어려운 이유데이터 활용 방식특정 데이터를 누가, 언제, 어떻게, 어디서 활용하는지 알 수 없..

ADsP 1과목 데이터 이해 - 1장 데이터의 이해 정리

01 데이터와 정보 1. 데이터의 정의 데이터 : 있는 그대로의 사실, 가공되지 않은 자료정보 : 가공된 자료 데이터의 특성존재적 특성데이터는 있는 그대로의 객관적 사실당위적 특성데이터는 추론, 예측, 전망, 추정을 위한 근거   2. 데이터의 유형 정성적 데이터주관적이거나 서술적인 데이터언어, 문자 등정량적 데이터기준이 명확해 객관적 평가가 가능한 데이터수치, 도형, 기호 등정형 데이터정형화된 틀이 있고 연산이 가능CSV, 엑셀 스프레드 시트 등반정형 데이터정형화된 틀이 없고 연산이 불가능*로그*, XML, JSON, 센서 데이터 등비정형 데이터형태는 있지만 연산이 불가능소셜 데이터, 댓글, 영상, 음성 등  암묵지와 형식지 암묵지 : 개인에게 습득되어 있지만 겉으로 드러나지 않은 상태의 지식형식지 :..

[데이터 분석] EDA의 개념

AI를 활용하기 위해서는 우선적으로 데이터와 친밀해지는 것이 매우 좋다. 데이터를 잘 다루기 위해서는 진행 과정에 대해 알 필요성이 있다.  EDA(Exploratory Data Analysis)는 벨연구소의 수학자인 존 튜키가 개발한 데이터분석에 대한 개념으로, 데이터를 분석하고 결과까지의 과정 중에 어떻게 데이터를 이해하고 활용하는지에 대해서 알려주고 있다.이 과정중에서 데이터를 이해하고 의미 있는 관계를 찾아내기 위해 데이터의 통계값과 분포 등을 시각화하고 분석하는 방법에 대해서도 알 수 있다. 이는 데이터 분석에 있어서 초기 분석 단계이며 데이터를 분석하고 결과를 내는 과정에 있어 가장 기본적인 단계이기 때문에 매우 중요한 단계이다.EDA의 필요성데이터에서 어떠한 insight를 얻기 위해서는 데..

반응형