DIVERSITY IS GOOD
DIVERSITY IS GOOD
반응형

EDA 2

ADsP 3단원 데이터 분석 1장 R과 데이터 마트 정리

R은 이제 잘 안나오는 추세라고 하니 간단하게 하고 넘어갑니다. 1. R 대입연산자, 비교 연산자, 산술 연산자정규분포, 표본추출 R 데이터 구조 벡터, 행렬, 배열, 리스트, 데이터 프레임 데이터 전처리 요약변수파생변수 R에서의 데이터 전처리 패키지 reshape : melt로 데이터를 녹이고 cast로 재구조화sqldf : sql로 데이터를 다룸plyt : apply 함수 기반data.table : table 데이터 구조  2. 데이터 마트 데이터 마트 작은 규모의 데이터 웨어하우스로 사용자가 원하는 방향으로 데이터를 수집, 변형, 적재한 것 3. EDA(탐색적 자료 분석) EDA 데이터를 이해하고 의미있는 관계를 찾아내기 위해 시각화하고 파악하는 것 결측값 존재하지 않는 데이터NA, Null, 공백..

[데이터 분석] EDA의 개념

AI를 활용하기 위해서는 우선적으로 데이터와 친밀해지는 것이 매우 좋다. 데이터를 잘 다루기 위해서는 진행 과정에 대해 알 필요성이 있다.  EDA(Exploratory Data Analysis)는 벨연구소의 수학자인 존 튜키가 개발한 데이터분석에 대한 개념으로, 데이터를 분석하고 결과까지의 과정 중에 어떻게 데이터를 이해하고 활용하는지에 대해서 알려주고 있다.이 과정중에서 데이터를 이해하고 의미 있는 관계를 찾아내기 위해 데이터의 통계값과 분포 등을 시각화하고 분석하는 방법에 대해서도 알 수 있다. 이는 데이터 분석에 있어서 초기 분석 단계이며 데이터를 분석하고 결과를 내는 과정에 있어 가장 기본적인 단계이기 때문에 매우 중요한 단계이다.EDA의 필요성데이터에서 어떠한 insight를 얻기 위해서는 데..

반응형
1