DIVERSITY IS GOOD
DIVERSITY IS GOOD
반응형

분류 전체보기 104

ADsP 3단원 데이터 분석 2장 통계분석1 정리

1. 통계 개요전수조사, 표본조사 전수조사 : 전체를 다 조사, 시간 & 비용 ↑표본조사 : 표본집단만 선별해 조사 표본 추출 방법 단순 랜덤 추출법 : n개의 데이터를 무작위로 추출계통 추출법 : 모딥단의 원소에 차례대로 번호를 부여한 뒤 일정 간격을 두고 추출집락 추출법(군집 추출법) : 군집은 서로 비슷하고, 군집 내 데이터는 서로 이직적층화 추출법 : 군집이 서로 다르고 군집 내 데이터는 서로 동질적복원 추출, 비복원 추출 척도 질적 척도 : 명목 척도, 순서 척도(서열 척도)양적 척도 : 구간 척도(등간 척도), 비율 척도 기초 통계 평균 = 기댓값중앙값최빈값 : 가장 빈번하게 등장하는 겂분산 : 자료들이 퍼진 정도표준편차 : 분산의 제곱근공분산 : 두 변수의 상관관계    - 공분산 = 0 :..

ADsP 3단원 데이터 분석 1장 R과 데이터 마트 정리

R은 이제 잘 안나오는 추세라고 하니 간단하게 하고 넘어갑니다. 1. R 대입연산자, 비교 연산자, 산술 연산자정규분포, 표본추출 R 데이터 구조 벡터, 행렬, 배열, 리스트, 데이터 프레임 데이터 전처리 요약변수파생변수 R에서의 데이터 전처리 패키지 reshape : melt로 데이터를 녹이고 cast로 재구조화sqldf : sql로 데이터를 다룸plyt : apply 함수 기반data.table : table 데이터 구조  2. 데이터 마트 데이터 마트 작은 규모의 데이터 웨어하우스로 사용자가 원하는 방향으로 데이터를 수집, 변형, 적재한 것 3. EDA(탐색적 자료 분석) EDA 데이터를 이해하고 의미있는 관계를 찾아내기 위해 시각화하고 파악하는 것 결측값 존재하지 않는 데이터NA, Null, 공백..

ADsP 2단원 데이터 분석 기획 2장 분석 마스터플랜 정리

1. 마스터 플랜 수립 분석 마스터 플랜 어떤 하나의 분석 프로젝트를 위한 전체 설계도수립 → 수행 과제 도출 및 우선순위 평가 → 이행 계획 수립 분석 마스터 플랜 수립 프레임 워크우선 순위 고려 요소전략적 중요도비즈니스 성과 / ROI실행 용이성↓적용 우선순위 설정↓적용 범위 / 방식 고려 요소업무 내재화 적용 수준분석 데이터 적용 수준기술 적용 수준 수행 과제 도출 및 우선순위 평가 1) 일반적인 IT 프로젝트 우선 순위 평가    - 전략적 중요도, 실행 용이성을 고려 2) 빅데이터의 특징을 고려한 분석 ROI 요소    - 투자 비용 요소 : 3V (Volume 크기, Variety 다양성, Velocity 속도)    - 비즈니스 효과 : Value 가치 3) 우선 순위 평가 기준    - 난..

ADsP 2단원 데이터 분석 기획 1장 데이터 분석 기획 정리

1. 분석 기획 분석 기획의 정의 실제 분석을 수행하기 전 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 것 분석 주제 분석 대상분석 방법발견XX통찰XO솔루션OX최적화OO 분석 기획 시 고려사항 1) 가용 데이터 고려2) 적절한 활용 방안과 유스케이스의 탐색3) 장애요소에 대한 사전 계획 수립  분석 방법론 주어진 과제를 해결하기 위해 조직이 어떠한 절차로 작업을 수행할 것인지 일련의 절차를 정의 분석 방법론 구성 요소 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물 분석 방법론 모델 폭포수 모델프로토타입 모델나선형 모델계층적 프로세스 모델 KDD 분석 방법론 데이터셋 선택 → 데이터 전처리 → 데이터 변환 → 데이터 마이닝 → 데이터 마이닝 평가 C..

ADsP 1과목 데이터 이해 2장 빅데이터의 이해 정리

1. 빅데이터의 이해 빅데이터의 정의 큰 용량과 복잡성으로 기존 툴로는 다루기 어려운 데이터셋의 집합 빅데이터의 특징 3V + 4V3V : 양(Volume), 유형(Variety), 증가(Velocity)4V : 가치(Value), 정확성(Veracity), 시각화(Visualization), 가변성(Variablility) 빅데이터의 출현 배경 과학기술의 발달과 스마트폰의 보급, 클라우드 환경과 분산 컴퓨팅을 통한 비용 절감, 산업계와 학계의 발전과 변화 빅데이터의 기능 및 기대 비유 21세기 원유, 렌즈, 플랫폼 빅데이터가 만들어내는 변화전후표본조사전수조사사전처리사후처리질양인과관계상관관계 빅데이터 가치 산정이 어려운 이유데이터 활용 방식특정 데이터를 누가, 언제, 어떻게, 어디서 활용하는지 알 수 없..

20250212 운동일기

타깃 : 어깨 시티드 리어 래터럴 레이즈25kg 20reps35kg 20reps45kg 10reps25kg 20reps 밀리터리 프레스20kg 20reps40kg 20reps50kg 10reps50kg 5reps + 40kg 10reps 덤벨 숄더 프레스14kg 20reps 2sets14kg 15reps 2sets 사이드 래터럴 레이즈6kg 20reps 4sets 케이블 리어 래터럴 레이즈10kg 20reps(15kg 10reps + 10kg 10reps) 3sets 페이스풀35kg 20reps 4sets 덤벨 슈러그20kg 20reps(30kg 10reps + 20kg 10reps) 3sets

ADsP 1과목 데이터 이해 - 1장 데이터의 이해 정리

01 데이터와 정보 1. 데이터의 정의 데이터 : 있는 그대로의 사실, 가공되지 않은 자료정보 : 가공된 자료 데이터의 특성존재적 특성데이터는 있는 그대로의 객관적 사실당위적 특성데이터는 추론, 예측, 전망, 추정을 위한 근거   2. 데이터의 유형 정성적 데이터주관적이거나 서술적인 데이터언어, 문자 등정량적 데이터기준이 명확해 객관적 평가가 가능한 데이터수치, 도형, 기호 등정형 데이터정형화된 틀이 있고 연산이 가능CSV, 엑셀 스프레드 시트 등반정형 데이터정형화된 틀이 없고 연산이 불가능*로그*, XML, JSON, 센서 데이터 등비정형 데이터형태는 있지만 연산이 불가능소셜 데이터, 댓글, 영상, 음성 등  암묵지와 형식지 암묵지 : 개인에게 습득되어 있지만 겉으로 드러나지 않은 상태의 지식형식지 :..

20250210 운동일기

오늘부터는 한번 전신 웨이트가 돌아간 후이기 때문에 좀 더 본격적인 운동에 가까운 강도로 진행했다. 대신 좀더 세부적으로 나눠서 웨이트를 진행하여 각 근육군이 쉬는 날이 더 길어지도록 했다. 타깃 : 등 풀업10reps 4sets 바벨로우40kg 20reps60kg 15reps60kg 10reps 2sets 랫풀다운45kg 20reps60kg 10reps 3sets 슈퍼세트(벤트오버 풀다운 + 시티드 로우)45kg 20reps + 60kg 20reps 4sets 확실히 저번주에 해서 그런지 근육군의 움직임이 좀 더 좋아진 느낌이다. 다음주가 기대가 된다.

반응형