DIVERSITY IS GOOD
DIVERSITY IS GOOD
반응형

테크 34

ADsP 3단원 데이터 분석 1장 R과 데이터 마트 정리

R은 이제 잘 안나오는 추세라고 하니 간단하게 하고 넘어갑니다. 1. R 대입연산자, 비교 연산자, 산술 연산자정규분포, 표본추출 R 데이터 구조 벡터, 행렬, 배열, 리스트, 데이터 프레임 데이터 전처리 요약변수파생변수 R에서의 데이터 전처리 패키지 reshape : melt로 데이터를 녹이고 cast로 재구조화sqldf : sql로 데이터를 다룸plyt : apply 함수 기반data.table : table 데이터 구조  2. 데이터 마트 데이터 마트 작은 규모의 데이터 웨어하우스로 사용자가 원하는 방향으로 데이터를 수집, 변형, 적재한 것 3. EDA(탐색적 자료 분석) EDA 데이터를 이해하고 의미있는 관계를 찾아내기 위해 시각화하고 파악하는 것 결측값 존재하지 않는 데이터NA, Null, 공백..

ADsP 2단원 데이터 분석 기획 2장 분석 마스터플랜 정리

1. 마스터 플랜 수립 분석 마스터 플랜 어떤 하나의 분석 프로젝트를 위한 전체 설계도수립 → 수행 과제 도출 및 우선순위 평가 → 이행 계획 수립 분석 마스터 플랜 수립 프레임 워크우선 순위 고려 요소전략적 중요도비즈니스 성과 / ROI실행 용이성↓적용 우선순위 설정↓적용 범위 / 방식 고려 요소업무 내재화 적용 수준분석 데이터 적용 수준기술 적용 수준 수행 과제 도출 및 우선순위 평가 1) 일반적인 IT 프로젝트 우선 순위 평가    - 전략적 중요도, 실행 용이성을 고려 2) 빅데이터의 특징을 고려한 분석 ROI 요소    - 투자 비용 요소 : 3V (Volume 크기, Variety 다양성, Velocity 속도)    - 비즈니스 효과 : Value 가치 3) 우선 순위 평가 기준    - 난..

ADsP 2단원 데이터 분석 기획 1장 데이터 분석 기획 정리

1. 분석 기획 분석 기획의 정의 실제 분석을 수행하기 전 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 것 분석 주제 분석 대상분석 방법발견XX통찰XO솔루션OX최적화OO 분석 기획 시 고려사항 1) 가용 데이터 고려2) 적절한 활용 방안과 유스케이스의 탐색3) 장애요소에 대한 사전 계획 수립  분석 방법론 주어진 과제를 해결하기 위해 조직이 어떠한 절차로 작업을 수행할 것인지 일련의 절차를 정의 분석 방법론 구성 요소 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물 분석 방법론 모델 폭포수 모델프로토타입 모델나선형 모델계층적 프로세스 모델 KDD 분석 방법론 데이터셋 선택 → 데이터 전처리 → 데이터 변환 → 데이터 마이닝 → 데이터 마이닝 평가 C..

ADsP 1과목 데이터 이해 2장 빅데이터의 이해 정리

1. 빅데이터의 이해 빅데이터의 정의 큰 용량과 복잡성으로 기존 툴로는 다루기 어려운 데이터셋의 집합 빅데이터의 특징 3V + 4V3V : 양(Volume), 유형(Variety), 증가(Velocity)4V : 가치(Value), 정확성(Veracity), 시각화(Visualization), 가변성(Variablility) 빅데이터의 출현 배경 과학기술의 발달과 스마트폰의 보급, 클라우드 환경과 분산 컴퓨팅을 통한 비용 절감, 산업계와 학계의 발전과 변화 빅데이터의 기능 및 기대 비유 21세기 원유, 렌즈, 플랫폼 빅데이터가 만들어내는 변화전후표본조사전수조사사전처리사후처리질양인과관계상관관계 빅데이터 가치 산정이 어려운 이유데이터 활용 방식특정 데이터를 누가, 언제, 어떻게, 어디서 활용하는지 알 수 없..

ADsP 1과목 데이터 이해 - 1장 데이터의 이해 정리

01 데이터와 정보 1. 데이터의 정의 데이터 : 있는 그대로의 사실, 가공되지 않은 자료정보 : 가공된 자료 데이터의 특성존재적 특성데이터는 있는 그대로의 객관적 사실당위적 특성데이터는 추론, 예측, 전망, 추정을 위한 근거   2. 데이터의 유형 정성적 데이터주관적이거나 서술적인 데이터언어, 문자 등정량적 데이터기준이 명확해 객관적 평가가 가능한 데이터수치, 도형, 기호 등정형 데이터정형화된 틀이 있고 연산이 가능CSV, 엑셀 스프레드 시트 등반정형 데이터정형화된 틀이 없고 연산이 불가능*로그*, XML, JSON, 센서 데이터 등비정형 데이터형태는 있지만 연산이 불가능소셜 데이터, 댓글, 영상, 음성 등  암묵지와 형식지 암묵지 : 개인에게 습득되어 있지만 겉으로 드러나지 않은 상태의 지식형식지 :..

MySQL 비트 연산(Bitwise Operations) 완벽 가이드

MySQL에서 비트 연산(Bitwise Operations)은 데이터를 효율적으로 저장하고 조작할 수 있도록 해주는 강력한 기능 중 하나입니다. 특히 권한 관리, 상태 플래그, 다중 선택값 저장 등에 자주 사용됩니다. 이 튜토리얼에서는 MySQL에서 지원하는 비트 연산자와 활용 방법을 자세히 설명하겠습니다.1️⃣ 비트 연산자 개요MySQL에서 지원하는 주요 비트 연산자는 다음과 같습니다:연산자 설명 예제&비트 AND (둘 다 1일 때 1 반환)5 & 3 → 1``비트 OR (둘 중 하나가 1이면 1 반환)^비트 XOR (둘이 다를 때 1 반환)5 ^ 3 → 6~비트 NOT (비트를 반전)~5 → -6비트 왼쪽 시프트 (n비트 왼쪽 이동)5 >>비트 오른쪽 시프트 (n비트 오른쪽 이동)5 >> 1 → 2M..

테크/MySQL 2025.01.31

KPI란? (Key Performance Indicator의 개념과 중요성)

1. KPI의 정의KPI(Key Performance Indicator, 핵심 성과 지표)는 조직이나 개인이 특정 목표를 달성하기 위해 측정해야 하는 주요 지표입니다. 단순한 수치나 데이터가 아니라, 조직의 전략적 목표와 직접적으로 연결된 핵심 요소를 의미합니다.예시:온라인 쇼핑몰: 월 매출, 고객 재구매율, 장바구니 이탈률마케팅 팀: 웹사이트 방문자 수, 전환율, 이메일 클릭률인사팀: 직원 유지율, 신입사원 교육 기간, 직원 만족도2. KPI의 중요성KPI는 단순한 데이터가 아니라 의사결정과 성과 개선을 위한 핵심 도구입니다. 이를 통해 조직은 목표를 명확하게 설정하고, 지속적인 성과 개선을 도모할 수 있습니다.KPI의 주요 역할:목표 명확화: 조직이 달성해야 할 목표를 구체적으로 정의하는 데 도움을 ..

기본 SQL 문법 튜토리얼

SQL이란?SQL(Structured Query Language)은 데이터베이스를 관리하고 조작하기 위한 언어입니다. SQL을 사용하면 데이터를 삽입, 조회, 수정, 삭제하고 데이터베이스 구조를 정의할 수 있습니다. 이 튜토리얼에서는 SQL의 기본 문법을 살펴보고 간단한 예제를 통해 학습합니다.1. 데이터 조회 (SELECT)데이터베이스에서 데이터를 조회하려면 SELECT 문을 사용합니다.문법:SELECT 열1, 열2, ...FROM 테이블명WHERE 조건;예제:SELECT 이름, 나이FROM 학생WHERE 나이 > 20;위 쿼리는 학생 테이블에서 나이가 20보다 큰 학생의 이름과 나이를 조회합니다.키워드 설명:SELECT: 조회할 열을 지정.FROM: 데이터를 조회할 테이블 지정.WHERE: 조건을 설..

테크/MySQL 2025.01.25

예외 처리(Exception Handling): 안전한 코드 작성하기

소프트웨어 개발에서 예외(Exception)는 프로그램 실행 중에 발생하는 예기치 않은 상황을 의미합니다. 이러한 상황을 올바르게 처리하지 않으면 프로그램이 중단되거나 예기치 못한 동작을 할 수 있습니다. 따라서 예외 처리는 안전하고 신뢰할 수 있는 코드를 작성하는 데 필수적인 요소입니다. 이번 튜토리얼에서는 예외 처리의 기본 개념부터 효과적인 사용법까지 단계별로 알아보겠습니다.1. 예외(Exception)란 무엇인가?예외는 프로그램이 실행 중에 발생하는 오류 상황을 나타냅니다. 이는 파일이 존재하지 않거나 네트워크 연결이 실패하거나, 숫자를 0으로 나누는 경우와 같은 다양한 상황에서 발생할 수 있습니다. 예외는 보통 두 가지로 분류됩니다:Runtime Exception: 실행 중 발생하는 오류로, 프로..

테크/python basic 2025.01.25

파이썬 리스트 추가와 삭제

파이썬에서 리스트(List)는 데이터를 순서대로 저장할 수 있는 가장 기본적인 자료형 중 하나입니다. 리스트를 사용하면 데이터를 추가하거나 삭제하는 작업을 간단히 처리할 수 있습니다. 이 튜토리얼에서는 리스트에 요소를 추가하고 삭제하는 방법을 단계별로 설명하겠습니다.1. 리스트에 요소 추가하기리스트에 요소를 추가하는 방법은 여러 가지가 있습니다. 주요 메서드로는 append(), insert(), extend() 등이 있습니다.1.1 append() 메서드리스트의 끝에 요소를 추가합니다.# 예제fruits = ['apple', 'banana', 'cherry']fruits.append('orange')print(fruits) # ['apple', 'banana', 'cherry', 'orange']1...

테크/python basic 2025.01.22
반응형