DIVERSITY IS GOOD
DIVERSITY IS GOOD

테크/Data Analysis

ADsP 3단원 데이터 분석 2장 통계분석2 정리

diversity is good 2025. 2. 20. 00:53
반응형

1. t-검정

 

일 표본 t-검정 (One sample t-test)

 

하나의 모집단의 평균(n)값을 특정 값과 비교하는 경우 사용

 

일 표본 단측 t-검정

 

모수값이 "~보다 크다" 혹은 "~보다 작다"와 같이 한쪽의 방향성을 갖는 경우 수행

 

일 표본 양측 t-검정

 

모수값이 "~이다" 혹은 "~이 아니다"와 같이 방향성이 없는 경우 수행

 

이(독립) 표본 t-검정(Independent sample t-test)

 

서로 독립적인 두 개의 집단에 대하여 모수(모평균)의 값이 같은 값을 갖는지 통계적으로 검정하는 방법

 

이 표본 단측 t-검정

 

두 집단에 대하여 모수 비교를 할 때 "~이 ~보다 크다" 혹은 "~이 ~보다 작다"와 같이 두 집단 사이에 대소가 있는 경우 수행

 

이 표본 양측 t-검정

 

두 집단에 대하여 모수 비교를 할 때 "두 집단이 같다" 혹은 "두 집단이 다르다"와 같이 두 집단 사이에 대소가 없는 경우 수행

 

대응 표본 t-검정

 

동일 대상에 대해 두 가지 관측치가 있는 경우 이를 비교하여 차이가 있는지 검정

주로 실험 전후의 효과를 비교

 

분산 분석

 

세 개 이상의 모집단이 있을 경우에 여러 집단 사이의 평균을 비교 검정

세 가지 가정 사항 요구 : 정규성, 등분산성, 독립성

F-value : 집단 간 분삭 / 집단 내 분산

 

일원분산분석

 

셋 이상의 집단 간 평균을 비교하는 상황에서 하나의 집단에 속하는 독립변수와 종속변수 모두 한 개 일 때 사용

 

이원분산분석

 

일원분산분석 수행시 독립변수가 두 개 이상일 때검정 (One sample t-test)

하나의 모집단의 평균(n)값을 특정 값과 비교하는 경우 사용

 

일 표본 단측 t-검정

 

모수값이 "~보다 크다" 혹은 "~보다 작다"와 같이 한쪽의 방향성을 갖는 경우 수행

 

일 표본 양측 t-검정

 

모수값이 "~이다" 혹은 "~이 아니다"와 같이 방향성이 없는 경우 수행

 

이(독립) 표본 t-검정(Independent sample t-test)

 

서로 독립적인 두 개의 집단에 대하여 모수(모평균)의 값이 같은 값을 갖는지 통계적으로 검정하는 방법

 

이 표본 단측 t-검정

 

두 집단에 대하여 모수 비교를 할 때 "~이 ~보다 크다" 혹은 "~이 ~보다 작다"와 같이 두 집단 사이에 대소가 있는 경우 수행

 

이 표본 양측 t-검정

 

두 집단에 대하여 모수 비교를 할 때 "두 집단이 같다" 혹은 "두 집단이 다르다"와 같이 두 집단 사이에 대소가 없는 경우 수행

 

대응 표본 t-검정

 

동일 대상에 대해 두 가지 관측치가 있는 경우 이를 비교하여 차이가 있는지 검정

주로 실험 전후의 효과를 비교

 

 

2. 분산 분석

분산 분석

 

세 개 이상의 모집단이 있을 경우에 여러 집단 사이의 평균을 비교 검정

세 가지 가정 사항 요구 : 정규성, 등분산성, 독립성

F-value : 집단 간 분삭 / 집단 내 분산

 

일원분산분석

 

셋 이상의 집단 간 평균을 비교하는 상황에서 하나의 집단에 속하는 독립변수와 종속변수 모두 한 개 일 때 사용

 

이원분산분석

 

일원분산분석 수행시 독립변수가 두 개 이상일 때

 

 

3. 교차 분석

교차분석

 

범주형 자료 간의 관계를 알아보고자 할 때 사용

카이제곱($x^{2}$) 검정통계량을 이용

적합도 검정, 독립성 검정, 동질성 검정에 사용

 

적합도 검정

 

실험결과 얻어진 관측값이 예상값과 일치하는지 여부를 검정

 

적합도 검정에서의 가설

 

$H_{0}$ : 실제 분포와 예측 분포 간에 차이가 없다 → 두 분포가 일치한다

$H_{1}$ : 실제 분포와 예측 분포 간에 차이가 있다 → 두 분포가 일치하지 않는다

 

독립성 검정

 

모집단이 두 개의 변수에 의해 범주화 됐을 때 그 두 변수들 사이의 관계가 독립적인지 아닌지 검정

 

동질성 검정

 

관측값들이 정해진 범주 내에서 서로 비슷하게 나타나고 있는지를 검정

 

 

4. 상관 분석

상관 분석

 

두 변수간의 선형적 관계가 존재하는지 알아보는 분석 방법

 

피어슨 상관 분석 (선형적 상관 관계)

 

모수적 방법의 하나로 두 변수가 모두 정규 분포를 따른다는 가정이 필요

$$\gamma_{xy}=\frac{\sum_{i}^{n}(X_{i}-\hat{X})(Y_{i}-\hat{Y})}{\sqrt{\sum_{i}^{n}(X_{i}-\hat{X})^{2}\sum_{i}^{n}(Y_{i}-\hat{Y})^{2}}}$$

 

스피어만 상관 분석(비선형적 상환 관계)

 

측정된 두 변수들이 서열 척도일 때 사용하는 상관계수

반응형