작성일자 : 2023-12-11
Ver 0.1.1
1. 가설 설정 및 필요 module import
(대응표본)
H0 : after - before = 0 (양측) / after - before >= 0 or <= 0 (단측)
H1 : after - before != 0 (양측) / after - before < 0 or > 0 (단측)
(독립표본)
H0 : A = B (양측) / A <= B or A >= B (단측)
H1 : A != B (양측) / A > B or A < B (단측)
import pandas as pd
import numpy as np
import scipy.stats as stats
from scipy.stats import shapiro
2. 유의 수준 확인
일반적으로 유의 수준을 5%으로 하여 가설 검정을 한다.
3-1. (공통) 정규성 검정
Shapiro-Wilk 검정은 가설검정의 방법으로 데이터가 정규분포를 가지는 지에 대해 검정하는 방법이다.
Python에서 Shapiro-Wilk 검정을 수행하는 함수는 scipy 패키지의 stats 모듈의 shapiro() 함수가 있다.
(대응표본)
H0 : 정규분포를 따른다.
H1 : 정규분포를 따르지 않는다.
# 대응표본
stats.shapiro(after - before)
3-1. p-value가 0.05보다 크면 귀무가설 채택 ( = 정규분포를 따른다) -> 대응 표본 t-test
3-2. p-value가 0.05보다 작으면 귀무가설 기각 ( = 정규분포를 따르지 않는다) -> wilcoxon 부호순위 test
(단일표본)
H0 : 두 집단 모두 정규분포를 따른다.
H1 : 두 집단 중 하나라도 정규분포를 따르지 않는다.
stats.shapiro(A)
stats.shapiro(B)
3-1. 두 집단의 p-value가 0.05보다 크면 귀무가설 채택 ( = 두 집단 모두 정규분포를 따른다)-> 대응 표본 t-test
3-2. 두 집단의 p-value가 0.05보다 작으면 귀무가설 기각 ( = 두 집단 모두 정규분포를 따르지 않는다)-> wilcoxon ranksums test
3-2. (대응표본) 등분산성 검정
H0 : 등분산을 따른다.
H1 : 등분산을 따르지 않는다.
stats.barlett(A, B)
3-1 : p-value가 0.05보다 크면 귀무가설 채택 ( = 등분산을 따른다.) -> (정규성 충족 & 등분산 충족) t-test
3-2 : p-value가 0.05보다 작으면 귀무가설 기각 ( = 등분산을 따르지 않는다.) -> (정규성 충족 & 등분산 불충족) t-test
4. 검정실시 (검정 통계량, p-value)
2023.12.01 - [Data Analysis/Data & Statistics] - [Statistics] p-value (유의확률)
(대응표본)
# 4-1. (정규성 충족) t-test
stats.ttest_rel(after, before, alternative = 'two-sided' or 'greater' or 'less')
# 4-2. (정규성 불충족) wilcoxon
stats.wilcoxon(after - before , alternative = 'two-sided' or 'greater' or 'less')
(단일표본)
# (공통) 단측검정시 가설 설정에 따른 A,B 순서 중요
# 5-1. (정규성 충족 & 등분산 충족) t-test
stats.ttest_ind(A, B, equal_var = True, alternative = 'two-sided' or 'greater' or 'less')
# 5-2. (정규성 충족 & 등분산 불충족) t-test
stats.ttest_ind(A, B, equal_var = False, alternative = 'two-sided' or 'greater' or 'less')
# 5-3. (정규성 불충족) wilcoxon ranksums
stats.ranksums(A, B, alternative = 'two-sided' or 'greater' or 'less')
5. 귀무가설 기각여부 결정
검정 실시에서 구한 p-value가 유의수준인 0.05보다 크면 귀무가설 채택
검정 실시에서 구한 p-value가 유의수준인 0.05보다 작으면 귀무가설 기각 ( = 대립가설 채택)