작성일자 : 2023-12-14
Ver 0.1.1
1. 가설 설정 및 필요 module import
H0 : 두 변수간 선형관계가 존재하지 않는다.
H1 : 두 변수간 선형관계가 존재한다.
import pandas as pd
import numpy as np
from scipy.stats import pearsonr
# 상관분석을 할 2가지 변수 설정
x = x['col1']
y = y['col2']
print(x.head())
print(y.head())
2. 유의 수준 확인
일반적으로 유의 수준을 5%으로 하여 가설 검정을 한다.
3. 검정실시 (상관계수, 검정 통계량, p-value)
2023.12.01 - [Data Analysis/Data & Statistics] - [Statistics] p-value (유의확률)
r, pvalue = pearsonr(x,y)
# 1. 상관계수
print(round(r, 2))
# 2. p-value
print(round(pvalue,4))
# 통계량을 별도로 구해야 함 (T = r * root(n-2) / root(1-r-squared))
# r = 상관계수
# n = 데이터의 개수
4. 귀무가설 기각여부 결정
검정 실시에서 구한 p-value가 유의수준인 0.05보다 크면 귀무가설 채택
검정 실시에서 구한 p-value가 유의수준인 0.05보다 작으면 귀무가설 기각 ( = 대립가설 채택)