작성일자 : 2023-12-01
Ver 0.1.1
0.Intro
학부생시절 통계학을 공부하면서부터 수없이도 많이 들어온 가설 검정.
헷갈릴만한 통계 용어도 꽤나 많이 등장하고, 우리 실생활에서도 리서치 등에서 사용되는 방법이므로 개념 확립을 위해 정리할 필요성이 있어 가설 검정의 과정에 대해서 정리해보고자 한다.
이번 포스팅은 귀무가설과 대립가설에 대한 내용이다.
- 귀무가설, 대립가설 수립
- 유의수준 확인
- 귀무가설 하에 검정통계량 계산
- 검정통계량으로 p-value 계산
- 귀무가설 기각 여부 결정(채택/기각)
-> 가설검정은 검정통계량을 구해 귀무가설을 채택할 것인지 기각할 것인지 판단하는 과정
1. p-value (유의확률) 그리고 유의수준과의 차이점
유의확률(Significance Probability)은 귀무가설이 옳다고 가정했을 때, 통계치가 관측될 확률이고, p-value라고 부른다.
지난 포스팅에서 유의 수준에 대해서 살펴보았다.
유의수준은 귀무가설을 기각하거나 채택하는 기준이 되는 확률로 제 1종 오류의 위험성을 부담하는 최대 확률로 α(알파)라고 부르며 0.05의 값으로 주로 사용한다.
이제 유의수준과 유의확률을 비교하여 귀무가설을 채택하거나 기각할 수 있다.
결론을 먼저 이야기하자면, 유의확률(p-value)이 유의수준(α)인 0.05보다 작다면 귀무가설을 기각하고 대립가설을 채택한다.
그 이유는 어떤 사건이 우연히 발생할 확률이 0.05보다 작을 가능성은 거의 없으며, 만약 발생하더라도 그것은 우연히 일어난 것(귀무가설)이 아니라 유의(대립가설)했기 때문에 일어났다고 해석한다.
따라서 귀무가설을 기각하고, 대립가설을 채택하는 것이다.
그림을 통해 유의 수준과 유의 확률에 대해서 이해해보도록 하자.
(단측검정)
위 그래프는 표준정규분포를 가정으로 한 검정이고, 빨간색 빗금 부분은 유의확률(p-value)의 면적이다.
만약 왼쪽 사진과 같이 빨간색 유의확률(p-value)의 면적이 하늘색 유의수준(α)인 0.05보다 작다면 귀무가설을 기각하고, 대립가설을 채택한다.
반대로 오른쪽 사진과 같이 빨간색 유의확률(p-값)의 면적이 하늘색 유의수준(α)인 0.05보다 크다면 귀무가설을 기각하지 못하고, 채택한다.
(양측검정)
양측검정의 유의확률(p-value)에 관한 해석은 단측검정의 유의확률(p-value)과 동일한데요. 단 한 가지 다른 점은 양측검정의 경우, 앞서 계산한 유의수준(α)인 0.05를 반으로 나눈 값인 0.025와 유의확률(p-값)을 비교하여 귀무가설을 채택할지 기각할지 결정해 준다는 것이다.
하지만 앞선 두 개의 값인 0.025와 유의확률(p-value)에 각각 2씩 곱해준다면, 0.05와 2*유의확률(2를 곱한 p-value)이 된다. 이러한 계산을 한다면, 유의수준(α)을 0.05로 맞춰줄 수 있다는 장점이 생기게 되는 것이다.
즉, 양측검정의 유의확률(p-값)에 2를 곱하여 0.05의 유의수준(α)과 비교해 준다는 것이 차이점이다.
2. 귀무가설 기각 여부 결정
앞서 유의확률(p-value)는 귀무가설이 옳다고 가정했을때, 통계치가 관측될 확률이라고 했다.
그리고 유의수준은 귀무가설을 기각하거나 채택하는 기준이자, 제 1종 오류( = 귀무가설이 참일 때, 이를 기각할 확률)의 위험성을 부담하는 최대 확률로 보통 0.05의 값으로 주로 사용한다.
이에 검정 통계량에 의해 구해진 유의확률(p-value)이 유의 수준보다 작다면 귀무가설을 채택한다.
유의수준이 0.05라고 했을 때, 유의확률(p-value)이 유의 수준보다 작다면 귀무 가설의 사건이 우연히 발생할 확률이 0.05보다 작은 확률로 발생한다는 의미로 해석한다.
이에 p-value에 따른 귀무가설 채택 여부를 정리하면 아래와 같다.
- p-value이 높은 경우: 귀무 가설이 참일 가능성이 높다
- p-value이 낮은 경우: 귀무 가설이 참일 가능성이 낮다.