유의수준과 유의확률
지난 기초통계 포스팅에서는 영가설과 대립가설을 설명하면서
영가설을 기각하고 대립가설을 채택하는 통계 원리에 관해 설명했습니다!
*참고: 2023.11.17 - 영가설과 대립가설 & 통계의 원리
오늘은 통계의 원리를 좀 더 깊이 이해하기 위해 유의수준과 유의확률에 관해서 설명해보려 합니다!
먼저 아래 그림을 한번 보고 시작하겠습니다.
1. 유의수준(significant level, a)
유의수준과 유의확률은 모두 가설의 유의성(significance)를 검증할 때 사용하는데요.
유의수준과 유의확률을 비교해서 유의성 측면에서 가설의 통과 또는 기각을 결정하는 것이죠.
유의수준(significant level)은 통상 a(alpha)로 표현을 하고, 0.1, 0.05, 0.01(또는 10%, 5%, 1%)로 표현됩니다.
유의수준이 뜻하는 바는 다음과 같습니다(영가설을 바탕으로 대립가설을 검증하는 상황을 생각해보겠습니다).
- 영가설이 참이라면 관찰된 검정통계량은 (영가설을 바탕으로)예측한 정규분포 안에서 일정한 범위 안에 들어와야 한다(이를 신뢰구간이라고 하고, 이는 신뢰수준을 기반으로 정하게 됩니다).
- 그런데 만약 검정통계량이 예측한 정규분포에서 극단적인 값에 해당하는 경우, 예측(즉, 영가설)이 틀렸다는 의미가 된다.
- 따라서 검정통계량이 일정 수준 이상의 극단적인 값에 위치한다면, 영가설은 기각되고 대립가설을 지지하게 된다.
위의 설명에서 말하는 "일정 수준"이 바로 유의수준이 되는 것이죠.
만약 만약 영가설(H0)이 "평균=0"이라고 했을 때 평균이 0인 정규분포를 바탕으로 관찰된 값을 비교하게 되는데요.
관찰된 값이 1이라면, 1이 정규분포 안에서 얼마나 극단적인 값에 해당하는지를 확인하게 되죠.
이때 극단적인 수준에 대한 기준을 연구자가 세우는 것이 유의수준입니다!
따라서 유의수준은 연구자가
"관찰된 값이 일정 수준 이상으로 극단적일 경우 예측이 잘못된 것으로 판단하겠다"라고 할 때
그 일정 수준이 되는 것입니다.
2. 유의확률(significant probability, p-value)
연구자는 유의수준을 사전에 설정하고, 관찰된 값이 정규분포 안에서 얼마나 극단적인 값인지 확인하게 되는데,
실제 관찰된 값의 극단적인 수준이 유의확률(significant probability, p-value)가 됩니다!
쉽게 구분해서 유의수준과 유의확률 모두 어떤 값의 극단적인 수준을 보여주는 수치인데요.
유의수준은 연구자가 직접설명하는 값이고, 유의확률은 관찰값에 대한 계산을 통해 얻은 값이 됩니다.
유의확률(p-value)이 유의수준(a) 보다 작으면 영가설을 기각하고, 대립가설을 채택하게 되며,
유의확률이 유의수준보다 크면 영가설을 채택하고, 대립가설을 기각하게 됩니다!!
유의수준과 유의확률의 비교는 통계를 활용한 연구에서 가장 기본적으로 이루어지는 활동이기 때문에
통계의 원리에 이어서 바로 유의수준 & 유의확률 설명으로 넘어왔습니다.
무엇보다 실전에서 응용하는 것이 중요하기 때문이죠.
사회과학, 특히 정치학 전공을 하면서 통계를 사용할 때 세세한 통계의 원리를 이해하려고 하는 것보다는
먼저 어떻게 사용하는지를 알고, 그 원리는 차차 이해해나가는 것이 더 좋은 순서라고 개인적으로 생각합니다.
그래서 다음 포스팅에서는 실제 논문에서 유의수준과 유의확률이 어떻게 사용되는지 알아보도록 하겠습니다~!
감사합니다^^
'방법론 및 논문 쓰기' 카테고리의 다른 글
확실성과 고유성 그리고 네 가지 검증 (0) | 2023.12.29 |
---|---|
신뢰구간 추정 (2) | 2023.11.22 |
영가설과 대립가설 & 통계의 원리 (0) | 2023.11.17 |
국제관계학 분야 국내 SSCI 학술지 (2) | 2023.11.16 |
구간 변수, 비율 변수, 이항변수/더미변수 (0) | 2023.11.15 |
댓글