신뢰구간 추정
지난 포스팅에서는 유의확률과 유의수준을 통해서 유의성 검증의 원리를 설명했는데요.
오늘은 신뢰구간에 대해서 이야기해볼까 합니다.
1. 표준정규분포와 확률밀도함수
위의 그래프는 평균이 0이고 분산이 1인 정규분포, 즉 표준정규분포(standard normal distribution)입니다.
표준정규분포는 신뢰구간을 추정하는 데 중요한 요소입니다.
이 그래프의 특징은 X축과 그래프 사이의 면적이 총 1(=100%)이 된다는 점인데요.
이는 확률밀도함수(probability density function)으로 구할 수 있죠.
이러한 확률밀도함수를 바탕으로 표준정규분포는 매우 흥미로운 정보를 제공합니다!
평균(0)에서 좌우로 1표준편차에 해당하는 면적은 전체의 68.27%이고
평균(0)에서 좌우로 2표준편차에 해당하는 면적은 전체의 95.45%이죠.
평균에서 95%가 되는 구간은 -1.96과 +1.96의 사이이며,
평균에서 99%가 되는 구간은 -2.57과 +2.57의 사이입니다!
2. 신뢰수준과 신뢰구간의 추정
이때 95%, 99%의 범위은 신뢰수준이 됩니다.
신뢰수준(confidential level)은 추정치가 모수를 포함할 가능성의 의미하죠.
그럼 이를 활용해서 신뢰구간(condifential interval)을 추정해보도록 하죠.
신뢰구간이란 주어진 신뢰수준에서 추정치가 모수를 포함하는 구간을 의미합니다.
이를 구하는 공식은 위와 같습니다. 표본평균을 모평균으로 빼고, 그 값을 표본 수의 제곱근으로 나눈 표준편차로 나누는 것이죠.
이 공식을 이용해 모수에 관한 가설을 세우고, 표본평균을 바탕으로 신뢰구간을 구해서 가설을 검증할 수 있습니다.
쉽게 이해하기 위해서는 예시를 생각해보는 것이 좋습니다!
고등학생 1학년 남학생의 키를 연구하는데, 모평균를 175cm로 추정했다고 해보죠.
이때 어느 한 학교의 고등학교 1학년 학생 100명을 표본으로 추출하여 측정을 했더니
표본평균이 100, 표준편차가 7.5가 나왔다고 해보겠습니다.
이 상황에서 신뢰수준 95%에서 신뢰구간을 추정하게 되면 다음과 같은 계산이 나오게 됩니다.
공식을 이용해 95% 신뢰수준의 신뢰구간을 구해보면 모평균는 168.53보다 크거나 171.47보다 작아야 합니다.
그렇게 때문에 이러한 표본에 따르면 모평균이 175cm라는 가설을 기각할 수 있게 되는 것입니다!
이렇게 해서 유의성 검정과 신뢰구간 검정을 모두 다루었네요~!
다음 기초통계 포스팅에서는 그 동안 지나친 다른 기초적인 개념들을 다루도록 하겠습니다. 감사합니다^^
'방법론 및 논문 쓰기' 카테고리의 다른 글
확실성과 고유성 그리고 네 가지 검증 (0) | 2023.12.29 |
---|---|
유의수준과 유의확률 (1) | 2023.11.20 |
영가설과 대립가설 & 통계의 원리 (0) | 2023.11.17 |
국제관계학 분야 국내 SSCI 학술지 (2) | 2023.11.16 |
구간 변수, 비율 변수, 이항변수/더미변수 (0) | 2023.11.15 |
댓글