A.I/Study
통계적 가설 검정(statistical hypothesis test)
궁선이
2019. 1. 22. 17:05
통계적 가설 검정(statistical hypothesis test)
0. 정의
- 통계적 추측의 하나로서, 모집단 실제의 값이 얼마가 된다는 주장과 관련해, 표본의 정보를 사용해서 가설의 합당성 여부를 판정하는 과정을 의미한다.
1. 유의확률(p-value)
- Probability value
- 귀무가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 같거나 더 극단적인 통계치가 관측될 확률
- 관찰된 데이터가 귀무가설과 양립하는 정도를 0에서 1 사이의 수치로 표현한다.
- p-value가 작을수록 그 정도가 약하다고 보며, 유의수준 (대개 0.05나 0.01 등) 보다 작을 경우 귀무가설을 기각하고 대립가설을 채택하는 것이 관례이다.
양측 꼬리 유의 확률
우측 꼬리 유의 확률
2. 귀무가설(H0)
- Null Hypothesis
- 부정하고자 하는 주장
- 의미있는 차이가 없거나, 보수적인 주장.
- 이것이 맞거나 맞지 않다는 통계학적 증거를 통해 증명하려는 가설이다.
- ex) 한국 남성의 평균 신장은 175cm이다.
3. 대립가설(H1)
- 귀무가설 과 반대되는 가설
- 연구자가 연구를 통해 입증되기를 기대하는 예상이나 주장하는 내용
- 우리가 적극적으로 입증하려는 주장, 차이가 있음을 통계적 근거를 통해 입증하고자 하는 주장
- ex)
- 제 1형 양측검정: 한국 남성의 평균 신장은 175cm 이 아니다. ( 신장 != 175cm )
- 제 2형 좌측검정: 한국 남성의 평균 신장은 175cm 보다 작다. ( 신장 < 175cm )
- 제 3형 우측검정: 한국 남성의 평균 신장은 175cm 보다 크다. ( 신장 > 175cm )
4. 유의수준(α)
- 오류를 허용할 범위
- 유의확률이 유의수준보다 작다면 보통은 귀무가설을 기각한다 and 대립가설을 채택한다.
- 유의확률이 유의수준보다 크다면 보통은 귀무가설을 채택한다 and 대립가설을 기각한다.
5. 예제
- 유의확률 = 0.03
- 유의수준 = 0.05
- 귀무가설 : 한국 남성의 평균 신장은 175cm 이다.
- 대립가설 : 한국 남성의 평균 신장은 175cm 보다 작다.
- 결과 : 유의확률이 유의수준 보다 작으므로, 한국 남성의 평균 신장은 175cm 보다 작다고 본다.
6. 오류
구분 | H0 True | H0 False |
---|---|---|
H0 채택 | Valid | 2종 오류 |
H0 기각 | 1종 오류 | Valid |
1. 1종 오류
- 귀무가설이 참인데도 귀무가설을 기각하는 경우
- ex) 한국 남성의 평균 신장이 2m 이하인게 분명한데도 잘못된 표본을 토대로 평균 신장이 2m 가 넘는다고 주장하는 학자
2. 2종 오류
- 귀무가설이 거짓인데도 귀무가설을 채택하는 경우
- ex) 한국 남성의 평균 신장이 150cm 이상인게 분명한데도 잘못된 표본을 토대로 평균 신장이 150cm 가 안된다고 주장하는 학자