A.I/Study

통계적 가설 검정(statistical hypothesis test)

궁선이 2019. 1. 22. 17:05

통계적 가설 검정(statistical hypothesis test)

0. 정의

  • 통계적 추측의 하나로서, 모집단 실제의 값이 얼마가 된다는 주장과 관련해, 표본의 정보를 사용해서 가설의 합당성 여부를 판정하는 과정을 의미한다.

1. 유의확률(p-value)

  • Probability value
  • 귀무가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 같거나 더 극단적인 통계치가 관측될 확률
  • 관찰된 데이터가 귀무가설과 양립하는 정도를 0에서 1 사이의 수치로 표현한다.
  • p-value가 작을수록 그 정도가 약하다고 보며, 유의수준 (대개 0.05나 0.01 등) 보다 작을 경우 귀무가설을 기각하고 대립가설을 채택하는 것이 관례이다.

양측 꼬리 유의 확률

우측 꼬리 유의 확률

2. 귀무가설(H0)

  • Null Hypothesis
  • 부정하고자 하는 주장
  • 의미있는 차이가 없거나, 보수적인 주장.
  • 이것이 맞거나 맞지 않다는 통계학적 증거를 통해 증명하려는 가설이다.
  • ex) 한국 남성의 평균 신장은 175cm이다.

3. 대립가설(H1)

  • 귀무가설 과 반대되는 가설
  • 연구자가 연구를 통해 입증되기를 기대하는 예상이나 주장하는 내용
  • 우리가 적극적으로 입증하려는 주장, 차이가 있음을 통계적 근거를 통해 입증하고자 하는 주장
  • ex)
    • 제 1형 양측검정: 한국 남성의 평균 신장은 175cm 이 아니다. ( 신장 != 175cm )
    • 제 2형 좌측검정: 한국 남성의 평균 신장은 175cm 보다 작다. ( 신장 < 175cm )
    • 제 3형 우측검정: 한국 남성의 평균 신장은 175cm 보다 크다. ( 신장 > 175cm )

4. 유의수준(α)

  • 오류를 허용할 범위
  • 유의확률이 유의수준보다 작다면 보통은 귀무가설을 기각한다 and 대립가설을 채택한다.
  • 유의확률이 유의수준보다 크다면 보통은 귀무가설을 채택한다 and 대립가설을 기각한다.

5. 예제

  • 유의확률 = 0.03
  • 유의수준 = 0.05
  • 귀무가설 : 한국 남성의 평균 신장은 175cm 이다.
  • 대립가설 : 한국 남성의 평균 신장은 175cm 보다 작다.
  • 결과 : 유의확률이 유의수준 보다 작으므로, 한국 남성의 평균 신장은 175cm 보다 작다고 본다.

6. 오류

구분H0 TrueH0 False
H0 채택Valid2종 오류
H0 기각1종 오류Valid

1. 1종 오류

  • 귀무가설이 참인데도 귀무가설을 기각하는 경우
  • ex) 한국 남성의 평균 신장이 2m 이하인게 분명한데도 잘못된 표본을 토대로 평균 신장이 2m 가 넘는다고 주장하는 학자

2. 2종 오류

  • 귀무가설이 거짓인데도 귀무가설을 채택하는 경우
  • ex) 한국 남성의 평균 신장이 150cm 이상인게 분명한데도 잘못된 표본을 토대로 평균 신장이 150cm 가 안된다고 주장하는 학자