통계적 가설검정 (2)
신뢰구간과 p-value 영향 요소 비교
- 표본 크기, 모집단 변산성은 둘 다 비슷하게 영향 줌.
- 신뢰수준 vs. 유의수준:
- 신뢰구간은 신뢰수준 따라 폭 달라짐.
- p-value 자체는 유의수준 영향 안 받음 (계산 후 유의수준과 비교).
- 귀무가설과의 차이:
- p-value는 귀무가설과의 차이 클수록 작아짐.
- 신뢰구간은 모수에 대한 가설 없음. 그 자체가 모수에 대한 구간 추정치.
통계적 유의함 (Statistical Significance)
- 의미: 통계적 가설검정에서 귀무가설 기각하는 경우 ("통계적으로 유의하다").
- 해석: 관찰된 관계/차이가 단순 우연(표집 오차)만으로 설명되기 어렵다는 의미. (표본 크기 고려 시, 뭔가 의미 있는 차이가 있을 가 능성 시사)
- 주의: 통계적 유의함 ≠ 현실적 유의함 (Practical Significance)
- 통계적 유의함은 표본 크기 영향 받음. 표본 크 매우 크면, 현실적으로 아주 작은 차이도 통계적으로 유의하게 나옴.
- 현실적 유의함은 결과의 실제 중요성, 의미, 가치에 대한 주관적 판단 필요.
- 예: 평균 수명 하루 연장 치료제 (통계적 유의 O), 단 가격 10억원 (현실적 유의 X).
1종 오류와 2종 오류
가설검정: 귀무가설 기각 | 가설검정: 귀무가설 기각 실패 | |
---|---|---|
실제: 참 | 1종 오류 (α) False Positive (임신 아닌데 임신 진단) | 정확한 판단 True Negative |
실제: 거짓 | 정확한 판단 (검정력, 1-β) True Positive | 2종 오류 (β) False Negative (임신인데 임신 아님 진단) |
- 1종 오류: 실제 참인 귀무가설을 잘못 기각 (오판 확률 = α).
- 2종 오류: 실제 거짓인 귀무가설을 잘못 기각 실패 (오판 확률 = β).