신뢰구간
표집 오차 (Sampling Error)
- 모집단과 표본 다르기 때문에 생기는, 표본 추정값과 실제 모수와의 차이.
- 예시:
- 모집단 (6면체 주사위) 평균 = 3.5
- 표본 (주사위 10개 굴림, 합 26) 평균 = 2.6
- 표집 오차 = 2.6 - 3.5 = -0.9
- 측정 오차는 줄일 수 있음(더 정확한 도구 등)
- 표집 오차는 표집의 확률적 성격 때문에 발생 → 없앨 수 없음
- 오차범위(margin of error): 표집 오차가 발생하는 범위
- 예: 주사위 굴리기의 경우 ±2.5
신뢰구간 (Confidence Interval, CI)
- 대표적 구간 추정 방법.
- 계산:
신뢰구간 = 통계량 ± 오차범위 - 오차 범위: 신뢰수준, 표본 크기, 데이터 변산성 등 고려하여 이론적으로 유도하여 사용.
평균의 신뢰구간
- 모든 통계량(중간값, 비율 등)에 신뢰구간 존재.
- 특히 평균의 경우, 이론적으로 신뢰구간 간단히(정규분포/t-분포 이용) 구할 수 있음.
- 예시: 평균의 95% 신뢰구간 계산 (pingouin 패키지 사용)
import pingouin as pg
pg.ttest(df.price, 0, confidence=0.95)- 결과 표에서
CI95%항목 확인 (예:[814.1, 893.22]) - 해석: df.price의 모평균은 95% 신뢰수준에서 814.1 ~ 893.22 사이에 있을 것으로 추정됨.
- 결과 표에서
퀴즈
사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.