Skip to main content

신뢰구간

표집 오차 (Sampling Error)

모집단과 표본 다르기 때문에 생기는, 표본 추정값과 실제 모수와의 차이.
예시:
- 모집단 (6면체 주사위) 평균 = 3.5
- 표본 (주사위 10개 굴림, 합 26) 평균 = 2.6
- 표집 오차 = 2.6 - 3.5 = -0.9
측정 오차는 줄일 수 있음(더 정확한 도구 등)
표집 오차는 표집의 확률적 성격 때문에 발생 → 없앨 수 없음
오차범위(margin of error): 표집 오차가 발생하는 범위
- 예: 주사위 굴리기의 경우 ±2.5

신뢰구간 (Confidence Interval, CI)

대표적 구간 추정 방법.
계산: 신뢰구간 = 통계량 ± 오차범위
오차 범위: 신뢰수준, 표본 크기, 데이터 변산성 등 고려하여 이론적으로 유도하여 사용.

평균의 신뢰구간

모든 통계량(중간값, 비율 등)에 신뢰구간 존재.
특히 평균의 경우, 이론적으로 신뢰구간 간단히(정규분포/t-분포 이용) 구할 수 있음.
예시: 평균의 95% 신뢰구간 계산 (pingouin 패키지 사용)
```
import pingouin as pg
pg.ttest(df.price, 0, confidence=0.95)
```
- 결과 표에서 CI95% 항목 확인 (예: [814.1, 893.22])
- 해석: df.price의 모평균은 95% 신뢰수준에서 814.1 ~ 893.22 사이에 있을 것으로 추정됨.

퀴즈

사용자 정보 입력

퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

이름

별명

소속

Q&A

표집 오차 (Sampling Error)
신뢰구간 (Confidence Interval, CI)
평균의 신뢰구간
퀴즈
Q&A