Skip to main content

신뢰구간

표집 오차 (Sampling Error)

  • 모집단과 표본 다르기 때문에 생기는, 표본 추정값과 실제 모수와의 차이.
  • 예시:
    • 모집단 (6면체 주사위) 평균 = 3.5
    • 표본 (주사위 10개 굴림, 합 26) 평균 = 2.6
    • 표집 오차 = 2.6 - 3.5 = -0.9
  • 측정 오차는 줄일 수 있음(더 정확한 도구 등)
  • 표집 오차는 표집의 확률적 성격 때문에 발생 → 없앨 수 없음
  • 오차범위(margin of error): 표집 오차가 발생하는 범위
    • 예: 주사위 굴리기의 경우 ±2.5

신뢰구간 (Confidence Interval, CI)

  • 대표적 구간 추정 방법.
  • 계산: 신뢰구간 = 통계량 ± 오차범위
  • 오차 범위: 신뢰수준, 표본 크기, 데이터 변산성 등 고려하여 이론적으로 유도하여 사용.

평균의 신뢰구간

  • 모든 통계량(중간값, 비율 등)에 신뢰구간 존재.
  • 특히 평균의 경우, 이론적으로 신뢰구간 간단히(정규분포/t-분포 이용) 구할 수 있음.
  • 예시: 평균의 95% 신뢰구간 계산 (pingouin 패키지 사용)
    import pingouin as pg
    pg.ttest(df.price, 0, confidence=0.95)
    • 결과 표에서 CI95% 항목 확인 (예: [814.1, 893.22])
    • 해석: df.price의 모평균은 95% 신뢰수준에서 814.1 ~ 893.22 사이에 있을 것으로 추정됨.

퀴즈

사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

Q&A