Skip to main content

범주가 3개인 경우

범주가 3개인 경우

  • ABC 순 A 기준 설정됨.
  • B, C 대한 더미 변수 2개(TRT[T.B], TRT[T.C]) 생성.
TRTTRT[T.B]TRT[T.C]
A00
B10
C01
  • Python 결과 (ols('y ~ TRT', dep).fit().summary()):
    • Intercept: 기준(A)의 평균 y (예: 62.3333).
    • TRT[T.B]: B 평균 y - A 평균 y 차이 (예: -10.4167).
    • TRT[T.C]: C 평균 y - A 평균 y 차이 (예: -11.0833).
    • B의 평균 y: Intercept + TRT[T.B] 계수 = 62.3333 - 10.4167 = 51.9166.
    • C의 평균 y: Intercept + TRT[T.C] 계수 = 62.3333 - 11.0833 = 51.2500.

Python에서 기준 범주 바꾸기

  • C() 함수와 Treatment() 사용.
    # model 변수의 기준 범주를 'K3'로 지정
    ols('price ~ C(model, Treatment("K3"))', df).fit().summary()

퀴즈

사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

Q&A