범주가 3개인 경우
범주가 3개인 경우
- ABC 순
A기준 설정됨. B,C대한 더미 변수 2개(TRT[T.B],TRT[T.C]) 생성.
| TRT | TRT[T.B] | TRT[T.C] |
|---|---|---|
| A | 0 | 0 |
| B | 1 | 0 |
| C | 0 | 1 |
- Python 결과 (
ols('y ~ TRT', dep).fit().summary()):Intercept: 기준(A)의 평균y(예: 62.3333).TRT[T.B]:B평균y-A평균y차이 (예: -10.4167).TRT[T.C]:C평균y-A평균y차이 (예: -11.0833).- B의 평균 y: Intercept + TRT[T.B] 계수 = 62.3333 - 10.4167 = 51.9166.
- C의 평균 y: Intercept + TRT[T.C] 계수 = 62.3333 - 11.0833 = 51.2500.
Python에서 기준 범주 바꾸기
C()함수와Treatment()사용.# model 변수의 기준 범주를 'K3'로 지정
ols('price ~ C(model, Treatment("K3"))', df).fit().summary()
퀴즈
사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.