스크리닝

성공적인 스크리닝의 원칙

희소성(Sparsity)
- 파레토 원칙: 대부분의 변동은 소수의 입력 요인에 기인
- 스크리닝 실험은 이 원칙에 의존해 적은 실행으로 많은 요인 탐색
- 80-20 규칙: 요인 20%로 변동성의 80% 설명 가능
계층구조(Hierarchy)
- 1차 효과(주효과)가 2차 효과(교호작용, 이차항)보다 일반적으로 큼
- 모델 선택 시 주효과부터 추가한 후 2차 효과 고려 권장
유전성(Heredity)
- 강한 유전성: 교호작용이 모델에 포함되면 관련 두 주효과도 모두 포함
- 약한 유전성: 교호작용이 모델에 포함되면 관련 주효과 중 하나 이상 포함
- 강한 유전성 모델은 요인 척도 변경 시에도 예측 결과 불변

Plackett-Burman 설계: 수많은 잠재적 요인들 중에서 결과에 가장 큰 영향을 미치는 핵심 인자를 가려내기(screening) 위한 효율적인 설계 방법
최소한의 실험으로 최대의 정보
- N번의 실험으로 최대 N-1개의 요인을 스크리닝할 수 있음
- N은 4의 배수
- 예: 12번의 실험으로 최대 11개 요인의 주 효과를 빠르게 평가
연구 초기 단계에서 어떤 요인이 중요한지 전혀 모를 때 사용
- 주 효과와 교호작용이 복잡하게 섞여(교락) 있으므로, 교호작용 분석에는 적합하지 않음

pyDOE3.pbdesign(3) # 3개의 요인에 대한 설계

완전 요인 설계

from yeom import doe
NUM_FACTORS = 3
ff_design = pyDOE3.ff2n(NUM_FACTORS)
doe.compute_d_optimality(ff_design)

Plackett-Burman 설계

pb_design = pyDOE3.pbdesign(NUM_FACTORS)
doe.compute_d_optimality(pb_design)

D-최적성 기준을 만족하는 설계를 찾는 알고리즘
순서:
- 초기 설계 행렬을 무작위로 생성
- 행렬식을 계산 → 행렬식 = 0이면 처음부터 다시 시작
- 각 요소를 -1 또는 +1로 바꿔보고 D-최적성 기준 개선 여부 평가
- 더 이상 개선이 없을 때까지 반복
국소 최적(locally optimal) 설계 생성
전역 최적(globally optimal) 설계를 찾기 위해 여러 시작점 필요

design, det = doe.coordinate_exchange(4, 'a + b + a:b')