Skip to main content

시계열 데이터

시계열 Time Series

  • 동일한 변수의 시간에 따른 변동을 나타낸 데이터
  • 예시:
    • 고객 수
    • 가격
    • 온도

시계열 분석의 종류

  • 예측(Forecasting)
    미래 값이나 추세를 예측
  • 대치(Imputation)
    센서 오류, 데이터 손상 또는 측정 부재로 인해 누락된 데이터를 전후 데이터를 바탕으로 채움
  • 이상 탐지(Anomaly Detection)
    시계열 내에서 비정상적이거나 비정상적인 패턴을 식별
  • 분류(Classification)
    특성을 기반으로 주어진 시계열에 레이블이나 범주를 할당하는 작업

시계열 분석의 사례

  • 예측
    • 날씨 예측: 기상 데이터를 바탕으로 미래의 온도, 강수량, 바람 속도 등을 예측
    • 가격 예측: 과거 가격 데이터를 활용하여 특정 상품의 미래 가격을 예측
    • 수요 예측: 과거 판매 데이터를 바탕으로 제품의 미래 수요를 예측하여 재고 관리 및 공급망 최적화
  • 대치
    • 센서 오류로 인한 데이터 누락: 기계의 온도나 진동을 측정하는 센서가 일시적으로 오작동하여 데이터를 기록하지 못했을 때, 이전 및 이후의 데이터를 바탕으로 누락된 데이터를 보완
    • 데이터 손상으로 인한 누락: 자연재해나 데이터 전송 중의 오류로 인해 손상된 데이터를 이전 및 이후의 패턴을 바탕으로 복원
    • 측정 부재로 인한 누락: 센서 교체 등으로 누락된 데이터를 보완하여 지속적으로 모니터링

시계열 분석의 사례

  • 이상 탐지
    • 사이버 보안에서의 네트워크 트래픽 모니터링: 네트워크 트래픽 데이터를 분석하여 비정상적인 패턴을 탐지하고 잠재적인 사이버 공격을 식별
    • 신용 카드 거래 모니터링: 시계열로 기록된 신용 카드 거래 데이터를 분석하여 평소와 다른 비정상적인 거래 패턴을 찾아내고, 잠재적인 사기를 예방
    • 산업 기계 유지보수: 기계의 작동 데이터를 분석하여 비정상적인 진동, 온도 또는 소음을 탐지하고, 이를 통해 기계 고장을 미리 예측하여 유지보수를 수행
  • 분류
    • 음악 장르 분류: 음악 데이터의 시계열 패턴을 분석하여 해당 음악이 어떤 장르에 속하는지 분류
    • 활동 인식: 착용형 센서에서 수집된 시계열 데이터를 분석하여 사용자의 활동(예: 걷기, 달리기, 앉기)을 분류
    • 음성 감정 분석: 음성 데이터를 분석하여 화자 감정의 변화를 시계열적으로 분류(예: 기쁨, 슬픔, 분노 등)

추세 trend

  • 데이터의 장기적인 증가나 감소 패턴

계절성 seasonality

  • 달력 상의 특정 시점(예: 겨울, 월말, 일요일 등)마다 반복되는 패턴

주기성 cycle

  • 일정한 빈도가 아닌 형태로 증가나 감소하는 패턴
  • 대체로 계절성보다 간격이 긺
  • 예) 주택 거래의 경우 계절성과 함께, 6~10년 정도 주기성이 존재

자기 상관 autocorrelation

  • 이전의 값과 이후의 값 사이에 상관이 존재
  • 양의 자기상관이 있으면, 이전에 +면 계속 +로, -면 –로 유지되는 경향
  • 음의 자기상관이 있으면, 이전에 +면 –로, -면 +로 변하는 특성

자기 상관 예시

양의 자기 상관: 화학 공정의 품질 주별 제품 판매량(음의 자기 상관)

비정상 non-stationary

  • 정상(stationary): 시계열의 구조가 일정한 상태(normal의 뜻이 아님)
  • 데이터의 분포가 시간에 따라 변하면 비정상
  • 대부분의 시계열 분석은 정상(stationary) 시계열을 가정

이상점 outlier

  • 패턴에서 벗어난 특이 사례

퀴즈