Skip to main content

머신러닝의 종류

머신러닝의 주요 접근

  • 지도 학습
  • 비지도 학습
  • 강화 학습

지도학습 supervised learning

  • 라벨이 있는 데이터로부터 학습
  • 입력(𝑥)과 출력(𝑦) 간의 관계 모형화
  • 머신 러닝의 90% 이상을 차지하는 학습 형태
  • 종류:
    • 회귀(regression): 연속적인 y를 예측하는 것
    • 분류(classification): 여러 종류의 값들을 구분하는 것. 범주형 y를 예측하는 것

예시:

  • 스팸 메일 필터링: 이메일 내용을 분석하여 스팸 여부를 판단
  • 이미지 분류: 이미지를 특정 카테고리로 자동 분류
  • 질병 예측: 환자의 데이터를 기반으로 질병 발병 확률 예측
  • 주가 예측: 과거 주식 데이터를 이용해 미래 주가를 예측

비지도 학습 unsupervised learning

  • 라벨이 없는 데이터로부터 학습
  • 데이터의 구조나 패턴 발견

종류:

  • 클러스터링(clustering): 비슷한 특성을 가지는 군집으로 묶음
  • 차원 축소(dimensionality reduction): 데이터를 더 낮은 차원으로 표현

예시:

  • 고객 세분화: 비슷한 특성을 가진 고객 그룹으로 분류
  • 문서 군집화: 유사한 내용의 문서를 자동으로 묶음
  • 차원 축소: 데이터의 중요 정보를 유지하면서 차원 축소
  • 장바구니 분석: 고객의 구매 패턴을 분석하여 연관 상품 추천

클러스터링 clustering

  • 비슷한 사례들을 하나의 군집(cluster)으로 만드는 비지도 학습

  • 파티션(partition) 알고리즘: 수평적인 군집들로 나눔

    • K-Means
    • Mixture of Gaussian
    • Spectral Clustering
  • 위계적(hierarchical) 알고리즘: 큰 군집 안에 작은 군집들이 포함되는 형태로 나눔

다차원 척도법 MultiDimensional Scaling

  • 주어진 거리를 최대한 만족하는 방식으로 점들의 좌표를 계산하여 시각화하는 방법
  • 포지셔닝 맵과 같은 시각화를 할 때 사용할 수 있음

강화 학습 Reinforcement Learning

  • 행위자는 환경과 상호작용
  • 행위자의 행동(𝐴)에 따라 보상이 주어짐
  • 수익(𝐺): 보상을 장기간에 걸쳐 누적한 것
  • 행위자는 현재 상태(𝑆)에서 앞으로 수익이 가장 큰 행동을 내는 정책(𝜋)을 찾아야 함

예시:

  • 게임 인공지능: 게임 환경에서 스스로 학습하여 최적의 전략을 수행(예: AlphaGo)
  • 로봇 제어: 로봇이 다양한 환경에서 최적의 행동을 학습
  • 자율 주행: 자율 주행 차량이 주행 상황에 맞춰 최적의 경로를 선택

지도 학습과 강화 학습의 차이

  • 지도 학습
    • X에서 Y를 예측하는 문제.
    • X와 Y가 모두 있는 데이터가 필요
    • Y에 대한 예측 오차를 줄이는 것이 목표
    • 바둑) 현재 상황(X)에서 프로 기사들의 다음 수(Y)를 학습
    • 투자) 기업의 정보(X)에서 주가(Y)를 학습
  • 강화 학습
    • 데이터 대신 직접 시행 착오
    • 행동으로 인한 보상을 최대화하는 것이 목표
    • 바둑) 현재 상황(S)에서 다음 수(A)를 시행착오를 통해 학습
    • 투자) 기업의 정보(X)에서 매수/매도/보유(A)를 시행착오를 통해 학습

퀴즈

사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

Q&A