머신러닝의 종류
머신러닝의 주요 접근
- 지도 학습
- 비지도 학습
- 강화 학습
지도학습 supervised learning
- 라벨이 있는 데이터로부터 학습
- 입력(𝑥)과 출력(𝑦) 간의 관계 모형화
- 머신 러 닝의 90% 이상을 차지하는 학습 형태
- 종류:
- 회귀(regression): 연속적인 y를 예측하는 것
- 분류(classification): 여러 종류의 값들을 구분하는 것. 범주형 y를 예측하는 것
예시:
- 스팸 메일 필터링: 이메일 내용을 분석하여 스팸 여부를 판단
- 이미지 분류: 이미지를 특정 카테고리로 자동 분류
- 질병 예측: 환자의 데이터를 기반으로 질병 발병 확률 예측
- 주가 예측: 과거 주식 데이터를 이용해 미래 주가를 예측
비지도 학습 unsupervised learning
- 라벨이 없는 데이터로부터 학습
- 데이터의 구조나 패턴 발견
종류:
- 클러스터링(clustering): 비슷한 특성을 가지는 군집으로 묶음
- 차원 축소(dimensionality reduction): 데이터를 더 낮은 차원으로 표현
예시:
- 고객 세분화: 비슷한 특성을 가진 고객 그룹으로 분류
- 문서 군집화: 유사한 내용의 문서를 자동으로 묶음
- 차원 축소: 데이터의 중요 정보를 유지하면서 차원 축소
- 장바구니 분석: 고객의 구매 패턴을 분석하여 연관 상품 추천