Skip to main content

머신러닝 소개 및 기본 개념

인공지능의 과거와 현재

  • 과거의 인공지능은 논리, 계획, 지식에 바탕
  • 머신 러닝은 데이터로부터 패턴을 학습하는 인공지능의 한 분야
  • 딥러닝은 머신러닝의 일종

소프트웨어 2.0

  • AI 연구자 안드레 카파시(Andrej Karpathy)가 2017년 제안한 개념
  • 소프트웨어 1.0: 전통적인 프로그래밍 - 프로그래머가 서술한 규칙에 따라 데이터를 입력하면, 처리된 결과를 출력
  • 소프트웨어 2.0: 머신러닝 - 데이터와 원하는 결과를 입력하면, 프로그램이 출력

주요 용어

  • 모형(model): 데이터의 패턴을 나타내는 수학적 함수 또는 컴퓨터 프로그램의 집합
    • 예시: 선형 모형 y=wx+by = wx + b
  • 훈련(training): 모형에서 데이터가 가진 특정 패턴에 맞는 함수/프로그램을 찾는 것
    • 선형 모형의 경우 파라미터 𝑤와 𝑏를 찾는 형태
    • 모든 모형이 파라미터를 갖는 것은 아님
  • 테스트(testing): 모형의 성능을 평가하는 것

머신러닝과 통계학

  • 머신러닝은 통계적 학습(Statistical Learning)이라고도 함
  • 통계학: 데이터의 특성 이해와 추론에 중점, 수학적 엄밀성 강조
  • 머신러닝: 예측과 의사결정에 더 중점, 알고리즘의 성능과 실용성에 더 집중

머신러닝에서 데이터의 중요성

  • Unreasonable effectiveness of data
    • Google 소속의 Peter Norvig, Alon Halevy, Fernando Pereira 가 2009 발표한 논문
  • 데이터의 "비합리적인" 효과: 모형 간의 성능 차이에도 불구하고 데이터가 증가할 수록 모든 모형에서 성능이 향상됨
  • 데이터 중심 접근 방식: 도메인 지식에 덜 의존적, 새로운 도메인이나 언어에 쉽게 적용 가능

퀴즈

사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.

Q&A