머신러닝 소개 및 기본 개념
인공지능의 과거와 현재
- 과거의 인공지능은 논리, 계획, 지식에 바탕
- 머신 러닝은 데이터로부터 패턴을 학습하는 인공지능의 한 분야
- 딥러닝은 머신러닝의 일종
소프트웨어 2.0
- AI 연구자 안드레 카파시(Andrej Karpathy)가 2017년 제안한 개념
- 소프트웨어 1.0: 전통적인 프로그래밍 - 프로그래머가 서술한 규칙에 따라 데이터를 입력하면, 처리된 결과를 출력
- 소프트웨어 2.0: 머신러닝 - 데이터와 원하는 결과를 입력하면, 프로그램이 출력
주요 용어
- 모형(model): 데이터의 패턴을 나타내는 수학적 함수 또는 컴퓨터 프로그램의 집합
- 예시: 선형 모형
- 훈련(training): 모형에서 데이터가 가진 특정 패턴에 맞는 함수/프로그램을 찾는 것
- 선형 모형 의 경우 파라미터 𝑤와 𝑏를 찾는 형태
- 모든 모형이 파라미터를 갖는 것은 아님
- 테스트(testing): 모형의 성능을 평가하는 것
머신러닝과 통계학
- 머신러닝은 통계적 학습(Statistical Learning)이라고도 함
- 통계학: 데이터의 특성 이해와 추론에 중점, 수학적 엄밀성 강조
- 머신러닝: 예측과 의사결정에 더 중점, 알고리즘의 성능과 실용성에 더 집중
머신러닝에서 데이터의 중요성
- Unreasonable effectiveness of data
- Google 소속의 Peter Norvig, Alon Halevy, Fernando Pereira 가 2009 발표한 논문
- 데이터의 "비합리적인" 효과: 모형 간의 성능 차이에도 불구하고 데이터가 증가할 수록 모든 모형에서 성능이 향상됨
- 데이터 중심 접근 방식: 도메인 지식에 덜 의존적, 새로운 도메인이나 언어에 쉽게 적용 가능
퀴즈
사용자 정보 입력
퀴즈를 시작하기 전에 이름과 소속을 입력해주세요.