컴퓨터 비전의 개념
컴퓨터 비전 computer vision
- 컴퓨터를 이 용해 이미지로부터 의미 있는 정보를 추출하는 것
- 생물의 시각에 해당하는 영역을 다루는 인공지능의 분야
- 사진, 동영상 등의 입력을 받아 처리
- 더 나아가 새로운 이미지를 생성하는 것까지 포함
- 교통, 의료, 스포츠, 제조 등 다양한 분야에 활용
인공지능
- 인간이나 동물의 지능을 컴퓨터나 시스템 등으로 만든 것
- 반드시 사람과 같은 방식으로 수행할 필요는 없음
- 다양한 범위의 환경에서 주어진 목적을 달성할 수 있는 능력
이미지 처리 Image Processing
- 원본 입력 이미지를 처리하여 품질을 향상시키거나 특징을 강조
- 다른 작업을 수행할 수 있도록 준비
- 이미지를 입력으로 받아 새로운 이미지를 출력
- 사진 찍은 다음에 이미지 편집 툴로 하는 작업들이 이미지 처리
- 밝기 및 대비 조정, 노이즈 감소 구현, 크기 조정, 선명화 등
컴퓨터 비전 과업(task)
- 이미지 분류
- 물체 탐치
- 광학 문자 인식
- 이미지 분 리
- 깊이 추정
- 자세 추정
- 이미지 간 변환
- 이미지 생성
이미지 분류 image classification
- 사진에 찍힌 것이 무엇(what)인가?
- 이미지를 미리 정해진 카테고리 중에 하나로 분류
- 예) 이미지 → 고양이(0), 강아지(1)
- 예) ImageNet 1k: 1000가지 종류의 사물 중 하나로 분류
- 이미지를 해당 카테고리로 레이블을 붙인 학습 데이터 필요
- 응용:
- 부품 분류: 이미지의 부품을 분류
- 품질 검사: 제품을 정상(0)/불량(1)으로 분류
물체 탐지 object detection
- 이미지의 어디(where)에 무엇(what)이 있는가?
- 이미지 분류와 비슷하지만 하나의 이미지에서 다수의 물체를 위치와 함께 탐지
- 응용
- 자율 주행: 보행자, 자전거, 신호등 및 도로 표지판을 탐지
- 스포츠: 경기 중 모니터링과 심판을 위해 공이나 선수를 추적
- 이미지 검색: 스마트폰으로 사진에 있는 특정 물체를 검색할 때 사용
- 개수 세기: 이미지에서 물체의 개수를 샐 때 사용 (상품, 방문자, 군중 수 등)
- 무인 매장
- 보안: 출입게이트나 위험구역 감시
- 산업 안전: 위험 행동 및 사고 발생 인식 및 대처
광학 문자 인식 Optical Character Recognition
- 이미지에서 텍스트를 추출
- 응용:
- 회사의 인보이스, 영수증, 합의서 문서들을 디지털화
- 비대면 계좌 개설에서 신분증 인식
이미지 분리 image segmentation
- 이미지의 각 픽셀을 객체에 매핑되는 세그먼트로 분리
- 응용
- 배경 제거: 화상 회의에서 크로마 키 없이 배경을 지우고 필터를 적용
- 의료 영상: 장기나 조직을 구분해서 색칠
깊이 추정 depth estimation
- 이미지에 존재하는 물체의 깊이를 예측하는 작업
- 응용
- 물체의 부피 및 구성 측정
- 2D 이미지에서 3D 표현을 개발
자세 추정 pose estimation
- 관절 등의 특징점을 탐지하고, 가려진 부분의 위치도 추정 →사람의 자세를 추정
- 응용:
- 운동 분석: 자세를 올바르게 유지하도록 도와줄 수 있음
- 보안: 침입자나 부적절한 행동을 감지하거나, 위험한 행동이나 사고 등을 감지
- 로봇 공학: 로봇이 사람의 동작을 따라 작업을 수행
이미지 간 변환 Image-to-Image
- 원본 이미지를 원하는 특성에 맞게 변환
- 응용:
- 스타일 트랜스퍼: 사진을 유명 화가의 스타일로 그림으로 변환
- 인페인팅: 사진에서 원치 않는 물체를 제거
- 이미지 컬러화: 흑백 이미지를 컬러 이미지로 변환
- 슈퍼 해상도: 저해상도 이미지의 해상도를 높임
이미지 생성 image generation
- 프롬프트를 통해 제공한 지시와 예시를 바탕으로 새로운 이미지 생성
- 응용:
- 예술적 창작
- 기존의 이미지 데이터에 새로운 이미지 데이터 추가
- 가상 현실 환경에서 사용할 수 있는 사실적인 이미지를 생성
- 새로운 제품 디자인 생성