지난 강의 내용
- 접근방식을 Data- driven 방식으로 전환하게 된 계기에 대해 배움.
- Challenges of Recognition : Semantic Gap, Clutter 등등 실제로 우리가 보는 의미론적 비전과 컴퓨터가 보는 그리드 값에는 상당한 차이 존재
- K-nn : 간단히 데이터를 학습하고 분류할 수 있는 방법, CIFAR 10 , cross Validation, hyper parameter
- Linear Classifier: paramatic classifier, image -> Long vector, image pixel converts to 10 categories - CIFAR 10
이번 시간
- 강의를 통해서 어떤 W를 선택해야하는지, W의 선택방법에 대해서 배움
- Optimization, Loss function
이미지 Feature는 다음과 같이 다르게 분포된 데이터 값을 학습을 통해 하나의 벡터로 합치게 되고 이 벡터를 이용하여 값을 구하고 분류를 해주게 된다.
비선형적으로 분포된데이터도 수식을 통해서 선형적으로 분리를 할 수 잇다.
Color Histogram이라는 것을 통해서 색상의 특징을 나타내줄 수 있다.
Histogram of Oriented Gradient라는 가장자리의 특징을 Gradient를 이용해서 방향을 알아내는 방식으로 사진을 구분해주었고, 딥러닝이전에 만힝 사용하는 방식이었다.
Bag of Words : 사진을 조각내고 군집화하여 해당하는 분류군의 코드 북을 만든다. 그리고 이미지를 인코딩을 하면서 그 사진이 얼마나 해당하는 분류와 일치하는지 체크하는 방식을 이용하였다.
과거에는 이렇게 여러 특징들을 연결하는 방식, 즉 사진의 특징을 미리 추출하고 학습하는 방식을 이용했다면 이제는 사진에 데이터를 학습하며 특징 또한 같이 추출해준다는 것이 특징이다.