Lecture 2 | Image Classification 00:00~20:00

Hoon82의 velog·2022년 7월 25일

cs231n

이미지 분류 작업을 수행하는 방법은 무엇입니까? 04:50

이미지는 시스템에 미리 결정된 범주 또는 레이블 집합을 인식합니다.

고정된 범주 레이블이 있고 컴퓨터의 역할은 그림을 보고 하나를 지정하는 것입니다.

예를 들어 소파에 숨어 있는 고양이를 찾는 경우 우리는 강력한 인공지능이 필요합니다.

그리고 고양이가 다양한 모양과 크기, 색상과 나이를 가질 수 있습니다. 우리의 알고리즘은 이러한 다양한 변형을 처리해야 합니다.

이러한 이미지 분류는 정말 놀라운 기술입니다.

세상의 모든 다양한 물체에 훨씬 더 자연스럽게 확장되는 알고리즘을 제시하고자 합니다. 11:30

이 모든 것이 작동하도록 만드는 통찰력은 데이터 중심 접근 방식에 대한 아이디어입니다.

정확히 만들기 위해 손으로 규칙을 작성하기보다 많은 대규모 데이터 세트를 수집합니다.

그리고 요약한 다음 이러한 다양한 객체 범주를 인식하는 방법에 대한 지식을 요약하는 모델을 내보내는 기계 학습 분류기를 훈련합니다.

마지막으로 이 훈련 모델을 사용해서 고양이를 인식할 수 있는 새 이미지에 적용합니다.

일종의 작은 테스트 케이스로 머신 러닝에서 매우 일반적으로 사용되는 CIFAR-10이라는 데이터 세트로 작업하는 것을 상상할 수 있습니다.

CIFAR-10 데이터 세트는 10가지 다른 클래스를 제공합니다. 그리고 이에 대해 50,000개의 훈련 이미지를 제공하며 알고리즘을 테스트해야 하는 10,000개의 추가 테스트 이미지가 있습니다.

이러한 테스트 이미지 중 일부에 간단한 최근접이웃 분류기를 적용하는 예가 있습니다.

테스트 이미지가 픽셀 값이 작은 4X4 이미지라고 가정하고 테스트 이미지의 왼쪽 상단 픽셀을 가져오고 훈련 이미지의 값을 빼고 절대값을 취합니다. 두 이미지 사이의 픽셀 차이를 가져옵니다. 그런 다음 이미지의 모든 픽셀에 대해 이 모든 것을 합산합니다. 이것은 두 이미지의 차이를 측정하는 매우 구체적인 방법을 제공합니다.

이를 구현하기 위한 파이썬 코드는 넘파이에서 제공하는 이러한 벡터화 된 연산을 많이 사용했기 때문에 매우 짧고 매우 간결합니다.

일반적으로 최근접이웃 분류기를 사용할 때 거의 항상 1보다 큰 K 값을 사용하려고 합니다. 이는 결정 경계를 부드럽게 하고 더 나은 결과로 이어지는 경향이 있기 때문입니다. 22:30

Hoon82의 velog

나는 킹고수다!!

이전 포스트

신경망 모델 훈련

다음 포스트

Lecture 2 | Image Classification 00:00~20:00

신경망 모델 훈련

Inductive Bias

0개의 댓글