실습1-1. K-Nearest Neighbor classifier

Speedwell🍀·2022년 3월 16일

cs231n

목록 보기

3/8

공식사이트) https://cs231n.github.io/assignments2020/assignment1/

KNN을 통한 image classification & cross-validation

Setup

https://cs231n.github.io/assignments/2021/assignment1_colab.zip

위의 링크를 통해 Starter code가 담긴 폴더를 다운받는다.
개인 Google Drive에 cs231n/assignments 폴더를 생성 후, 위에서 다운 받은 폴더를 넣는다.
앞으로 Google Colab을 사용해서 실습을 진행한다.

Python Numpy 튜토리얼

Jupyter나 Colab을 사용할 수 있다.
cs231n에서는 Colab을 사용하는 것을 권장하고 있다.

https://colab.research.google.com/github/cs231n/cs231n.github.io/blob/master/python-colab.ipynb

위의 링크는 파이썬과 넘파이 튜토리얼을 진행할 수 있는 Colab이다. 한 cell씩 따라해보면서 실습하면 된다!

이제 K-Nearest Neighbor classifier 실습을 본격적으로 진행해보자!

구글 드라이브에서 cs231n/assignments/assignment1 폴더에 있는 knn.ipynb을 실행시켜서 진행하면 된다.

1. dataset 다운로드

첫 번째 셀은 과제에 필요한 dataset이 다운받기 위한 코드이다. 실행시키면 아래와 같은 결과 화면이 나온다.

실행결과

2. 모듈 import & 데이터 load

두 번째 셀에서 필요한 모듈을 import하고 세 번째 셀에서 데이터를 로드한다.

결과창은 아래와 같다.

실행결과

3. Data Visualizing

num_classes는 classes의 길이인 10이다.

idxs = np.flatnonzero(y_train == y)은 train data의 class 값 중 같은 class를 가지는 data의 인덱스들을 저장하는 코드이다. 여기서 flatnonzero()는 0이 아닌 요소의 인덱스를 반환한다.

idxs = np.random.choice(idxs, samples_per_class, replace=False는 idxs에서 samples_per_class 수 만큼 랜덤으로 추출하는 코드이다. 여기서 replace=False는 비복원추출(같은 원소가 2번 이상 뽑힐 수 없음)을 의미한다.

plt_idx = i * num_classes + y + 1은
1, 11, 21, 31, 41, 51, 61, 2, 12, 22, 32, 42, 52, 62, 3, 13, 23 ...으로 진행된다.

plt.subplot(nrows, ncols, index)
여기서 nrows는 행의 수, ncols는 열의 수, index는 위치를 의미한다.

셀을 실행시키면 아래와 같은 결과를 확인할 수 있다.