CS231n Lecture 2 정리

류창훈·2023년 7월 4일

cs231n

CS231n

목록 보기

2/16

2강은 어려운 부분이 크게 없었습니다.

대략적인 내용은

1. Data-driven(데이터 추진 접근 방법)
2. 클래스 분류기
3. 거리측정 방식(L1, L2)
4. Setting Hyperparameters
5. Linear Classification

로 구성이 되어 있습니다.

컴퓨터는 이미지를 숫자 조합으로 인식합니다.

(위 그림은 카메라가 다른 곳 비추니 픽셀값 바뀐 것 설명하기 위해서 보여준 것이다.)

Data-driven접근 방법에 대한 이야기도 했는데, 첫번째는, 이미지와 레이블로 구성된 데이터셋을 수집, 두번째는, 머신러닝 훈련을 하고,
세번째는 훈련한 것으로 새로운 이미지를 판별하는 것 입니다.

처음에 들었을 때, 생소한 용어여서 뭔가 했더니, 그냥 train하고, test하는 전체적 흐름을 장황하게 설명하는 것이었다....

클래스 분류기에 대한 이야기도 나왔는데,

1. 최근접 이웃(Nearest Neighbor)
2. K-최근접 이웃(K-NearestNeighbors)

이렇게 두가지에 대해 설명하였습니다.

1. 최근접 이웃(Nearest Neighbor)

최근접 이웃(Nearest Neighbor)는 시간복잡도가 train시에 O(1), predict시에는 O(n)입니다.
학습 할 때는 느리고, 예측은 빨라야 하기 때문에, 요새는 많이 사용하지 않는 분류기라고도 첨언 했습니다.

2. k-최근접 이웃(K-NearestNeighbors)

Nearest Neighbor의 취약점을 보완한 분류기 입니다.
위 그림은 K의 숫자가 커지면 커질 수록, 점점 퀄리티가 좋아진다는 것을 뜻합니다. (K는 주변 이웃의 수)

K값을 무조건 높인다고 좋은건 아니다. 상황에 맞춰서, 값 조정하자.

거리측정 방식

L1(Mahatan) distance
L2(유클리드) distance

좌표값이 변경되면 거리가 달라지는 특징

좌표값 변경해도 동일한 특징

(더 자연스럽다)

Setting Hyperparameters

첫번째 방식은 전체 데이터셋에서 train셋, validation셋, test셋으로 분류하는 방식입니다.

검증세트를 중간에 따로 빼놓았기 때문에, overfitting문제를 예방하는데 탁월합니다.

두번째 방식은 Cross-validation(교차검증)방식입니다.
그림에서도 볼 수 있듯이, train셋, test셋 사이에 동일하게 검증셋을 껴넣고, fold하는 방식을 사용합니다.

하지만 딥러닝에서는 시간이 너무 오래 걸리는 문제 때문에, 잘 사용을 안한다고 합니다.