
F1 score란 F1 score는 분류 모델에서 사용되는 머신러닝의 평가지표이다. Accuracy 뜻 : 정확도. 즉 얼마나 정확한지를 나타내는 지표다. 예를 들어 생각해보자. 위 처럼 개와 고양이의 사진 각각 100장에 대해서 분류하는 모델을 학습했다고 가정하자

먼저, 이진분류에 대해서 알아보자. 이진분류는 간단하게 새로운 데이터가 주어졌을때, 사전 정의한 두가지 범주로 해당 데이터를 분류하는 것이다. train 데이터를 사용해 input과 target간 관계를 모델에 학습시킨다. 그 후, train 데이터에 포함되지 않는,

linear regression의 값을 확률로 매핑 시켜주는 sigmoid 함수에 대해서 알아보자. 먼저, 그래프는 아래와 같다.위의 그래프에서 x축은 linear regression의 결과 값(Output), y축은 그에 맞는 확률값(prob)을 의미한다. linea

predict값과 target값의 차이(잔차)의 제곱합을 최소화하는 매개변수 W와 b를 추정하는 방법이다. 쉽게 생각하면, 주어진 데이터를 좌표위에 점을 찍고난 후 그 점과 내가 그을 직선사이의 거리가 최소화되는 직선을 구하는 방법이다.위와 같이 빨간 직선으로 선형식을

PCA란 고차원 데이터를 작은 차원으로 축소해 데이터의 주된 패턴을 파악하는 데 사용하는 차원 축소 기법이다. 쉽게 생각해서 데이터셋에 존재하는 변수의 수를 줄이는 것이다. 변수의 수를 줄이고 간결하게 표현하는 이유는 뭘까?차원의 저주는 데이터의 차원이 높아질 수록 알