
📌 선형회귀 (Linear Regression) 선형회귀는 머신러닝의 비지도 학습 중 회귀에 해당한다. 선형회귀란, 데이터를 가장 잘 표현하는 최적의 선을 찾는 것을 말한다. 통계학에서는 좀 어려운 표현으로 이 선을 최적선, 영어로는 'Line of best fi
📌 다중 선형 회귀 다중 선형회귀에서는 하나의 입력 변수가 아니라 여러 개의 입력 변수를 사용해서 목표 변수를 예측하는 알고리즘이다. 위 사진으로 데이터의 표현 방법을 알아보자. 피처의 개수는 $n$개, 학습 데이터의 개수는 $m$개이고, 목포 변수는 여전히 한
다항 회귀란 데이터에 잘 맞는 일차 함수나 직선을 구하는 게 아니라 다항식이나 곡선을 구해서 학습하는 걸 의미한다.다항 회귀도 피처가 하나인 경우, 피처가 여러 개인 경우 총 2가지로 나눌 수 있다.선형 회귀의 가설 함수는 다음과 같다.$$h\_{\\theta}(x)
📌 분류 문제 머신 러닝은 지도 학습과 비지도 학습 그리고 강화 학습으로 나뉜다. 지도 학습은 또 회귀와 분류로 나뉘는데, 회귀는 연속적인 값을 예측하는 거고 분류는 정해진 몇 개의 값 중에 예측하는 것이다. 예를 들면 어떤 이메일이 스팸인지 아닌지, 어떤 기사가 스
📌 Feature Scaling Feature Scaling 이란, 머신 러닝 모델에 사용할 입력 변수들의 크기를 조정해서 일정 범위 내에 떨어지도록 바꿔주는 것을 말한다. 크게 Normalization과 Standardization 으로 나뉜다. 📌 Normal
편향이란 추정 결과 한 쪽으로 치우치는 경향을 보임으로써 발생하는 오차이다. 머신러닝 모델 측면에서의 편향은 예측값과 정답값의 차이를 말한다. 따라서 편향이 클수록 예측과 정답 간 차이가 크다고 할 수 있다.사람의 키를 이용해서 몸무게를 예측하고 싶다고 할 때, 위의
📌 Validation (검증) 검증은 머신 러닝 모델의 성능을 평가할 수 있는 방법이다. 검증에는 크게 Hold-out Validation, K-Fold Cross Validation, LOOCV (Leave-One-Out Cross Validation)이 있다.
📌 결정 트리 (Decision Tree) 📍 결정 트리 결정 트리는 예/아니오로 답할 수 있는 어떤 질문들이 있고, 그 질문들의 답을 따라가면서 데이터를 분류하는 알고리즘이다. 예를 들어 교통사고가 났을 때, 운전자의 생존 여부를 예측하고 싶다고 하자. 그러
📌 결정 트리와 앙상블 📍결정 트리의 단점 머신러닝 분야에서 유명한 책인 'The Elements of Statistical Learning' 에서는 결정 트리의 단점을 다음과 같이 말한다. > 결정 트리는 이상적인 머신러닝 모델이 되기 힘든 한 가지 특징을 갖
📌추천 시스템 📍추천 시스템이란? 수많은 상품들 사이에서 사용자가 좋아해 할 만한 것들을 찾아주는 프로그램을 추천 시스템이라고 한다. 구체적으로 말하면, 어떤 추천을 할 때, 유저의 행동 패턴을 통해 그 작업에 대한 추천을 더 정확하게 해주는 머신러닝 프로그램이라
📌행렬 인수분해 📍행렬 인수분해란? 인수분해란 자연수나 다항식을 여러 개의 인수의 곱으로 변형하는 수학 개념이다. 따라서 행렬 인수분해란 말 그대로 하나의 행렬을 다른 두 개의 다른 행렬의 곱으로 변형하는 것을 의미한다. 일단 예시를 먼저 봐보자. 왼쪽의 평점