[구글 머신러닝 단기집중과정] 2강

환공지능·2021년 7월 2일
0
post-thumbnail

1. 선형 회귀

오랫동안 귀뚜라미는 시원날 날보다 더운 날 더 자주 우는 것으로 알려져 왔다. 전문가 및 아마추어 곤충 학자들이 수십 년에 걸쳐서 1분당 귀뚜라미가 우는 횟수와 온도에 관한 데이터를 목록으로 작성했다.

고모가 생일 선물로 두 특성의 관계를 예측하는 모델을 학습시켜 보라고 아끼던 귀뚜라미 데이터베이스를 줬다고 가정해보자.

올바른 첫 번째 단계는 데이터를 그래프로 만들어 검토하는 것이다.

그림 1. 1분당 우는 횟수 및 섭씨온도

예상대로 그래프를 통해 우는 횟수가 증가할수록 온도가 올라가는 것을 확인할 수 있다. 우는 횟수와 온도는 관계를 근사치로 하는 하나의 직선을 그릴 수 있기에 선형이다.

그림 2. 선형 관계

사실 선이 모든 점을 완벽하게 통과하지는 않지만, 선은 우리에게 있는 온도 데이터와 우는 소리 데이터의 관계를 명확히 보여준다. 선형대수학을 약간 적용하면 이 관계를 다음과 같이 작성할 수 있다.

y=mx+by = mx+b

여기서

  • y는 섭씨온도, 즉 예측하려는 값이다.
  • m은 선의 기울기이다.
  • x는 1분당 우는 횟수, 즉 입력 특성 값이다.
  • b는 y절편이다.
    머신러닝의 관습에 따라 모델의 방정식을 약간 다르게 작성하면 다음과 같다.
y=b+w1x1y' = b+w_{1}x_{1}

여기서

  • y'는 예측된 라벨(얻고자 하는 출력)이다.
  • b는 편향(y절편)이며, 일부 머신러닝 자료에서는 w0w_{0}이라고도 한다.
  • w1w_{1}은 특성 1의 가중치이다. 가중치는 위에서 m으로 표현된 '기울기'와 같은 개념이다.
  • x1x_{1}은 특성(알려진 입력)이다.

새로운 분당 우는 횟수 x1에서 온도 y'를 추론(예측)하려면 x1값을 이 모델에 삽입하기만 하면 된다.

아래 첨자(예: w1, x1)는 여러 특성에 의존하는 좀 더 정교한 모델을 제시한다. 예를 들어 세 가지 특성에 의존하는 모델은 다음과 같은 방정식을 사용할 수 있다.

y=b+w1x1+w2x2+w2x2y' = b+w_{1}x_{1}+w_{2}x_{2}+w_{2}x_{2}

2. 학습 및 손실

모델을 학습시킨다는 것은 라벨이 있는 데이터로부터 올바른 가중치와 편향값을 학습하는 것이다. 지도 학습에서 머신러닝 알고리즘은 다양한 예를 검토하고 손실을 최소화 하는 모델을 찾아봄으로써 모델을 만들어내는데 이 과정을 경험적 위험 최소화라고 한다.

손실은 잘못된 예측에 대한 벌점을 의미한다. 한가지 예에서 모델의 예측이 얼마나 잘못되었는지를 나타내는 수로 모델의 예측이 완벽하면 손실은 0이며, 그렇지 않다면 손실이 커진다.

모델 학습의 목표는 결과적으로 작은 손실을 갖는 가중치와 편향의 집합을 찾는 것이다.

위의 그림에서 보면 왼쪽 모델은 손실이 크고, 오른쪽 모델은 손실이 작다.

(1) 제곱 손실

=the square of the difference between the label and the prediction

=(observationprediction(x))2= (observation - prediction(x))^2
=(yy)2= (y - y')^2

평균 제곱 오차(MSE) 는 예시당 평균 제곱 손실을 의미한다. MSE를 계산하려면 개별 예의 모든 제곱 손실을 합한 다음 예의 수로 나누어야 한다.

MSE=(1/N)(yprediction(x))2MSE = (1/N) \sum (y-prediction(x))^2

여기서
(x,y)는 예이며, 다음과 같다.

  • x는 모델이 예측하는 데 사용하는 특성 집합(예: 온도, 나이, 짝짓기 성공률)이다.
  • y는 예의 라벨(예: 분당 우는 소리)이다.
  • prediction(x)은 특성 집합 x과 결합된 가중치 및 편향의 함수이다.
  • D는 (x,y)쌍과 같이 여러 라벨이 있는 예가 포함된 데이터 세트다.
  • N은 D에 포함된 예의 수이다.

MSE가 머신러닝에서 흔히 사용되지만, 모든 상황에서 최선인 유일한 손실 함수는 아니다.

.
.
.

강의 링크 : 구글 머신러닝 단기집중과정

profile
데이터사이언티스트 대학원생

0개의 댓글