섹션1 때는 데이터셋의 처리방법과 통계에 대한 기본 지식을 얻었다면 섹션2는 크게 머신러닝(지도학습)의 기본인 1.회귀모델 2.분류모델 3.모델에 대한 해석방법, 평가지표를 학습했다.
섹션 2에서 처음으로 배웠던 모델은 단순선형모델이였다. 첫 느낌은 1차 함수를 보는 느낌이 들어서 반가웠다. 한마디로 표현하자면 'X(독립변수)의 변화량에 따라 Y(종속변수)의 값을 예상'하는 것으로 이해하기도 쉬웠고 잘 따라갔던거 같았다.
항상 예상할수 있는게 수치형일리는 없다. 범주형이여서 갈매기인지 비둘기인지 2가지로 구분할때는 선형모델을 사용 할 수 없다는 것이다. 따라서 배운건 트리모델이였고 첫 인상은 역시 그림이 되게 쉬워보였다. 분류모델은 '이미 정해진 타겟에 알맞게 구분하는 작업'이라고 생각된다. 하지만 만만하게 볼 녀석은 아니였던거 같다. 용어가 생소한게 많았고 하이퍼파라미터 설정부터 이해하기 쉽지 않았다. 하지만 이때 파이프라인을 처음 써보고 '오 정말 편한다' 라는 느낌이 들어서 기억에 남는 파트였다.
아직도 더 공부해야되는 부분이다. 섹션2에서 가장 힘들고 의욕이 사라지게 만든 부분이랄까?? 지금은 뭐 리뷰하는 공간임으로 편하게 작성을 하겠다. confusion matrix,f1,recall,precision의 대략적인 개념은 이해한다. 하지만 pdp plot, shap이라던지 많이 힘들었다.