SKNetworks Family AI 캠프 13기 5주차 회고

¿curious_jin¿·2025년 4월 29일

지난 주에 분명 코딩 테스트를 위한 알고리즘에 대해 공부하겠다고 다짐했건만.... 5주차에 들어와 본격적으로 배워본 머신러닝은 감히 한 눈을 팔 대상이 아니었다.

불과 제작년과 작년에 걸쳐 머신러닝에 대해 배울 기회가 있었고, 열심히도 공부했었지만 개념을 공부하는 것과 실제 파이썬으로 이를 구현해보는 것 사이에는 정말 큰 차이가 있었다.

이번 한 주 간에는 scikit-learn이나 다른 곳에서 제공하는 데이터 셋을 가지고 이들을 여러 방면으로 다루며, 모델을 만들고 학습시키는 과정을 겪어보았다.

sklearn의 서브 모듈

어떻게 보면 내가 직접 하나하나 짜내는 파이썬에서 짜여진 코드로 그려내는 파이썬으로 넘어가는 첫 단추가 되는 한 주를 보낸 것 같다.

그도 그럴것이 sklearn의 서브 모듈 중에 이번 한 주간 다룬 것만 해도....

sklearn.datasets
sklearn.model_selection
sklearn.preprocessing
sklearn.impute
sklearn.linear_model
sklearn.tree
sklearn.ensemble
sklearn.svm
sklearn.metrics
sklearn.pipeline
sklearn.compose

정신 나가는줄 알았다

아무래도 기존에 존재하는 모듈을 불러와 사용하는 것이다보니 내가 직접 작성하는 부분이 엄청 크지는 않았고, 그렇기에 강의 내용을 들으면서 혹여나 눈으로만 익히게 될까 걱정이 되었다.

그래서 크게 크게 한 파트가 지나갈 때마다 빈 셀에 혼자 처음부터 작성하는 연습을 꾸준히 했더니 머리에 모듈들이 들어온 느낌이 든다 !

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.impute import SimpleImputer
from sklearn.ensemble import RandomForestRegression
from sklearn.metrics import accuracy_score
from sklearn.pipeline import Pipeline

빈 셀에 처음 작성할 때 위 코드와 같이 모듈을 불러오는 코드를 먼저 작성하게 되는데 이 부분을 스스로 짜내는 것이 머신러닝의 구조를 이해하는데 큰 도움이 된 것 같다.

이진 분류 평가 지표


이전에 배울때도 느꼈던 것이지만 정말.... 정말 헷갈린다.

True/False 는 예측이 맞다는 것을 의미하고 Positive/Negative 는 예측한 결과를 의미한다.

이들을 통해서 정밀도(Precision), 재현율(recall) 등의 지표를 알 수 있는데 이 친구들의 정의가 뇌리에 잘 박히지 않는다.

우선 정밀도의 경우 기계가 얼마나 정밀한지에 대한 지표로 기계가 정답이라고 예측한 값이 실제로 얼마나 맞았냐 ! 에 대한 지표이다. Positive를 정답이라고 해 그냥

재현율이 문젠데, 재현율의 경우 실제 정답이 기계가 하는 예측에 의해 얼마나 재현될 수 있냐를 나타내는 지표이다. 이전에는 대체 왜 이름이 recall인지 납득을 못했었는데 이번 기회에 강사님의 설명을 듣고 알게 되었다.

이처럼 정리가 가능하지만! 여전히 뇌리에 박히지 않아 나만의 방법을 만들어냈다.

  • 맞는걸 맞다고 해 -> 재현율
  • 맞다고 했는데 맞아 -> 정밀도

ㅎㅎ,,,;;

그래서?

한 주가 너무 재밌었다....

Pandas에서 Series나 DataFrame만 만지면서 놀다가 실제 서브 모듈에서 모델들을 불러와 만지니 흙놀이만 하다가 장난감이 생긴 기분...?

거기에 더해 개념적인 부분을 선행하고 오니 수업 진도에 맞춰 더 다양하게, 더 깊게 파고들어 볼 수 있었고 내 머릿속에만 있던 지식을 실현시키는 느낌이라 더 흥미를 느꼈던 것 같다.

그 덕에 바빠서 다음 주에 있을 코딩 테스트 준비나 파이썬 책 읽기는 하나도 못했지만 재밌었으니 되었다!

다음주 근로자의 날 휴무를 이용해 이번 머신러닝 전체 내용에 대해 정리하고 다음 주차 회고록에 적어볼 생각이다. 아마....한....확률 70퍼?

그럼 Bye!

profile
궁금증이 많은 아이

0개의 댓글