Week12 주간 회고

Jihoon·2022년 12월 10일
1

주간회고

목록 보기
8/9
post-thumbnail

✨ 한 주 요약

DKT 대회가 끝이 났다.
비록 LG 추천 대회에 집중하느라, 크게 집중을 못한 것 같았지만 결과가 나쁘지 않아서 다행이다.
12월은 격동의 한 달인 것 같다. 큰 틀의 계획을 세우고, 세부적으로 수행해나가자. 할 수 있다.

✨ 잘했던 점

  1. Feature Engineering을 통해서 LGBM의 모델 성능을 확 올려서, 팀의 전체 성적을 Private 기준 3등까지 올릴 수 있었다.
  1. CV와 Optuna를 진행해서 일반화 성능을 많이 향상할 수 있었다.
  1. 내가 EDA와 FeatureEngineering 부분에서 많이 약함을 인지할 수 있었고, 대회 진행에 있어서 도메인(Domain)에 대한 이해가 굉장히 중요함을 알 수 있었다.
  1. 내가 무엇을 하고 싶은지, 뭘 해야 할지, 앞으로 어떻게 살아야 할지, 어떠한 식으로 나를 성장시켜야 할 지 지속적으로 고민하고 있다. 더 정진할 것이다.

😂 아쉬운 점 & 보완할 점

  1. 종속 변수와 독립 변수간의 관계에 있어서 유의미한 차이가 있다면, Feature를 여러 개 추가를 했어야했는데, LGBM에 있어서 Feature가 얼마나 필요할 지 감을 못잡고 있어서 초반에 헛발질을 한 시간이 아쉽다.
  • 왜 부족하다고 느꼈나?

→ 저번 영화 추천 대회에 있어서 Catboost같은 경우 FE를 얼마 진행하지 않고, 즉 Feature의 개수가 약 10~15개 정도의 적은 수로 좋은 성능을 냈었는데 LGBM은 늘린다고 해도 좋아지는 판단을 할 수 없었다.

→ 이번 대회의 Catb사용한 다른 팀을 보면 20개 이하의 Feature 수로 좋은 성능을 낸 거 같은데, 모델의 특성 차이라고 생각한다.

→ LGBM 같은 경우는 수치형 변수에 좋으며, 그런 수치형 변수들은 많은 Feature를 추가할 수록 모델이 더 좋은 판단을 할 수 있다.

→ CATB는 범주형 변수에 좋은 모델로서, 모델의 작동 원리에 있어서 CATB가 적은 Feature수로도 좋은 성능을 내는 것이 아닌가? 하는 생각이 든다.

  1. 시각화를 하는 역량이 좋았더라면, 다양한 시각화를 통해 유의미한 파생 변수 생성을 통해서 모델의 성능에 도움되는 여러 피쳐들을 추가할 수 있었는데, 시각화 역량이 부족한 부분이 아쉽다.
  • 시각화 역량을 향상시켜야 한다 → 시각화 강의를 통해 이론을 탄탄히 하고, 많은 구현을 할 필요가 있다.
  • 독립 변수와 종속 변수 간의 유의미한 차이를 찾아낸다면, 이를 모델에 어떻게 적용할지, 또는 Rule-Based로 적용할 수 있을지 고민을 할 필요가 있다. ( 어떻게 써먹을지 고민을 해야 한다)
  1. 모델링에 있어서 하이퍼 파라미터의 기능 및 다른 코드들을 참고하여 어느 정도로 설정해야 할지 잘 참고할 필요가 있는데, 이 부분을 인지하지 못한 체 모델을 실험을 해서 초반에 성능이 생각대로 많이 나오지 못한 게 아닐까 하는 생각이 든다.
  • 왜 애초에 신경을 쓰지 않았나?
  • 저번 대회에는 기존의 모델에 있어서 일반적인 기준의 하이퍼 파라미터의 범위를 설정하여, Optuna만 돌려서 내가 직접 손댈 필요가 없었다.
  • Why? CATB는 하이퍼 파라미터의 영향이 적기 때문에, 그러나 LGBM은 상대적으로 큰 편이라고 생각한다.(민감)
  • 모델의 특성이 하이퍼 파라미터에 민감한지, 하지 않는지 잘 판단할 필요가 있다.

🙂 느낀점 및 감정 상태 회고

음.. 최근에 굉장히 힘들었던 것 같다.
여자 친구랑도 사이가 멀어지게 되고, 지금은 이별했지만.
음.. 지금껏 3개월 간 그래도 나름(?!) 잘 달려온 것 같지만, 나의 진로 및 나의 현 상황, 그리고 여러 복합적인 상황들에 대해 많은 생각을 하고 있다.

  • 내가 과연 잘하고 있을까?

이 부분에 답은 주관적이기 보다는 객관적으로 봤을 땐, 부캠 전의 나와도 비교해 봤을 땐, 굉장히 치열하게 살고 있다고 생각한다.
지금 현 상황만 보는 것이 아니라, 앞으로 6개월? 아니 1년 후의 지금 나를 본다면 나에게 어떤 말을 해줄까? 잘하고 있다고 말해줄까? 아니면, 다른 길을 찾아도 된다고 말을 해줄까?

최근 대회에 있어서도 노력한만큼 성과가 나오지 않고, 그러다 보니 남과 비교하게 되고, 그리고 여자친구와도 사이가 멀어지게 되니 인생의 현타가 갑작스럽게 한 번에 찾아온다. 그런 말이 있지 않은가? 힘든 일은 원래 한 번에 찾아오는 법이라고.

이 부분을 잘 이겨낸다면, 난 더 큰 사람이 될 수 있으리라 생각된다. 나에 대해 알아보는 시간과 그걸 기반으로 어떻게 이력서를 작성할지, 그리고 어떠한 기업에 입사할 지 큰 계획을 세우고 세부적으로 쪼개나가면서, 현 상황에 최대한 집중할 수 있는 환경을 만들려고 노력할 것이다.

어떠한 상황에 쳐해 있는 것이 나를 더 단련시키고, 지속적 성장 및 달릴 수 있게 하는 것 같다. 앞으로 또 힘든 일이 찾아올 수 있겠지만, 항상 본질에 대해서 집중하고, 본질을 기반으로 어떠한 점이 부족한지 등과 같은 나에 대한 회고 및 학습을 이어나갈 것이다.


profile
장난감이 데이터인 사람

1개의 댓글

comment-user-thumbnail
2022년 12월 10일

Fighting Bro

답글 달기