220329_TIL

신두다·2022년 4월 3일
0

TIL

목록 보기
2/82

Fact


오늘은 아래 내용을 배웠다.

  • Feature Engineering
    • What is Feature Engineering? and Why?
    • datatype
    • string, replace, apply (!!)
  • list comprehension (for문)

오늘은 아래 문제를 풀었다

  • 데이터셋 기존 feature를 통해 새로운 feature 생성하기
  • string Manipulation (쉼표가 포함된 숫자를 integer로 변경하기)
  • apply
  • Missing value handling (결측치 처리)

Feeling


  • apply()를 한번에 여러 칼럼에 적용하려고 하다보니 상당히 헤맸다. 가능할 것이라고 생각해 for문을 쓰지 않고 해봤는데 그러다 시간을 많이 잡아먹었다.
  • 당장 과제를 해결할 것이냐 vs 조금이라도 더 fancy하게 코딩을 하기 위해 시간을 더 할애할 것이냐의 딜레마를 apply() 문제에서 느꼈다. 우선 오늘은 전자를 선택했고 주말에 후자를 해보려고 한다.
  • 도전과제 풀어냈을 때 기분이 정말 좋았다. 이렇게 조금씩 성취감을 쌓아나가면 될 것 같다.

Finding


  • 데이터셋을 보고 다룰 때 셋의 특성(결측치 여부, datatype 등)을 항상 염두에 두어야 한다.
  • 코드 하나하나에 집착할 필요는 없지만, 다만 생각을 좀 더 논리적으로 하기 위해 노력은 하자. 바로 코딩부터 무작정 하려고 하지 말고, 어떻게 해결하면 좋을지 구조를 미리 짜보고 시작하는게 좀 더 빠르게 문제를 해결할 수 있을 것이다.
  • 어떻게 하면 좀 더 잘할 수 있을까? 라는 생각을 놓지 말자!

Future action


주말에 보충해야 한다

  • 강의노트에 있는 학습자료 링크 다시 한 번 볼 것.
  • 판다스 연습 튜토리얼 진행
profile
B2B SaaS 회사에서 Data Analyst로 일하고 있습니다.

0개의 댓글