[AIFFEL 대전 1기] 49일째 날

데이터 여행자·2021년 3월 10일

[일기]

목록 보기
50/105

오늘 추Node 스터디는 쉬는 날이다. 비는 1시간동안 코딩 마스터 준비를 하려고 했건만 결국 일어나는데에 실패했다. 침대에 가만히 누워 있는 것은 정말 중독적이다.

노드

오늘의 노드는 html과 Flask에 대한 것이었다. 어제 조원들과 백엔드에 대해 이야기를 나누었는데, 다음날 바로 백엔드가 나와서 신기했다. html은 예전에 공부한 적이 있어서 그리 어렵지 않았지만 Flask 부분은 이해하기 어려웠다. 게다가 코딩 마스터 준비한다고 중간에 그만 두어서 아직 마무리를 하지 못했다.

노드를 하던 중에 테트리스도 했다. K님께서 같이 하자고 하셔서 하던 중 아쉽게도 개더가 제대로 동작하지 못해서 중간에 그만 둘 수밖에 없었다.

풀잎스쿨, 코딩마스터

오늘은 numpy로 데이터를 다루는 것을 배웠다. Numpy의 기본 사용법을 배우고 이전에 for문으로 작성했던 코드를 Numpy로 바꾸는 실습을 했다. 기본 사용법은 그럭저럭 끝냈지만 실습은 감을 못 잡아서 제대로 하지 못했다. 조원들과 이야기를 나누는데 시간을 보낸 것 같다.

마지막 1시간은 코로나 데이터를 어떻게 시각화할 것인지에 대해서 토론하는 시간이었다. 우리는 지난주에 이야기를 나누었기 때문에 각자 해온 것을 공유했다. 그리고서 내린 결론은 '잘 모르겠다'였다. 아직 데이터 분석이 무엇인지, 어떻게 시각화를 해야하는 것인지 모르겠다. 커널을 보고 따라하려고 했지만 그렇게 하면 제대로 안 될 것이라는 조언을 들었다. 그렇다면 어떻게 해야 하는 걸까?

수업을 마친 후

뭔가 해보려고 했지만 저녁을 먹고 동영상 몇 개 보고 나니 벌써 9시였다. 9시부터 약 11시까지 추Node의 대회 준비조끼리 seaborn tutorial 동영상을 보고 실습하는 시간을 가졌다. 이미 한 번 본 것이지만 다시 보니 새로웠다.

실습할 때는 졸렸는데, 구글밋방을 나오고 스터디 준비를 하니 정신이 들었다. 저녁에 본 동영상은 스터디 준비를 위해 본 것이었다. 그러나 별 내용은 없었다. 생각 외로 한국어 자료가 없었다. 결국 영어 자료를 보면서 준비해야 했다. 그래도 다행히 어느 정도 끝낼 수 있었다.

내가 준비한 주제는 feature engineering이다. 캐글 프로젝트를 하는 동안 여러 개의 캐글 커널을 보면서 느낀 것은 feature를 만들지 않으면 좋은 성능이 나오지 않는다는 것이었다. 어떻게 해야 하는 것인지 고민을 하고 있었는데 좋은 기회가 생겨서 정리할 수 있는 시간을 가질 수 있었다.

물론 정리를 한다고 feature engineering을 잘 할 수 있는 것은 아니지만 어떻게 해야 하는 것인지는 조금 감을 잡은 것 같다. 그리고 하나 알게 된 것은 자동으로 feature engineering을 해주는 툴이 있다고 한다. featuretools이 바로 그것이다. 오픈 소스라고 하니 대회 준비를 하면서 한 번 사용할 수 있으면 좋을 것 같다. 캐글 커널을 참고하면 될 것 같다.

0개의 댓글