2021.1.20 수
https://www.youtube.com/watch?v=pnyy8Yd2KG4&list=PL9mhQYIlKEhdSd8qt20neH1hHYjLWmV3w
캐글 시작하면 먼저 해야할 일
1단계. 기존에 논의된 Discussion 살펴보기
2단계. Upvote 많은 Notebook 살펴보기 -> 내가 읽는 모든 커널에 좋은 커널이라고 댓글 달기(50개 이상) : discussion 동메달 획득
커널공부
1단계. 데이터 입력방법 공부하기 : 이미지 데이터 입력 라이브러리 - Pillow, skimage, imageio
2단계. 데이터 시각화 - matplotlib(조금 더 이쁘게), seaborn(쉬운 사용)
3단계. 전처리: feature engineering - 이미지 encoding 방법
4단계. 모델 - 이건 정말 정확하게 작동방법, 수학이론도 공부 : 공부하는 딥러닝 수학이론은 그때그때 공부하고 정리하기
- 모델을 완전히 이해했다의 기준
- 개념적이해
이모델이 어떤 아이디어를 가지로 있는가.
이 모델은 어떤 문제점에서 비롯되었고 기존 모델의 어떤것을 개선하기 위해 만들어졌는가
이 모델의 장단점은 무엇인가? - 이런 분포에 대해서는 잘 예측할 수 있지만, 저런것은 잘 예측하지 못한다. - 모델의 특징- 프로그래밍 스킬
라이브러리 사용방법
모델을 직접 구현하는 방법
구현된 모델을 내가 원하는 모델로 커스텀하는 방법
어떻게 하면 최대한 효율적으로 모델을 돌릴수 있을까
가독성, 재사용성이 높은 코드. 상대방이 잘 읽을 수 있는 코드.- 수학, 도메일 지식
모델 내부에는 어떤 과정이 진행되나
데이터 전처리 ex) 음성 데이터는 mel_spectrogram : 이 전처리가 왜 진행되어야 하는지 - 수학적, 도메인적 지식