느낌 점: 하이퍼파라미터보다 파라미터가 중요하다
- 인공지능 개발은 데이터와 모델이 있다고 생각하였다
- 모델은 모델구조(종류)선정, 하이퍼파라미터튜닝이 있고
- 데이터는 별도의 다른 분야라고 생각하였는데
- 모델이 어떻게 움직이는 걸 결정하는 게 모델최적화라면
- 모델이 어떻게 생각하는 걸 결정하는 게 데이터였다
- 왜냐하면 결국 데이터가 하는 일이라고는,
- 모델의 파라미터를 점진적으로 최적화하는 것이기에
- 파라미터는 가중치와 편차를 말하는데, 그냥 모델이 스스로 생성해내는 알고리즘이다
- 이걸 인간이 복잡하게 할 수 없으니
- 모델이 스스로 판단하게 하는데
- 이 모델의 작업에 간접적으로 인간이 할 수 있는 일이 데이터를 주면서 그에 맞는 파라미터를 업데이트시키는 것이다
- 결국 인간이 모델에게 할 수 있는 일은 먹이(데이터)를 쥐어주고 그에 맞도록 변화하도록 하는 것이다.
- 그래서 프로젝트 시작 초반에는 베이스라인 돌려보고, 리더보드 제출도 하면서 전반적으로 친숙해지는 시간을 갖고, 꼭! 반드시 모델의 먹잇감인 데이터를 하나씩 뜯어보면서 어떤 먹이를 모델에게 줄 것인지 다같이 팀으로 모여서 탐구하는 시간이 필요하다. Trash in Trash out