[CNN-LSTM 4] AI HUB 데이터 살펴보기 및 CNN-LSTM 진행
📝 스터디 시간에 AI HUB 데이터에서 원하는 데이터를 쉽게 찾는 방법이 있는지 알아보는 시간을 가졌다.
- 결론적으로는 데이터셋이 정리되어있는 파일은 존재하지 않아 쉽게 찾을 수 있는 방법은 없었고, json 파일만 다운받아 csv파일로 변환하는 방법을 이용하기로 했다.
- 다시 ai hub에서 제공하는 데이터셋을 찾다가 다른 외부데이터도 발견했다.
어째서 지금 처음본거지? 아니면 봤다가 넘겼나?^^* 이 데이터는 영상목록을 csv 파일로 제공해서 어떤 영상이 있는지 쉽게 알아볼 수 있었다.
- ai hub의 json파일들을 csv 파일 변환이 끝난 후 고급단계 단어를 다시 정하기로 했다.
✔️ ai hub 데이터셋을 다시 찾아보면서 그 전에도 분명 읽었지만, 이제와서 보니 다르게 보이는 자료를 하나 발견했다.
✔️ 자료를 처음 접할 때 그 자료가 우리에게 도움이 되는 자료들이 맞는지를 단번에 알아보면 참 좋겠지만, 프로젝트를 진행하면 할 수록 고민과 질문들이 많아지고 관련 지식이 늘어나면서 전에 봤던 자료들이 다르게 보이는 경우가 늘어나고 있다. 전에 못알아본 것이 아쉽기도 하지만, 그래도 성장하고 있다는 증거이니 아쉬워하지말고 더더 성장하자 :)
📝 원래 진행하고 있던 CNN-LSTM 모델 구축 진행
- 원래 참고하던 사이트는 데이터셋으로 영상을 이용한다. 그래서 전처리 과정이 담겨있고, 그게 연결되어 모델에 들어가다보니 데이터셋이 이미 준비되어있는 우리의 상황과 많이 연결되지 않아 어디서부터 어떻게 고쳐나가야할지 막막했다.
- CNN에서 feature들을 추출해내는 것이 가장 관건이었는데, 원래 내가 진행하던 방식과 비슷하게 CNN-LSTM을 구현한 사람의 질문을 발견하였다.
- 위의 발견을 통해 TimeDistributed 레이어를 발견하였다. 이에 대한 조사는 추후에 더 이루어질 예정이다.
진행중인 코랩