NLP P stage Day 1, 9/27 Mon

이호영·2021년 10월 3일
0

Boostcamp AI Tech 2기

목록 보기
28/32

├── code
│ ├── pycache
│ │ └── load_data.cpython-38.pyc
│ ├── best_model
│ ├── dict_label_to_num.pkl
│ ├── dict_num_to_label.pkl
│ ├── inference.py
│ ├── load_data.py
│ ├── logs
│ ├── prediction
│ │ └── sample_submission.csv
│ ├── requirements.txt
│ ├── results
│ └── train.py
└── dataset
├── test
│ └── test_data.csv
└── train
└── train.csv

Code 설명

  • train.py
    baseline code를 학습시키기 위한 파일
    results 폴더에 model관련 파일이 저장됨

  • inference.py
    학습된 model을 통해 prediction하며, 예측한 결과를 csv 파일로 저장해줍니다. prediction 폴더에 csv 파일이 저장됨

  • load_data.py
    baseline code의 전처리와 데이터셋 구성을 위한 함수들이 있는 코드

  • logs
    텐서보드 로그가 담기는 폴더

  • prediction
    inference.py 를 통해 model이 예측한 정답 submission.csv 파일이 저장되는 폴더

  • results
    train.py를 통해 설정된 step 마다 model이 저장되는 폴더

  • best_model
    학습중 evaluation이 best인 model이 저장

  • dict_label_to_num.pkl
    문자로 되어 있는 label을 숫자로 변환 시킬 dictionary 정보가 저장

  • dict_num_to_label.pkl
    숫자로 되어 있는 label을 원본 문자로 변환 시킬 dictionary 정보가 저장

Dataset 설명

train

train 폴더의 train.csv 를 사용해 학습
evaluation data가 따로 제공되지 않아서 train data에서 dev set을 할당한다.

test

test_data.csv를 사용해 submission.csv 파일을 생성
만들어진 submission.csv 파일을 리더보드에 제출

profile
Speech Synthesis & Voice Cloning

0개의 댓글