# template 소스코드 다운로드
git clone https://github.com/sackoh/kdt-ai-aws
cd ./kdt-ai-aws
# 필요 라이브러리 설치
pip install -r requirements.txt
새로운 workspace가 생성되는 것을 확인할 수 있다.
이때 터미널 창을 열려고 하는데 다음과 같은 오류가 떴다.
Ctrl + ,
--> 검색창에 default profile:windows
를 검색source activate pytorch
python train_ml.py
코드를 작성하여 모델을 훈련시킨다.
깃허브로부터 데이터를 다운받고
다운 받은 데이터를 preprocessing, feature engineering 작업을 거친 후, 나이브 베이즈 모델에 훈련시키고 모델 성능을 평가했다.
그 후 학습한 모델을 아래 캡처처럼 저장하여 생성된 것을 확인할 수 있다.
모델을 디스크에 저장
joblib.dump
: 지정한 경로에 저장
model_input 데이터를 앞서 불러온 model의 input으로 넣었을 때 그 결과는?
model_output = model.predict_proba(model_input) # 결과값은 확률로 나옴
>>> model_output
array([[0.02618814, 0.97381186]])
>>> model_output = model_output.argmax(axis = 1) # model_output의 결과 중 가장 큰 값의 index 추출
>>> model_output
array([1])
>>> id2label = {0 : 'negative', 1 : 'positive'} # id값 --> label로 변환해주는 dict
print('sentiment : {}'.format(id2label[model_output[0]]))
>>> sentiment : positive
--> 해당 리뷰는 긍정 리뷰로 판단했다.