https://www.kaggle.com/code/nilanml/imdb-review-deep-model-94-89-accuracy
감정 분류 모델의 평가:
ROC 곡선을 사용하여 감정 분류 모델의 성능을 평가. 모델이 양성(긍정 또는 부정) 및 음성(중립) 샘플을 얼마나 잘 식별하는지를 평가
여러 감정 분류 모델 간의 성능을 비교:
각 모델의 곡선을 그려 비교하고, 곡선 아래 영역인 AUC(Area Under the Curve)를 계산하여 모델 간의 상대적 성능을 평가. AUC가 더 높은 모델이 더 나은 성능
임계값 선택
load
tsv-> dataframe
id drop
참고: https://www.kaggle.com/code/nilanml/imdb-review-deep-model-94-89-accuracy
의논사항: unlabeledtraindata를 어떻게 이용할 것인가?