1. 데이터 전처리
(1) Session Length
(2) 하위 99.9% 세션 길이 분포 누적합 시각화
(3) Session Time
(4) Data Cleansing
2. 미니 배치의 구성
(1) Train
(2) Valid
(3) Test split
3. 모델 구성
(1) SessionDataset
(2) Session Data Loader
4. 모델 학습
(1) Evaluation Metric
(2) Model Architecture
(3) Model Training
5. 모델 테스트
(1) 모델 1 학습
6. 모델 개선으로 Recall, MRR 등 변화추이 관찰
(1) 모델 2, 3, 4 학습
(2) Inference
가장 성능이 개선 된 모델
batch_size=32, hsz=50, drop_rate=0.1, lr=0.001, epochs=10, k=20
batch_size를 낮게 할 수록 모델 성능 개선 = 모델 학습 오래 걸림
어려웠던 점
1) index is out of bounds for axis 0 with size 에러
2) 데이터셋 전처리 과정에서 Time 유형 변경