https://sparkbyexamples.com/pyspark/pyspark-sampling-example/ 데이터가 1억건이 넘다보니, 샘플링을 해야할 것 같다.
IV, 엔트로피로 표현?, %로 표현?
1일차|기대 획득량 2일차|기대 획득량 3일차|기대 획득량 4일차|기대 획득량 5일차|기대 획득량