-> Label인 지연여부데이터가 범주형임(수치형이 아님)
수치형이면 회귀, 수치형이 아닐 때
해결방안 -> 분류 알고리즘
주어진 입력 값이 어떤 클래스에 속할지에 대한 결과 값을 도출하는 알고리즘
다양한 분류 알고리즘이 존재하며, 예측 목표와 데이터 유형에 따라 적용
가장 단순한 방식, -> 그러나 이것도 엄연히 예측모델
분류 문제에 대한 다양한 머신러닝 모델 사용
트리 구조 기반: 의사결정나무, 랜덤포레스트 ...
확률 모델 기반: 나이브 베이즈 분류기, ...
결정 경계 기반: 선형 분류기, 로지스틱 회귀 분류기, SVM, ...
신경망: 퍼셉트론, 딥러닝 모델, ...
...
우리가 좀 더 배울 것: 의사결정나무 모델 -> 간단하지만 생각보다 성능도 꽤 좋고, 확장할 수 있는 가능성도 높음, 앙상블 이라는 기법과 함께라면 굉장히 고급 기법까지 의사결정나무를 통해서 만들 수 있음.