y = 정답
y^ or y'는 추정값(예측값)
Toy datasets
https://scikit-learn.org/stable/datasets/toy_dataset.html
뒤에 regression, classificatioin으로 쓰이는 함수 구분
loss(cost) 값 = y - y'
타이타닉으로 전처리 연습
함수 train_test_split
random_state
문자를 수치로 변환
from sklearn.preprocessing import LabelEncoder