1. 데이터를 전처리 및 분석한다.
from sklearn.datasets import make_regression
X,y = make_regression(n_samples=100, n_features=5, noise=50,
random_state=42)
  1. 데이터를 training set, test set으로 나눈다.
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y,
random_state=33)
  1. training set에 대해서 사용할 모델을 학습시킨다.
    (model.fit(training_set))
lr = LinearRegression(normalize=True)
lr.fit(X_train, y_train)
  1. test set에 대해서 학습된 모델의 예측값을 통해 모델의 성능을 평가한다.
    (실제값과 예측값의 비교를 통해서)
y_pred = lr.predict(X_test)
print(mean_squared_error(y_test, y_pred))
  1. 모델의 성능이 충분히 쓸만하다고 판단될때
    새로운 데이터에 대해서 학습된 모델을 이용해 y값을 예측한다.
    이 과정을 inference 과정이라고 한다.
y_infer = lr.predict(X_infer)

0개의 댓글