모델을 만들때 진행했던 결측치 처리, 스케일링, 모델학습 등 머신러닝 프로세스에서 파이프라인(Pipelines)을 사용하면 중복 코드를 최소화여 쉽게 연결할 수 있다.
💛 장점
from sklearn.pipeline import Pipeline
pipe.named_steps
named_steps
속성을 사용해서 파이프라인의 각 스텝에 접근이 가능하다. 이 속성은 유사 딕셔너리 객체(dictionary-like object)로 파이프라인 내 과정에 접근 가능하도록 하기 때문이다.
target feature와 각 feature들의 상관계수를 바그래프로 나타내는 것 같다.
import matplotlib.pyplot as plt
model_lr = pipe.named_steps['logisticregression']
enc = pipe.named_steps['onehotencoder']
encoded_columns = enc.transform(X_val).columns
coefficients = pd.Series(model_lr.coef_[0], encoded_columns)
plt.figure(figsize=(10,30))
coefficients.sort_values().plot.barh();