이제까지 데이터 전처리를 했으니 모델링을 할것이다. 사용하는 모델은 RandomForestRegressor이다.
일단 우리가 예측할 것은 관객수이기 때문에 관객수를 없앤다.
train_x = train.drop(['box_off_num'], axis=1)
train_y = train['box_off_num']
그리고 모델을 불러온다.
model = RandomForestRegressor(n_estimators=100)
그런다음 이제 피팅 시킨다.
model.fit(train_x, train_y)
그리고 test와 예측을 한다.
pred = model.predict(test)
이것을 제출 파일에 담고 제출하면 끝.
소감
- 배우는 단계에서 거의 처음으로 해본 것이다. 그래서 다른 사람의 코드를 많이 보고 따라한 것을 내 생각대로 적어본 것이다. 그러니 나름 이해도 잘 된것 같고, 이런 비슷한 것은 왠지 혼자서도 잘 할 수 있을 것 같은 자신이 든다
정말 유익한 글이네요