저번에 kaggle dataset을 사용하여 어떤 식으로 구성되어 있는지 확인해 봤다. 그럼 이제 dataset을 이용하여 그래프를 그려 자세히 알아보도록 하자.
아무런 설명없이 갑자기 그래프만 떡하니 나와서 뭔가 부자연스럽긴 하지만, 설명을 해보도록 하겠다.
sns.boxplot(df['year'], df['cnt'])
는 가로는 year
을 세로는 cnt
로 비교하겠다는 뜻이다. 이는 조금만 찾아봐도 알 것이라고 생각한다. 위의 그림으로 무엇을 보여주고자 하는지는 명확이 파악했을 것이다.
위의 그림 같은 경우에는 month
와 cnt
를 비교하는 것으로 보면 된다. 여기서 cnt
는 무엇이냐 하면 자전거를 얼마나 공유했는지의 횟수이다. 이는 kaggle 사이트에 들어가서 확인해 보면 된다. 매번 위와 같은 코드를 쳐서 작업하는 것도 귀찮으면 이처럼 함수를 만들어 사용하는 것도 아주 좋은 방법이다.