pandas를 통한 시각화

도로롱·2022년 10월 17일
0

Matplotlib 기초

목록 보기
2/6

pandas를 통한 데이터 시각화

  • 판다스의 plot()함수를 사용해서 데이터 시각화가 가능하다

matplotlib에서 이미 plot 함수 쓰는데 왜 굳이 pandas에서 해야하는거지?

matploltlib에서는 차트 모양에 따라 함수를 다르게 써줘야 한다는 번거로움이 있음. 더군다나 각 함수마다 파라미터 설정값이 다르므로 오류도 많이 발생. 하지만 pandas는 모든 시각화 함수를 plot 함수 하나로 받고있기에 간결하고 단순하게 사용이 가능하다 개이득
하지만, 정교한 작업은 불가능하므로, 완전히 customizing 하고싶은 데이터가 있다면 멧플롯의 시각화를 사용하는게 맞다.

plot 함수의 인자 값

  • pandas에서 "df.plot()"로 사용하며 ()안에 인자를 넣을수 있음
  • x값과 y값을 따로 지정안하면 기본값으로 모든 x값을, 모든 수치형 y 칼럼을 갖구온다

  • kind 인자를 사용하여 차트의 종류를 선택할 수 있다

  • subplots 인자는 여러개의 그래프를 그리면 true 아니면 false(디폴트 값이다)

  • figsize는 그림의 크기를 조절하는 인자이다

  • title, xlabel,ylable 각 축의 이름과 그래프의 이름을 정할수 있다.

  • xticks, xlim은 x축을 변경하는 것으로, x축의 요소 변경이나, 범위를 변경할수 있다

  • style 인자를 통해 y축의 라인 스타일을 지정해줄수 있다


실습하기

  1. 멧플롯립에서 한글이 안깨지도록 먼저 설정을 해주고, df를 만들어 둔다

  2. df.plot() 함수 사용해서 df로 선그래프로 나타내려고 함

  • kind = df를 선그래프로 표현
  • title = 해당 그래프의 이름을 붙임
  • xticks= x축의 인덱스 이름을 바꿔줌

  • ylim = y값의 범위를 바꿔줌
  • xlable, ylabel = x,y축이 뜻하는 바를 넣어줌

  • style = style 양식을 보고 순서대로 red, 마커모양은 +, 실선모양은 - 를 뜻한다
  1. 년도와 지역을 바꾸기
  • 인덱스와 컬럼을 전부 바꾸고 싶은 상황

  • df.T.plot 하면 컬럼과 인덱스를 바꿀수 있다

  • 그래프를 여러개 쓰고 싶을때는 subplots 인자를 true로 해주면 되고 년도별로 3개의 axes가 나오게 된다

profile
질문 없는 성장은 없다. 3년차 데이터 분석가

0개의 댓글