Lineplot

yst3147·2022년 2월 6일
0

공부 내용

  • Lineplot
  • 정확한 Line plot

Lineplot

Lineplot이란?

  • 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프
  • 꺾은선 그래프, 선 그래프, line chart, line graph 등의 이름으로 사용됨
  • 시간/순서에 대한 변화에 적합하여 추세를 살피기 위해 사용됨 -> 시계열 분석에 특화!!
  • .line이 아닌 .plot()

Lineplot의 요소

  • 5개 이하의 선을 사용하는 것을 추천
    -> 선이 너무 많으면 중첩으로 인해 가독성 떨어짐

lineplot 구별 요소

  1. 색상 (color)
  2. 마커 (marker, markersize)
  3. 선의 종류 (linestyle, linewidth)

Lineplot을 위한 전처리

  • 시시각각 변동하는 데이터는 Noise가 존재 -> 패턴 및 추세 파악이 어려움
  • Noise의 인지적인 방해를 줄이기 위해 smoothing을 사용함

정확한 Lineplot

추세에 집중

  • Lineplot은 꼭 축을 0에 초점을 둘 필요는 없음 -> 추세를 보는 것이 목적이므로
  • 너무 구체적인 lineplot보다는 간단한 lineplot이 더 나을 수 있음
    • Grid, Annotate 등 모두 제거
    • 디테일한 정보는 표로 제공하는 것을 추천
  • 데이터가 생략되지 않는 선에서 범위를 조정하여 변화율 관찰

간격

  • x축 간격을 규칙적으로 주는 것이 중요

그래프 상에서 규칙적일 때

  • 기울기 정보의 오해 발생 -> 간격이 일정해야 함

그래프 상에서 간격이 다를 때

  • 없는 데이터인데 있다고 오해할 수 있음

  • 간격이 규칙적이지 않을 때는 각 관측 값을 점으로 표시할 것 !

보간

  • 점과 점 사이에 데이터가 없을 때 이를 잇는 방법

  • 데이터에 error나 noise가 포함되어 있을 때, 데이터의 이해를 돕는 방법

  • 발표할 때 쓰기에는 좋은 방법

  • 일반적인 분석에서는 사용 안 하는 것 추천!

    • 없는 데이터를 있다고 생각하게 할 수 있음
    • 작은 차이를 없앨 수 있음

이중 축 사용

  • 한 plot에 대해 2개의 축을 사용(dual axis)
  • 같은 시간 축에 대해 서로 다른 종류의 데이터를 표현할 때 사용
    • .twinx() 이용

  • 한 데이터에 대해 다른 단위 표현할 때 사용(ex. radian과 degree 표현)

  • 이중 축 사용보다는 2개의 plot을 따로 그리는 것이 나음!!

ETC

  • 라인 끝단에 범례 대신 레이블을 추가하면 식별에 도움됨

  • Min/Max 정보 등 원하는 포인트를 추가해주면 도움이 됨
    • annotation 등 활용

  • 보다 연한 색을 이용하면 불확실성(uncertainty) 표현 가능
    • 신뢰구간, 분산 등

0개의 댓글