[시계열] 시계열 도표란?

전주미·2024년 4월 15일
post-thumbnail

1. 시계열 도표란?

시계열 도표(Series Plot)는 시간에 따라 관측된 '시계열 데이터'를 시각적으로 나타내기 위한 도표이다.
이 시계열 도표는 데이터가 가진 시간에 따른 '연속성'을 그래프에 나타내기 위해 각 시점에 관측된 자료를 선으로 연결한다. 또 시계열 도표는 X축, Y축, 시계열로 구성되며, 필요에 따라 그룹을 추가하기도 한다. 다만, X축은 일자, 시간, 연도 등 시간을 나타내는 변수로 할당한다.

또한 시계열 도표는 시간에 따른 변화를 관측하거나 시계열 데이터에 '주기'나 '추세'가 있는지 등을 분석할 때 유용하며, 미래를 예측하기 위해 활용하기도 한다. 하지만 시계열 도표를 그릴때는 X축의 시간 간격이 항상 일정해야 하고, 너무 많은 대상을 나타낼 경우 가독성이 떨어지기 때문에 주의해야 한다. 시계열 도표는 산점도와 같이 두 수치형(한 변수는 시간을 나타냄) 변수 간의 관계를 파악할 수 있다. 하지만 산점도는 시간의 연속성을 시각적으로 표현할 수 없기 때문에 시계열 데이터를 시각화할 때는 시계열 도표를 사용하는 것이 바람직하다.

2. 구조

시계열 도표는 크게 X축, Y축, 그룹, 시계열 등 네 가지 요소로 구성되어 있다. 이 중 X축과 Y축은 필수 구성 요소이고, 시계열은 이 둘을 지정하면 자동으로 만들어진다. 그룹은 여러 개체에서 관측된 시계열 자료를 시각화할 때 사용한다.

1) X축에는 일, 월, 년, 주와 같은 시간 변수를 할당하며, 이는 시계열 데이터의 관찰 기준 시점을 의미한다. X축은 시계열 도표를 그리기 위한 필수 요소이다.

2) Y축은 매출, 물가, 온도, 주가와 같은 특정 시점에 관찰된 수치형 변수를 할당한다. Y축 역시 시계열 도표의 필수 요소이다.

3) 그룹은 여러 그룹에서 관찰된 시계열 데이터를 한 그래프로 시각화할 때나 각 그룹을 구분하는 변수를 할당할 때 사용한다. 그룹은 시계열 도표의 필수 요소는 아니다.

4) 시계열은 X축 변수(시간)의 변화에 따른 Y축 변수 값의 변화를 선으로 나타낸 그래프 영역을 의미한다. 시계열을 구성하는 선은 '색상', '두께' 등을 변경할 수 있다. 또한 실제 값이 존재하는 위치를 '표식'으로 설정하면 그래프상에 '점'으로 데이터가 표시된다. 표식은 산점도와 같이 형태나 크기를 변경할 수 있다.

3. 사용 목적

시계열 도표를 사용하는 목적은 크게 세 가지이다. 첫째, 시간에 따른 변화를 관측하기 위한 목적이다. 연도에 따른 평균 기온의 변화는 지구 온난화가 얼마나 가속화되고 있는가에 대한 정보를 준다. 이 경우 시계열 도표는 유용하다. 둘째, 주기와 추세를 분석하기 위한 목적이다. 경기 순환주기는 회복과 확장, 수축과 후퇴를 반복한다. 이때 경제 지표를 시계열 도표로 나타내면, 간접적으로 현재 경기가 어디쯤 위치하고 있는지 알 수 있다. 셋째, 미래를 예측하기 위한 목적이다. 과거의 추세가 반복된다면, 시계열 도표는 미래 예측에 꽤나 괜찮은 힌트를 제공한다. 이처럼 시계열 도표를 활용하면, 보다 과학적인 예측이 가능하다.

4. 주의할 점

시계열 도표를 그릴 때는 다음의 두 가지 사항을 주의해야 한다. 첫째, 축 간격이 같아야 한다. 축 간격은 입력 데이터에 의존하기 때문에, 입력 데이터를 잘 살펴보지 않으면 간격이 달라질 수 있다. 간격이 다를 경우, 그래프가 왜곡되기 떄문에 주의가 필요하다. 둘째, 그룹이 너무 많으면 시계열 도표의 가독성이 떨어진다. 그룹이 많은 경우 다른 시각화 방법을 선택하거나, 일부 그룹을 추출해 그리는 것이 바람직하다.

5. 시계열 도표와 산점도

시간이 수치형 데이터라는 점에서 시계열 도표와 산점도는 비슷한 점이 많다. 하지만 산점도가 아닌, 시계열 도표를 사용하는 데에는 이유가 있다. 시계열 도표는 시간에 따라 관측된 지점을 시각적으로 나타내기 위해 점과 점을 '선'으로 연결한다. 고작 선 하나를 추가한 것이지만, 선은 시각적 연속성을 잘 표현해 주기에 보는 이의 원활한 이해를 돕는다. 그리고 이 차이는 그래프의 가독성에 있어 큰 차이를 만든다.

코딩없이 배우는 데이터 과학

profile
data dreamer

0개의 댓글