실제 데이터를 분석하여 보고서를 작성하는 실습을 진행하였다.
'한국자산관리공사_국유부동산 매각현황' 데이터를 활용하여 데이터를 분석하였다. 데이터 분석은 다음 4개의 가설을 세워 진행되었다.
가설1) 상위 팀과 하위 팀 간 매각 금액이 2배 이상 차이를 보이지 않을 것이다.
가설2) 연도별 매각금액 추이는 우상향 그래프를 보일 것이다.
가설3) 가장 매각 면적이 큰 지역은 강원도일 것이다.
가설4) 가장 매각이 많은 때는 12월일 것이다
가설5) 처분 구분 중 가장 많은 비율을 차지하는 것은 매각수의일 것이다.
데이터 분석 과정은 다음과 같이 이루어졌다.
1) 매각 금액이 가장 많은 팀과 하위 팀의 차이를 확인하고자 시각화를 사용하였다. 각 팀별 매각 금액 차이 비교 뿐만 아니라 가장 높은 팀과 다른 팀의 두 분류로 나누어 비교하여 시각화하는 방법을 사용햐였다.


2) 연도별 매각금액 추이를 확인하기 위해 선그래프를 그려 확인하였다.

3) 지역별 매각 면적을 확인하기 위해 바그래프를 통해 상위 5개 지역의 매각 면적을 확인하였다.

4) 월별 매각 금액을 비교하기 위해 바그래프를 사용하여 비교하였다.

5) 처분 구분별 비율을 확인하기 위해 파이차트를 활용하여 분석하였다.

- 기본적인 데이터를 주로하여 연습식으로 데이터분석을 하다 실제적인 데이터분석을 처음하여 아직 부족한 부분을 많이 느꼈다. 분석하는 분석가의 관점에 따라 같은 데이터라도 다양하게 분석이 이루어지는 것을 보며 분석가로서의 경험이 중요하다는 것을 알게 되었다.
현재에서의 회고) 그래프 색상 무지개말고.. 가시성을 고려하여 시각화하자..!