계속 구인하고 최근 정처기에 지원해서 그에 대한 공부를 한다고 개발에 대한 포스팅을 하지 않았었는데 아주 재밌을 것 같은 일이 하나 들어왔다.
면접이 하나 잡혔는데 과제가 있었다. 그 과제 주제가 포스팅하는 글의 제목이다.
우선 이것에 대한 분석 보고서 작성이 아닌, 본인의 분석 방향 등을 발표하라고 되어있긴한데 직접적으로 일을 진행하면서 어떤 관점으로 분석하고 일을 진행하는게 좋을까 싶어서 해보는 것이다.
계획을 빠르게 짜봤고, 그에 대한 주제는 우선 '국회의사당 이전에 따른 인구 이동과 부동산 변동률'을 주제로 잡았다.
그럼 이제 이 데이터를 어디서 구하고 어떻게 가공하고, 어떤 방식으로 보여주느냐이다.
- 인구 이동 데이터
이건통계청 KOSIS (통계청 국가통계포털)와공공 데이터 포털에서 찾아보면 될 것 같다.
확보해야 할 핵심 데이터는
- 세종시의 유입 인구, 유출 인구, 순이동량.
- 수도권(서울, 경기)과의 비교 데이터.
- 부동산 변동률 데이터
한국부동산원과공공 데이터 포털, 여기서도 제대로 된 것을 찾지 못한다면직방/호갱노노 등 민간 데이터 플랫폼도 뒤져봐야할듯.
확보해야 할 핵심 데이터는
- 세종시와 수도권(서울, 경기)의 부동산 매매가 및 전세가 변동률.
공통으로 확보해야될 것은 시계열 데이터인데, 시계열 데이터를 기준으로 국회의사당 이전 발표 하기 전(2020년 9월까지)과 이후(2020년 10월 이후)로 나눠서 찾아야함.
우선 커다란 계획은 이렇고 파이썬으로 데이터를 정제하고 분석할 것이고 시각화는 QGIS를 사용해볼 예정이다. QGIS가 회사에서 요구하는 스킬 중 하나라서 활용해보고 싶다.
커다란 계획들은 어느정도 준비가 되었으니까 이제 데이터를 찾아봐야한다.

통계청에 일단 인구 동향이 있다.

지역 통계도 쓸만 할 것 같으니 일단 기억해두자.

'이동' 키워드로 검색하니까 국내 인구 이동 통계가 존재했다.

인구 이동률을 찾을 수 있었고, 이 데이터로 인구 변동률을 구체화 하면 될 것 같다. 제일 최신 데이터가 24년 11월이니까 발표전인 기간은 17년도 1분기까지로 잡고 비교분석할 수 있도록 선택해두자.
분기로 선택해서 17년도 1/4분기부터 24년도 3/4까지 골라서 데이터를 확보했음.

다운 과정에서 SDMX도 있었는데 지금은 가공할만한 시간이 없고 간단하고 빠르게 일을 처리해야되서 고민하다가 그냥 CSV로 가기로 결정했음.
여튼 일단은 인구이동률 데이터는 확보했다. (뭔가 더 필요하다고 느껴지면 그 땐, 공공데이터 포탈까지 써먹자고)
다음은 부동산 데이터 확보다.
일단 이건 공공데이터 포탈에서 검색조금하니까

이런걸 찾을 수 있었음.

공식문서 읽어보고 오자.
...
읽어보니까 지금 주제에 대해서 아주 잘 써먹을 수 있을 것 같다.
그럼 인증키를 발급 받아오자.

오케이 발급 받았다. 그럼 우선 데이터 두개가 다 준비 되었으니 프로젝트를 생성해보자.

이렇게 생성할거고 익숙한 flask 기반으로 가도록 하자.
프로젝트 생성 이후 서버 정상작동 확인했음.
그럼 이제 데이터 비교 로직을 간단하게 짜서 결과를 도출해 내고 그에 따른 논리를 도출해내보자.

우선 환경변수를 좀 깔끔하게 관리하기 위해서 파이썬 삭제하고 pyenv 도입후에 다시 설치후 진행했고, 디렉토리 나누면서 진행중이다. 부동산 데이터를 우선 끌어와서 직접눈으로 확인하고 싶기 떄문에 일단은 이렇게 엔드포인트를 만들고 파라미터는 하드코딩해서 결과를 보려고 해놨음.

우선 요청 자체는 성공 했음.
그럼 이제 뭘 검색해야되는지 알아야되기 때문에.

우선 여기,

그리고 여기서는 지역 코드를 알 수 있었음.

오케이 우선 매매지수를 뽑아왔음. 그럼 이제 매매 지수가 어떻게 변동했는지는 알 수 있을 것이고,
매매지수만으로는 조금 부족한 느낌이 들어서,

이거 두개로 엮어서 그래프로 그려보면 뭔가 보일 것 같음.
우선은 이 두개에 대한 엔드포인트랑 요청 함수 만들자.
오케이 apartment와 housing으로 엔드포인트를 나눠서 각각의 데이터를 반환성공했다.
이제 요청으로 얻을 수 있는 데이터는 매매가격지수 아파트, 매매가격지수 주택종합이고 수도권, 세종, 전국으로 데이터를 반환받을 수 있다. 그러니까 총 6개의 엔드포인트를 만들었다.
부동산 변동률 데이터는 진짜 확보 완료.
우선은 여기까지 하고 내일부터는 변동률 계산 로직, 비교 데이터 생성, 그래프 그리기, 이렇게 일을 진행하면 될듯?
그리고 지금 인구이동률 데이터는 가공을 조금 하고 QGIS 활용해서 시각화하는걸로 하자.