머리가 빙글빙글 돈다...!
엄청난 데이터 속에서 내가 사용할 데이터를 선별해야 한다.
많은 양이지만 하나씩 해나가도록 하자.
데이터 출처 : https://www.data.go.kr/index.do
대한민국 공식 전자정부 누리집에 공공데이터포털 이라는 사이트가 있다.
이곳에는 대한민국의 공공기관/공기업/사기업 등이 공공 데이터 제공 API를 배포하고 있다.


위와 같은 데이터들이 포함되어 있으며, 전체 약 9만건, API만해도 1.1만건 이상의 방대한 데이터를 제공한다.
이러한 거대한 데이터들을 계속 확인하고 어떻게 쓸지 고민하다보니 시간이 훌쩍 지나가버렸다...
마치 코딩을 처음 배울때 정보의 바다에 빠진거같은 느낌을 받게 되었다.
이전 글에서도 봤다시피, 대략적인 데이터 분야는 정해졌기 때문에 이를 바탕으로 최대한 엄선해서 분류했다.
그리고 공공 데이터 포털은 사용하기 위해 활용신청을 해 개인 Key를 받아야 한다.

방법은 간단하다. 특정 API 제공 글에 들어가면 활용신청 버튼이 떡하니 보인다.
저걸 누르고 절차대로 하면 Key가 발급될 것이다.
그리 어렵지는 않으니 따로 서술하진 않겠다.
지금 내가 받아올 수 있는 데이터를 정리해 볼 것이다.
다음 글에 스키마로 정리해볼 것이다.
한전) 가구평균 전력사용량
요청
응답
한국소비자원) 생필품 정보 조회
요청
응답
한국소비자원) 판매 업체 정보 조회
요청
응답
한국 소비자원)생필품 가격정보 조회
요청
응답
한국 소비자원) 기준 데이터 조회
요청
응답
건강보험심사평가원) 병원정보서비스
요청
응답
특이사항 - header, body, footer로 나눠져 있음
HIRA 빅데이터 개방포털) 종별 코드 정보
상위 몇개만 기술
코드구분 코드 명칭
서식구분코드 $ 해당사항없음
서식구분코드 021 의과입원
서식구분코드 031 의과외래
서식구분코드 041 치과입원
서식구분코드 051 치과외래
서식구분코드 061 조산원입원
서식구분코드 071 보건기관입원의과
기상청) 일기예보
요청
응답
여기서 예보지점 x,y좌표를 따로 입력해줘야 하는데...

이렇게 따로 XML 파일로 제공이 된다.
따로따로 매핑을 해줘야 한다...
이 데이터를 가공하는데 큰 어려움이 있을것으로 보인다.
단순히 데이터를 받아서 보내는 것이 아니라, 일정 시간마다 데이터를 한번에 호출해 데이터베이스에 쌓아놓을 생각이기 때문이다.
우리는 4가지 타입의 API를 요청/응답 받을 수 있다.
이것을 바탕으로 스키마를 짜고, 프로젝트를 진행할 예정이다.