대부분의 데이터 분석가들은 (1)에서 많이 가져온다
🤔WHY??
1. 생각보다 python을 할 수 있는 사람이 많지 않고
2. 잘 사용자체를 안하기 때문..(솔직히 공감..)
근데 왜 굳이굳이 배워야 하는걸까??
1. 데이터를 누가 이쁘게 만들어서 가져다 주는게 아니기 때문
2. 데이터가 없을 때 손놓고 아무것도 안하는 경우가 많기 때문
그 중에서 오픈 데이터 API에 대해 더 자세히 알아보자.
프로그램을 위한 인터페이스!! 사람을 위한 인터페이스 노노!!
사진과 같이 사용자가 서버에 API를 요청하게 되면 JSON 형태로 불러와 해당 형식에 맞게 사용자에게 보여지는 것이다.
말로 하면 어려우니 예시를 들어보자.
만약 사진과 같은 어떤 쇼핑몰에서 사용자가 자신의 장바구니를 보고 싶다고 가정해보자.
사용자가 데이터를 요청하고 보여지는 과정은 다음과 같다.
1. 사용자가 API를 통해 '자신의 장바구니'를 보고 싶다고 요청
2. API가 사용자의 요청을 서버에게 프로그램친화적으로 전달
3. 서버가 해당데이터 API에게 전달
4. API 해당 데이터 JSON형태로 가져옴
5. API가 JSON형태의 데이터 -> 사용자 친화적으로 변경해서 데이터 전달
6. 사용자 요청한 데이터 확인
결국 중요한건
사용자 -> API -> 서버 -> API -> 사용자
라는 것이다.
말 그대로 공개되어있는 API이다. = Public API (반대: Private API)
보통은 개인적으로 API에 접근할 수 있는 인증키를 부여받아서 무료로 사용한다.
인증키는 개인적인 것이니 다른 곳에 올리는것 조심!!
공공, 게임, 금융, 농수산물 등 다양한 곳에서 API를 얻을 수 있다
데이터 명세서 읽기
대부분 API는 설명서가 존재!!
어떤 것이든 사용 전 설명서 읽듯이 API도 읽으면 된다!!
API 사용 = 서버에 직접 데이터를 요청
설명서를 잘 읽어야 원하는 데이터를 가져오게끔 요청할 수 있다
만약 404 혹은 400,500번대가 나온다??
다 각자 듯이 있는 것이지만 일단 뭔가 문제가 있는것!!
나오게 되면 구글링해서 디버깅 해보자;;
만든 response 변수에서 쓸 수 있는 함수가 뭐가 있는지 모르겠으면
dir() / help() 등을 통해 알아볼 수 있다.
사진에는 잘렸지만 text 함수를 쓸 것이다.
이렇게 response.text를 통해 네이버에서 불러온 텍스트를 JSON형태로 확인할 수 있었다.
사실 저 텍스트들은 아래의 홈페이지 모습과 같은 정보를 담고 있다.
우리가 흔히 보는 네이버의 첫 화면이다
방금 확인한 JSON 형태를 사용자 친화적이게 시각화, 대시보드 생성 등을 이용하여 만들어 둔 것이다.
참고로 저건 실습용이고 숙제는 금융감독원 API로 했기 때문에 다른점이 많았다.
블로그
위 블로그를 참고했으니 궁금한 사람은 들어가서 보기..ㅎ