[제로베이스] 데이터 사이언스 15기 - (06-08 EDA 스터디노트)

윤태호·2023년 6월 9일
0
post-thumbnail

오늘 수강한 강의 - EDA Naver API (01 ~ 07)

01 ~ 03 Naver API 등록 및 간단한 사용

Naver API 등록

  • https://developers.naver.com/main/
  • 네이버 개발자 센터
  • 네이버 로그인
  • 서비스 API 선택
  • 데이터랩
  • 오픈 API 이용 신청

  • 환경 추가
  • WEB 설정
  • http://localhost 입력
  • 등록하기
  • Client ID
  • Client Secret
  • 복사해두기
  • 위 주소를 즐겨찾기에 두면 나중에 찾기 편리하다
  • 일일 사용량이 정해져 있다

Naver API 사용

  • API에 대한 Python 예제
  • 그 중에 API 기본 정보 항목에 보면 요청 URL이 있다
  • 웹 API는 이 경로를 이용한다
  • 예제 코드를 Jupyter Notebook에 복사
  • client_id, client_secret 변수에 발급받은 내용을 넣어준다
  • urllib: http 프로토콜에 따라서 서버의 요청/응답을 처리하기 위한 모듈
  • urllib.request: 클라이언트의 요청을 처리하는 모듈
  • urllib.parse: url 주소에 대한 분석
  • 이 주소가 네이버 블로그 검색 결과를 가져오는 주소이다
  • 응답 결과를 response에 저장
  • 결과를 보기 위해서는 약간의 작업이 더 필요하다
  • http.clinet.HTTPResponse 클래스는 getcode() 함수를 이용해서 응답의 상태를 확인할 수 있다
  • 200은 정상
  • 사용하는 서비스마다 에러코드가 조금씩 다르므로 잘 확인하자
  • 글자로 읽을 때 decode로 utf-8을 설정해줘야 한다
  • 이 주소는 네이버 책 검색 결과를 가져오는 주소이다

  • 이 주소는 네이버 영화 검색 결과를 가져오는 주소이다

  • 이 주소는 공개된 네이버 카페 검색 결과를 가져오는 주소이다

  • 이 주소는 공개된 네이버 쇼핑 검색 결과를 가져오는 주소이다

  • 이 주소는 공개된 네이버 백과사전 검색 결과를 가져오는 주소이다

04 ~ 07 Naver API에서 모은 몰스킨 데이터 정리하고 시각화하기

상품검색

  • 몰스킨이라는 이름으로 검색

  • 반고흐가 쓴 몰스킨 노트의 메모
  • 이 순서로 함수를 만들어 나감

get_search_url

get_result_onpage

get_fields



actMain


  • 인덱스에 문제가 있음

toExcel

시각화

  • matplotlib 한글 대응
  • 몰스킨 노트 판매자 조회

재미있었던 부분

네이버 API를 사용하여 필요한 정보를 불러오고 시각화 하는 부분이 가장 기억에 남고 재미있었다

어려웠던 부분

코드가 꼬이는 외의 특별하게 어려운 부분은 없었다

느낀점 및 내일 학습 계획

가면 갈수록 할수 있는것이 많아지지만 그럴수록 외워야 하고 손에 익어야 하는 것이 많아지는 것이므로 걱정이 좀 된다 내일은 인구 분석 부분을 공부할 예정이다

profile
데이터 부트캠프 참여중

0개의 댓글