Day56

김재현·2023년 8월 8일

JUPYTER/DL/ML

목록 보기
33/73

연습문제 풀이

데이터가 너무 방대한 경우 적당히 유효할 정도의 데이터를 추출해서 분석을 진행.
그래도 시간이 오래 걸리면 과금(GPU).


네이버 개발자

B.데이터 수집\01.OpenAPI 데이터 수집\06-카카오 책 검색(반복처리)강사님.ipynb 참고

접속 시도

프로토콜과 HTTP 메서드 확인

HTTP GET 방식

python
session.get(API_URL, params={"a":100, "b":200})

HTTP POST 방식

python
session.post(API_URL, params={"a":100, "b":200})

HTTP POST 방식이면서 파라미터를 JSON으로 구성하는 경우(body data 접속)

python
session.post(API_URL, data=json.dumps({"a":100, "b":200}))

대부분 OpenAPI는 get 방식으로 데이터 전달(HTTP메서드)

  • 데이터랩
    Open AIP 신청
  • 애플리케이션 이름
    jaekim3220
  • API 연동
  • 검색어와 키워드
    검색 주제를 정한 후 주제와 관련돼 사람들이 많이 검색할 것 같은 키워드를 list로 나열
    검색어를 여러 개 지정해 비교를 할 수도 있음
  • 외부에서 가져온 데이터는 무조건 문자열
    데이터의 dtype을 분석에 맞게 변경, index를 잡아줌
  • exp_time_data에서 "m"으로 한 경우 에러가 나면 데이터에서 0 값이 있다는 의미
    "a"로 잡아준다. 데이터가 상승 값이면 곱셈 방식으로 "m". 데이터가 하강 값이면 덧셈 방식으로 "a". max_diff로 최대 차분 횟수 설정. exp_time_data(df, 'Passengers', "m", max_diff=10)

0개의 댓글