HTML 기초
이렇게 인터넷창이 켜진다.(만들어진 인터넷창)
태그로 열었으면 닫아야 실행이된다.
위 실행했던 html 코드
Beautiful Soup 기초
파일로 저장된 html파일을 읽을 때
불러온 html태그들중 body태그만 보고싶다면 soup.body로 불러올 수 있다.
특정 태그만 불러올땐 find()명령으로 불러올 수 있다.
특정 태그 전부를 찾기위해선 find_all()명령으로 불러올 수 있다.
태그안의 옵션인 class명령으로 찾고싶다면
html 내에서 속성 id는 딱 한번만 나타난다.
태그안의 텍스트를 출력하는 코드
외부로 연결되는 링크의 주소를 알아내는 방법
접근태그 확인하기
구글에서 검색하여 들어가기
사이트 인증서 만료로 에러가 나올 수 도 있다.
import ssl # 인증없이 접속할 때 사용하는 방법을 활용하자.
req = Request(url, headers={"user-agent": ua.ie})
context = ssl._create_unverified_context()
html = urlopen(req,context=context)
이전에 저장했던 url 주소에 접속하여 가격, 주소등 정보를 불러오자
데이터 불러오기
구글 맵스를 이용하여 시각화하기
네이버 영화 검색 하여 접속하여 영화랭킹(현재 상영작 기준) 탭 이동
접근 URL 확인
주소에 담겨있는 정보 확인
데이터 읽어오기
읽어온 데이터에서 영화제목, 평점 불러오기
크롬 개발자 도구 활용
태그등 확인
영화제목 태그 확인하기
영화 제목 불러오기
영화 평점 태그 확인하기
평점 불러오기
pandas의 date_range를 이용하면, 손쉽게 날짜를 만들 수 있다.
날짜형 데이터들은 원하는 형태로 출력이 가능하다.
파이썬의 string(문자형) 데이터형은 format이라는 재미난 기능이 있다
필요한 모듈 불러오고 얻고싶은 데이터를 저장할 빈 리스트를 생성한다
이제는 100일간의 데이터를 그냥 for문으로 받아 오기만 하면 된다
100일치 영화 평점 데이터도 100KB가 채 안된다
point를 수정하기쉽게 astype 명령을 이용해서 숫자형으로 변경해준다
데이터 저장하기
DataFrame의 검색 명령으로 qeury 명령도 있다
그래프로 시각화 하기
100일간 영화를 모두 정리