[ TIL ] 22년 5월 2주차

Jiwon Lee·2022년 5월 18일
1

TIL

목록 보기
7/13

같이 푸는 Python

수료 조건 + 멘토링 때문에 미리 빠르게 듣고 다 해보는데 이상하게?? 코드가 다 안 되는... 거임 그래서 이게 뭔가 했는데 여러 문제로 인해 지금은 작동이 안 되는 코드들이었다 ㅠㅠ 그래서 나름대로 이래저래 해결은 봤지만 대체 강의가 언제 찍힌 건지 ㄱ- 멘티 분들도 완전 멘붕 오셔서 당황스러웠다.

1. 실시간 검색어 크롤링
이 강의의 경우엔 이제 실시간 검색어를 제공하지 않아서 크롤링을 못하는 건데, 지금 실시간 검색어를 제공하는 곳 중에 signal.biz라는 곳이 있어서 여길 크롤링해보려고 했다. 근데 여긴 html을 API로 쏴주는 동적 페이지라서 강의에 나오는 크롤링 코드로 크롤링이 안 됐다... 그래서 열심히 구글링 구글링 해서 selenium으로 동적 크롤링을 시도했다.

from bs4 import BeautifulSoup 
import time

# pip install selenium
from selenium import webdriver
from selenium.webdriver.common.by import By

# https://sites.google.com/chromium.org/driver/
# 버전에 맞는 driver 다운로드 

driver = webdriver.Chrome(executable_path=r'/Users/isdiscodead/Documents/LikeLion/2022/PythonDeep/chromedriver')
driver.get('https://signal.bz/')

results = driver.find_elements(By.CLASS_NAME, "rank-text")
print(results)


# 날짜 설정을 위한 모듈
from datetime import datetime
date_info = datetime.today().strftime("%Y년 %m월 %d일의 일일 검색어 순위입니다.\n")
print(date_info)


# 파일로 작성 
search_rank_file = open("rankresult.txt", "a")
search_rank_file.write(date_info)


rank = 1
for result in results :
    print(rank, "위 : ", result.text, '\n')
    search_rank_file.write(str(rank)+"위:"+result.text+"\n")
    rank += 1

2. 구글 번역기
3번째 강의는 Google Translator 모듈을 쓰는 거였는데, 이건 최근 버전으로는 작동이 안 돼서 아래처럼 모듈을 삭제했다가 다시 알파 버전으로 깔아주면 코드가 잘 작동된다! ^^...
pip uninstall googletrans
pip install googletrans==4.0.0-rc1

JSON 강의 자료 준비해야 되는데... 어카지 ?? 후훗 망했따

profile
노는 게 제일 좋은데 공부는 하고 싶어요 😗

0개의 댓글