: 훈련 데이터에 대해 온갖 규칙을 다 세워 훈련데이터에만 맞추고 새로운 데이터에 대해서는 판단, 예측을 못하는 경우
: 훈련 데이터에 대한 정보, 데이터가 너무 작고 테스트 데이터에 대한 판단,예측을 하지 못할 경우
: 훈련 세트로 학습한 모델이 테스트 세트에 대해 정확히 예측하도록 하는 경우

최근접 분류 알고리즘
: 근접한 이웃의 수에 따라 영역을 판단

해결방법
머신러닝
: 정형화된 데이터를 다룰 때 좋음
딥러닝
: 비정형 데이터를 다룰 때 좋음(이미지, 영상, 텍스트)


실습하기
!pip install requests bs4import requests as req #서버에 요청을 보내는 도구
from bs4 import BeautifulSoup #응답 받은 문서에서 데이터를 추출하는 도구url = "요청할 서버 주소"
res = req.get(url) #요청보내기
res.status_code #응답 성공 시 : 200, 페이지 없음 : 404, 서버오류 : 500naver_dom = BeautifulSoup(res.text,'html.parser')
a = naver_dom.select("div.news_area>a.news_tit")
a
for tag in a :
print(tag.text)
html 받아오기
url = "요청할 주소"
res = req.get(url2)
res.status_codenaver_img_dom = BeautifulSoup(res.text,'html.parser')
img_tags = naver_img_dom.select("img._img._listImage")
img_tags이렇게 하면 실행이 되지않는다.html 요청하여 받아오기
!pip install seleniumfrom selenium import webdriver
browser_obj = webdriver.Chrome()
browser_obj.get(url2)naver_img_dom2 = BeautifulSoup(browser_obj.page_source,'html.parser')
img_tags = naver_img_dom2.select("img._image._listImage")
img_tags[0] 
src = img_tags[0].get('src')
img_tags[0]['src'] 
파일 다운로드 받기
from urllib.request import urlretrieve
dest="./포켓몬빵.png"
urlretrieve(src,dest)
url로부터 파일을 다운받는 기능
다운 받을 원본의 URL, 다운로드할 경로 설정