mini project ์ธ๊ตฌ์์ CCTV ์์ ์๊ด๊ด๊ณ๋ฅผ ์์๋ณด์. > ๐ ๊ฐ์ : ์์ธ์ CCTV ๋ถ์ ๊ตฌ๋ณ ์ธ๊ตฌ์์ CCTV ์์ ์๊ด๊ด๊ณ๋ฅผ ์์๋ณด์. ๐ ๋ชฉํ -> ๊ทธ๋ํ ์์ฑํ๊ธฐ ๋ฐ์ดํฐ ์์ธ์ ๊ตฌ๋ณ ์ธ๊ตฌ์ : excel ํ์ผ ์์ธ ์ ๊ตฌ๋ณ CCTV ์
โ ์ฃผ์ ๋ฆฌ์ฃผ์ ๋ฆฌ์ง์ง ์ ๋ก๋ฒ ์ด์ค์ธ ๋๋ ํ๊ฒฝ์ค์ ์กฐ์ฐจ ๋๋ฌด ์ด๋ ค์ ๋ค.(๊ต์๋ ์์์ผ๋ฉด ์ด์ฉ ๋ป ํ์ด..)(๋งฅ๋ถ์ด๊ฑธ..)anaconda prompt ์คํconda activate ds_studycd OneDrivecd Documentscd ds_studyโ์ฌ์ ์ ds_stu
ํ์ด์ฌ์ ๋ฐ์ดํฐ ๋ถ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ฒ๋ผ ํ๊ณผ ์ด์ ๋ค๋ฃจ๋ ๋ฐฉ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ฐํธํ๊ฒ ์ฒ๋ฆฌํ๋ค.Series (1์ฐจ์)Data Frame (2์ฐจ์)index์ value๋ก ์ด๋ฃจ์ด์ ธ ์๊ณ , ํ๊ฐ์ง ๋ฐ์ดํฐ ํ์ ๋ง ๊ฐ์ง ์ ์๋ค.List, Array, Dict, Scalar๋ก
Matplotlib ํ์ด์ฌ์ ์ด์ฉํ ๋ฐ์ดํ ์๊ฐํ Seaborn
excel์ฒ๋ผ pandas์์๋ pivot table์ ํ์ฉ ํ ์ ์๋ค !ํ ์ธ๋ฑ์ค (index)์ด ์ธ๋ฑ์ค (columns)๋ฐ์ดํฐ ๊ฐ (values)๋ฐ์ดํฐ ์ง๊ณํจ์ (aggfunc)Nan ์ฒ๋ฆฌ (fill_values)๊ฐ ๊ตฌ์ฑ์์์ ์ ์ฉํ ๋ฐ์ดํฐํ๋ ์์ ์ด์ ๊ฐ๊ฐ ํจ์
mini project >๐ ๊ฐ์ : ์์ธ์ ๋ฒ์ฃํํฉ ๋ถ์ ๐ ๋ชฉํ >>1. ๊ฒฝ์ฐฐ์๋ณ ๋ฒ์ฃ๋ณ ๋ฐ์ดํฐ ํผ๋ดํ ๊ฒฝ์ฐฐ์๋ช ๊ตฌ๋ณ ๋ฐ์ดํฐ ์ ๋ฆฌ ๋ฒ์ฃ ๋ฐ์ดํฐ ์ ๊ทํ ์๊ด๊ด๊ณ ์๊ฐํ ์ง๋ ์๊ฐํ >- ๋ฐ์ดํฐ : ์์ธ์ ๊ด์๋ณ 5๋ ๋ฒ์ฃํํฉ ์ถ์ : ๊ณต๊ณต๋ฐ์ดํฐํฌํธ ํ๋ก์ ํธ
Python์ ๋ํ์ ์ธ ์๊ฐํ ๋๊ตฌ๋ก matplotlib์ ํจ๊ป ์ฌ์ฉ | seaborn (ํต๊ณ ๋ฐ์ดํฐ ์๊ฐํ)seaborn์ matplotlib ๋๋น ์์ฝ๊ฒ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๊ณ , ๊ทธ๋ํ ์คํ์ผ ์ค์ ์ ํ ์ ์์ (matplotlib ๊ธฐ๋ฐ โ matplotlib์ผ๋ก ์ปค์คํ
ํ์ด์ฌ์์ ์ฌ์ฉํ ์ ์๋ ์ง๋ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ!pip install foliumimport foliumfoilum.map()location = \[์๋,๊ฒฝ๋] or (์๋,๊ฒฝ๋) | list or tuple โก๏ธ ์ง๋์๊ฐํzoom_start = n | numbe
mini project ์์นด๊ณ ๋ง์งํ์ด์ง ๋ถ์ > ๐ ๋ชฉํ | ์์นด๊ณ ๋ง์งํ์ด์ง ํฌ๋กค๋ง์ ํตํ ๋ถ์ ( ์ด 50๊ฐ ํ์ด์ง์ ์ ๋ณดํฌ๋กค๋ง ) ๐ ํฌ๋กค๋ง ์ถ์ฒ https://www.chicagomag.com/Chicago-Magazine/November-2012/Bes
ํ์ด์ฌ์์ ์ฌ์ฉํ ์ ์๋ ์น๋ฐ์ดํฐ ํฌ๋กค๋ง ๋ผ์ด๋ธ๋ฌ๋ฆฌinstall \- conda install -c anaconda beautifulsoup4 \- pip install beautifulsoup4โก๏ธ open์ผ๋ก ๊ฐ์ ธ์จ html๊ตฌ๋ฌธsoup.headsoup
https://www.selenium.dev/documentation/https://selenium-python.readthedocs.io/api.htmlํฌ๋กค๋ง์ ํ๋ค๋ณด๋ฉด ๋ฌด์์ธ๊ฐ ์ ๋ ฅํ๊ฑฐ๋ ํน์ ๋ฒํผ์ ๋๋ฌ์ผ ํ๋ ์ํฉ์ด ๋ฐ์ํฉ๋๋ค. ์ฌ๋์ด ๊ทธ๋ฌํ
๐ ๋ชฉํ | ์์ธ์ ์ง์ญ๋ณ, ๋ธ๋๋๋ณ ์ฃผ์ ๊ฐ๊ฒฉ ๋ถ์ ๋ฐ ์๊ฐํ๐ ํฌ๋กค๋ง ์ถ์ฒhttps://www.opinet.co.kr/user/main/mainView.do๋ชฉํ๋ฐ์ดํฐ์์ธ์ ๊ฐ ๊ตฌ๋ณ ๋ฐ์ดํฐ(๋ธ๋๋, ๊ฐ๊ฒฉ, ์ ํ ์ฃผ์ ์ฌ๋ถ, ์์น) ์์ ํ์ผfrom seleni
forecast(์๊ณ์ด ๋ถ์) ์๊ฐ์ ํ๋ฆ์ ๋ํด ํน์ ํจํด๊ณผ ๊ฐ์ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ์๋ ๊ฒฝ์ฐ๋ฅผ ์๊ณ์ด ๋ฐ์ดํฐ๋ผ๊ณ ํจ. ์ค์น >- ์๋์ฐ์ ๊ฒฝ์ฐ Visual C++ Build Tool์ ๋จผ์ ์ค์น conda install pandas-datareader conda
๐ ๋ชฉํ ์ด๋์ผ๊ฐ ์คํ๋ฒ ์ค ๊ทผ์ฒ์ ๋งค์ฅ์ ๋ง๋ ๋ค๋ ์๋ฌธ์ด ์๋ค. ์นํฌ๋กค๋ง์ ํตํด ๋งค์ฅ์์น์ ๋ณด๋ฅผ ๋ถ๋ฌ์ค๊ณ ๊ฐ์ค์ ๊ฒ์ฆํด๋ณด์. 1. ์คํ๋ฒ ์ค ๋ฐ์ดํฐ ๊ฐ์ ธ์ค๊ธฐ > ๐ ๋ฏธ์ ์์ธ์์ ์คํ๋ฒ ์ค ๋งค์ฅ ์ด๋ฆ๊ณผ ์ฃผ์, ๊ตฌ ์ด๋ฆ์ pandas data frame์ผ๋ก ์ ๋ฆฌ
Source: KaggleDownLoad: archive.zipํด๋น ๋ฐ์ดํฐ๋ ๊ณต์ ๋ฐ์ดํฐ(๊ตญ์ ์คํฌ์ธ ์ ๋ณด์ผํฐ)์ ์ฐจ์ด๊ฐ ์์.๋ํ๋ฏผ๊ตญ ๋ฐ์ดํฐ ๋๋ฝ์์: 2008๋ ๋ฒ ์ด์ง์ฌ๋ฆผํฝ ์ญ๋ 48kg ์๋ฉ๋ฌ ์์ ํ ๋๋ฝ๋ณต์/๋จ์ฒด ์ข ๋ชฉ์ ๊ฒฝ์ฐ ํ ์ข ๋ชฉ์์ ์ฌ๋ฌ๋ช ์ด ๋ฉ๋ฌ์ ํ๋ํ์ง๋ง,
๋ฌธ์ ์๊ฐ ๋ฐ ๋ฐ์ดํฐ ์ค๋น ๋จ๊ณ Data ์๋ณธ ์ถ์ฒ Target Data(CSV): Global Internet Usage(๊ตญ๊ฐ๋ณ ์ธํฐ๋ท ์ฌ์ฉ๋ฅ ) Source: Kaggle DownLoad: archive.zip Reference Data01(HTML Link):
๋ฌธ์ ์๊ฐ ๋ฐ ๋ฐ์ดํฐ ์ค๋น ๋จ๊ณ Target Data(Json): ์ ๊ตญ๋ฐ๋ฌผ๊ด๋ฏธ์ ๊ด์ ๋ณดํ์ค๋ฐ์ดํฐ Source: ๊ณต๊ณต๋ฐ์ดํฐํฌํธ DownLoad: ์ ๊ตญ๋ฐ๋ฌผ๊ด๋ฏธ์ ๊ด์ ๋ณดํ์ค๋ฐ์ดํฐ.json ์ฐธ๊ณ ์ฌํญ ๊ณต๊ณต๋ฐ์ดํฐํฌํธ์์ ํด๋น ๋ฐ์ดํฐ๋ ๋ค์ํ Format(xls, xml, jso
1. ๊ธฐ์ด์ ๋ณด import pandas as pd 1-1) series > ์ธ๋ฑ์ค + ๋ฐ์ดํฐ - ์์ฑ ๋์ ๋๋ฆฌ ์ด๋, key = index, value = data ๋ฆฌ์คํธ ์ด๋, data = data index์ ๊ฒฝ์ฐ ์๋์์ฑ (or index = []๋ก ์ง์ ) - ๋ฐ์ดํฐํ์ธ ๋ณ์.value : Data ์กฐํ ๋ณ์.index : index ์กฐํ...