Python์์ pandas๋ก exel ํ์ผ(.xlsx, .xls)์ ์ฝ์ด์ค๊ธฐ ์ํด์๋ pandas.read_excel() ํจ์๋ฅผ ์ฌ์ฉํ๋ค.์ปค๋งจ๋๋ก ์ธ์คํจ ํน์ ํ๊ฒฝ์ ๋ฐ๋ผ pip3๋ฅผ ์ฌ์ฉ์ฒซ ๋ฒ์งธ ์ธ์์ ์์ ํ์ผ์ด ์๋ ํด๋ ๊ฒฝ๋ก ๋๋ URL์ ์ง์ ํด์ค๋ค.์ฝ๋์ ๊ฐ
Python pandas๋ก excel ํ์ผ์ ์ฝ์ด์ค๋ ๋ฐฉ๋ฒ์ ๋ํ ์ ์ฒด์ ์ธ ๋ด์ฉ์ ์๋์ ํฌ์คํ ์ฐธ๊ณ https://velog.io/@inhwa1025/Python-pandas%EB%A1%9C-exel-%ED%8C%8C%EC%9D%BC-%EC%9D%BD%EA%B
Ctrl + d: ์ ํ๋ ์คํฌ๋ฆฝํธ ๋๋ฒ๊ทธ ์คํCtrl + r: ๊ทธ๋ฅ ์คํ์ฌ๋ฌ ์ค ๋๋๊ทธ ํ Command + /์ฃผ์ ์ฒ๋ฆฌ ๋ ๊ณณ์์ ๋ค์ Command + / ๋๋ฅด๋ฉด ์ฃผ์ ํ๋ฆผimport ์ ์ธ ํ ๋ชจ๋์ด ์ค์น๋์ง ์์ ๋นจ๊ฐ์ค์ด ๊ทธ์ด์ง ๊ณณ์ ์ปค์๋ฅผ ๋๊ณ alt + Ent
Python pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ ๊ณตํ๋ ๋ฐ์ดํฐ ๊ตฌ์กฐ. R ์ธ์ด์ DataFrame ๋ฐ์ดํฐ ํ์ ์ ์ฐธ๊ณ ํ์ฌ ๋ง๋ค์ด์งํ๊ณผ ์ด๋ก ๊ตฌ์ฑ๋ 2์ฐจ์ Data Structure. RDB์ ํ ์ด๋ธ ๋๋ ์์ (์คํ๋ ๋ ์ํธ)๊ณผ ์ ์ฌ3์์: column, data(row), i
pandas๋ ๊ธฐ๋ณธ์ ์ผ๋ก row์ ์ธ๋ฑ์ค๋ฅผ 0๋ถํฐ ์ฐจ๋ก๋๋ก ๋ถ์ฌset_index ํจ์๋ฅผ ์ด์ฉํด ๋ณ๊ฒฝ ๊ฐ๋ฅ์๋์ ์ฝ๋๋ A column์ ์ธ๋ฑ์ค๋ก ์ง์ ํ๋ ๊ฒloc ์ฌ์ฉappend ์ด์ฉ์ธ๋ฑ์ค๋ฅผ ์ ๊ฒฝ์ฐ์ง ์๊ณ ๋ฐ์ดํฐ์ ๊ฐ์ฅ ๋ค์ row ์ถ๊ฐloc ์ด์ฉDataFrame\[โ
Python pandas๋ฅผ ์ด์ฉํด MySQL์ ๋ฐ์ดํฐ๋ฅผ ์ฝ์ ํ๋ค ์๋ฌ๊ฐ ๋ฐ์ํจ์ด๋ MySQL์์ python์ nan์ ์ดํดํ ์ ์๊ธฐ ๋๋ฌธ์ ๋ฐ์ํ ์๋ฌNaN์ด๋?Not a Number์ ์ฝ์ด. ํํ ๋ถ๊ฐ๋ฅํ ์์นํ ๊ฒฐ๊ณผ์์ ํ์ผ์ DataFrame ํํ๋ก ๋ฐ์์ฌ ๋
DataFrame.shape ์ ํตํด ๋ช ์ฐจ์์ธ์ง, ๊ฐ ์ฐจ์๋ณ๋ก ๋ช๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์๋ ์ง ํ์ธ ํ ์ ์์
.to_numpy ์ฌ์ฉ .values ์ฌ์ฉ
Pandas์ DataFrame, Series์ ์ ์ฅ๋ ๊ฐ์ ์นํํ๊ณ ์ถ์ ๊ฒฝ์ฐ replace() ํจ์ ์ฌ์ฉ ๊ฐ๋ฅto_replace: ๊ต์ฒดํด์ผํ๋ DataFrame์ ๊ฐ. str, regex, list, dict, Series, int, float, Nonevalue:
์ฐธ๊ณ ๋ก ๋์ฉ๋ ๋ฐ์ดํฐ์ ๋น ๋ฐ์ดํฐ๋ ๋ค๋ฅด๋ค. ๋ถ์ฐ์ปดํจํ ์ ํ์ง ์๊ณ , ์ค์ง ์ปดํจํฐ ํ๋๋ก ๋์ฉ๋ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ฅผ ์งํํด์ผ ํ๋ค๋ฉด ๋ณ์ ์์ฑ(์ด๊ธฐํ)์ ํ ์๋ก RAM์ด ๊ฐ๋์ฐจ ์๋ฌ๊ฐ ๋ฐ ๊ฒ์ด๋ฉฐ for ๋ฌธ์ ์๋๋ ํ์ ํ ๋จ์ด์ง๊ฒ
DataFrame์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ์ค null ๊ฐ์ด ํฌํจ ๋ ์ปฌ๋ผ์ ์๋ฃํ์ int๋ก ๋ฐ๊พธ๋ ค๊ณ ์๋ํ์์ผ๋ ์๋์ ๊ฐ์ ์ค๋ฅ๊ฐ ๋ฐ์ํจpandas.errors.IntCastingNaNError: Cannot convert non-finite values (NA or
์์ ๊ฐ์ ๋ฐ์ดํฐ ํ๋ ์์์ X๊ฐ 2์ด๊ณ Y๊ฐ ๋น์ด์์ง ์์ ์ด๋ง ์ฐพ๋ ๋ฐฉ๋ฒ์ ์๋์ ๊ฐ์X๊ฐ 1์ด๊ณ Y๊ฐ ๋น์ด์์ง ์์ ๋ Y์ ๊ฐ์ 9๋ก ๋ณ๊ฒฝํ๊ธฐ์์ ์กฐ๊ฑด ์ง์ ์ ํตํด ํด๋นํ๋ ์ด์ ์ธ๋ฑ์ค ๋ฒํธ๋ฅผ ๋ฐ์์ฌ ์ ์์์ด์ ์ธ๋ฑ์ค ๋ฒํธ ๋ฆฌ์คํธ๋ก for๋ฌธ ๋๋ฆฌ๊ธฐ์ด ๋ df.
DataFrame ํํ์ ๋ฐ์ดํฐ๋ฅผ ์์ ํ์ผ๋ก ์ ์ฅํ๊ธฐ ์ํด to_excel() ์ฌ์ฉ ๊ฐ๋ฅto_excel(excel_writer, sheet_name, na_rep, float_format, columns, header, index, inf_rep, freeze_pan
Boto3 ๋ Python ์ฉ AWS SDK (Software Development Kit) / Python ๋ฒ์ 2.7+ ๋ฐ 3.4+๋ฅผ ๊ธฐ๋ณธ์ผ๋ก ์ง์ / Boto3๋ฅผ ์ด์ฉํด AWS์์ ์ง์ํ๋ 40๊ฐ ์ด์์ ์๋น์ค๋ฅผ python์์ ํ์ฉํ ์ ์์
boto3๋ฅผ ์ฌ์ฉ ์์ ๋ฅผ ์ฐพ์๋ณด๋๋ฐ, ์ด๋ค ์์๋ boto3.client๋ฅผ ์ฌ์ฉํ๊ณ ์ด๋ค ์์๋ boto3.resource๋ฅผ ์ฌ์ฉํด์ ์ฐจ์ด์ ์ด ๋ญ๊ฐ ์ถ์ด์ ์ ๋ฆฌํด๋ณธ ๊ธ
boto3 ์ค์น ๋ฐ ๊ธฐ๋ณธ์ค์ ์ ์ฌ๊ธฐ์ ๐ย \[Python] boto3๋ก AWS S3์ ์ฐ๋ํ๊ธฐAmazon boto3 ๊ณต์ ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ์์ ๐ย AWS boto3 document - S3client์ resource์ ์ฐจ์ด์ ์ ์ฌ๊ธฐ๋ฅผ ์ฐธ๊ณ ๐ย \[Python] bo
์ฐธ๊ณ ์๋ฃ: Complexity of Python Operations
์์\\033\[ = \\xb1\[ = \\u001b\[Terminal ์ฐฝ์ ํน์ํ ์ญํ ์ ํ๋ ๋ช ๋ น์ ์ฃผ๋ ์์ ์ฝ๋\\033\[(์ซ์)m : ์ํ๋ ์์ ๋ํด ANSI ํ์ค์ผ๋ก ์ ํด์ง ์ซ์ ์ง์ \\033\[0m : Terminal ์์ฑ ์ด๊ธฐํ (Reset)Reset