๐ก์ค๋ ๋ฐฐ์ธ ๋ด์ฉ axis๋ N์ฐจ์ ๋ฐฐ์ด์ ์ ์ํ ๋ ์ฌ์ฉ๋๊ธฐ๋ ํ๋ฉฐ ์ฌ๋ฌ ์ฐ์ฐ ๊ณผ์ ์์์ ๊ธฐ์ค์ผ๋ก๋ ์ฐ์ ๋๋ค. ์ฆ, ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ Numpy, Pandas์์ ๋งค๊ฐ๋ณ์๋ก ์์ฃผ ์ฌ์ฉ๋๋ axis์ ์๋ฏธ์ ๋ํด ์์๋ด ์๋ค. axis axis=1 axis=0 ์ถ ํ
ํ๋ค์ค์ ์๋ฃ๊ตฌ์กฐ `์๋ฆฌ์ฆ`๋, 1์ฐจ์ ๋ฐฐ์ด๋ก์ ๋ค์ ์ธ๊ฐ์ง์ ํน์ง์ ๊ฐ์ง๋๋ค. ์ฐจ์ ๋ฐฐ์ด ๊ตฌ์กฐ์ด์, ์ธ๋ฑ์ค๋ฅผ ์ฌ์ฉํ ์ ์๊ณ , ๋ฐ์ดํฐ ํ์ (dtype)์ ๊ฐ์ง๋๋ค.
ํ๋ค์ค์ ์๋ฃ๊ตฌ์กฐ ๋ฐ์ดํฐํ๋ ์์, ์์ ์ ๋ฐ์ดํฐ ์ํธ์ฒ๋ผ 2์ฐจ์ ๋ฐฐ์ด์ ๋๋ค. ๋ค์์ ํน์ง์ ๊ฐ์ง๋๋ฐ ํ๊ณผ ์ด๋ก ๊ตฌ์ฑ๋๋ 2์ฐจ์ ๋ฐ์ดํฐ ๊ตฌ์กฐ์ด๊ณ ๊ฐ ์ด์ ๊ฐ๊ฐ ๋ฐ์ดํฐ ํ์ (dtype)์ ๊ฐ๊ณ ์์ต๋๋ค.
๋ฐ์ดํฐํ๋ ์(Df)์ ์ธ๋ฑ์ค(Index)์ ๊ด๋ จ๋ ์ฌ๋ฌ ๊ธฐ๋ฅ๋ค์ ์์๋ด ์๋ค.DataFrame์ด ๊ฐ์ง๋ ์์ฑ์ค ์ธ๋ฑ์ค(Index)๋ ํ๋ ์์ ๊ฐ์ฅ ์ฒซ๋ฒ์งธ ์ด์์ ํ์ธํ ์ ์์ต๋๋ค.
DataFrame ๊ฐ์ฒด๋ฅผ ์ก์ , CSV, ํ ์คํธ ํ์ผ ๋ฑ์ ํํ๋ก ์ ์ฅํ๊ณ ๋ถ๋ฌ์ค๋ ๋ฐฉ๋ฒ์ ์์๋ด ์๋ค.
ํ๋ค์ค ๋ฐ์ดํฐํ๋ ์์ ๊ฑฐ์์ ์ธ ๋งฅ๋ฝ์์ ํ์ธํ๋ ๋ช๊ฐ์ง ๋ฐฉ๋ฒ๋ค์ ์์๋ด ์๋ค.
loc์ location์ ์ฝ์๋ก, df.loc์ผ๋ก ์ธ๋ฑ์ค์ ์ด๋ฆ์ ๊ฐ์ง๊ณ ์ํ๋ ํ๊ณผ ์ด์ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์ฌ ์ ์์ต๋๋ค. ๋ํ iloc์ integer location์ ์ฝ์๋ก, df.iloc์ผ๋ก ์ธ๋ฑ์ค์ ์์น๋ฅผ ๊ฐ์ง๊ณ ์ํ๋ ํ๊ณผ ์ด์ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์ฌ ์ ์์ต๋๋ค.
loc/iloc์ ํตํด์ ๋ฐ์ดํฐ๋ฅผ ์ ํํ๋ ๋ฐฉ๋ฒ์ ์ด์ด, ์ผ์ ํ ์กฐ๊ฑด์ ๋ง๋ค์ด ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์ค๋ ๋ฐฉ๋ฒ์ ์์๋ด ์๋ค.
๊ฒฐ์ธก์น(Missing Value)๋ ๋ง ๊ทธ๋๋ก ๋ฐ์ดํฐ์ ๊ฐ์ด ์๋ ๊ฒ์ ๋ปํฉ๋๋ค. ์ค์ฌ์ 'NA'๋ผ๊ณ ํํํ๊ธฐ๋ ํ๊ณ , ๋ค๋ฅธ ์ธ์ด์์๋ Null ์ด๋ ํํ์ ๋ง์ด ์๋๋ค.
์ธ๋ฑ์ค์ ์ปฌ๋ผ์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฌํ๋ฉด, ๋ ํธํ๊ฒ ๋ฐ์ดํฐ๋ฅผ ํ์ธํ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ณผ์ ์์ ํน์ ์ด์ด๋ ํ์ ๋ณํํด์ผ ํ ๋๊ฐ ์์ต๋๋ค. apply() ํจ์๋ฅผ ๋ฐ์ดํฐ๋ฅผ ์ ์ฉํด๋ด ์๋ค.
๋ฐ์ดํฐํ๋ ์์ ์ปฌ๋ผ๊ณผ row(ํ)์ ์์ , ์ญ์ , ์ถ๊ฐํ๋ ๋ฐฉ๋ฒ์ ์์๋ด ์๋ค.
๋์ผํ ๊ฐ์ ๊ฐ์ง ๊ฒ๋ค๋ผ๋ฆฌ ๋ญ์ณ์ ๊ณ์ฐ์ ์ฝ๊ฒ ํ ์ ์์ต๋๋ค. ๊ทธ๋ฃนํ ๋ฌธ๋ฒ์ ๊ณต๋ถํด๋ด ์๋ค.