ํ ์ฃผ๋์ EDA, Feature engineering, ๋ฏธ๋ถ, ๊นํ๋ธ ์ฌ์ฉ๋ฒ์ ๋ํด์ ๋ฐฐ์๋ณด์๋ค.
ํนํ Feature engineering ๊ณผ์ ์ค, object๋ฅผ int๋ flot ํ์
์ผ๋ก ๋ฐ๊พธ๋ ๋ถ๋ถ์ด ์ด๋ ต๊ฒ ๋๊ปด์ก๋ค.
๋๊ฐ์ง ์ด์ ๋๋ฌธ์ด์๋๋ฐ, ์ฒซ์งธ ํ ์นผ๋ผ์ ์ ์ธํ๊ณ ์์ ํด์ผ ํ๊ธฐ ๋๋ฌธ์ด๋ค.
๋๋ ์ด๊ฒ์ if ๊ตฌ๋ฌธ์ผ๋ก ์ ์ธํ๊ณ ์ ํ์๋๋ฐ, ์ด์ ๊ฒฝ์ฐ ํ row์ฉ ๋ฐ๋ณต์ ๊ทผํด์ผํจ์ ๋ฐ๋ผ ์ฝ๋๊ฐ ๊ต์ฅํ ๋ณต์กํด์ง๋ค.
๋๋ฒ์งธ๋ ๋ฉ์๋์ ์ฌ์ฉ๋ฒ์ ๋ชฐ๋๊ธฐ ๋๋ฌธ์ด๋ค.
replaceํจ์์ ๊ฒฝ์ฐ ๋ฌธ์์ด์ ์ผ๋ถ๋ฅผ ๋์ฒดํ๊ณ ์ถ์๋๋, (regex=True)๋ผ๋ ์ต์
์ ์ค์ ํด์ฃผ์ด์ผ ํ๋ค.
ํ๋์ ๊ฒฐ๊ณผ๋ฌผ์ ๋ง๋ค๊ธฐ ์ํด, ๋ค์ํ ์ฝ๋ ์ ๊ทผ ๋ฐฉ์์ด ์๋ค๋ ๊ตํ์ ์ป์๋ค.
๋ด๊ฐ ์ฒ์์ ์ ๊ทผํ๋ for๊ณผ if ๋ฐฉ์์ ๊ฒฝ์ฐ, ๋ฐ์ดํฐ๋ฅผ ํ๋์ฉ ๋น๊ตํ์ฌ ์ด์ ๋ฐ๋ฅธ ์๊ฐ์ด ์์๋๋ค.
๊ทธ๋ฌ๋ ์ด๋ ๋ฐ์ดํฐ์ ์์ด ๋ฐฉ๋ํ๊ฒ ๋ง์์ง๊ฒ ๋๋ฉด, ์๋นํ ์๊ฐ์ด ์๊ตฌ๋๊ธฐ ๋๋ฌธ์ ์ค๋ฌด์์๋ ์ ์ ์น ์๋ค.
๋ฐ๋ผ์ ๊ฐ๋จํ ํจ์๋ฅผ ํ์ฉํ ์ ๊ทผ์ด ๋ ํจ์จ์ ์ธ ๋ฐฉ์์ด๋ค.
ํฅํ ์ด๋ฌํ ๋ถ๋ถ์ ๋ณด์ํ๊ธฐ ์ํด, ๋๋ ์ค์ต์ ํตํด ํจ์จ์ ์ธ ์ฝ๋ ์์ฑ ๋ฐฉ์์ ์ตํ ๊ฒ์ด๋ค.
ํนํ๋ ๋ฉ์๋์ ๊ฒฝ์ฐ ์ง์ document๋ฅผ ์ฝ์ด๋ณด๊ฑฐ๋ toydata๋ฅผ ์คํํ์ฌ ์๋๋ฐฉ์์ ์ตํ๊ณ ์ฌ์ฉํด์ผ ํ ๊ฒ ๊ฐ๋ค.