EDA
๐ง EDA๋?
: ๋ฐ์ดํฐ ๊ทธ ์์ฒด๋ง์ผ๋ก๋ถํฐ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ด๋ด๋ ์ ๊ทผ๋ฒ!
๐ง EDA์ Process
- ๋ถ์์ ๋ชฉ์ ๊ณผ ๋ณ์(column) ํ์ธ
- ๋ฐ์ดํฐ ์ ์ฒด์ ์ผ๋ก ์ดํด๋ณด๊ธฐ(์๊ด๊ด๊ณ, NA(๊ฒฐ์ธก์น) ๊ฐ ์๋์ง ํ์ธ)
- ๋ฐ์ดํฐ์ ๊ฐ๋ณ ์์ฑ ํ์
ํ๊ธฐ
๐ง Titanic Dataset
-
๋ถ์์ ๋ชฉ์
: ์ด์๋จ์ ์ฌ๋๋ค์ ์ด๋ค ํน์ง์ ๊ฐ์ง๊ณ ์์์๊น?
-
๋ณ์ ํ์ธ
- sibsp: ํจ๊ป ํ์นํ ํ์ ์๋งค ํน์ ๋ฐฐ์ฐ์ ์
- parch: ํจ๊ป ํ์นํ ๋ถ๋ชจ ํน์ ์๋
์ ์
- fare: ์ข์ ๊ฐ๊ฒฉ
- pclass: ์น๊ฐฑ ๋ฑ๊ธ(1๋ฑ๊ธ, 2๋ฑ๊ธ, 3๋ฑ๊ธ)
- embarked: ํ์น ์ฅ์(S: Southhampton, C: Cherbourg, Q: Queenstown)
- cabin: ๋ฐฉ ํธ์
- survived: ์์กด=1, ์ฃฝ์=0