์๋์ผ๋ก ๋ฐ์ดํฐ์์ ๊ท์น์ ํ์ตํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฐ๊ตฌํ๋ ๋ถ์ผ๋ํ์ ์ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก ์ฌ์ดํท๋ฐ์ด ์๋ค.๐ข ์ค๋ ๊ณต๋ถ ๋ชฉํ(1) ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐiris ํ์ข ํ์ธ๊ฐ๊ฐ์ target0 : setosa1 : versicolor2 : virginice๋ฐ์ดํฐ ์ ๋ณด150๊ฐ์ง์ iris
๐ข ์ค๋ ๊ณต๋ถ ๋ชฉํ์ ๋ง ๋์นดํ๋ฆฌ์ค๋ ์ด ์ ์์์๊น ..๐คจ๋ฐ์ดํฐ์ถ์ฒ : https://github.com/PinkWink/ML_tutorial/blob/master/dataset/titanic.xls๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ ๐ข ๋จ์ฑ์ ์์กด ๊ฐ๋ฅ์ฑ์ด ๋ ๋ฎ๋ค.๐ข
๋ฐ์ดํฐ์ค๋นโก๏ธ array('a', 'b', 'c', dtype=object)โก๏ธ array(0, 1, 2, 0, 1): a,b,c,a,b -> 0,1,2,0,1๋ก ๋ณํ๋จโก๏ธ array(0, 1, 2, 0, 1)โก๏ธ array('a', 'b', 'c', 'a', 'b',
๋ ๋์์ธ๊ณผ ํ์ดํธ ์์ธ ๊ตฌ๋ถ์ ์ํ color ์ปฌ๋ผ์ถ๊ฐํฉ์น๊ธฐX : ํน์ฑ๋ฐ์ดํฐ / y : ํ๊ฒโก๏ธ (array(0., 1.), array(3930, 1267, dtype=int64))๐ 0(ํ์ดํธ) 3930๊ฐ, 1(๋ ๋) 1267๊ฐโก๏ธ 0.9667115643640561
์ด๋ค ๋ชจ๋ธ์ด ์ข๋ค๊ณ ๋งํ ์ ์์๊น?์๋ฅผ๋ค์ด, ํ๊ท๋ชจ๋ธ๋ค์ ์ค์ ๊ฐ๊ณผ ์์ธก๊ฐ์ ์ฐจ์ด๋ฅผ ๊ฐ์ง๊ณ ๊ณ์ฐํด์ ๊ทธ ์๋ฌ๊ฐ ์ต์๊ฐ ๋๊ฒ ํ๋ ๋ชจ๋ธ์ ์ ํํ๋ค.ํ์ง๋ง ๋ถ๋ฅ ๋ชจ๋ธ์ ์ ํ๋(accuracy), ์ค์ฐจํ๋ ฌ(confusion matrix), ์ ๋ฐ๋(precision), ์ฌํ์จ
์ด๋ค ๋ชจ๋ธ์ด ์ข๋ค๊ณ ๋งํ ์ ์์๊น?์๋ฅผ๋ค์ด, ํ๊ท๋ชจ๋ธ๋ค์ ์ค์ ๊ฐ๊ณผ ์์ธก๊ฐ์ ์ฐจ์ด๋ฅผ ๊ฐ์ง๊ณ ๊ณ์ฐํด์ ๊ทธ ์๋ฌ๊ฐ ์ต์๊ฐ ๋๊ฒ ํ๋ ๋ชจ๋ธ์ ์ ํํ๋ค.ํ์ง๋ง ๋ถ๋ฅ ๋ชจ๋ธ์ ์ ํ๋(accuracy), ์ค์ฐจํ๋ ฌ(confusion matrix), ์ ๋ฐ๋(precision), ์ฌํ์จ