Flat clustering : ์ผ๋ฐ์ ์ธ clustering
Hierarchical clustering : ๊ณ์ธต์ ์ผ๋ก ์ํ ๊ด๊ณ๊ฐ ์๋ Clustering
Hard clustering : ํ๋์ ๋ฌธ์๋ ํ๋์ cluster์ ์ํด์์
Soft clustering : ํ๋์ ๋ฌธ์๊ฐ ์ฌ๋ฌ๊ฐ์ cluster์ ์ํ ์ ์๋ค.
โป ์ง๊ธ ์์๋ณผ ๊ฒ์ Hierarchical clustering์ด๊ณ top-down๊ณผ bottom-up ๋ฐฉ์์ด ์๋ค.
bottom-up ๋ฐฉ์ : ๋งจ ์๋์ ๋ฌธ์๋ถํฐ ์๋ก ์ฌ๋ผ๊ฐ๋๋ฐ, ๋งจ ์๋๋ถํฐ ๊ฐ ๋ฌธ์๊ฐ ํ๋์ cluster๋ก ๊ฐ์ ํ๊ณ ์๋ก ์ฌ๋ผ๊ฐ์๋ก ๋ ํฐ cluster๋ก ๋ฌถ๋๋ค.
๋ฌธ์๋ค์ ์ ์ฌ๋์ ๋ฐ๋ผ ์ ์ธต์ ์ผ๋ก ๋ฌถ์ด์ ์ฌ๋ผ๊ฐ๋ค.
์ต์ข ๊ฒฐ๊ณผ๋ฅผ dendrogram์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค.
K-means์์๋ cluster ๊ฐฏ์๋ฅผ ๋ฏธ๋ฆฌ ์ ํด์ฃผ์ด์ผ ํ๋ ์ด๋ ค์์ด ์์๋๋ฐ, HAC๋ ๊ทธ๋ฌ์ง ์์๋ ๋๋ค.
โป ๊ฐ cluster๋ ํ๋์ ๋ฌธ์๋ก ์ด๋ฃจ์ด์ ธ ์์ผ๋ฏ๋ก, ์ฒ์์๋ ๊ฐ๊น์ด ๋ฌธ์๋ผ๋ฆฌ 2๊ฐ์ฉ ๋ฌถ๋๋ค.
single-link (Maximum similarity)
complete-link (Minimum similarity)
centroid ๋ฐฉ๋ฒ (Average intersimilarity) : ๋ชจ๋ pair์ ์ ์ฌ๋์ ํ๊ท ์ cluster์ ์ ์ฌ๋๋ก ์ฌ์ฉ (๋ ํด๋ฌ์คํฐ์ centroid์ ๊ฑฐ๋ฆฌ๊ณผ ๊ฐ๋ค)
Group average (Average intrasimilarity) : average intersimilarity์์ ๊ฐ์ cluster ์์ pair๋ ํฌํจํ์ฌ ํ๊ท ์ ๊ณ์ฐ
top-down ๋ฐฉ์์ด๋ค.
์ฒ์์ ํ๋์ cluster์ด๊ณ , ์ ์ ์ชผ๊ฐ ๋ค.
๋ถํ ํ ๋๋ K-means ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ๋ค.
๋ํ์ top-down clustering
์ฒ์์ ๋ ๊ทธ๋ฃน์ผ๋ก ๋ถ๋ฆฌํ๊ณ , ๋ ๊ทธ๋ฃน ์ค ํฌ๊ธฐ๊ฐ ๋ ํฐ ๊ฒ์ ์ฐ์ ์ ์ผ๋ก ๋ถ๋ฆฌํ๋ค.
์ํ๋ ๊ฐฏ์๋ก ์ด๋ฃจ์ด์ง cluster๊ฐ ๋ ๋๊น์ง ๊ณผ์ ์ ๋ฐ๋ณตํ๋ค.
์ฅ์ : ์ํ๋ ๊ฐฏ์๊น์ง๋ง ๋ถ๋ฅํ๊ธฐ ๋๋ฌธ์ HAC๋ณด๋ค ๋น ๋ฅด๋ค.
๋จ์ : k-means ํน์ฑ์ centroid๋ฅผ ์์๋ก ์ ํ๊ธฐ ๋๋ฌธ์ centroid ์ ํ์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ์ง๋ค.
๋น ๋ฅธ ์๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ด์ผํ ๋ : 1์์.flat clustering ์ฌ์ฉ, 2์์. bisecting k-means ์ฌ์ฉ
k ์ซ์๋ฅผ ์ ํ๊ธฐ ์ด๋ ค์ธ ๋ : HAC ์ฌ์ฉ
ํญ์ ์ผ์ ํ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ๋ฅผ ์ํ ๋ : HAC ์ฌ์ฉ
๊ณ์ธต ๊ตฌ์กฐ์ ๊ฒฐ๊ณผ๊ฐ ํ์ํ ๋ : HAC ์ฌ์ฉ