유클리디안 거리 : 통계적 개념 없음. 변수들의 산포 정도가 전혀 감안되어 있지 않음
표준화 거리
마할라노비스 거리
체비셰프(Chebychev) 거리 :
맨하탄 거리 :
캔버라 거리 :
민코우스키 거리: 맨하탄 거리와 유클리디안 거리를 한번에 표현한 공식
- L1 거리 (맨하탄), L2 거리(유클리디안)
2) 범주형 변수의 경우
자카드 거리 : boolean 속성으로 이루어진 두 객체 간의 유사도 측정
코사인 거리
비계층적 군집분석
혼합 분포 군집(mixture distribution clustering)
SOM(Self Organizing Map)
코호넨 맵(Kohonen Map)이라고도 알려짐
SOM은 비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화. 입력변수의 위치 관계를 그대로 보존한다는 특징이 있음
구성
1) 입력층
2) 경쟁층(2차원 격자로 구성된 층)
특징
SOM과 신경망 모형의 차이점
구분 | 신경망 모형 | SOM |
---|---|---|
학습 방법 | 오차역전파법 | 경쟁학습방법 |
구성 | 입력층, 은닉층, 출력층 | 입력층, 2차원 격자 형태의 경쟁층 |
기계 학습 방법의 분류 | 지도 학습 | 비지도 학습 |
연관성 규칙의 장단점
순차 패턴(Sequence Analysis)
최근 연관성분석 동향
품목 수 n개, 품목 부분집합의 개수 = 개,
가능한 모든 연관규칙의 개수 = 개