비지도 학습 (Unsupervised Learning)

Harry Kim·2022년 6월 1일
0

레이블(타깃)이 없는 훈련 데이터를 이용하여 시스템이 스스로 학습한다

대표적 비지도 학습

  • 군집
  1. 데이터 특성를 비슷한 특성을 가진 몇개의 그룹으로 나누는 것
  2. 예제: 블로그 방문자들을 남성, 여성, 주말, 주중, 만화책등으로 묶는다
  3. 알고리즘: K-mean, DBSCAN, Hierarchical Clustering
  • 시각화
  1. 다차원 특성을 가진 데이터셋을 2D 또는 3D로 표현
  2. 시각화를 하기 위해서는 데이터의 특성을 2가지로 줄여야한다 (numerical or categorical)
  • 차원 축소
  1. 데이터의 특성 수를 줄인다
  2. 특성 추출: 상관관계가 있는 여러 특성을 하나로 합친다
  3. 예제:자동차 주행거리와 연식은 상관관계가 높기 때문에 차의 마모정도라는 하나의 특성으로 축소 가능
  4. 알고리즘: PCA, Kernal PCA, t-SNE, Locally Linear Embedding(LLE)
  • 비정상 탐지(anomaly detection)

  1. 정상 샘플을 이용하여 훈련 후 입력 샘플의 정상 여부 판단
  2. 예제: 부정거래 사용 감지, 제조 결함 잡아내기, 이상치(outliers) 자동 제거
  • 특이치 탐지(novelty detection)
  1. 오염되지 않은 (clean) 훈련 세트 활용 후 훈련 세트에 포함된 데이터와 달라보이는 데이터 감지하기
  • 비정상 탐지 vs 특이치 탐지
  1. 특이치 탐지 알고리즘은 강아지 사진 중 치와와 사진을 특이한 것으로 간주하지 않는다
  2. 반면에 비정상 탐지 알고리즘은 강아지 사진 중 치와와 사진을 다른 강아지들과 다른 종으로 간주할 수 있다
  • 비정상 탐지와 특이치 탐지 알고리즘
  1. Isolation Forest
  2. One-Class SVM
  • 연관 규칙 학습
  1. 데이터 특성 간의 관계를 찾는다
  2. 예제: 바베큐 소스와 스테이크 구매 사이의 연관성이 밝혀지면 상품을 서로 가까이 진열한다
  3. 알고리즘: Apriori, Eclat
profile
Hi there! I'm from Korea and currently working in Singapore. This is my journey to master Machine Learning/Deep Learning

0개의 댓글