데이터표현: 특징추출

친친·2022년 11월 21일
0

선형변환에 의한 특징추출

특징추출
.학습(데이터분석)
.변환함수

학습 목적
.분석에 불필요한 정보를 제거하고 핵심 정보만 추출
.차원 축소를 통한 분석 시스템의 효율 향상

변환함수
.선형변환
.비선형변환

특징추출을 위한 접근법
.수작업에 의한 특징추출
ex) 영상분석, 숫자인식, 문서분석
.표현학습
ex)딥러닝 모델을 이용한 얼굴인식용 특징추출

선형변환에 의한 특징추출
.차원 축소 관점에서의 특징추출
.주어진 데이터를 변환행렬 w에 의해 정해지는 방향으로 사영함으로써 저차원의 특징값을 얻는 것

통계적 특징추출
.선형변환을 사용하는 대표적인 통계적 특징추출 방법
-주성분분석법(PCA): 비지도학습
-선형판별분석법(LDA): 지도학습

주성분분석법, PCA

목적
.변환 전의 데이터가 가지고 있는 정보를 차원 축소 후에도 최대한 유지
.데이터 분산이 가장 큰 방향으로의 선형변환을 수행

사용예시
.얼굴 영상의 표현

PCA의 특성
.데이터분석에 대한 특별한 목적이 없는 경우, 가장 합리적인 차원 축소의 기준
.비지도 학습: 클래스 레이블 정보 활용 x

한계
.데이터의 비선형 구조를 반영하지 못함

선형판별분석법, LDA

목적
.클래스 레이블 정보를 적극 활용
.분류에 적합한 방향으로 차원 축소

특성
.지도학습 능력

한계
.복잡한 비선형 구조의 경우, 적절한 변환 불가
.작은 표본 집합의 문제

거리 기반 차원 축소 방법

목적
.두 데이터 쌍의 거리를 최대한 유지하는 방향으로 축소

거리의 정의에 따라 다양한 방법이 존재

특징
.입력데이터와 특징 데이터 간의 매핑 함수를 정의하지 않음

MDS, 다차원 척도법
.유클리디안 거리 사용
.거리행렬 D가 값으로 정의되거나 유클리디안 거리 사용

t-SNE
.확률 밀도 함수를 활용하여 거리를 정의
.데이터 간의 거리와 특징 간의 거리를 조건부 확률을 이용한 유사도로 정의

Isomap
.측지 거리 사용
.데이터들을 정점으로 가지는 그래프 간의 경로를 데익스트라 알고리즘으로 계산

profile
웹개발 블로그

0개의 댓글