(- 이론적인 내용말고 내가 이해한 내용을 적을 수 있는 정의가 필요함. 고차원이 무엇이고 저차원이 무엇이고 현실적으로 모르겠음 : 내용 추가 할것)
데이터가 실제 값으로 표현된 간결한 특성 벡터 표현. 이런 벡터를 임베딩이라 함
고차원 벡터를 저차원 공간으로 변환하는 것
Q : 컴퓨터에게 우리는 어떻게 다양한 형태의 정보를 표현해 줄 수 있을까요?
A : 벡터 공간(Vector Space) 에다가 우리가 표현하고자 하는 정보를 사상(mapping) 하는 방법을 사용
ex) 사람 : 두 얼굴이 얼마나 닮았나 비교 ⇨ 컴퓨터 : 두 얼굴 벡터 사이의 거리가 얼마인가?
임베딩 기법을 활용하여 표현할 수 있는 데이터의 유형
1. 텍스트(단어, 문장, 전체 문서), 이미지, 오디오 등과 같은 구조화되지 않은 데이터
2. 사용자가 시청한 영화 목록 및 사용자 ID와 같이 상호작용 환경설정만 있고 입력 특성이 없는 항목
3. 그래프 및 네트워크와 같은 복잡한 구조 데이터. 예: 소셜 네트워크 및 생화학 화합물
4. 텍스트 설명을 사용한 이미지 검색 및 이미지 캡션 작성과 같은 다중 모달 변환
5. 위치 및 점유와 같은 희소 특성(이를 밀집 특성으로 변환)
6. 인구통계, 사회, 금융, 행동 속성이 300개 이상 포함된 고객 레코드와 같은 고차원 항목(이러한 항목을 보다 간결한 표현으로 변환)
정리 잘 해놓으셨어요👍