Cosine Similarity

Heejin·2023년 10월 11일

Computer Vision Glossary

목록 보기
14/24

Cosine Similarity(코사인 유사도)는 벡터 공간에서 두 벡터 간의 유사성을 측정하는 데 사용되는 유사성 지표 중 하나이다. 이 지표는 두 벡터 사이의 각도를 측정하여 유사성을 계산한다.

코사인 유사도는 다음과 같은 방식으로 계산된다. 두 벡터 A와 B가 주어졌을 때:

코사인 유사도 = (A · B) / (||A|| * ||B||)

여기서,

  • A · B는 두 벡터의 내적(두 벡터 간의 곱셈 합)을 나타낸다.
  • ||A||은 벡터 A의 크기(벡터의 길이 또는 노름)를 나타낸다.
  • ||B||은 벡터 B의 크기(벡터의 길이 또는 노름)를 나타낸다.

코사인 유사도의 값은 -1에서 1 사이에 있으며, 일반적으로 두 벡터가 같은 방향을 가지면 1에 가까워지며, 반대 방향을 가지면 -1에 가까워진다. 만약 두 벡터가 직교(90도 각도)에 있다면 코사인 유사도는 0이 된다.

코사인 유사도는 텍스트 문서의 문장, 단어, 이미지 특징 벡터, 추천 시스템, 정보 검색, 자연어 처리, 클러스터링 및 다양한 기계 학습 작업에서 유사성을 측정하는 데 널리 사용된다. 이는 특히 벡터 표현을 사용하여 데이터를 표현하고 비교할 때 유용한 유사성 메트릭 중 하나이다.

0개의 댓글