Cosine Similarity(코사인 유사도)는 벡터 공간에서 두 벡터 간의 유사성을 측정하는 데 사용되는 유사성 지표 중 하나이다. 이 지표는 두 벡터 사이의 각도를 측정하여 유사성을 계산한다.
코사인 유사도는 다음과 같은 방식으로 계산된다. 두 벡터 A와 B가 주어졌을 때:
코사인 유사도 = (A · B) / (||A|| * ||B||)
여기서,
코사인 유사도의 값은 -1에서 1 사이에 있으며, 일반적으로 두 벡터가 같은 방향을 가지면 1에 가까워지며, 반대 방향을 가지면 -1에 가까워진다. 만약 두 벡터가 직교(90도 각도)에 있다면 코사인 유사도는 0이 된다.
코사인 유사도는 텍스트 문서의 문장, 단어, 이미지 특징 벡터, 추천 시스템, 정보 검색, 자연어 처리, 클러스터링 및 다양한 기계 학습 작업에서 유사성을 측정하는 데 널리 사용된다. 이는 특히 벡터 표현을 사용하여 데이터를 표현하고 비교할 때 유용한 유사성 메트릭 중 하나이다.