일반화된 LSH는 점 사이의 "거리"에 기반합니다 (비슷한 점은 가깝다)
d => distance measure는 다음의 조건을 만족해야합니다
- d(x,y) >=0
- d(x,y) = 0 iff x=y
- d(x,y) = d(y,x)
- d(x,y) <= d(x,z) + d(z,y) (triangle inequality)
유클리드 거리
비유클리드 거리
정의
H hash 함수의 family 는 로 나타낼 수 있다.
이것의 의미는 집합에서 모든 에 대해서 다음을 의미한다.
- if 이면 의 원소 에 대해 일 확률이 적어도 이다.
- if 이면 의 원소 에 대해 일 확률이 많으면 이다.
Example
LSH Family의 증폭