[DB] 릴레이션

임유빈·2022년 7월 26일
0

DB

목록 보기
8/15
post-thumbnail

1. 릴레이션

카디널리티는 전체 행에 대한 특정 컬럼의 중복 수치를 나타내는 지표이다. 카디널리티는 객관적 수치보다는 상대적인 개념으로 이해해야한다. 인덱스를 걸 때, 내가 원하는 데이터를 선택하는 과정에서 최대한 많은 데이터가 걸러져야 성능이 좋을것이다. (선택하는 데이터가 많아질수록 full scan에 가까워지므로)

즉, 여러 컬럼을 동시에 인덱싱할때, 다음과 같이 카디널리티가 높은 컬럼을(중복이 적은 컬럼을) 우선순위로 두는 것이 인덱싱 전략에 유리하다.

카디널리티 중복도가 ‘낮으면’ 카디널리티가 ‘높다’고 표현하고, 중복도가 ‘높으면’ 카디널리티가 ‘낮다’고 표현하며 상대적이다.

예로 주민등록번호는 카디널리티가 높다 그리고 이름 같은 경우는 중복도가 높기 때문에 주민등록번호에 비해 카디널리티가 낮다. 카디널리티는 상대적이기 때문에 이름이 주민등록번호에 비해 낮다고 한 것이다.

0개의 댓글