Row_number()
: Row에 순서대로 숫자를 매긴다. 순서나 순위를 매길 때 주로 사용.
Rank()
: 위의 Row_number()
와 거의 같다. 만약 데이터가 같아서 순위가 같을 경우
'1, 2, 3, 3, 3, 6, 7...' 이와 같이 출력된다.
Dense_rank()
: 위의 Rank()
와 동일하지만 순위가 같아도 생략되지 않는다.
'1, 2, 3, 3, 3, 4, 5...' 와 같이 출력된다.
NTILE()
: 출력할 데이터를 등분하여 출력.
NTILE(4)
의 경우 출력할 데이터의 Row가 12개라면 3개의 Row씩 4개의 군집을 생성하여 각각 1, 2, 3, 4의 번호를 매긴다.
Lag()
: 해당 Column의 ()에 해당하는 수 만큼 이전의 Row 값을 출력함.
Lead()
: 해당 Column의 ()에 해당하는 수 만큼 다음의 Row 값을 출력함.
LAG와 LEAD는 해당 Row 그리고 이전 혹은 다음 Row를 빼거나 더하는 등 함께 계산하는데 사용한다.
저번 프로젝트에서 느꼈던 것과 마찬가지로 UDEMY 데이터가 한정적이기에,
그 중에 어떤 데이터로 어떤 지표를 정의하여 얼마나 자세한 레벨의 지표를 대시보드에 담을 것인지가 관건인 것 같다.