행 열 별 요약된 값으로 정렬해서 분석을 하고자 할 때 사용
컬럼 형태로 되어 있는 것을 행 형태로 바꿀 때 사용
이미 수집된 변수 활용해서 새로운 변수 생성하는 경우
주관적일 수 있으며 논리적 타당성을 갖추어 개발해야 함.
원 데이터를 분석 Needs에 맞게 종합한 변수
빈도 카운팅, 집계의 개념
요약변수 | 파생변수 |
---|---|
매장 이용 횟수 | 주 구매 매장 |
구매 상품 품목 | 구매 상품 다양성 |
데이터의 속성값이 -1.0 ~ 1.0 같이 정해진 구간 내에 들도록 하는 기법
종속변수의 증가가 독립변수의 증가보다 급격 -> Log 변환
(기울기가 점점 기하급수적으로 증가)
반대는 square 변환
(기울기가 점점 내려감)