SPSS에서 데이터 정규화 해보기
변수들의 단위나 값이 다를 때 무작정 서로를 비교할 수는 없다.
예를 들면총점이 50점인 변수와 총점이 100점인 변수를 바로 비교할 수는 없다는 것이다.
이때 필요한 것이 데이터 정규화이며 아래와 같이 2가지 종류가 있다.
각 공식에 대해서도 알아두자.
1) Z-score 정규화(Standardization)
2) Min-Max 스케일링(Normalization)
또한 값이 너무 크거나 범위가 크면 이에 대한 영향도가 커지게 되는데,
기존 데이터를 표준화나 정규화 과정을 거쳐 이에 대한 영향을 줄일 수도 있다.
(Standardization)
먼저 표준화 변수는 평균=0, 표준편차=1이 되도록 변수를 변환한다.
데이터의 기존 값에서 평균을 빼준 값을 표준편차로 나눈다.변환된 데이터값인 표준화 변수가 양수이면 표준보다 크고,
음수이면 표준보다 작다.SPSS 프로그램에서 회귀분석 또는 다변량분석 시
기술통계-표준화변수로 저장을 클릭하여 손쉽게 활용할 수 있다.
분석-기술통계량-기술통계 순으로 클릭
왼쪽 변수 목록에서 표준화 변수로 변환할 변수 클릭해서
가운데 파란 화살표로 오른쪽 변수 목록으로 이동
아래쪽에 표준화 값을 변수로 저장 체크하고 확인 클릭
※ 출처:
시대고시 사회조사분석사 2급 실기 연습용 데이터
데이터 보기 창에 가보면
표준화 변수로 변환된 변수 데이터가 추가되어 있는 것을 볼 수 있다.
(Normalization)
최대값과 최소값을 활용하는 Min-Max 정규화 방법이다.
데이터의 기존 값에서 최소값을 뺀 값을 최대값에서 최소값을 뺀 값으로 나눠준다.데이터 정규화는 기존 데이터를 0~1사이의 값을 갖게 변환하여 변수들을 비교한다.
데이터 정규를 통해 변환된 데이터는 가장 큰 값=1, 가장 작은 값=0이 된다.