[이렇게 쉬운 통계학] 2장 데이터와 그래프 처리에서 큰 실수 피하기

data_buddha·2023년 7월 31일
0

척도로 데이터 분류

  • 데이터는 총 4가지 척도로 구분 가능

  • 데이터는 질적데이터 / 양적데이터 로 구분가능

  • 질적데이터
    -명목척도 : 성별, 주소, 혈액형, 찬반 등 / 최빈값만 의미 있음
    -서열척도 : 성적순, 좋고 싫음 / 중앙값, 최빈값 의미 있음

  • 양적데이터
    -등간척도 : 체온, 기온, 득점 / 평균, 중앙값, 최빈값 모두 사용가능
    -비율척도 : 키, 몸무게, 시간, 돈, 연령 / 평균, 중앙값, 최빈값 모두 사용가능

  • 명목척도는 '서울=1'처럼 임의로 값을 매긴 데이터

  • 서열척도는 '순위' 데이터

등간척도와 비율척도?

  • 10℃는 5℃의 2배가 아니다?
    - 분명히 섭씨온도(℃)의 세계에서 보면 2배가 되겠지만 온도의 기준이 화씨온도(℉)로 바뀐다면? 성립되지 않음

퍼센트와 포인트 구분

  • A사의 점유율이 20%에서 5% 증가했다고 한다면...

  • 덧셈발상으로 20 + 5 = 25%가 맞을까? / 곱셈발상으로 20%를 기준으로 5% 증가이므로 20 * 0.05 = 1% 증가일까?

  • '포인트' 발상으로 전환!

  • ex)실업률이 3%에서 3.35%로 증가했다면 : 0.35포인트 실업률이 올랐다

  • 따라서 A사의 점유율이 20%에서 5%올랐다는 표현은
    -5포인트 올랐다
    -점유율 20%에서 25%로 5%증가했다 (%를 사용하고 싶다면)

원그래프 사용 시 유의점

  • 다중응답에서 원그래프 사용x

  • 원그래프는 크기 비교도 안되고 시간에 따른 변화도 나타낼 수 없음

  • 원그래프를 자주 사용하는 것을 피하자

profile
来日方长 : 앞길이 구만리 같다; 앞길이 희망차다. 장래의 기회가 많다.

0개의 댓글