[스터디_R] 데이터 분석 과정을 알아보자

Brad Pitt·2022년 5월 14일
0

1.데이터 분석 흐름

  • 데이터 분석 설계 : 방향성 기획, 방법론 검토, 가설 설정
  • 데이터 준비 : 데이터 불러오기, 형태 파악하기
  • 데이터 가공 : 추출 및 정제, 파생 변수 생성, 데이터 병합
  • 데이터 분석 : 통계 분석, 그래프 및 시각화
  • 결과 도출 : 분석 결과 해석, 분석 결과 정리

데이터 분석 설계

  • 용어 정리가 중요하다 (우유, 밀크, milk 같은 걸 의미하지만 용어는 다르기 때문에 데이터 분석에 영향을 줄 수 있음)
  • 분석 가능한 변수에 대해 정리하고 가설을 정의한다.
  • 가설을 통해 분석 항목을 설정한다.

데이터 준비

  • 데이터를 수급하는 과정
  • api, excel, text, csv, data base 등을 통해 수급한다.
  • 모양이나 데이터 형태가 다르면 통합하는 과정이 필요하다.
  • 데이터 값의 특성을 파악해야한다.

데이터 가공

  • 가설을 검증하는데 도움이 되는 데이터로 가공해야한다.

[출처] 처음 시작하는 R데이터 분석, 강전희

profile
데이터는 철저하게 해석은 자유롭게

0개의 댓글