[TIL] Excel Ch2. EDA 1

Joel Lee·2023년 9월 26일
0

Today I Learned

목록 보기
4/9
post-thumbnail

Tiny Data : 로우 데이터 관리

[!info] Tiny Data 란?

  • 데이터 전처리에 걸리는 시간을 최소화하기 위한 표준화 데이터 형태
  • 밑바닥부터 시작할 필요 없는 데이터

[!tip] 필요 조건

  • 열에는 개별 변수 1 개
  • 행에는 관측치
  • 각 표는 1 개의 관측기준에 의해 조직


탐색적 데이터 분석 (Exploratory Data Analysis, EDA)

#EDA

[!info] EDA

  • 수치 요약과 시각화를 사용하여 데이터를 탐색하고
    변수 간 잠재적 관계 (인사이트) 를 찾아내는 프로세스

[!example]

  • 데이터 특성 이해
  • 데이터 변동의 패턴 발견
  • 이상치 발견
  • 모델링 전략 수립, 방향 설정
  • 분석 결과의 발견

[!quote]

' 잘못된 질문 ' 에 대한 ' 확실한 답 ' 은 결론이 확실할 수 있으나,
때론 ==' 정확한 질문 '==에 대한 ' 대략적인 답이 더 낫다 '
- John Tukey, 미국의 수학자이자 컴퓨터 과학자.


실습 : 세계 인구 데이터 분석

데이터 소개 및 전처리

#excel/query

[!note] 쿼리를 이용한 Tiny Data 화

  • 데이터 -> 테이블/범위에서 -> 쿼리 편집기 -> 변환 -> 열 피벗 해제

데이터 탐색 및 시각화

#excel/graph/combo

[!note] 시각화

  • 콤보 그래프
  • 신장률 계산 수식 복붙 팁
    - IF 함수를 이용한 다른 대륙 간 계산 방지

실습 : 미국 도시별 House Price 데이터 분석

데이터 소개 및 탐색

[!note]

  • 추세 탐색 : 막대 그래프, 분산 그래프, 박스 그래프
  • Pivot table 열 그룹화

상관분석 및 시각화

[!note] 상관분석

  • 데이터 분석 추가
    - 파일 -> 옵션 -> 추가기능 -> 분석 도구 팩
  • 셀 배경을 값에 따라 표시
    - 홈 -> 조건부서식 -> 규칙 관리 -> 새 규칙 -> 셀 값을 기준으로 모든 셀의 서식 지정

[!example] 결과

profile
개발자 전직을 향해 나아가고 있는 Technical Sales Engineer

0개의 댓글