[Excel] Ch2. EDA (Tiny Data, EDA, 쿼리, 상관분석)

Joel Lee·2023년 9월 27일
0

Excel

목록 보기
2/3
post-thumbnail

Tiny Data : 로우 데이터 관리

[!info] Tiny Data 란?

  • 데이터 전처리에 걸리는 시간을 최소화하기 위한 표준화 데이터 형태
  • 밑바닥부터 시작할 필요 없는 데이터

[!tip] 필요 조건

  • 열에는 개별 변수 1 개
  • 행에는 관측치
  • 각 표는 1 개의 관측기준에 의해 조직


탐색적 데이터 분석 (Exploratory Data Analysis, EDA)

#EDA

[!info] EDA

  • 수치 요약과 시각화를 사용하여 데이터를 탐색하고
    변수 간 잠재적 관계 (인사이트) 를 찾아내는 프로세스

[!example]

  • 데이터 특성 이해
  • 데이터 변동의 패턴 발견
  • 이상치 발견
  • 모델링 전략 수립, 방향 설정
  • 분석 결과의 발견

[!quote]

' 잘못된 질문 ' 에 대한 ' 확실한 답 ' 은 결론이 확실할 수 있으나,
때론 ==' 정확한 질문 '==에 대한 ' 대략적인 답이 더 낫다 '
- John Tukey, 미국의 수학자이자 컴퓨터 과학자.


실습 : 세계 인구 데이터 분석

데이터 소개 및 전처리

#excel/query

[!note] 쿼리를 이용한 Tiny Data 화

  • 데이터 -> 테이블/범위에서 -> 쿼리 편집기 -> 변환 -> 열 피벗 해제

데이터 탐색 및 시각화

#excel/graph/combo

[!note] 시각화

  • 콤보 그래프
  • 신장률 계산 수식 복붙 팁
    - IF 함수를 이용한 다른 대륙 간 계산 방지

실습 : 미국 도시별 House Price 데이터 분석

데이터 소개 및 탐색

[!note]

  • 추세 탐색 : 막대 그래프, 분산 그래프, 박스 그래프
  • Pivot table 열 그룹화

상관분석 및 시각화

#excel/correlation

[!note] 상관분석

  • 데이터 분석 추가
    - 파일 -> 옵션 -> 추가기능 -> 분석 도구 팩
  • 셀 배경을 값에 따라 표시
    - 홈 -> 조건부서식 -> 규칙 관리 -> 새 규칙 -> 셀 값을 기준으로 모든 셀의 서식 지정

[!example] 결과


실습 : 온라인 쇼핑몰 데이터 분석

데이터 소개

데이터 탐색 및 전처리

#excel/text #excel/search #excel/isnumber

[!note]

  • 텍스트를 날짜 형식으로 바꾸기
    - 데이터 -> 텍스트 나누기 -> 3단계 열 데이터 서식 -> 날짜 선택
  • 날짜를 요일로 바꾸기
    -
  • 여러 도메인의 주소를 통합하기
    -
    - IF(ISNUMBER(SEARCH("google",K2)),"google",K2)
  • Pivot 테이블 열 합계 비율로 나타내기
    - 피벗 테이블 필드 -> 값 -> 값 필드 설정 -> 값 표시 형식 -> 열 합계 비율

장바구니 상관 분석

profile
개발자 전직을 향해 나아가고 있는 Technical Sales Engineer

0개의 댓글