기초통계량(중앙값, 최빈값, 표준편차 등)과 텍스트 추출(슬라이싱같은거,병합 등) 을 알아봅니다.
셀 내 데이터 추출과 피벗테이블에 대해 알아봅니다.
피벗테이블과 SUMIFS, Vlookup함수를 이용한 자동화 보고서
실전데이터 분석 하기 전, 다시한번 이론에 대해 간단하게 정리
vlookup으로 데이터병합, 쿼리편집기로 데이터구성 변형(가로형->세로형 tidy) 로 전처리를 하여 시각화 합니다.
상관분석 시각화
수치형 데이터를 문자형으로 변환하여 상관분석
t-test, 정규분포의 이론에 대해 간단한 설명
백화점 고객들의 매출데이터로, 작년 매출과 올해 매출의 평균 차이를 통계적으로 유의미한지 (통계적으로 차이가 있는지) 알아보겠습니다.
상관관계를 지닌 상관분석과 인과관계를 지닌 회귀분석, 그리고 세분화(다양한 타겟팅 Segmentation)와 군집화(유사성을 지닌 각 그룹 생성 Clustering)
y와 인과관계를 지닌 x변수들의 다중공선성 확인후, 회귀분석을 진행하며 중고차 가격을 예측합니다. 실제 가격과의 차이(오차)를 구하고 회귀모델을 평가 (MAE, RMSE) 합니다.
한 백화점에서 명품을 구매하는 고객들의 속성과 구매데이터를 군집화(clustering)해보고, 명품을 구매하는 고객들에는 어떤 고객군이 있는지 분석합니다.
슬라이서를 통한 자동업데이트 차트가 있는 대시보드 생성합니다.
서울시 공공데이터(따릉이) 데이터 전처리, 피벗테이블로 기본 차트 시각화, 경도와 위도로 map 시각화를 진행합니다.
최근 코로나보다 오히려 더 경제가 안 좋아졌으며, 앞으로도 안좋아질거라는 비관적인 전망이 많이 들린다. 그래서 알아보는 서울시 폐업점포 데이터 분석
데이터 업데이트 날짜상 그나마 최근 데이터인 2022년을 1~4분기로 나뉘어 분석합니다.
개인홈페이지에 올릴 저장형태 (html형태, 구글시트의 iframe 그리고 pdf>jpeg)
공공데이터로 엑셀에서 기초적인 통계 분석과 시각화를 스스로 해봤습니다.
1주차 강의 생략 후 2주차 강의부터 복습합니다.
& 를 활용하여 셀값, 텍스트, 함수등을 연결하여 추출할 수 있습니다. 어떠한 셀에 수치를 입력하면 그 수치에 맞는 데이터만 바로바로 반영되어 출력되는 쿼리문 작성
정규표현식으로 원하는 텍스트만 추출해내어 가공(변형) 해보겠습니다.
요새 XLOOKUP을 많이 쓰긴 하지만, 낮은 버전의 경우 INDEX & MATCH 와 VLOOKUP이 더 유용할 수 있다고 합니다.