변수: 정해지지 않은 임의의 값을 표현하기 위해 사용된 기호, '변하는 숫자', 조사 목적에 따라 관측된 자료 값
질적 자료: 몇개의 범주로 구분하여 표현할 수 있는 데이터
양적 자료: 숫자 형태의 관측된 데이터, 숫자의 크기가 의미 가짐
EDA(Exploratory Data Analysis): 도표, 그래프, 요약 통계 등을 사용하여 데이터를 체계적으로 분석하는 하나의 방법
-> 목적
1) 초기 가설 수립
2) 초기에 적절한 모델 및 기법 선정
3) 변수간 트렌드, 패턴, 관계 찾고 통계적 추론 기반 가정 평가
4) 분석 데이터에 적절한지 여부 평가, 추가 수집, 이상치 발견 등에 활용
데이터 시각화
-> 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정
-> 도표라는 수단을 통해 정보를 명확하고 효과적으로 전달하는 목적을 가짐
이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다