1. 학습 키워드
데이터 전처리, 시각화 기본, pandas란?
2. 학습 내용
데이터 전처리와 시각화
시각화를 왜 하는가?
데이터 전처리와 시각화는 왜 해야할까?
- 데이터 전달의 목적성과 효과성을 위해서 (중요!)
전처리를 하기 전에 어떻게 분석할 것인지 미리 설계해야 전처리 과정에서의 시행착오를 줄일 수 있다.
pandas
Excel vs pandas
- 자동화 프로그래밍 가능
- 대용량 데이터 처리
- 복잡한 데이터 처리 및 분석
- 확장성과 유연성
- 버전 관리
pandas는 대규모 데이터 및 복잡한 작업을 프로그래밍을 통해 시각화 함으로써 높은 유연성과 확장성을 가진다.
시리즈(Series)
하나의 속성을 가진 1차원 배열의 형태
데이터프레임
2차원 배열의 표형태

3. 배운점 및 생각
- 데이터 분석 or 모델 학습을 할때 사전에 목적에 대해서 잘 생각하지 않거나 중간에 방향성이 바뀌면 전처리 작업을 다시 해야할 때가 종종 있다. 그만큼 전처리를 목적에 맞게 하는 것이 업무와 시간의 효율을 줄여준다고 생각한다.