데이터 분석 TIL - 데이터 전처리와 시각화, pandas란?

테리·2025년 10월 31일

1. 학습 키워드

데이터 전처리, 시각화 기본, pandas란?

2. 학습 내용

데이터 전처리와 시각화

시각화를 왜 하는가?

  • 설득하기 위해서 데이터를 시각화함

데이터 전처리와 시각화는 왜 해야할까?

  • 데이터 전달의 목적성과 효과성을 위해서 (중요!)

전처리를 하기 전에 어떻게 분석할 것인지 미리 설계해야 전처리 과정에서의 시행착오를 줄일 수 있다.

pandas

Excel vs pandas

  • 자동화 프로그래밍 가능
  • 대용량 데이터 처리
  • 복잡한 데이터 처리 및 분석
  • 확장성과 유연성
  • 버전 관리

pandas는 대규모 데이터 및 복잡한 작업을 프로그래밍을 통해 시각화 함으로써 높은 유연성과 확장성을 가진다.

시리즈(Series)
하나의 속성을 가진 1차원 배열의 형태

데이터프레임
2차원 배열의 표형태

3. 배운점 및 생각

  1. 데이터 분석 or 모델 학습을 할때 사전에 목적에 대해서 잘 생각하지 않거나 중간에 방향성이 바뀌면 전처리 작업을 다시 해야할 때가 종종 있다. 그만큼 전처리를 목적에 맞게 하는 것이 업무와 시간의 효율을 줄여준다고 생각한다.

0개의 댓글