데이터 전처리 및 Pandas의 장점

HJ·2024년 5월 12일

DATALITERACY_TIL

목록 보기
2/3

데이터 전처리란?

= 내가 원하는 데이터를 보기 위해 하는 모든 활동

1. 데이터 전처리는 왜 해야할까?

1) 정형 데이터 : 엑셀시트, 표 등 열과 행이 뚜렷한 데이터
2) 비정형 데이터 : 이미지 등 다양한 형태의 데이터

= 깔끔하게 데이터를 알 수 있도록 가공해야한다.

2. 데이터 전처리는 어떻게 해야할까?

데이터 전처리는 데이터를 전달하기위한 '목적성'을 꼭 지녀야한다.
이때, 데이터 전달의 '효과성'이 증가한다.

Pandas 알아보기

1. Excel vs Pandas

1) Pandas의 장점

  • 자동화와 프로그래밍 기능 활용 가능

  • 대용량 데이터 처리 가능

  • 복잡한 데이터 처리 및 분석 가능

  • 확장성과 유연성

  • 버전 관리 가능

    2) Pandas란?

  • pandas의 구조
    업로드중..

profile
First time, Last time, Every time.

0개의 댓글