Pandas 데이터 처리 및 분석을 위한 라이브러리 대용량 데이터를 안정적이면서도 간편하게 처리 서로 다른 데이터타입으로 열을 구성할 수 있음 (참고) Numpy : 전체 배열 원소를 동일한 타입으로 제한 주요 기능 데이터 입출력 : csv, excel, RDB
DataFrame 생성 2차원 배열과 유사한 자료형 다차원 리스트, 딕셔너리 자료형으로 데이터 구성 가능 관계형 데이터베이스의 테이블 구조, excel/csv 데이터 구조와 유사 하나의 컬럼은 하나의 Series로서 하나의 Dataframe은 여러 개의 Series 묶
컬럼 삭제del 키워드 + 컬럼 인덱싱df.drop(col, axis=1)df.drop(columns=col)로우 삭제df.drop(idx) : axis = 0 (기본값)dataframe 과 스칼라 값 산술연산dataframe 과 series 간의 산술연산datafra
pd.read_csv()컬럼명이 존재하는 데이터컬럼명이 없는 데이터구분자 설정(참고) 절대경로: 모든 경로를 다 입력해서 파일이나 경로를 가져오는 것(정확)(불편) 상대경로: 대상파일과 실행중인 파일간에 겹치는 경로가 존재할 때 겹치지 않는 부분부터 기술하는
데이터 형식에 대한 처리공백 문자str.strip() : 양쪽 공백 제거str.lstrip() : 왼쪽 공백 제거str.rstip() : 오른쪽 공백 제거데이터 타입불규칙한 대소문자불규칙한 구분기호유효하지 않은 문자불규칙한 날짜 및 시간 표기데이터의 인코딩 작업에 포함