1. Pandas 기초
- 파이썬의 데이터 분석 라이브러리
- 'PANel DAta'의 앞 글자를 따서 지어짐
- 특징
 -> 간편한 문법 (낮은 진입 장벽)
 -> 다양한 기능
 -> 뛰어난 성능 (대용량 데이터 처리 가능)
 -> 다양한 포맷/DB 연동 지원
 -> 지속적인 개선, 업데이트
2. Series와 DataFrame 기본 개념
- Pandas가 제공하는 자료구조
  
- 클래스의 구성 : 속성/기능
 -> 클래스를 인스턴스화 하면 해당 클래스의 속성과 기능을 탑재한 객체(Object) 생성
  
3. Series와 DataFrame 인덱싱
- 인덱서: Pandas에서 series나 DataFrame 안의 특정 data를 선택 또는 조작하게 함
- 인덱싱: index를 이용해서 원하는 데이터에 접근하는 것
- Boolean 인덱싱: 참/거짓 값을 가지는 조건을 활용하여 데이터를 선택하는 방법
4. Series의 속성
- index: 시리즈의 인덱스(라벨)를 조회 Series.index
- values: 시리즈의 값들을 Numpy 배열로 반환 property Series.values
- dtype: 시리즈에 저장된 값들의 데이터 타입을 변환 property Series.dtype
- shape: 시리즈의 형태를 튜플로 반환 property Series.shape
- size: 시리즈에 포함된 항목의 개수를 숫자로 반환 property Series.size
- hasnans: 시리즈에 결측치의 존재 여부를 boolean 값으로 반환
- is_unique: 시리즈 내 중복되는 값 여부를 boolean 값으로 반환
- name: 시리즈에 이름 지정 및 확인 property Series.name
5. Series의 기능
- head(n)/tail(n): 시리즈의 첫/마지막 n개의 항목 반환
- unique(): 시리즈에서 중복되지 않는 고유한 값을 배열로 반환
- duplicated(): 시리즈 내 각 원소가 중복되었는지 boolean 형태로 나타내는 시리즈 반환
- value_counts(): 시리즈 내의 고유한 값들의 개수를 시리즈로 반환
- sort_values(): 시리지의 값을 기준으로 정렬(기본값은 오름차순)
- describe(): 시리즈의 기초 통계 정보를 요약하여 시리즈나 dataFrame 반환
 -> 평균, 표준편차, 최솟값, 최댓값, 중앙값...)
- max()/min(): 시리즈의 최대값/최소값 반환
- idxmax()/idxmin: 시리즈에서 최대값/최소값을 가진 첫번째 항목의 인덱스를 반환
- mean()/median()/mode(): 시리즈의 평균값, 중앙값, 최빈값 반환
- sum(): 시리즈 내 원소들의 합 반환
- isin(values): 시리즈의 각 원소가 주어진 리스트에 포함되는지 여불르 boolean 값으로 반환
- apply(function): 시리즈의 각 항목에 함수를 적용하여 새로운 값 생성
- str: 문자열 메서드에 접근할 때 사용하는 접근자
- str.contains: 문자열 포함 여부 확인
12. DataFrame의 속성과 기능
- index: 데이터프레임의 인덱스를 조회 DataFrame.index
- columns: 데이터프레임의 컬럼을 조회
- values: 데이터프레임의 값들을 2차원 Numpy 배열로 반환
- dtypes:각 열의 데이터 타입을 시리즈로 반환
- shape: 데이터프레임의 형태를 튜플로 반환
- size: 데이터프레임에 있는 총 원소의 개수를 숫자로 반환
- T: 데이터프레임의 전치를 반환 (행과 열을 바꿈)
- head(n)/tail(n)
- describe()
- info(): 데이터 프레임의 요약 정보 출력
- isna()/isnull(): 데이터프레임의 각 요소가 누락된값인지 여부를 나타내는 boolean 데이터프레임 반환
- fillna(): 누락된 값에 대해 다른 값으로 대체
- dropna(): 누락된 값이 있는 행을 삭제
- drop(): 특정 행 또는 열을 삭제
- reset_index(): 인덱스를 기본 숫자 인덱스로 재설정
- sort_values(): 시리즈의 값을 기준으로 정렬(기본값은 오름차순)
이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다