1. 데이터 불러오기
import pandas as pd
df = pd.read_csv("/content/sample_data/california_housing_train.csv")
df.head()
2. 열 이름 확인 & 변경
df.columns
3. 데이터 프레임의 정보(컬럼명, 길이, 데이터 타입 용량 등) 확인
df.info()
4. 데이터 구조 크기 확인
df.shape
5. 변수들의 타입 확인
df.dtypes
df.columns_.dtypes
6. 기초통계량 확인
df.describe()
df.describe(include='all')
7. 데이터 개수 확인
df.count()
8. 컬럼의 각 요소별 빈도 계산
df['column_'].value_counts()
9. 기초 통계 계산 함수
df.mean()
df['column_'].mean()
df[['column_1','column_2']].mean()
10. 상관계수 행렬 생성
df.corr()
df[['column_1','column_2']].corr()