import pandas as pd
data = vlaus
df.loc["row", "column"]
- 이름으로 처리할 때
df.iloc[:, [0, 2]]
- 데이터 프레임 행/열의 순서를 나타내는 정수를 통해 가져오는 방법
결측치 채우기!
NaN값을 찾아서 NaN인 경우 그 데이터를 특정값(-1)으로 채워주는 함수
df[''].fillna()
ex) df['키'].fillna(height[0], inplace=True)
- inplace 옵션이란?
inplace의 기본값은 False이다.
.fillna()로 결측치를 채운 다음, 결측치 값이 채워진 상태로 저장을 할 것인지 묻는 옵션이다.
False(저장 안할거야) / True(저장 할거야!)
df.dropna()
결측치가 있는 행을 날려버린다.
- df.dropna(axis=0)
axis = 0은 행을 날린다.- df.dropna(axis=1)
axis = 1은 열을 날린다.- dropna()와 같은 함수 실행시 인덱스가 변경될때, 다시 인덱스값을 부여할 때
df.reset_index(drop=True)
df.drop_duplicates()
중복된 값을 제거한다.
- df['키'].drop_duplicates()
첫번째 데이터만 남기고 나머지는 다 삭제한다.
한글 폰트 설치하기
!sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf
- 폰트 설치 후 런타임 다시시작!(cntl + M)
import matplotlib.pyplot as plt # matplotlib의 폰트를 Nanum 폰트로 지정합니다 plt.rc('font', family='NanumBarunGothic')