Pandas

Shin jaeeun·2023년 10월 12일
0

공부노트

목록 보기
4/7
import pandas as pd

dataframe
data = vlaus

df.loc["row", "column"]

  • 이름으로 처리할 때

df.iloc[:, [0, 2]]

  • 데이터 프레임 행/열의 순서를 나타내는 정수를 통해 가져오는 방법

결측치 채우기!

NaN값을 찾아서 NaN인 경우 그 데이터를 특정값(-1)으로 채워주는 함수
df[''].fillna()
ex) df['키'].fillna(height[0], inplace=True)

  • inplace 옵션이란?
    inplace의 기본값은 False이다.
    .fillna()로 결측치를 채운 다음, 결측치 값이 채워진 상태로 저장을 할 것인지 묻는 옵션이다.
    False(저장 안할거야) / True(저장 할거야!)

df.dropna()

결측치가 있는 행을 날려버린다.

  • df.dropna(axis=0)
    axis = 0은 행을 날린다.
  • df.dropna(axis=1)
    axis = 1은 열을 날린다.
  • dropna()와 같은 함수 실행시 인덱스가 변경될때, 다시 인덱스값을 부여할 때
    df.reset_index(drop=True)

df.drop_duplicates()

중복된 값을 제거한다.

  • df['키'].drop_duplicates()
    첫번째 데이터만 남기고 나머지는 다 삭제한다.

한글 폰트 설치하기

!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
  • 폰트 설치 후 런타임 다시시작!(cntl + M)
import matplotlib.pyplot as plt
# matplotlib의 폰트를 Nanum 폰트로 지정합니다
plt.rc('font', family='NanumBarunGothic') 

0개의 댓글

관련 채용 정보