
1️⃣masking 연산import numpy as np
import pandas as pd
df=pd.DataFrame(np.random.rand(5,2), columns=["A", "B"]
df[df['A']>0.5 & df['B']<0.3]
--> query문으로도 가능
df.query("A > 0.5 and B <0.3")
2️⃣문자열 검색df["Animal"].str.contains ("Cat")
df.Animal.str.match("Cat")
apply() 를 통해서 함수로 데이터를 다루기df=pd.DataFrame(np.arange(5), column=["Num"])
def square(x) :
return x**2
df["Num"].apply(square) --> Num에 제곱수 넣기
df["Square"]=df.Num.apply(lambda x:x**2) -->square 칼럼을 만들고 람다 식 이용
replace() df.sex.replace({"Male" :0, "Female":1})
df.sex.replace({"Male" :0, "Female":1}, inplace=True) # 원래 값 자체를 바꿀
groupby() : 간단한 집계를 넘어서서 조건부로 집계할 경우

aggregate() : groupby를 통해서 집계를 한 번에 계산하는 방법

칼럼별로 다른 집계 함수를 사용하고 싶을 때는 딕셔너리 형태로 표현
get_group() : groupby로 묶인 데이터에서 key값으로 데이터를 가져올 수 있음