[Python] filtering & Sorting

JONGYOON JEON·2024년 2월 22일
0

Python

목록 보기
1/7
칼럼 조건 넣기
df[df['quantity']==3]

칼럼 두개면 대괄호 하나 더씀
df[['quantity','item_price']]


인덱스 초기화해서 칼럼 조건으로 데이터 가져오기
df.loc[df['quantity'] == 3].head().reset_index(drop=TRUE)

::2는 짝수열
df.iloc[:,::2]

loc와 iloc은 둘 다 pandas 데이터프레임에서 행이나 열을 선택하는데 사용되는 함수입니다. 그러나 두 함수는 서로 다른 방식으로 데이터를 선택합니다.
loc: 라벨 기반의 데이터 선택 방식을 사용합니다. 즉, 행과 열의 라벨(이름)을 기준으로 데이터를 선택합니다. df.loc['item_price']
iloc: 정수 기반의 데이터 선택 방식을 사용합니다. 즉, 행과 열의 정수 인덱스를 기준으로 데이터를 선택합니다 df.iloc[1]

item_price에서 문자 읽기
df.item_price.str[1:].astype('float')
df.item_name.str.contains('문자')

기본 오름차순 + 인덱스 초기화
df.sort_values('new_price',ascending=False).reset_index(drop=TRUE)

df.drop_duplicates('열네임')

df.loc[df.new_price >= df.new_price.mean()]

loc[행, 열]
df.loc[df.item_name=='lzze', 'item_name'] = 'Fizzy Lizzy'

NaN 값 세기
df.choice_description.isnull().sum()

df.loc['choice_description'.isnull(), 'choice_description'] = 'NoData'

df.choice_description.str.contains('Black') # 포함하는 글자
df.loc['choice_description'=='lizzy', 'choice_description'] # 행열
Ans = df[df.item_name.str.startswith('N')] # 시작하는 글자
Ans = df[df.item_name.str.len() >=15] # 글자수 세기


lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98]
Ans = df.loc[df.new_price.isin(lst)]  # isin(list) 리스트에 있는걸 포함하는 것
display(Ans.head(3))
print(len(Ans))
profile
효율적인 걸 좋아해요

0개의 댓글