Display the First Three Rows (#03)

nooooy·2025년 1월 28일

IntroToPandas

목록 보기
3/9

01.28. LeetCode

import pandas as pd

def selectFirstRows(employees: pd.DataFrame) -> pd.DataFrame:
   return(employees[:3]) 

데이터프레임 row

df.head(3)
인덱스와 상관없이 데이터프레임의 처음 3개의 행을 반환한다.
간단히 데이터를 미리 보고 싶을 때 good

df.loc[0:2]
인덱스 값(이름)이 0, 1, 2인 행을 반환한다. (2를 포함한다..!)
인덱스 값이 중요하거나 특정 라벨을 기준으로 선택할 때 good

df.iloc[0:3]
인덱스와 상관없이 정수 기반 위치(index position)를 사용하여 row를 선택한다.
이 때는 일반 슬라이싱 규칙을 따름.(3 포함 x)
인덱스와 상관없이 위치 기반으로 데이터를 선택할 때 good

세 메서드는 비슷한 역할을 하지만 index가 순차정렬되어 있지 않거나, custome index일 경우에는 결과가 달라질 수 있다.

데이터프레임 column

df['열 이름'] df.'열이름'
열이 하나일 때는 return 타입이 series이다.
df[['열1', '열2']]
두 개 이상일 때는 DataFrame. 이 때는 여러개의 열 이름을 [ ]로 묶어주어야 한다.

df.loc[:, '열 이름'] df.loc[:, ['이름', '나이']]
.loc은 철저하게 해당 열의 이름 기반이다.
df.iloc[:, '열 번호'] df.iloc[:, 0:3] # 0~2번 열
.iloc은 철저하게 index 기반이다.

둘을 바꿔서 넣으면 오류난다. ;-;

etc.
# 열 이름 확인
print(df.columns)

# 특정 열 이름 가져오기
df[df.columns[0]] 

# 열 이름 리스트로 선택
df.filter(items=['A', 'B'])

# 특정 문자열이 포함된 열 선택
df.filter(like='A')  # 'A'가 포함된 열 선택

# 열 데이터를 Numpy 배열로 변환
df['A'].to_numpy()

0개의 댓글