.loc[]과 DataFrame['column']을 사용하여 데이터 선택하기Pandas에서 데이터에 접근할 때 두 가지 주요 방법이 있습니다. 하나는 .loc[]을 사용하여 행과 열을 선택하는 방법이고, 다른 하나는 DataFrame['column']을 사용하여 열을 선택하는 방법입니다. 이 두 방법은 데이터 분석에서 매우 자주 사용됩니다.
DataFrame['column']을 사용하여 열 선택하기우리는 이전에 states라는 DataFrame을 사용하여 주별 인구수와 면적을 담은 데이터를 가지고 있었습니다. states DataFrame은 다음과 같습니다:
import pandas as pd
# 인구수와 면적 데이터로 Series 생성
population = pd.Series([38332521, 19552860, 12882135, 19651127, 26448193],
index=['California', 'Florida', 'Illinois', 'New York', 'Texas'])
area = pd.Series([423967, 170312, 149995, 141297, 695662],
index=['California', 'Florida', 'Illinois', 'New York', 'Texas'])
# DataFrame 생성
states = pd.DataFrame({'population': population, 'area': area})
# DataFrame 출력
print(states)
출력은 다음과 같습니다:
population area
California 38332521 423967
Florida 19552860 170312
Illinois 12882135 149995
New York 19651127 141297
Texas 26448193 695662
DataFrame['column']을 사용하여 열 선택하기states['area']는 'area' 열을 선택하는 방법입니다. 이렇게 하면 해당 열의 값들을 쉽게 얻을 수 있습니다.
# 'area' 열만 선택
print(states['area'])
California 423967
Florida 170312
Illinois 149995
New York 141297
Texas 695662
Name: area, dtype: int64
설명:
states['area']는 DataFrame에서 'area' 열만 선택하여 반환합니다. 이 결과는 Pandas Series 형식으로, 인덱스는 주 이름(예: California, Florida 등)이고 값은 각 주의 면적입니다..loc[]을 사용하여 행과 열 선택하기loc[]은 레이블을 기반으로 행과 열을 선택하는 데 유용합니다. 예를 들어, California 주의 전체 행을 선택하고 싶다면:
# 'California' 행 선택
print(states.loc['California'])
population 38332521
area 423967
Name: California, dtype: int64
또는 특정 열만 선택하고 싶다면:
# 'California' 행에서 'area' 열만 선택
print(states.loc['California', 'area'])
423967
설명:
states.loc['California', 'area']는 'California' 행에서 'area' 열만 선택하는 방법입니다. 이 결과는 423967로, California의 면적을 반환합니다..loc[]과 DataFrame['column']의 차이점states['area']: DataFrame에서 'area' 열을 선택하여 Series로 반환합니다. 인덱스는 주 이름이고, 값은 면적입니다.states.loc['California']: 'California'라는 행을 선택하여 해당 주에 대한 모든 열을 반환합니다.states.loc['California', 'area']: 'California' 행에서 'area' 열만 선택하여 그 값을 반환합니다.DataFrame['column']: 특정 열을 선택하는 방법입니다. 예를 들어, states['area']는 'area' 열만 선택합니다..loc[]: 레이블을 기반으로 행과 열을 동시에 선택할 수 있는 방법입니다. 예를 들어, states.loc['California', 'area']는 California 행에서 area 열을 선택합니다.이 두 가지 방법을 적절히 활용하면 데이터를 더욱 직관적으로 선택하고 다룰 수 있습니다.